For å slippe problemene relatert med det gamle søkesystemet valgte vi å fjerne "gatewayen" mellom Glimpse og HTML (glimpse-html.pl). I tillegg oppgraderte vi Glimpse & Glimpseindeks til versjon 4.0. Denne versjonen støtter bl.a indeksering av tittel-feltet i HTML-sider.
Problemene med indekseringen viste seg å ligge i at rettighetene til enkelte indeks-filer endret seg når Glimpseindeks ble kjørt. Dette løste vi ved å la indekseringsjobben være et script (~/admin/search/glimpse.helper) som utføres av cron. Scriptet utfører chmod 755 på allle indeksfilene etter at indekseringen er utført.
Grensesnittet til web endret vi til å basere seg på GlimpseHTTP. GlimpseHTTP er et perl-script som tar output fra kommandoen glimpse (søkeverktøyet) og setter inn passende HTML-kode for formatering av output. Vi utvidet GlimpseHTTP til å legge inn header og footer etter Al Mashriq-standard.
I tillegg har vi ekskludert større deler av html-hierarkiet for å unngå for mye "søppel" i søkeresultatene. Denne ekskluderingen gjøres i .glimpse_exclude, hvor man legger inn stier og filnavn på filer som ønskes å fjerne fra indekseringen. Ekskluderingen foregår vha. regulærutrykk. Vi har også satt regler (se delprosjekt for kvalitetssikring) for navngivning av temporære filer. Disse temporære filene blir automatisk ekskludert av indekseringsmekanismen.