Delprosjekt:
Relative størrelser

Ansvarlig:
Ole Haakon Neskvern (ole.h.neskvern@hiof.no)

Innledning:
I løpet av Al Mashriq's leveår har mengden av dokumenter lagret på denne serveren økt med flere hundre sider i året. Mengden av informasjon har medført endel nye problemer, bl.a at det er vanskelig og finne frem, og vanskelig å vite hvor informasjonen ligger lagret. I tillegg kan det være et problem for brukerne å vite hvor stor Al Mashriq egentlig er, og i hvilke deler av serveren som informasjonen finnes. Dette har vi forsøkt å forbedre ved å lage et system som grafisk fremstiller mengden av dokumenter for de enkelte deler av serveren.

Hva har vi gjort:
I første omgang lagde vi noen enkle modulære script for å generere tallmatriale for serveren. Scriptene leste en konfigurasjonsfil som spesifiserte kategori og søkekriterier og skrev resultatene ut til skjerm. Tellingen av dokumenter foregår etter følgende prinsipp:

find /www/almashriq/htdocs/lebanon \( -name '*.html' -o -name '*.txt' \) -print | wc -l

Denne kommandoen leter rekursivt etter alle filer med extension html eller txt under lebanon på Al Mashriq. Ønsker vi å utvide tallmatrialet også til å dekke bilder kan vi skrive kommandoen slik:

find /www/almashriq/htdocs/lebanon \( -name '*.html' -o -name '*.txt' -o -name '*.gif' -o -name '*.jpg' \) -print | wc -l

Konfigurasjonsfilen (~/admin/rels/.rels) har følgende oppsett:

Kommentarer: Kommentering foregår etter vanlig UNIX-syntax, f.eks slik: # dette er en kommentar

Tabelltittler: <tittel> Denne spesifiserer starten på en ny tabell-type. F.eks land, slik: <Countries>

Kategori: Navn Søkestreng for denne kategori *URL

Eks: Egypt find /www/almashriq/htdocs/egypt \( -name '*.html' -o -name '*.txt' \) -print /base/egypt.html

Alle feltene skilles med tabulator.
*valgfri

Etter at filformatet ble spesifisert og scriptene fungerte slik de skal lagde vi et script som genererer ferdige HTML-dokumenter med tabeller og grafer utfra tallmatrialet (~/admin/rels/rels-html.pl). Grafene lages ved å strekke et en-pixel-bilde (~/almashriq/htdocs/sys/pixel.gif) i høyde og bredde.

Erfaringer:
Ideelt sett burde tallmatriale generes utfra Dewey Decimal-systemet på serveren, eller etter de kategoriene som er spesifisert på hovedsiden. Det siste derimot er svært vanskelig å få gjennomført i praksis da dokumentene i disse kategoriene er lagret på kryss og tvers av Dewey, dette gjør at telling vha. UNIX-kommandoen find er håpløst. Vi begrenset oss derfor til å lage tallmatriale for land og hovedkategoriene i Dewey.

Prosjektfakta:
Lokalisering:
  • Script: /home/almash/admin/rels/rels-html.pl
  • Konfigurasjonsfil: /home/almash/admin/rels/.rels
  • Ferdig HTML-dokument: /www/almashriq/htdocs/base/rels.html
Tidsestimering:
  • 69 timer
Ressurspersoner
  • Børre Ludvigsen
Cronjobb:
  • Spesifisert i crontab til å utføre dokumenttelling hver mandag kl. 02.00