Filene så litt rare ut når vi listet de ut, og ved nærmere granskning (hexdump -c) viste det seg at de inneholdt \r/return, i stedet for \n/new_line. Så det første vi gjorde var å lage en liten kodesn
utt som byttet om på de to tegnene.
Etter litt testing kom vi fram til at DDC dokumentene lå under /disk2/htdocs/ddc[...] i Libanon, mens cgi scriptene lå under /cgi-bin (sett fra web).
Ut i fra dette dro vi følgende sluttninger:
1) Alle lokale datafiler som scriptene måtte benytte må inneholde ordet ddc i stien. Dette gjelder uansett om de er URLer eller vanlige filreferanser.
2) Linker videre fra scriptene er enten til cgi script som ligger under /cgi eller til filer/URLer (som dekkes av punkt 1).
Altså kunne vi søke etter ddc og cgi-bin, og få gode indikasjoner på hvor de kritiske kodebitene befant seg.
Etter å ha gjort de nødvendige endringene dobbeltsjekket vi ved å søke gjennom scriptene etter "form", "href" og "img" tagger, og se hvor disse pekte.
Siste punkt var å finne alle cgi-bin referanser i html delen av DDC. Dette løste vi med en find kommando som fant alle .html filer og kjørte en grep 'cgi' på dem.
Listen vi fikk ut ble rettet for hånd, bortsett fra en gruppe på 94 script-genererte sider som ble konvertert med et par linjer perl.