Delprosjekt:
Vaktbikkje

Ansvarlig:
Arne Vonheim (arne.vonheim@hiof.no)
Innledning:

For å gjøre Almashriq bedre med tanke på oppetid, ble det bestemt at vi skulle lage en vaktbikkje.
Den skulle overvåke serveren og gi beskjed hvis den av en eller annen grunn ikke lengre var tilgjengelig.

Hva har vi gjort:
Vi laget to script:

Det første (ping.pl) kontrollerer at almashriq.hiof.no er i "live" og på nett. Siden edmund2 ikke selv kan kontrollere om den er skrudd av/nede, må selvfølgelig scriptet gå på en annen maskin.

Den andre vaktbikkja (oppslag.pl) benytter nettleseren lynx til å hente ned en side fra serveren. Hvis noe går galt prøver det å slå opp i DNS, og kontrollere om det virkelig finnes en httpd prossess. Basert p&arin g; disse to testene lager den en liten rapport.
Her er et lite diagram som viser flyten i programmet.

Vi vurderte å inkludere kontroll av nettverket ut av skolen, men lot være siden det ikke er stort man kan gjøre med det uansett.

Felles for begge scriptene er at de sender epost når noe går galt. Så venter de til problemet ordner seg igjen før de igjen gir beskjed. Altså prøver de å unngå at store mengder epost om samme vedvarende problem sendes ut.

Vedlikehold:
Scriptene kan ligge hvor som helst på harddisken, og er skrevet for å gå som cron-jobber.
Begge har de konfigurasjons variabler plassert i toppen av filene.
Den mest interessante i ping.pl er:

  • $MAIL_TO - Epost adresse for feilmeldinger. (almash@almashriq.hiof.no)

I oppslag.pl er det:

  • $MAIL_TO - Epost adresse for feilmeldinger. (almash@almashriq.hiof.no)
  • $SERVER_URL - Hvilken URL som kontrolleres. (http://almashriq.hiof.no/)

Siden oppslag.pl starter lynx og gjør ett oppslag på serveren hver gang det kjøres, bør det nok ikke gå _for_ ofte. I utgangspunktet setter vi det til hver halvtime.
For å sette en vaktbikkje ut av funksjon må scriptet kommenteres ut fra crontab'en på maskinen det går på.

Prosjektfakta
Lokalisering:
  • /home/almash/vaktbikkje/oppslag.pl (lynx/httpd kontroll. Går på almashriq)
  • /var/tmp/oppslag.alarm (Avgjør om en lynx/httpd advarsel allerede er sendt)

  • /home/almash/vaktbikkje/ping.pl (ping kontroll. Går på en av Børre sine maskiner.)
  • /var/tmp/ping.alarm (Avgjør om en ping advarsel allerede er sendt)

  • /var/tmp/oppslag_status.txt (Inneholder siste melding om server opp/ned)

Tidsestimering:

  • 28 timer