LPS:CFEngine3/TODO

Z HelpDesk

Konfigurace

Věci, co bych chtěl do cfenginu zavést, ale papírky se mi ztrácejí:

  • na virtuálech je zbytečný mdadm, tj. zjistit přes virt-what, zda se jedná o virtuál, nastavit podle toho třídu a balík odebrat
  • konfigurace /etc/resolv.conf pres fcopy, pozor, nerozlisuje se zatim privátní (kolejní/voip servery - jak detekovat?) a veřejné
  • inteligentne nastavit /etc/openafs/cacheinfo (je treba upravit i v debconfu), nektere servery maji vlastni partition, jine ne, velikost cache musi mit velikost maximalne do cca 90% prostoru/partition, jinak nenabehne klient, asi by bylo vhodne to delat pres debconf
  • obcas se stane, ze cf-serverd se zasekne (klienti posilaji hromadu mailu, ze se nemohou pripojit, pomuze vetsinou 'stop'; 'start'), mozna to vyresi nejaky rizeny restart (idealne vnitrnim mechanismem cfenginu) nebo verzovani konfiguracnich souboru, neslo by udelat pres git? obdobne jako $CVS$.
  • nainstalovat mcelog (projit konfiguraci), pripravit spolu se sondou do nagiosu
  • git na serveru by nemel jit z cronu, ale testovat se z cfenginu, v pripade uspechu se sam reloadovat, vcetne testu na cf-promises, inspirace zde a zde
  • spoustet pravidelne (1x tydne/mesicne) long smart test pres vsechny HDD/SSD. Detekce problemu/chyb: cfengine?/nagios?(hotovo)/smartd?
  • na serverech nastavit echo 0 > /proc/sys/kernel/hung_task_timeout_secs, kontrolovat podle hodnoty z /proc
  • pridat monitoring cfengine do nagiosu
  • v /etc/nagios/nrpe.cfg musi byt vsechny '^command[...]=...' zakomentovane
  • nrpe: hlídat aktualnost /etc/nagios/nrpe.d/zcu nebo nrpe_local.cfg, zrusit kopirovani pres cron a nahradit jej kontrolou cfengine, zaroven kontrolovat, zda se na afs verze nezmenila, staci na policy_hubu s reportem, aby napsal mail
  • /etc/default/rcS
  • hlidat, ze /etc/default/cfengine3 obsahuje start cfengine
  • do grubu (/etc/grub/...) pridat volby pro instalaci/shell z FAI, pouzivame distribucni jadro, tak by to nemel byt problem
  • hlidat ze v /etc/postfix/virtual je zaznam pro smerovani posty uzivatele 'root', pokud neni, pridat a zavolat postmap + reload server, pripadne /etc/postfix/go skript
  • kontrola, ze bezi mdadm --monitor a ze je aktivovana kontrola integrity sw raidu, pouze tam, kde se SW RAID pouziva (jinde odinstalovat?)
  • kontrolovat, ze na serveru nevisi neodeslane maily (nebude lepsi nagios sonda, tady nejde o konfiguraci ale spise o monitoring)
  • garbage, vymastit stare soubory v /var/cfengine/output/ uz to bylo nekde v cfengine od debianu nebo nekde jinde

Vize

  • nejak inteligentne usporadat konfiguraky, do adresaru? jak pojmenovat? inspirace?
  • jak udelat report, např. kde všude mame nekoho v /home/ ... napsat vlastni .cf a nejak vratit informaci na server, nasledne zobrazit treba pres web ... zkratka udelat takove prehledy
  • davat cfengine vsude (nejen do FAI:SRV), kde je wheezy, v soucasnosti do tridy TESTING, nutno vyrazne otestovat
  • vymena klicu pro baculu. Bacula pro overeni klienta vuci serveru pouziva "heslo", ktere je zapsane v konfiguracich, je vhodne, aby bylo pres vsechny stroje ruzne a v case se menilo, to lze v cfengine zaridit tak:
    • na bacula-serveru mit take zpristupneny masterfiles pro stahovani, do nej generovat info (klient-klic)
    • bacula-clienti si pres cf-agent z bacula-server stahnou informaci a upravit/opravit v nem heslo
    • ostatni konfigurace pro cf-engine je rizena z cf-serveru a to vcetne chovani cf3 na bacula-serveru