LPS:CFEngine3/TODO
Z HelpDesk
Konfigurace
Věci, co bych chtěl do cfenginu zavést, ale papírky se mi ztrácejí:
na virtuálech je zbytečný mdadm, tj. zjistit přes virt-what, zda se jedná o virtuál, nastavit podle toho třídu a balík odebratkonfigurace /etc/resolv.conf pres fcopy, pozor, nerozlisuje se zatim privátní (kolejní/voip servery - jak detekovat?) a veřejné- inteligentne nastavit /etc/openafs/cacheinfo (je treba upravit i v debconfu), nektere servery maji vlastni partition, jine ne, velikost cache musi mit velikost maximalne do cca 90% prostoru/partition, jinak nenabehne klient, asi by bylo vhodne to delat pres debconf
obcas se stane, ze cf-serverd se zasekne (klienti posilaji hromadu mailu, ze se nemohou pripojit, pomuze vetsinou 'stop'; 'start'), mozna to vyresi nejaky rizeny restart (idealne vnitrnim mechanismem cfenginu) nebo verzovani konfiguracnich souboru, neslo by udelat pres git? obdobne jako $CVS$.- nainstalovat mcelog (projit konfiguraci), pripravit spolu se sondou do nagiosu
git na serveru by nemel jit z cronu, ale testovat se z cfenginu, v pripade uspechu se sam reloadovat, vcetne testu na cf-promises, inspirace zde a zde- spoustet pravidelne (1x tydne/mesicne) long smart test pres vsechny HDD/SSD. Detekce problemu/chyb: cfengine?/nagios?(hotovo)/smartd?
na serverech nastavit echo 0 > /proc/sys/kernel/hung_task_timeout_secs, kontrolovat podle hodnoty z /proc- pridat monitoring cfengine do nagiosu
- v /etc/nagios/nrpe.cfg musi byt vsechny '^command[...]=...' zakomentovane
nrpe: hlídat aktualnost /etc/nagios/nrpe.d/zcu nebo nrpe_local.cfg, zrusit kopirovani pres cron a nahradit jej kontrolou cfengine, zaroven kontrolovat, zda se na afs verze nezmenila, staci na policy_hubu s reportem, aby napsal mail- /etc/default/rcS
- hlidat, ze /etc/default/cfengine3 obsahuje start cfengine
- do grubu (/etc/grub/...) pridat volby pro instalaci/shell z FAI, pouzivame distribucni jadro, tak by to nemel byt problem
- hlidat ze v /etc/postfix/virtual je zaznam pro smerovani posty uzivatele 'root', pokud neni, pridat a zavolat postmap + reload server, pripadne /etc/postfix/go skript
- kontrola, ze bezi mdadm --monitor a ze je aktivovana kontrola integrity sw raidu, pouze tam, kde se SW RAID pouziva (jinde odinstalovat?)
- kontrolovat, ze na serveru nevisi neodeslane maily (nebude lepsi nagios sonda, tady nejde o konfiguraci ale spise o monitoring)
- garbage, vymastit stare soubory v /var/cfengine/output/ uz to bylo nekde v cfengine od debianu nebo nekde jinde
Vize
- nejak inteligentne usporadat konfiguraky, do adresaru? jak pojmenovat? inspirace?
- jak udelat report, např. kde všude mame nekoho v /home/ ... napsat vlastni .cf a nejak vratit informaci na server, nasledne zobrazit treba pres web ... zkratka udelat takove prehledy
- davat cfengine vsude (nejen do FAI:SRV), kde je wheezy, v soucasnosti do tridy TESTING, nutno vyrazne otestovat
- vymena klicu pro baculu. Bacula pro overeni klienta vuci serveru pouziva "heslo", ktere je zapsane v konfiguracich, je vhodne, aby bylo pres vsechny stroje ruzne a v case se menilo, to lze v cfengine zaridit tak:
- na bacula-serveru mit take zpristupneny masterfiles pro stahovani, do nej generovat info (klient-klic)
- bacula-clienti si pres cf-agent z bacula-server stahnou informaci a upravit/opravit v nem heslo
- ostatni konfigurace pro cf-engine je rizena z cf-serveru a to vcetne chovani cf3 na bacula-serveru