LPS:Letní odstávka

Z HelpDesk
Verze z 21. 8. 2017, 12:09, kterou vytvořil Svamberg (diskuse | příspěvky) (→‎ODS: aktualizace)

Zde by měl postupně vykrystalizovat seznam všeho, co budem dělat o velke profylaxi v létě.

Termín:
Út 15.8.2017 až Pá 18.8.2017 z rozhodnutí 6K/2016

Komu dát vědět:

  • CESNET e-mailem na support@cesnet.cz a to z důvodu:
    • MetaCentrum - clustery KKY v UI420b, vše co se týká UL011, licenční servery, AFS, kerberos, ...
    • Datové úložiště - vše ohledně UL011: konektivita, chlad, elektrika
    • Konektivita pro ostatni subjekty

Podmínky:
Datovou síť používanou pro interní telefony odstavovat v pracovní době jen na nezbytně nutnou dobu.

Vysvětlivky:

  • červěně (red): To co MUSÍ (kontrolovaně, z nějakéh důvodu) fungovat = klíčový provoz ZČU
  • oranžově (orange): Důsledek prací -> tedy to co nepůjde
  • zeleně (green): Pro úspěch provedené práce je vyžadováno
  • šedě (gray): Odloženo na menší profylaxi
  • tlustě (b): Práce nelze přesunout, protože je na to nasmlouvána externí firma nebo jsou k tomu jiné důvody, jako oznámení zákazníkům
  • přeškrnuto (s): Práce je úspěšně dokončena

Průběh odstávky je v RT#255944

Akce na celou odstávku

  • Problematika zajištění provozu klíčových služeb ZČU (to co musí chodit)
    • Spisová služba: Je nutno zajistit provoz mezi 7-9hod ranní, kdy se přebírá pošta. Závisí na: síti, eris.zcu.cz, webauth, LDAP, db ESPIS, ESPISTST. Kontakt: S. Brož
    • IP telefonie: Standard. Kontakt: L.Šmíd
    • Menza (iskam) - v době odstávky je uzavřena, ale beží koleje, neplánované mimořádnosti ovlivňující iskam dát vědět, kontakt: S. Brož.
      • Aktuálně v úterý: Ahoj do utery 15.8. By meli delat rezervace znas to ze studenti to nechavaji na posledni chvili.

Pondělí 14.8.2017

  • V pondělí není odstávka! Je to čas určený pro přípravu.

Úterý 15.8.2017

PIS

  • až se dodělá všecko co se týká pole, tak začít s migrací VERSO na UTF8

KPS

  • Upgrade/sjednocení verzí NX-OS v datacentových switchích Cisco Nexus (CIV, NTIS)
    • Součinnost s Oldou při přesunu FC switchů
    • Dopady: výpadek všech serverů v DC IC UI420 a DC NTIS US013

ODS

  • upgrade Xen dom0 serveru na debian stretch - pozor na virtualy s Windows!!! [List] Zbytečná práce, budeme převádět do cloudu
  • upgrade databazovych serveru na debian Stretch: db*, amphy2, pelops, atreus, tantalos, tantalos-test, nioba [PIS, List]
    • chybi systemd-networkd: db*, amphy2, pelops, atreus, tantalos, tantalos-test, nioba [List]
  • upgrade kraken-bacula, preliti databaze trva 2 dny! [Olda]
  • bootes.zcu.cz se vypne a uz se nezapne [dex/Martin] Odloženo na podzimní odstávku
    • licence prevadime na bootes2 nebo lm64 [Milos Mulac]
    • prestanou fungovat licence, pro ktere majitele vcas nedodaji nove licencni soubory pro nove licencni servery
  • diskové pole
    • přesun polic starého diskového pole fc-p1-a - nic neovlivní [Olda, Libor]
    • přesun FC switchů do vedlejšího racku - podle úvahy, postupný výpadek fabriců [Olda, Libor]

ISS

Středa 16.8.2017

PIS

  • migrace VERSO na UTF8
  • upgrade demo na 12c rel 2
  • zrušení stagt11g
  • vytvoření stagt122

KPS

ISS

ODS

  • upgrady stroju squeeze -> wheezy -> jessie -> stretch
    • amor3
    • netflow
    • netdiscover
  • ZRUŠENÍ serverů s Debian Lenny:
  • upgrade rdkd2,3 wheezy -> jessie -> stretch (pozno posunout) [Olda,List]

Čtvrtek 17.8.2017

ODS

  • upgrady stroju jessie -> stretch
    • apate-ch, apate-pc, cetus, salvator2

KPS

PIS

Pátek 18.8.2017

Předběžný konec změn ve 12:00 - následuje kontrola služeb uživateli, koordinace v samostatném RT#255944

PIS

  • migrace VERSO na UTF8
  • převedení databází na samostatné uživatele
  • upgrade demo na 12c rel 2
  • vytvoření stagt122

ODS

Sobota, neděle

Pouze jako rezerva, snaha je udělat vše v průběhu pracovního týdne. Odstávka je vyhlášená i na víkend, možno využít.

Seznam nezařazených prací aneb možno provést kdykoliv

LPS

  • Windows
    • vypnout a přejmenovat ourea31 -LAPS
    • přidání hdd do hyperion3
      • úprava raid
      • použítí ReFS?
      • úprava zálohování
    • update a reboot všech windows serverů = Opakované výpadky služeb na Windows srv.
    • Zrušení Windows server 2003,2008
      • Bootes, Valhalla, Odin, Zephyrus
      • Hyperion 1
        • přesun produkce na hyperion 3
        • ostatní na hyperion 2
        • zrusit
    • Přání:
      • přesun iskam na iskam-new a iskam-zaloha -bude případně přiřazeno na určitý den
      • příprava zeus-db-new
  • Alfresco
    • Update na novou verzi
    • Snad už konečně funkční CUL
    • Pokud se stihne dodělat a otestovat tak i online editace v prohlížeči


KPS

  • Výměna přepínače v Menze 24 portů -> 48 portů
    • Dopady: Výpadek Menzy
  • Konfigurace BGP communities pro zapojení FW FortiGate v transparentním režimu do CESNETu
    • Dopady: Žádné
  • Sjednocení MTU na páteři
    • Dopady: krátkodobé výpadky částí sítě (konvergence OSPF)
  • Spanning Tree primary a secondary root na páteřních přepínačích/směrovačích
    • Dopady: krátkodobé výpadky konektivity v dané lokalitě (konvergence STP)
  • Konfigurační úpravy bezdrátové sítě
    • Dopady: krátkodobé výpadky bezdrátové sítě

ODS

PIS

Kdokoliv

  • čistka v lednicích RC a jednotlivých patrech [marek & čepi]
  • deratizace různých zákoutí RC [marek & čepi]

Rušené služby, servery

Servery:

  • portal3
  • shib-old
  • bootes - odloženo na podzimní odstávku
  • janus
  • aeneas - vypnutý už dlouho
  • portal4 - převedeno na virtuál, uvolněn HW
  • secweb, zalohu kraken:/mnt/data8/zalohy_stroju/
  • doc-old.zcu.cz (ichthys2)
    • zazalohovat - zustalo v LVM na xenech, jako cold-backup
    • vypnout, časem zrušit
    • opravit dokumentaci (zrusit odkaz na read-only verzi)
  • hucan, hucan2, hucan3, hucan4

Poznámky do plánu na rok 2017

  • udělat na závěr komplexní a nezávislé testy aplikací a služeb (SUP, SIS), předběžně v pátek od 12:00, synchronizace přes RT#civ
  • upravit formulace o dostupnosti služeb (výpadky telefonie)
  • chybí nám v některých případech jednoznačné určení správce služby (kdo dokáže ověřit chod, plánovat odstávku, kontaktovat servisní firmu, informovat "své" uživatele...)
  • služby, které mají být dostupné nejlépe bez výpadků
    • ISKAM včetně webu a autentizace (zápis studentů na koleje) - výpadky dohodnout se Standou Brožem
    • bázové služby
      • síť
      • AAA služby
      • telefony

Poučení z krizového vývoje anebo poznámky pro rok 2018