Stalo sa, stane sa
Výpadok IPv6 10. 12.: V utorok 10. 12. došlo medzi 18:14 a 19:20 k výpadku IPv6 pre FI. Došlo k nemu kvôli problému v sieti univerzity a zrejme šlo o dôsledok plánovanej migrácie sieťových prvkov v rámci univerzity.
OOM Aury a nedostupnosť SSH 12. 12.: V stredu 11. 12. začalo o 23:56 dochádzať k dochádzaniu pamäte na Aure a výraznému celkovému spomaleniu práce s ňou. Z neznámeho dôvodu nezasiahli ochranné mechanizmy cgroups v podobe pamäťového kontroléra a nedošlo k ukončeniu problematického procesu cez OOM killer. Ručným zásahom o 00:46 sme cez sériovú konzolu nad rozhraním IPMI vyvolali OOM killer (Alt+SysRq+F
, respektíve ~-B-F
). Po tomto však ešte zostalo nefunkčné prihlasovanie cez SSH, ktoré sme napravili až o 11:38. Dôvodom bolo rozbitie služby SSSD (pravidelným čitateľom blogu nebude táto služba neznáma…), ktorá nie je veľmi tolerantná k takýmto veľmi spomaleným stavom systému a dochádza u nej k vnútorným timeoutom.
Skúšky v PC hale (B106): Plán skúšok v PC hale, a teda i jej dostupnosť na mimoskúškové využívanie, môžete nájsť v rozvrhu B106.
Infraštruktúra a hardvér
Príprava na rekonštrukciu: Záverom roka, i počas sviatkov, kulminovala menej viditeľná, ale dôležitá činnosť: preloženie dátovej siete pre B5 (s niekoľkodňovou nedostupnosťou siete) mimo oblasť, ktorá bude zasiahnutá stavbou (takéto odstávky sa budú v januári realizovať aj pre B2, B3, B4, C4, C5, ako bolo avizované mailom zamestnancom), demontáže Wi-Fi AP a kamier z krčkov budov B a C, a demontáž techniky z déčok. Tiež sme pripravovali kamery na časozberné video stavby (podobne ako v rokoch 2012–2014).
Učebňové stroje s Linuxom
Osadenie strojov v PC hale: Oproti pôvodnému plánu sú v PC hale nakoniec stroje Titan01–Titan24 a Nymfe01–75. (K 1/2025: viď plánik.)
Dualboot na Titanoch v PC hale: Ako už bolo avizované, na 24 Titanov v počítačovej hale bol doinštalovaný Linux, aby sme umožnili masové skúšanie. Vedľa A215 ide v túto chvíľu o druhú dualbootovú učebňu.
Linux v A215 na žiadosť: Učebňa A215 s dualbootom bude implicitne s Windows. V prípade potreby Linuxu je nutné oň požiadať; viď i poznámku miestnosti v ISe.
Softvérové vybavenie a prostredie
ghostscript na Aure: Na základe známok snahy o použitie sme na Auru nainštalovali ghostscript
.
Služby
Stratus.FI a rýchlosť úložiska: Pokračujúc v minulomesačnej snahe sme ako ďalší krok optimalizovali v Cephe deep scrubbing (kontrola zhody dát na troch replikách). Predĺžili sme (štyrikrát) požadovaný interval jeho opakovania a tiež sme obmedzili počet ich paralelných behov (bežia na úrovni placement groups, čo je relatívne malý segment dát a na jednom fyzickom úložisku ich býva niekoľko, takže v prípade súbehu viacerých kontrol na jednom fyzickom disku ho môžu viditeľne vyťažiť) na maximálne jeden. Vplyv tejto údržbovej réžie nie je priamočiaro vyhodnotiteľný (používateľské operácie totiž majú určitú rezerváciu a prioritu), ale minimálne pozorujeme výrazne nižšiu záťaž fyzických diskov (I/O utilization).
Kopírka SUPO v knižnici/študovni: Došlo k presunu kopírky SUPO do z PC haly do knižnice/študovne.
Nedostupnosť kopírok: Od 10. 12. je mimo prevádzky tlačiareň lj4p
a od 17. 12. kopírka copy2c (mala by byť opäť prístupná niekedy tento mesiac). U oboch sme zakázali prijímanie úloh na tlačovom serveri, aby ste ich tam omylom neposlali (a následne boli prípadne v neistote, či to eventuálne bude vytlačené).
Vyučujúci v rozvrhoch mapy miestností: V mape miestností sme doplnili u odkazov na rozvrhy aj zobrazovanie vyučujúcich.
Zmena vydavateľa certifikátov TCS: Pokiaľ by ste využívali certifikáty od služby TCS (GÉANTu/CESNETu), došlo k zmene certifikačnej autority zo Sectigo na grécku akademickú CA HARICA. Zo strany Sectiga sa nečakane začali črtať problémy s vystavovaním certifikátov.
Vedeli ste, že…
… (zdroje a kvóty v Stratus.FI) ak ste niekedy premýšľali nad konkrétnym významom niektorých podobne znejúcich kvót v Stratus.FI (viď záložku Quotas v nastaveniach), tak…
- CPU vs VCPU: CPU určuje očakávanú záťaž VM na jadrá procesora (desatinné číslo) a využíva ju plánovač pri nasadzovaní (inštanciovaní) VM na hosťovské uzly, zatiaľ čo VCPU (celé číslo) určuje počet vlákien, ktoré QEMU použije, a efektívne tým určuje počet virtuálnych procesorov (VCPUs) viditeľných zvnútra VM (dokumentácia), t. j. de facto počet využiteľných jadier hosťovského uzla.
- X vs Running X: Kvóta na X sa týka všetkých VMs, i nebežiacich (napr. stavy POWEROFF, UNDEPLOYED), keďže napr. i stav POWEROFF alebo SUSPENDED nejaké zdroje blokujú, plus zabezpečuje limit na počet zdrojov z hľadiska ich réžie (napr. aj z hľadiska možného DoSu) a kvóta Running X sa vzťahuje len na zdroje využívané bežiacimi strojmi, ktoré sú aktívne (napr. stavy RUNNING, HOLD, PENDING a CLONING).
… (Wi-Fi pre akcie) pokiaľ organizujete na FI akciu, je možné po dobu jej konania sprístupniť Wi-Fi sieť, či už po celej FI alebo len v nejakej časti? Viď dokumentácia Wi-Fi.
Záverom
Máte pripomienky, návrh na vylepšenie alebo jednoducho potrebu pochváliť nás? :-) Napíšte nám mail či využite IT ideas.
Ak vás tieto novinky zaujali, môžete si zapnúť sledovanie blogu a následne zapnúť posielanie mailových upozornení.