Stalo sa, stane sa
Nedostupnosť fakultnej MariaDB 24. 3.: V pondelok 24. 3., odhadom po 18:00, došlo k bližšie nezistenému problému s fakultným serverom MariaDB a zaseknutiu zápisových operácií. To eventuálne spôsobilo vyčerpanie počtu slotov na pripojenie k DB a od 18:31 bola teda táto DB nedostupná. Problém sa nám podarilo odstrániť o 19:25. Zasiahlo to niekoľko našich služieb a fakultných projektov, ktoré túto DB používajú.
PC hala cez skúšky jaro 2025: Výukové obdobie sa ani prehuplo do polky a už musíme spriadať plány na PC halu počas skúškového (ktoré začína v utorok 20. 5.). Aktuálne je v PC hale 68 skúškových strojov (a 6 Lun). Na prelome výuky a skúšok tam presunieme z C117 a C123 25 PC, čím počet navýšime na 93 skúškových strojov, takže prakticky zaplníme požiarnu/stolovú kapacitu miestnosti, podobne ako cez posledné skúškové.
Výmena klávesníc v C1: Raz za čas dostávame hlásenia o problematických klávesniciach. Napríklad tento mesiac sme menili dve, pričom v jednom prípade na nej nefungoval číselný riadok a ľavé Ctrl. Máme v pláne ich kompletnú výmenu na konci semestra, keďže často sú už čiastočne poškodené (viditeľné žily kábla pri USB koncovke). Ak by ste však narazili na nejakú akútne nefunkčnú, určite sa ozvite.
Infraštruktúra a hardvér
Nová UPS: Koncom mesiaca vošla do skúšobnej prevádzky nová UPS, ktorá bude vedľa doterajšej DUPS plniť rovnakú úlohu a zabezpečovať odolnosť niektorých dôležitejších spotrieb pred výpadkami. Viac snáď časom v dedikovanom blogovom príspevku.
Rozvrhové panely v C1: Na konci mesiaca sme uviedli do prevádzky rozvrhové panely pre nové PC učebne v C1.
Učebňové stroje s Linuxom
Nonstop prevádzka A219: Od 19. 3. sme A219 uviedli do nonstop prevádzky. Dôvodom sú požiadavky na možnosť nárazového využívania GPU aj pre domáce úlohy pred termínmi odovzdania, mimo výukové časy. Ide o testovaciu prevádzku, na základe ktorej ešte posúdime termín jej ukončenia a jej zmysluplnosť.
Nové učebňové manuály k Linuxom: V súvislosti s doťahovaním vecí okolo nových PC učební v C1 sme naše pôvodné manuály vynovili: previedli sme ich do angličtiny, do nového dizajnu, mierne sme revidovali text a doplnili sme QR kód, čo nám dáva flexibilitu ohľadne úpravy doplnkových informácií.
Problémy s výpadkami projekcie v C1: Po skoro detektívnom príbehu z minulého mesiaca došlo na konci marca k výmene všetkých trás HDBaseT v C1 z UTP na STP. Už u skôr vymenenej C123 sa ukázalo, že počet výpadkov rapídne ubudol, hoci sa k nám i tak dostala anekdota o jednom výpadku, po počuteľnom a asi zvlášť vypečenom výboji. Tiež sme prehodili skriňu katedrovej Nymfe74 so študentskou Nymfe80, aby na katedrovom stroji s obomi používanými grafickými výstupmi nebol mierne vykývaný port HDMI, ktorý sme tiež zmieňovali v minulom blogovom príspevku. Ale problémy zrejme spôsoboval len ojedinele.
Kontrola zapojenia káblov v A219: Na základe pár problémov v A219 sme skontrolovali a napravili zapojenie napájacích káblov, ktoré boli do monitorov/PC z nejakého dôvodu nie vždy úplne pevne zapojené.
Prvá a zatiaľ jediná deduplikácia /var/tmp
: Po zavedení XFS na /var/tmp
v A219 došlo k potrebe aktivovať deduplikáciu kvôli blížiacemu sa zaplneniu len na jedinom stroji – Nymfe98. Z 200 GB zväzku bolo pôvodné zaplnenie kapacity 171 GB redukované na 96 GB (56 %). Deduplikácia neprebieha automaticky na pozadí: vyvolávame ju vždy ráno pred výukou a, pre zaujímavosť, jej beh trvá v tomto prípade na NVMe disku okolo 5 minút.
Softvérové vybavenie a prostredie
Nymfy/Múzy a dotnet8
: Na žiadosť sme na Nymfy a Múzy doinštalovali (na Aise a Aure už dlhšie dostupný) balíček dotnet8
.
asciinema na Aise: Na Aisu sme doinštalovali asciinema – umožňuje nahrávanie a prehrávanie obsahu terminálu. Na podobné účely síce idú využiť i nástroje script
a scriptreplay
, ale asciinema
je používateľsky o čosi prívetivejšie.
podman-compose
na Aure: Pokus o sudo
prezradil niečiu snahu o inštaláciu podman-compose
na Aure. Balíček tam z nejakého dôvodu nebol, i keď rozhodne dáva zmysel, tak sme ho doinštalovali, aby bol dostupný (podobne ako na Nymfách).
Nové moduly unix@fi: idea-2024.3.4
Nové moduly od používateľov: cryptography-44.0.2
Problém s náhľadom Markdownu v IDEA: IDEA zas vyvádza. Na podnet vyučujúceho sme sa jeho nefunkčnosť pokúšali riešiť, ale napriek úsiliu nie úplne úspešne (vrátane pokusu o aktualizáciu modulového IDEA). IDEA na to využíva Chromium, ktorého zámok sa však po skončení IDEA neodblokuje a na inom stroji už Chromium nejde spustiť (a ako bonus o tom ani nenapíše žiadnu chybovú správu). Hrubým riešením je aspoň premazať cache ~/data/IntelliJIdea
.
Modulový Python 3 a „torch“: Na žiadosť sme kvôli výuke doinštalovali do aktuálne implicitného modulu s Pythonom 3 CUDA verzie balíčkov PyTorch (pôvodne v CPU verzii) a torchview.
Upozornenia pre zastarané moduly (gcc-10.2): Vzhľadom na známe problémy, ktoré môžu niektoré modulové balíčky upravujúce premenné prostredia ako PATH
alebo LIBRARY_PATH
spôsobovať, sme do prvého takého (gcc-10.2
) doplnili varovanie zobrazované pri module add
. To môže byť užitočné a informatívne, zvlášť ak je automaticky a potichu pridávaný cez inicializačný súbor shellu.
Zrušené logovanie kontajnerov do žurnálu: Kontajnery štandardne logujú správy do žurnálu, čo z pohľadu nás správcov nie je vždy ideálne: bez bližšej inšpekcie správ nejde vždy hneď spoznať, že ide o správy týkajúce sa len prostredia kontajnera, a také pre nás nie sú zaujímavé. Preto sme to implicitne vypli pomocou log_driver="none"
v /etc/containers/containers.conf
.
Služby
Skenery späť v PC hale: Od konca mesiaca sú v PC hale opäť k dispozícii skenery, a to pri strojoch Nymfe01 a Nymfe48.
Opatrnejšie posielanie niektorých mailov z FI von: Narazili sme na problémy pri posielaní pošty z fakultného poštového servera (@fi.muni.cz
), kde vzdialené poštové servery odmietali niektoré správy s nedoručenkou (… block list (S3150) …). Situáciu zrejme zlepšuje spomalenie posielania mailov na takéto poštové servery (Gmail, Outlook, Yahoo (áno, stále ešte žije)). Ide o ďalší doklad toho, že prevádzkovanie poštového servera, pokiaľ nie ste v pozícii jedných z najmocnejších, ale chcete s nimi komunikovať, nie je úplne jednoduché.
Plánovaný prechod na PHP 8.4 na weboch Aisy: V moduloch sme sprístupnili aktuálne vydanie PHP verzie 8.4 ako php-next
; viď i našu dokumentáciu PHP. Eventuálne budeme migrovať aj implicitný modul php
z verzie 8.3 na 8.4. Viď informácie o migrácii a zvlášť nekompatibilné zmeny.
Problém s Kerberom z Aisy/Aury na Anxura: Bolo nám nahlásené nefunkčné kerberizované prihlásenie z Aisy a Aury na Anxura. Problém zatiaľ nemáme vyriešený, ale máme rozpracovaný monitoring takýchto problémov. Ostatné smery bezheslového prihlasovania medzi strojmi Aisa, Anxur, Aura, Nymfe* sú funkčné. Dúfajúc vo vaše pochopenie je teda táto brána Anxura dočasne privretá.
Odolnejšie SSH na Anxurovi a Aise: SSH server má limit na počet „rozautentizovaných“ spojení a pri jeho prekročení dochádza k pravdepodobnostnému zahadzovaniu nových spojení, až po strop, pri ktorom dochádza k zahadzovaniu všetkých nových spojení (MaxStartups
) – teda efektívne k nedostupnosti SSH. Vzhľadom na výskyt takejto zahadzovacej udalosti 17. 3. sme skontrolovali výskyty takýchto udalostí na našich serveroch a tieto limity sme na Aise a Anxurovi zvýšili, keďže ide o servery, na ktoré sa prihlasuje pomerne veľa klientov. A ešte v prípade Anxura počúva SSH aj na portoch 80 a 443, čo vďaka webcrawlerom ešte zvyšuje šancu zahadzovania.
Fakultný web a technická dokumentácia
Tentokrát len k technickej dokumentácii:
Nymfe a Musa: Do dokumentácie sme doplnili niekoľko vecí:
- zmienku o nonstop prevádzke Nymfe03 (keďže má GPU),
- odkaz na troubleshooting prihlasovania,
- zmienku o umiestňovaní dát kontajnerov do
/var/tmp/containers
,
- zmienku o
nvidia-container-toolkit
a poznámku k používaniu nvcc
.
Reorganizácie učební a /tech/
: Prekontrolovali sme obsah našej technickej dokumentácie a po mnohých úpravách ohľadne PC miestností by už sme snáď mali mať všetky uvedené informácie správne.
Externé učebne: Na (autentizovanú) stránku sme doplnili už zmieňované IP adresy FAST VUT a sklikateľnili sme telefónne čísla.
Aura: Do dokumentácie sme pridali sekciu CUDA a nvcc a zmienku o podman-docker
.
Vedeli ste, že…
… (zwwwery na FI) Zverinec má viacero podôb a v nejakých existuje i na našom fakultnom webe?
… (účty v GitLabe pre externistov) poskytujeme možnosť výroby externých účtov GitLabu? Existujú len v GitLabe, môžu ich vyrábať zamestnanci a je možné prideliť ich správu aj skupine osôb. Nemajú síce plné práva ako majú účty v GitLabe pridružené k fakultnému účtu, ale pre bežné účely spolupráce s externistami sú postačujúce.
Záverom
Máte pripomienky, návrh na vylepšenie alebo jednoducho potrebu pochváliť nás? :-) Napíšte nám mail či využite IT ideas.
Ak vás tieto novinky zaujali, môžete si zapnúť sledovanie blogu a následne zapnúť posielanie mailových upozornení.