CVT FI

RSS

Novinky, zajímavosti a změny v provozu počítačů, počítačové sítě, prezentační a další techniky na FI MU. Další informace jsou dostupné v Technických informacích na webu fakulty.

Pro hlášení problémů prosím kontaktujte příslušnou sekci CVT FI.

Informace o aktuálních problémech naleznete na stránce o výpadcích.

Vlastníci blogu: FI:unix@fi, FI:CVT FI
Starší příspěvky
Kategorie
Vlastníci blogu: FI:unix@fi, FI:CVT FI
Právo číst: kdokoliv v Internetu
Právo komentovat: kdokoliv přihlášený v ISu
6. 8.
2015

Uptime našich strojov

  • RSS
Zajímavé | 4 | 4
Mgr. Tomáš Szaniszlo (CVT FI MU), učo 359894
unix
O uptime strojov pod našou správou a včerajšom míľniku dvoch rokov bezvýpadkovej prevádzky servera Aisa.

Jedným z hlavných cieľov správcov strojov je dosiahnuť čo najväčšiu dostupnosť služieb na nich bežiacich a podstatným faktorom, na ktorom táto dostupnosť závisí, je uptime strojov. U kritických služieb je samozrejme možné vyhnúť sa výpadku služby použitím redundancie, avšak nie vždy je služba natoľko dôležitá, aby bola realizovaná redundantne, prípadne to môže byť z technických dôvodov náročné na realizáciu.

Dva roky Aisy

Dostupnosť našich strojov zaznamenala z hľadiska uptime pekný míľnik – serveru Aisa včera uplynuli presne dva roky od posledného bootu systému:

[root@aisa ~]# uptime
 13:17:01 up 731 days,  5:02, 11 users,  load average: 0.05, 0.03, 0.01

Vďaka tomuto je medzi strojmi, u ktorých je uptime sledovateľný, momentálne najdlhšie bežiacim strojom pod správou CVT. Jedným z faktorov, ktorý umožnil dosiahnutie tejto hodnoty, je prítomnosť dvoch redundantných napájacích zdrojov v hardvéri Aisy (viac o hardvéri), čo umožňuje dočasné prepojenie na záložný zdroj napájania v prípade plánovaných odstávok. Navyše počítačová sála ÚVT, v ktorej je momentálne Aisa umiestnená, zaznamenala pomerne dlhé obdobie bez výpadkov napájania.

Takýto dlhý uptime môže pôsobiť ako bezpečnostný risk, keď si uvedomíme, že štandardne je na opravu bezpečnostných chýb v linuxovom jadre potrebný reboot. Tomuto sa však dá vyhnúť pomocou živého zaplátavania systému počas jeho behu bez nutnosti rebootu, na čo u nás na dôležitých linuxových strojoch využívame systém Ksplice, a ostatné softvérove služby je samozrejme možné aktualizovať i za behu servera.

Uptime ďalších našich strojov

Ďalšími našimi strojmi, ktoré majú výrazne väčší uptime, sú dokumentový server k výstavbe FI (731 dní, virtuál na Aise), Jabber server (462 dní, virtuál na Aise) a server s linuxovými domovskými adresármi Anxur (341 dní). Okrem toho máme u niektorých switchov uptime vyše roka – najdlhší je u rozvádzacieho switcha sw1-b1 v dátových stupačkách pre budovu B s 489 dňami, u ktorého tomu prispievajú aj redundantné zdroje zapojené do dvoch napájacích vetiev (zálohovaná a nezálohovaná) pre minimalizáciu výpadkov. Ten je nasledovaný 422-dňovými neprerušenými behmi ďalších piatich switchov – zväčša ide o rozvádzacie switche v počítačovej sále ÚVT, kde bol doteraz hlavný uzol siete FI, a v budove C.

$ snmpget ... sw1-b1 sysUpTime.0
DISMAN-EVENT-MIB::sysUpTimeInstance = Timeticks: (4230022745) 489 days, 14:03:47.45

Plánované výpadky a sťahovanie

Za normálnych okolností by bol uptime mnohých našich serverov vrátane ISu vyšší, avšak počas týchto prázdnin prebieha sťahovanie do nového datacentra FI, ktoré je nutne spojené s resetom uptime a nedávno boli taktiež realizované práce na napájaní v budove B, čo opäť spôsobilo plánovanú odstávku počas víkendu. V rámci týchto presunov budeme musieť vypnúť aj Aisu, takže o tento pekný uptime čoskoro prídeme. Na druhú stranu, od týchto presunov si okrem iného sľubujeme navýšenie priestorových kapacít a zvýšenú spoľahlivosť chodu serverov vďaka výrazne redundantnému riešeniu napájania a chladenia v nových datacentrách FI a CERIT, o ktorom ste sa mohli dočítať v tomto blogu, napríklad v poslednom príspevku o napájaní.

Dosud nečteno0 komentářůpermalink
« Účinnost chlazení datacentra (8. 7. 2015 15:26) | Galéria FI MU a 3D prehliadka budovy » (24. 9. 2015 16:46)

Zatím žádné komentáře.