D 2014

The Performance of the Czech National Grid Infrastructure after Major Reconfiguration of Job Scheduling System

KLUSÁČEK, Dalibor a Šimon TÓTH

Základní údaje

Originální název

The Performance of the Czech National Grid Infrastructure after Major Reconfiguration of Job Scheduling System

Autoři

KLUSÁČEK, Dalibor (203 Česká republika, domácí) a Šimon TÓTH (203 Česká republika, garant, domácí)

Vydání

Karków, Poland, Cracow Grid Workshop 2014, od s. 65-66, 2 s. 2014

Nakladatel

Academic Computer Centre CYFRONET AGH

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/14:00073986

Organizační jednotka

Fakulta informatiky

ISBN

978-83-61433-10-1

Klíčová slova anglicky

queue reconfiguration; multi-resource fairness; plan-based scheduling

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 27. 4. 2015 13:16, RNDr. Dalibor Klusáček, Ph.D.

Anotace

V originále

This work describes the outcomes of a large reconfiguration of the job scheduling system used in the Czech National Grid MetaCentrum which has been done in January and July 2014. MetaCentrum serves to various users and research groups. It is very important to guarantee that computational resources are used efficiently and in a fair fashion with respect to different users. With the significant growth of MetaCentrum (1,500 CPU cores in 2009 vs. 10,000 CPU cores in 2014) we recently had to revise our scheduling approaches to better reflect the increased size of the system and the growing heterogeneity of hardware resources and users' workloads. This revision took place in three major steps through the year 2014. First of all, new multi-resource aware fair-sharing algorithm was deployed, in order to improve fairness with respect to growing heterogeneity of resources and users demands. Second, large queue reconfiguration was done, in order to decrease resource fragmentation and improve utilization. Finally, new plan-based job scheduler enabling schedule optimization has been deployed in July 2014, currently managing 5 large computer clusters with 4500 CPU cores.

Návaznosti

GAP202/12/0306, projekt VaV
Název: Dyschnet - Dynamické plánování a rozvrhování výpočetních a síťových zdrojů (Akronym: Dyschnet)
Investor: Grantová agentura ČR, Dyschnet - Dynamické plánování a rozvrhování výpočetních a síťových zdrojů
MUNI/A/0855/2013, interní kód MU
Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace III. (Akronym: FI MAV III.)
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace III., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty