Whatsapp

SLURM-Un manager de sarcină de lucru conceput pentru clustere Linux de orice dimensiune

Anonim

Slurm care reprezintă (Simple Linux Utility for Resource Management)este un manager și un planificator de job grozav, puternic, modular și open source, construit pentru cluster-uri Linux de orice dimensiune. Slurm este un sistem de gestionare a clusterelor și de planificare a lucrărilor cu toleranță la erori și foarte conectabil, cu multe plugin-uri opționale pe care le puteți utiliza. Oferă gestionarea sarcinii de lucru pe mai multe computere puternice și centre de date din întreaga lume.

Principalele funcții ale Slurm

Slurm are trei funcții majore, în primul rând alocă acces exclusiv și/sau neexclusiv la resurse utilizatorilor care doresc să lucreze pentru o anumită perioadă de timp. În continuare, Slurm folosește un cadru care ajută la pornirea, executarea și monitorizarea lucrărilor pe un set de gazde alocate într-un cluster, iar funcția sa finală este aceea de a controla utilizarea resurselor prin gestionarea unei cozi de lucru în așteptare.

Funcții unice pentru Slurm

Puteți găsi o mulțime de manageri de sarcină de muncă acolo, dar Slurm are multe caracteristici unice care îl diferențiază de alți manageri de sarcină de muncă și aceste caracteristici includ:

Arhitectura Slurm

Sistemul Slurm se bazează pe un manager centralizat, slurmctld care monitorizează diferite resurse și lucru și poate include un manager de rezervă responsabil pentru protejarea stării sistemului în cazul oricărei defecțiuni. Fiecare gazdă de pe cluster are un slurmd daemon care este comparat cu un shell la distanță și primește lucru, îl execută, returnează starea și apoi așteaptă ca mai multă muncă să fie executată, demonul permite, de asemenea, comunicarea tolerantă la erori în ierarhia de configurare a sistemului. Există, de asemenea, un opțional slurmdbd(slurm database daemon) folosit pentru a înregistra informații contabile din mai multe clustere gestionate de Slurm într-o singură bază de date. Despre arhitectura completă puteți citi de pe aici

Mai jos este o imagine care arată diferitele componente ale sistemului Slurm

Componentele sistemului Slurm

O imagine care arată diferite entități ale sistemului Slurm

Entități de sistem Slurm

Citește clientul mărturii despre Slurm. Poate doriți să verificați și să încercați sistemul Slurm de gestionare a clusterelor și de programare a locurilor de muncă dacă lucrați cu clustere Linux de orice dimensiune. Pentru orice informații suplimentare, vă puteți lăsa aici părerile despre Slurm, lăsând un comentariu în secțiunea de comentarii de mai jos.