Monitoreo De Tareas

De usuarios.nlhpc.cl
Revisión a fecha de 11:48 10 jul 2018; Ecabrera (Discusión | contribuciones)

(dif) ← Revisión anterior | Revisión actual (dif) | Revisión siguiente → (dif)
Saltar a: navegación, buscar

¿Como listo las tareas?

Ejecuto el comando squeue para conocer por ejemplo el estado, tiempo de ejecución e identificador de los trabajos [SLURM]

[usuario@leftraru1 ~]$ squeue -o "%.15i %.6P %.8j %.20S %.11M %.11L %.20V %.2t %.10q %.4C %.2D %.7W %N " -S -t,-Q
          JOBID PARTIT     NAME           START_TIME        TIME   TIME_LEFT          SUBMIT_TIME ST        QOS CPUS NO LICENSE NODELIST 
       12863561  slims   test04  2018-07-08T13:57:53  1-20:25:20  1-03:34:40  2018-07-08T13:57:26  R        120   20  1  (null) cn109 
       12864082  slims   test02  2018-07-09T10:44:15    23:38:58  2-00:21:02  2018-07-09T10:43:51  R        120   10  1  (null) cn088 
       12865333  slims   test01  2018-07-10T17:16:38        0:00  3-00:00:00  2018-07-10T09:30:22 PD        120   10  1  (null)  
       12865334  slims   test06  2018-07-10T17:49:42        0:00  3-00:00:00  2018-07-10T09:38:13 PD        120   10  1  (null)  
       12865335  slims   test09  2018-07-11T07:42:16        0:00  3-00:00:00  2018-07-10T09:28:05 PD        120   20  1  (null)

¿Como conozco los recursos utilizados por mi tarea?

Conectándose al nodo

Ya que puedo entrar vía ssh al nodo de computo, puedo ejecutar distintos comandos:

[usuario@leftraru1 ~]# ssh cn109 usuario@cn109's password: [usuario@cn109 ~]# uptime

10:40:59 up 27 days, 16:46,  1 user,  load average: 17.04, 13.76, 13.09 #para conocer la carga del nodo, cuantos procesos por core existen actualmente

[usuario@cn109 ~]# htop

[[Archivo:Htop.png|200px|thumb|left]