Usuarios NLHPC

De usuarios.nlhpc.cl
(Redirigido desde «Página principal»)
Saltar a: navegación, buscar

Información para nuevos usuarios

Esta es el wiki de usuarios de Leftraru, el clúster HPC del NLHPC. Aquí encontrará información útil para:

  • Ingresar al clúster
  • Descripción del hardware
  • Lanzar tareas en el gestor de colas Slurm
  • Preguntas Frecuentes

Recursos computacionales de leftraru

Leftraru cuenta actualmente con 5 particiones: slims, debug, general, largemem y gpus.

Las caracterísiticas de estas particiones pueden encontrarse en Recursos Computacionales NLHPC

Creación de cuentas

El proceso de creación de cuentas es relativamente fácil. Para poder crear una cuenta debe seguir las instrucciones del siguiente enlace y luego postular a una cuenta rellenando información en un formulario online.

Software instalado en el Clúster

Leftraru cuenta con una amplia gama de software.

Para saber el software que está instalado en nuestro clúster, vaya al siguiente link: Lmod

Tenga en cuenta que el NLHPC no entrega licencias de software, por lo que es responsabilidad de cada usuario o grupo de usuarios el adquirir estas licencias.

Accediendo a Leftraru

Leftraru está basado en Linux, por lo que opera mediante SSH y un gestor de colas. Puede conectarse e interactuar con Leftraru en la siguiente dirección “leftraru.nlhpc.cl”, utilizando un cliente SSH que lo llevará a uno de nuestros cuatro nodos de acceso. Si utiliza screen, le recomendamos tome nota en algún lugar el nombre del nodo en el cual ejecutó screen (leftraru1, leftraru2, leftraru3 or leftraru4), y cuando desee chequear el estatus de su trabajo, simplemente escriba: “ssh nombre_del_nodo” desde cualquier node de acceso, por ejemplo, si abrió ssh en leftraru3 y ahora está conectado a leftraru1, deberá escribir: “ssh leftraru3” y será capaz de recuperar su sesión en screen. Puede encontrar mayor información en Tutorial de acceso a Leftraru via SSH. Para facilitar la copia de archivos en Leftraru, vea el Tutorial de acceso a archivos

Slurm, sistema de gestión de colas

Leftraru utiliza Slurm como gestor de colas. Slurm es un gestor de trabajos que provee de un framework para encolar trabajos, asignación de nodos de cómputo, reserva de tiempo de CPU, ejecución y gestión de trabajos dentro de clúster. Nuestros nodos de cómputo se encuentran divididos en particiones Slurm, dentro de las cuales los usuarios pueden ejecutar sus trabajos.

Para ver más información acerca de cómo trabajar con Slurm en Leftraru, por favor visite el tutorial de ejecución de tareas dentro de Leftaru.

Lustre, sistema de archivos distribuido

Lustre es un conocido sistema de archivos distribuido de alta disponibilidad que permite usar una red de computadores para construir un espacio de almacenamiento amplio, escalable y mantenible en el que se pueden definir cuotas de utilización por usuario.

Lustre es open source, pero debido a su envergadura y dificultad para constituirlo, se ha optado por contratar una solución privada (a la empresa DDN) que incluye tanto infraestructura como configuraciones optimizadas de tal manera de contar con una opción de almacenamiento acorde a las necesidades del NLHPC.

Limitaciones y excepciones

A pesar de tener muchas características sobresalientes, y en pos de aumentar el rendimiento de la lectura y escritura de archivos, Lustre no permite bloquear un archivo (file locking en inglés). Esto implica que muchos de los motores de bases de datos más conocidos (MySQL, Postgres, etc.) e incluso algunas aplicaciones que hacen uso de esta característica no funcionen o se caigan en su ejecución. Se recomienda realizar esa parte del trabajo en su computador local o en espacio de almacenamiento local de algún nodo de cómputo (/tmp por ejemplo) para después consolidar en el espacio distribuido de Lustre.

Tutoriales

Tutorial de acceso a Leftraru via SSH

Ejecución de tareas dentro de Leftaru

Presentación uso Leftraru

Escalamiento de Aplicaciones

Monitoreo De Tareas

Recetario de Software