Noticias

12-11-2009 El clúster sufrirá una parada de 20.00 a 10.00 del día siguiente por operaciones de mantenimiento del suministro eléctrico.
28-7-2009

El viernes 31 de julio, el subclúster CMI pasará a funcionar en modo dedicado.

Durante el mes de agosto, el subclúster CMI pasará a funcionar con una única cola de 64 procesadores en vez de las colas 16 y 32 que están habilitadas en la actualidad.

14-4-2009

El Clúster de Modelización vuelve a estar operativo. La nueva configuración de los recursos del clúster se describe en detalle en la página web de la unidad:

http://cms.uniovi.es

Recomendamos a todos los usuarios consultar la información de las secciones de acceso, arquitectura, almacenamiento, sistema de colas y software, ya que se han introducido novedades significativas en todos estos apartados. Los cambios más importantes son:

  1. Nuevo nodo de acceso: cmi.uniovi.es
  2. Arquitectura: todos los recursos de cómputo y almacenamiento del clúster comparten la misma red interna
  3. Almacenamiento: el /home es común a todos los nodos y las particiones de la MSA1500 se han exportado a los nodos de calculo.
  4. El sistema de colas se ha unificado. La configuración inicial es:
    cola32 y cola16
    idóneas para calculo MPI en el nuevo clúster infiniband CMI.
    cola8
    para los nodos DL585 de CMQ.
    cola2 y cola2_express
    para los DL140 de CMD.
  5. Software: La versión por defecto de compiladores intel, librerías matemáticas y MPI ha cambiado. Se utiliza el paquete modules para controlar las variables de entorno de éstas y otras aplicaciones. Se anima a los usuarios de cálculos quimicocuánticos a probar códigos tipo NWCHEM, con un paralelismo MPI muy eficiente en la red Infiniband, dado que Gaussian no funciona en esta arquitectura.

Desafortunadamente, nuestros problemas con el funcionamiento del aire acondicionado no han desaparecido, ya que una de las unidades sigue presentando un funcionamiento anómalo después de haberse instalado el presostato. Una vez realizada una prueba intensiva de funcionamiento, hemos comprobado que las dos unidades que funcionan correctamente sólo garantizan una temperatura controlada para CMI, CMQ y la mitad de CMD. Por esta razón, la cola2 y cola2_express arrancan temporalmente con un límite de 15 trabajos (en vez de los 25 previstos), a la espera de resolver los problemas de funcionamiento del aire acondicionado.

2-4-2009

Las tareas de reorganización del Cluster de Modelización (actualización de SO en nodos de cálculo CMQ-CMD; configuración de una nueva red interna, reconfiguración de servicios de clúster, integración de CMI, actualización de sistema de colas, copia de datos, etc.) están próximas a completarse, aunque todavía quedan pendientes varias labores en los sistemas (configuración de modules y scheduler, optimización de NFS, etc), documentar todos los cambios y novedades (imprescindible para la puesta en marcha) así como la realización de diversas pruebas de comportamiento de todo el conjunto. Además, desde la semana pasada, una de las unidades de aire acondicionado está detenida por una fuga del gas refrigerante, estando a la espera de que el servicio de mantenimiento proceda a su reparación y a la instalación de presostatos en los tres equipos de aire acondicionado para optimizar su funcionamiento frente a bajas temperaturas exteriores y evitar la formación de hielo en las unidades internas. Para dar tiempo a completar las tareas pendientes y a la reparación de la unidad de aire acondicionado (sin la cual no es posible arrancar a todo el sistema), el servicio de la unidad se restablecerá a la vuelta de las vacaciones de Semana Santa.

Los datos de los usuarios están ya accesibles en los servidores cmq y cmd. Para conectar a los sistemas deben tenerse en cuenta las siguientes pautas:

  1. El nuevo sistema de almacenamiento está operativo, de modo que en el mismo /home cada usuario encontrará sendos subdirectorios home.cmq y home.cmd que contienen los datos de los antiguos /home de cmq y cmd.

  2. El sistema de usuarios ha sido unificado y todos los usuarios deben acceder a su cuenta, ya sea a través de cmd o cmq, empleando la password que tenían en el antiguo cmq.

  3. Los nombres de usuarios con más de ocho caracteres han sido truncados:

    Por ejemplo:

    siderurgia1 → siderur1
    ltoffolatti → ltoffola

    Por favor, consultad con el técnico de la unidad para cualquier aclaración o cambio.

25-2-2009

Clúster

  • Los clusteres CMQ y CMD vuelven a estar operativos una vez completadas las obras del acondicionamiento provisional del centro de datos de la unidad en el Campus de Mieres.

    Se han llevado a cabo las siguientes ampliaciones en CMQ y CMD:

    • Todos los nodos de calculo de CMD (DL140) poseen ahora 4GB de memoria RAM.
    • La capacidad del /scratch de los nodos de calculo de CMQ (DL585) se ha duplicado, siendo ahora de 200 Gb distribuidos en RAID0 en cuatro discos SCSI 15k.

    En las proximas semanas se completara la configuracion del nuevo sistema  de almacenamiento y del nuevo cluster de altas prestaciones. Por lo tanto, es  muy probable que a finales de Marzo realicemos una nueva parada, de unos pocos dias tan solo, con el objeto de constituir una nueva red interna que englobe a todos los equipos, reorganizar el almacenamiento y sistema de colas, y poner en produccion al nuevo equipamiento. Mientras tanto, CMQ y CMD prestaran servicio con la configuracion habitual.