Se encendió la súper computadora

Ya ingresó en la etapa de pruebas el Centro de Computación de Alto Rendimiento (CeCAR), un desarrollo de características excepcionales para nuestro país que está instalado en el Pabellón I. En pocas semanas brindará sus servicios a todos los investigadores de la Facultad.

16 de septiembre de 2008

“Hoy estamos en una situación en la cual los científicos conocemos las ecuaciones que describen la dinámica de los sistemas, pero para obtener soluciones cuantitativas de esas ecuaciones necesitamos mucho poder de cómputo; por ejemplo, para hacer un pronóstico meteorológico a diez días”, señala el doctor en física Pablo Mininni quien, con Esteban Mockscos, del Departamento de Computación, comparte la responsabilidad de coordinar el funcionamiento del CeCAR, un centro de cómputos de la Facultad de Ciencias Exactas y Naturales diseñado específicamente para ofrecer alto poder de cálculo a todos los investigadores de la institución. “En el trabajo interdisciplinario esto es muy importante, porque cuando uno se comunica con otra área empieza a necesitar respuestas de tipo cuantitativo en condiciones realistas, y para eso hace falta procesar grandes cantidades de datos, o computarizar un alto número de operaciones, lo cual requiere de una elevada capacidad de cálculo”, completa Mininni.

Según los supervisores del CeCAR, “en menos de un mes se terminará con las pruebas”. Será entonces cuando los 224 microprocesadores de las 56 computadoras conectadas mediante una red de alta velocidad podrán trabajar en conjunto para -mediante lo que se denomina “cálculo paralelo”- resolver problemas de diversas áreas, como, por ejemplo, la geología, la biología, la astronomía, la química, o las ciencias de la atmósfera.

De Bocha al CeCAR

El primer cluster -conjunto de computadoras interconectadas- de importancia que tuvo la Facultad fue bautizado “Bocha” -“porque así le decían a Giambiagi”, acota Mininni- y fue el resultado de una presentación ante la Agencia Nacional de Promoción Científica y Técnica (ANPCyT) efectuado por los Departamentos de Física y de Computación. “En el 2003, cuando Bocha llevaba dos años funcionando, se empezó a trabajar para hacer una nueva presentación para renovar equipamiento, sobre todo porque empezó a crecer el número de grupos de investigación que necesitaba cálculo paralelo”, recuerda el físico.

Un pedido de subsidio con la firma de decenas de investigadores de varios departamentos dio como resultado un subsidio de 250.000 dólares del Programa de Modernización de Equipamiento (PME) de la ANPCyT. “El CeCAR es mucho más que un convenio entre dos departamentos, es un centro para toda la Facultad que está dirigido por un comité científico conformado por profesores e investigadores de distintas áreas”, observa Mininni.

Tareas incalculables

“Lo que siguió al otorgamiento del subsidio no fue fácil, porque armar un centro de cómputos para toda la Facultad involucra un sinnúmero de cuestiones, entre ellas y primero que nada, disponer de un espacio”, explica. El lugar otorgado por resolución del Consejo Directivo de Exactas para el funcionamiento del CeCAR está situado en la planta baja del Pabellón I, dentro del área que ocupa el Departamento de Computación.

La adecuación del espacio a las necesidades técnicas de un centro de cómputos de gran envergadura requirió, además, de una nueva instalación eléctrica: “Si el cluster se enciende completamente necesita de alrededor de 30 amperios, y como la Facultad estaba “corta” en cuanto a amperaje hubo que cambiar todo el cableado y el tablero, y eso demoró bastante la puesta en marcha del centro”, comenta Mininni, y añade, “también, hubo que pintar, cambiar el piso e instalar un aire acondicionado de 30 mil frigorías, lo que prolongó la demora”.

Conectividad de primera

El cluster del CeCAR tiene algunas características especialmente pensadas para las tareas de cálculo paralelo que va a desarrollar. Para empezar, el sistema posee una arquitectura de 64 bits en lugar de la clásica de 32 bits: “Esto permite acceder a muchos más números en memoria, multiplica la memoria que se puede usar por 4.000 millones”, puntualiza Mininni. Además, cada una de las 56 computadoras (nodos) tiene cuatro microprocesadores, lo que resulta en que el cluster tiene un total de 224 procesadores trabajando.

Pero la estrella del sistema es el tipo de conectividad por la que se optó, llamada InfiniBand, cuyo costo consumió la mitad del presupuesto. Por un lado, porque tiene un tiempo de latencia muy corto, es decir, demora muy poco para iniciar la “conversación” entre los nodos y, por otro lado, porque ofrece mucho ancho de banda a la conexión entre las computadoras. “Si la conectividad no es buena llega un momento en que se convierte en el cuello de botella, porque aunque los procesadores sean muy rápidos si, en comparación, la red es muy lenta, el cluster sólo puede aprovechar una fracción de los procesadores en forma eficiente. En cambio, con InfiniBand, se puede utilizar una cantidad creciente de procesadores sin que la red se convierta en el cuello de botella”, ilustra Mininni, y tiene una analogía, “si una empresa contrata más obreros pero no considera la logística para proveer de las materias primas a esos trabajadores, probablemente no mejorará su producción. Así, podría decirse que la conectividad es la logística del cluster, porque si se aumenta el número de procesadores sin considerar la conectividad, se están incorporando al sistema un montón de obreros bobos”.

División del trabajo

Continuando con la analogía, podría decirse que el cluster del CeCAR ofrece la posibilidad de repartir una tarea entre 224 trabajadores, y de manera eficiente. Así, por ejemplo, un proceso que, en una sola computadora, puede llevar meses, podría reducirse a días o, incluso, a horas.

Pero repartir una tarea no siempre es sencillo. En ciertos momentos, para poder continuar con su labor, algunos trabajadores necesitan saber en qué etapa de la faena está el resto de sus compañeros: “Si se quiere repartir entre varios trabajadores un problema que antes resolvía uno sólo, seguramente va a ser necesario que haya un diálogo entre ellos, que haya un intercambio eficiente de información, y para eso justamente, es muy útil la conectividad rápida que brinda el InfiniBand”.

No obstante, a la hora de dividir el trabajo, la conexión no es todo. También debe adecuarse la manera de resolver los problemas. Porque, muchas veces, ciertos algoritmos que habitualmente se utilizan para resolver ecuaciones mediante un sólo procesador no se pueden usar en forma automática en dos o más procesadores. “La mayoría de los problemas no son fácilmente paralelizables, porque algunos algoritmos en cierto momento te dicen que para poder continuar necesitan toda la información en todo el espacio, y eso se transforma en otro cuello de botella”, expone Mininni, “pero existen técnicas de programación que resuelven este inconveniente”, completa.

Trabajadores a prueba

En este momento, el CeCAR está “corriendo” simultáneamente cuatro aplicaciones de un total de siete que constituyen la etapa de prueba del cluster. Uno de los modelos que se está ejecutando describe la interacción Sol-Tierra. Otro, es un programa de modelado molecular que permite estudiar la dinámica de las moléculas; en este caso, para tratar de comprender cómo funciona una proteína determinada. “Es una proteína que está involucrada en procesos como el cáncer, y estamos tratando de estudiar cómo se mueve en el espacio y cómo interacciona con una droga que podría utilizarse para tratar esa patología”, explica Adrián Turjansky, uno de los impulsores de la creación del CeCAR.

Para mostrar la potencialidad del cluster, Turjansky da un ejemplo,“estudiar diez nanosegundos de la vida de una proteína con una computadora, analizar con una sola máquina qué le sucede a esa proteína picosegundo a picosegundo, durante diez nanosegundos, puede llevar meses, y con el cluster eso se puede hacer en pocos días”. Pero, como sucede cuando se intenta acceder a los rincones del mundo microscópico, o a lo más recóndito del universo, todavía hay fronteras que aun el cluster más poderoso es incapaz de atravesar. “Si quiero estudiar cómo una droga entra y sale de una proteína, eso ocurre en el orden de los milisegundos, y eso nadie lo puede simular hoy en día, ni siquiera con las computadoras más potentes que existen”, señala.

– ¿Y si se dejara funcionar el programa de modelado molecular durante largo tiempo, un año, digamos?

– Podría ver un posible camino por el cual la droga entró o salió de esa proteína. Sólo eso y una vez. Lo cual no dice mucho, porque se necesita analizarlo muchas veces, y de muchas maneras diferentes.

Horas de cálculo

A la manera de una impresora que administra sus trabajos pendientes, el cluster funciona con un “sistema de colas” de manera tal que, cuando un usuario “envía” un proceso, ese sistema administra las horas de cálculo que se hacen disponibles. “Hay usuarios que no van a necesitar todas las máquinas, entonces podrá haber quien use 100 procesadores, otro que use 50 y, en ese caso, si algún usuario te pide 50, va a haber espacio disponible”, ilustra Mininni, y agrega, “en cualquier caso, el usuario tiene que “correr” procesos con programas que puedan aprovechar el cluster”.

– ¿Cómo se establecen las prioridades?

– Para eso está la estructura del CeCAR. Los supervisores nos encargamos de los aspectos técnicos. Para evaluar las diferentes propuestas está el comité científico, conformado por representantes de cada departamento, que es quien asigna las horas de cálculo.

Trabajo futuro

Cuando comenzamos con este proyecto, casi nadie hablaba de InfiniBand, ni tampoco de 64 bits, y hoy, todavía, creo que este es el único cluster de Argentina con este tipo de conectividad”, consigna Esteban Mockscos.

En la actualidad, existen sitios de la web que proveen cálculo paralelo por medio de clusters. “Son los que permiten, por ejemplo, saber a qué otras proteínas se parece la que uno está estudiando. Lo que hacen es comparar la secuencia que uno les da con la de todas las proteínas conocidas, y eso lo hacen en pocos segundos por medio del cálculo paralelo”, señala Turjansky.

“Cuando se llega a ese nivel de especialización en cuanto al servicio que se brinda se habla de clusters dedicados”, señala Mininni, y opina, “hoy, en la Argentina, no llegamos a ese nivel, pero empezar a crear estos centros institucionalizados, como el CeCAR, es el primer paso. Porque se empieza a crear, alrededor de este tipo de centros, una comunidad que requiere del uso de súper cómputos y, a partir de ahí, comienzan a identificarse los actores, la gente que necesita de esos recursos, y eso, con el tiempo, permite ir planificando, tanto para hacer crecer el cluster como para elegir áreas prioritarias para las cuales puede hacer falta un cluster dedicado”.

Fuente: El Cable Nro. 699

Gabriel Stekolschik