Daniela Rodríguez y Esteban Mocskos.
Daniela Rodríguez y Esteban Mocskos.

Servicio de cómputo, recargado

El Centro de Computación de Alto Rendimiento es un recurso compartido de la Facultad que permite “correr” aplicaciones de modelos numéricos en su cluster equipado con decenas de placas de video para cómputo.

21 de mayo de 2019

 

Para obtener resultados, los científicos necesitan hacer muchos cálculos, a veces demasiadas. Tantas que deben recurrir a súper computadoras para que resuelvan por ellos la complejidad de las ecuaciones usadas para verificar cada hipótesis, cada teoría. El Centro de Computación de Alto Rendimiento (CeCAR) es, dentro de la Facultad de Ciencias Exactas y Naturales, la dependencia que presta servicios de cómputo avanzado de la más alta calidad, brindando soluciones a investigadores de muy diversas áreas.

Instalado en la planta baja del Pabellón 1 desde fines de 2008, el CeCAR se convirtió, desde entonces, en un referente nacional en HPC (High Performance Computing) o cómputo de alto desempeño y cálculo paralelo. Se trata de un cluster –un conjunto de computadoras que funcionan en red– que “corre” aplicaciones de modelos numéricos que permiten simular desde el funcionamiento de una proteína hasta la interacción entre la Tierra y el Sol o cualquier otro fenómeno cuya comprensión involucre un considerable poder de cálculo.

“Desde 2008 pasaron muchas cosas. Inicialmente, logramos tener un equipo que era único en el país y en la región, no por su tamaño sino por su tecnología, muy innovadora para ese momento, especialmente en la conectividad de la red. Ahora, a partir de la obtención de otros subsidios y los aportes de investigadores que lo utilizan, encaramos una readecuación del equipo que, otra vez, vuelve a tener características muy competitivas y se torna atractivo para muchos investigadores –explica Esteban Mocskos, doctor en Ciencias de la Computación, investigador del CONICET y uno de los responsables del CeCAR–. Fundamentalmente, porque dispone de una gran cantidad de placas de video para cómputo, que es un requisito central para desarrollar programas de inteligencia artificial. Las GPU (unidades de procesamiento gráfico) son la herramienta de procesamiento de grandes volúmenes de datos que hoy usan las grandes compañías como Google o Microsoft. Lo que se conoce como machine learning requiere mucho poder de cómputo y, por lo tanto, muchas placas de video. Hacia allí orientamos las últimas adquisiciones para nuestro cluster. Teníamos claro que por ahí venía la demanda y no nos equivocamos. El equipo del CeCAR es hoy uno de los más importantes del país por la cantidad de esos dispositivos disponibles.”

El cluster del CeCAR tiene unas 40 placas de video, en su mayor parte nuevas, que permiten brindar servicio a una amplia comunidad de investigadores, de un modo accesible y transparente. “Eso podemos decirlo con cierto orgullo. Cuando en 2010 se constituyó en todo el país el Sistema Nacional de Computación de Alto Desempeño, buscando englobar a todos los centros de cómputo, de alguna manera, la política de apertura del CeCAR fue extendiéndose a todo el sistema público. Nuestra filosofía es fomentar las facilidades compartidas, dentro de la Facultad, para quienes lo necesiten, investigadores y también estudiantes. Se comparte lo que hay. Desde luego, el uso del servicio debe estar vinculado a un aporte científico, a un proyecto educativo o formativo, sin fines de lucro”, puntualiza Mocskos.

No hay fondos específicos para el CeCAR, salvo un administrador part time que solventa la Facultad. Y es necesario readecuar permanentemente los equipos. Por eso, a los investigadores que lo utilizan, se les pide un aporte voluntario que permita, por lo menos, adquirir repuestos, hacer mantenimiento y sustentar en el tiempo la utilidad del equipamiento. Para los investigadores, el servicio les ofrece resultados ahorrándoles la necesidad de instalar, administrar o mantener infraestructura propia.

“Hay dos tipos de prestaciones –describe Mosckos–. El servicio de cómputo de alto desempeño, es decir, un montón de máquinas en red en las que el usuario puede ejecutar con gran eficiencia modelos numéricos que involucran muchas cuentas, lo que llamamos number crunching, en un cluster que ya tiene instaladas muchas de las aplicaciones que se usan en este tipo de equipamientos, básicamente, las que los usuarios requieren, siempre en un ámbito open source. La otra prestación que hemos venido desarrollando es del tipo nube. Se trata de una modalidad interactiva: la máquina del investigador corre el programa, hace procesamiento, visualización, lo que quiera, pero con el soporte del hardware del centro de cómputos y durante un tiempo determinado”.

Los principales usuarios de las prestaciones de cálculo del CeCAR son biólogos y químicos, porque necesitan correr aplicaciones complejas que requieren enormes flujos de cálculo. El machine learning también es un consumidor incipiente pero sostenido de este tipo de recursos.

“En mi grupo hacemos, entre otras cosas, análisis bioinformáticos a gran escala: ensamblados y anotación de genomas, predicción de estructuras de proteínas y modelado molecular. Todo eso requiere de cómputo intensivo”, explica Adrián Turjanski, director del Laboratorio de Bioinformática Estructural y usuario habitual del cluster. Y agrega: “Tener acceso al CeCAR nos permite llevar adelante nuestras investigaciones ya que es un servicio centralizado que está disponible siempre y es fácil de usar. Desde el genoma de la yerba mate al diagnóstico de enfermedades raras, ambos proyectos se realizaron en el CeCAR”.

Un comité académico, conformado por profesores e investigadores de distintas áreas, define cómo se administra el tiempo de uso del cluster y cómo se configura la ocupación de su capacidad de cálculo, en función de las necesidades de cada investigador. “Apuntamos a ampliar nuestra base de usuarios y, para eso, necesitamos comunicar cabalmente a los investigadores que este servicio, en tanto facilidad compartida, les soluciona un problema. En muchos aspectos simplifica sus investigaciones”, cierra Mocskos.

Se prevé que, en breve, el CeCAR se traslade de la planta baja del Departamento de Computación –donde funciona con una instalación eléctrica especial, con el amperaje adecuado, y un acondicionamiento de aire también concebido para mitigar las altas temperaturas que genera el cluster de computadoras– al nuevo edificio Cero + Infinito, donde seguirá ofreciendo su poder de cálculo a la comunidad científica de Exactas.

Exactas UBA