Maximiliano Camporino – Grandata


Irse de Exactas sin irse de Exactas

Después de que Agustina Pose inaugurara el Pabellón I, Maximiliano Camporino hizo lo tuyo, abriendo para las charlas el continente de las matemáticas. En una fría mañana de agosto, volvió al que fuera durante mucho tiempo su lugar de estudios con un objetivo claro: «vengo a contarles un poco cómo fue mi camino”.

Como otras anteriores del ciclo, la de Maximiliano es una historia del despertar de una vocación y no la de un destino previsto: “hice la licenciatura acá, en matemática pura y después un doctorado en teoría de números. Por ahí no tiene mucho que ver con lo que hago ahora, pero de alguna forma todo ese proceso te va preparando para la resolución de problemas”. Lo más importante, asegura, no es tanto un conocimiento puntual sino más bien adquirir forma de razonar: “la formación te ayuda a aprender a pensar de otra forma. Yo desde las olimpiadas de matemática, en la secundaria, empecé a agarrar el gusto por resolver problemas”

En 2015, terminando el doctorado, comenzó a sentir que lo suyo no iba por ahí: “me empezó a pasar que no me cerraba el día a día del trabajo de la academia. Cuando entré sí decía “quiero ser investigador”, pero después de 5 años empecé a pensar que yo no estaba del todo hecho para ese trabajo”. Así que su mirada se corrió de lugar: “empecé a averiguar un poco qué había ahí afuera. Ariel Pacetti, que fue mi director, me orientó sobre con quién hablar… Y terminé cayendo en Crisil”. En la empresa estaban él y otro graduado de Exactas, Manuel Maurette, “quien había empezado a armar un grupo de gente de acá. Así que yo como que me fui pero con un poco de trampa, porque caí en un lugar donde éramos 14 personas, casi todas con doctorado en física y matemáticas”. Quizás por eso, piensa, la transición no fué tan brusca: “estaba como en un híbrido raro, porque era una empresa privada pero yo estaba en un departamento de matemáticas… Era una atmósfera bastante académica. Pero la mitad de la empresa hacía financial research… Ahí había más economistas y la actividad era más econometría”.

«Era como hacer una materia optativa, pero por primera vez ví algo profundo de matemáticas aplicada a algo bien concreto»

Su puesto allí no se parecía demasiado al actual (“lo que hacía en Crisil no tenía tanto que ver con datos ni Big Data. Eran más bien tareas de finanzas. Hay bancos que tercerizan sus mediciones de riesgos en activos financieros y ese banco, curiosamente, quería gente con doctorado. Ese era el requisito y así fue que entré yo”), pero de todos modos supo aprovecharlo: “fueron meses de aprender algo nuevo, y también tenía elementos de matemáticas. Análisis estocásticos y cosas así… Era como hacer una materia optativa, pero por primera vez ví algo profundo de matemáticas aplicada a algo bien concreto”.

“Entretenerse con lo uno se hace”

Durante gran parte de la carrera, afirma Maximiliano, no pensaba hacer nada alejado al camino señalado: “quería hacer un doctorado, un posdoc, lo de siempre… Fue en los últimos años que vi que no era lo que quería. Pero me llevó tiempo verlo… Es que son muchos años de estudio con un objetivo… Y de repente pensar que querés hacer otra cosa…”, reflexiona.

Ya buscándola, la chance llegó: “apareció la oportunidad por una chica que trabajaba ahí y terminé haciendo data science, que sería algo así como ciencia con datos…”. «Ahí» es donde está ahora, GranData, y data science es casi sinónimo de BigData: “que es recopilar y analizar grandes volúmenes de datos, interpretarlos y producir información con valor social o comercial”. Hasta entonces, casi no había escuchado hablar de términos que hoy domina con holgura y maneja casi a diario, como machine learning (“que sería ‘aprendizaje automático”, traduce).

Más allá del incentivo económico y el desafío profesional, remarca que también se decidió a irse GranData porque pensó que se entretendría  : “durante casi 10 años a los matemáticos nos enseñan a resolver problemas, así que si no hay problemas el laburo se me hace medio embole… En ese sentido, lo que hago ahora me gusta más que lo que hacía antes”. Y como cree que en el ámbito privado cada empresa tiene sus problemas “que son específicos y acotados, cuando uno cambia de sitio siempre está un poco este síndrome del ‘juguete nuevo’, que te mantiene entretenido”.

Dice que a pesar de haber cambiado de empresa, tiene «la suerte» de seguir en un ámbito científico: “donde estoy sigue siendo un ambiente parecido a Exactas. Somos matemáticos, físicos y computadores… Y en la otra mitad de la empresa, donde hacen software, son ingenieros y programadores. No son todos de Exactas. Hay físicos del Balseiro… pero de forma una comunidad muy semejante entre sí”.

Una asistente quiere saber cuál es la distribución de género data science. Risas, y hay quienes se dan vuelta para mirar de quién viene la pregunta, que Maximiliano no esquiva: “es parecida a la de la ciencia, en general… Cuando entré éramos 8 hombres y 2 mujeres. Luego una se fue al exterior y quedó una sola. Y en Desarrollo, que son todos computadores, al principio eran todos hombres y ahora hay una chica… No sé cuál es la explicación, pero sí…”, admite, reconociendo que existe el sesgo de género. Casi en seguida, otra consulta punzante cruza el aula: “de alguna manera, por lo que contás, pareciera que tu trabajo es investigar las preferencias de la gente y ayudar al gran capital a inducirla a consumir. Quería saber ¿cómo ves vos eso?”. Maxi piensa unos segundos y suelta un “sí…”, que queda suspendido en el aire. Silencio… y más risas. Aprovechando la pausa, quien había preguntado sigue: “es que en matemáticas como que no hay moral, ¿no?”. Risas más fuertes. Otra persona le contrapone su visión: “Bueno… Toda la información se aplica hoy a la industria, así que incluso todo lo que investigues acá… va a ser usado en tu contra”. Maximiliano espera a que termine el intercambio y finalmente señala: “toda posición es válida”, y expresa su posición: en su trabajo, como en todos, hay cosas que gustan más y otras que gustan menos. Y pasemos a otros temas…  

París – Francia + Inglaterra = Londres

El invitado da una descripción global de su trabajo: “lo que hacemos es darle información al banco para que sepa a quien probablemente le interese más sacar una hipoteca o un préstamo…”. Ante este comentario, desde el fondo llega otra intervención: “yo hablé con un economista, que también era físico, y decía que le parecía que otras carreras, como computación o física, daban una mejor preparación para esto de producir modelos matemáticos para predecir comportamientos”. Maximiliano asiente, y dice es difícil precisar cuál es la formación más adecuada para hacer lo que él hace.

Es que no resulta fácil, afirma, definir a qué campo pertenece el Big Data: “es difícil decir qué define a un data scientist. En principio, todo lo que sea tomar valores a partir de métodos científicos cae en la bolsa de ciencia de datos; básicamente abarca cualquier tarea con datos a la que le apliques un procedimiento científico”. Dice que hay una frase que resume esta ambigüedad: “un científico de datos es alguien que sabe un poco más de estadística que un programador y que programa un poco mejor que alguien que hace estadística. Es una mezcla entre estadística y computación”. A esta suerte de indefinición se debe que hoy trabaje de científico de datos gente que se dedica a muy diversas disciplinas: «economistas, computadores, matemáticos, sociólogos… Es muy amplio. Pero estadística y desarrollo de software son las dos patas principales».

«es difícil decir qué define a un data scientist. En principio, todo lo que sea tomar valores a partir de métodos científicos cae en la bolsa de ciencia de datos»

Quizás se deba a esta transversalidad el hecho de que el campo esté en constante expansión: “el primer modelo de análisis matemático es de los ’60”, explica, “y de ahí no ha parado de crecer”. Uno de los últimos avances en la materia es que una computadora haga cosas que para un ser humano serían muy fáciles: “por ejemplo, que pueda mirar una foto y decir que es un pájaro… La simple operación de reconocer imágenes” (hace una demostración en la computadora: sube una foto de Messi y una voz dice: “fútbol”). Pasa a otro ejemplo (“uno clásico”, dice «de pregunta que se espera que un ordenador responda»): “¿qué queda si a París le saco Francia y le sumo Inglaterra? Londres”. El concepto que está en el fondo de estos programas y operaciones, dice, es el de «redes neuronales artificiales”, y para ilustrarlo abre un powerpoint y ofrece muchos ejemplos más:

Uno: “conocí un grupo que procesaba comentarios de un foro de pacientes psiquiátricos, intentando taggearlos”. Risas en el auditorio.

Otro: abre el traductor de google: «ésto últimamente mejoró mucho. Lo que hay atrás es mucho machine learning; es decir, gente subiendo datos y mejorando los modelos para cruzarlos”.

Otro más: abre el multimedia y aparece un video de un auto en marcha, sin conducción humana: “también aquí hay una máquina que está viendo qué pasa y tomando decisiones. Es una computadora que tiene que aprender a reaccionar. Estas son cosas que una persona debería saber mejor que una máquina… Aunque manejar… en principio no me queda claro”. Muchas risas.

Último ejemplo: “Quizás el más cotidiano: Spotify, Netflix y MercadoLibre son empresas que usan muchísima ciencia de datos. Todo el sistema de recomendaciones se basa en eso: en segmentar, secuenciar y cruzar información. Recolecta info de millones de usuarios y la cruza, y en base a eso saca recomendaciones personalizadas”. Explica que así funciona toda la publicidad de internet, “que se basa tanto en las propias navegaciones como en las búsquedas anónimas de miles de personas, que permiten construir perfiles arquetípicos”.

Un día en la oficina

En el último tramo, y frente a preguntas sobre cómo es la rutina de un cientista de datos, Maximiliano dice que la actividad de un data scientist puede definirse así: “alguien te da un dataset enorme y vos tenés que sacar conclusiones de eso. Ver cómo los interpretás”. Y ofrece un nuevo ejemplo: “Un día vino un banco y nos dijo: ‘vamos a vender hipotecas, así que queremos saber si se puede predecir si alguien se va a mudar”. El punto era cómo saber, a partir de la información telefónica, si cierta persona tenía en mente mudarse. Pero la real dificultad estaba antes de eso (“que no es más que una máquina que corre un algoritmo”), en identificar un grupo que sirva para estudiar la población gente-que-se-va-a-mudar (“y mucho dataset de eso no hay”, se ríe): “el problema del banco implicaba uno anterior: detectar si alguien se mudó. Sin eso no se puede establecer ningún patrón ni estudiar rasgos de la gente que se muda” ¿Cómo se hace? Maxi explica la secuencia lógica que siguieron: “sabemos que toda actividad telefónica (llamar, mensajeár o navegár por internet) se hace a través de una antena. Así que ahí tenemod registro de actividad. Entonces si queremos saber si alguien se mudó lo que hacemos es, y suena medio creepy, buscar desde dónde hizo los llamados cerca de las 2am”. Si el registro tiene la forma de un escalón, explica (“si lo venís haciendo de un lado y luego lo empezás a hacer siempre de otro”), eso puede indicar una mudanza, “porque supuestamente estás en tu casa”. Nuevamente, alguien de público lo pincha: “a menos que haya empezado a trabajar de noche…”. Maxi vuelve a sonreír y asentir: “sí, claro; hay un montón de ruido… No se puede suprimir. Pero nos apoyamos en estudios que analizan la relación entre horarios y conductas tiempo… En EUA se hizo uno, y salió que el 99% de la gente a las 3am está durmiendo… y en su casa”.

La última pregunta es la más directa: “concretamente ¿qué hacen en GranData?”, a la que Maximiliano responde, como a las anteriores, con franqueza y humor: “en teoría somos buenos en leer datos sociales. Lo que sabemos hacer es sacar información de las condiciones sociales de la gente, e intentar predecir comportamientos”. Las predicciones van desde determinar la edad de alguien (“para pensar qué puede querer comprar”) hasta saber si va a querer sacar una tarjeta de crédito o va a pagarla: “la gente que tiene hijos es muy probable que saque un seguro; la que se mueve mucho de noche es probable que no pague la tarjeta… Son probabilidades, claro. Es un campo de la ciencia fuertemente experimental”.

Quedó pendiente, entre tanta pregunta, saber si Maximiliano cree que su Yo-actual podría haber predicho que su Yo-Doctorando se iba a terminar dedicando a la ciencia de datos.

Para la próxima.


Más información mencionada durante esta charla:

Hospital de niños:  Se lo menciona porque incorporaron un secuenciador de genes (tecnología que funciona bajo operaciones de aprendizaje automático).

A/B testing: «Básico de la estadística”, dice Maximiliano. Y lo explica: «se muestran dos cosas diferentes a dos grupos al azar, se define una métrica (cantidad de clicks o tiempo de permanencia en la pantalla) y se miden los resultados. Es una técnica muy presente en grandes empresas (…) como Facebook, o Booking, que son los reyes del A/B testing y pueden llegar a correr mil de esos test por día”.

Carlos Sarraute: Director de Investigación en Grandata. También egresado de FCEyN.

Fundación Bunge y Born: Trabaja con GranData para armar un mapa de riesgo del Mal de Chagas en Argentina.

Leandro Lombardi:Investigador en aprendizaje automático y Ciencia de Datos en CONICET y en la Fundación Sadosky.

Metadata: Página de la fundación Sadosky que auspicia competencias de data science.