Noticias UCC

La ciencia de los datos

Publicado el 24/05/2017 en Investigación y Tecnología

En el marco del ciclo Hands on Data, organizado por nuestra cátedra Sistemas Inteligentes y Bioscience data Mining Group (CIDIE -  CONICET), entrevistamos al analista en Data Science, Diego Llarrull sobre su workshop acerca de Deep Learning, una rama novedosa y en auge de Machine Learning (ML).

¿Qué es ML?

Son formas de enseñar a una máquina para que pueda predecir cosas. De alguna manera es el mismo proceso que nosotros atravesamos a la hora de estudiar, por ejemplo, matemática: hacés ejercicios, llegás a una solución y la comparás con el resultado correcto. De acuerdo a los errores, aprendés y si se presenta un ejercicio similar, estás en condiciones de resolverlo.

Esto significa hacer una predicción sobre el resultado correcto y compararlo con el resultado real, ya que eso te muestra si aprendiste correctamente.

Del mismo modo se busca entrenar computadoras para que, ante la presentación de una nueva evidencia, se pueda hacer una predicción o cálculo que de un resultado. A falta de una idea de cuál sería el resultado correcto, a nosotros nos permite predecir y trabajar de forma más eficiente en muchos campos. Por ejemplo, en de la detección de enfermedades, donde nosotros estamos buscando un diagnóstico que no conocemos a priori, pero siempre nos viene bien una predicción de algo que puede ser potencialmente una enfermedad.


Diego Llarrull

¿Cómo se aplica?

Hay muchísimos campos de aplicación. Por ejemplo, predicción de valores bursátiles; cotizaciones de acciones; análisis de riesgo; hasta predicción del clima. Cualquier cosa de la cuál se tenga información previa y sobre la cual se pueda hacer una predicción se puede abordar como un problema de ML.

Yo trabajo para Héritas en medicina de precisión, que es una forma de diagnóstico pero usando información genómica. Se usa una secuencia de genoma de una persona para diagnosticar enfermedades, generalmente de tipo hereditario.

¿Qué desarrollo hay en Argentina?

EEUU es el referente. Yo me especialicé allí a través de Bec.ar, un programa nacional para formación de especialistas en el exterior en áreas de relevancia estratégica para el desarrollo del país. Con esto te quiero decir que hay una voluntad a nivel nacional de formar profesionales en estos temas, pero todavía nos falta mucho. Desde mi punto de vista, aún no somos concientes de que la información es un activador de mejora en los procesos de toma de decisiones.

Recién ahora, en algunas empresas o ámbitos muy formados que están en contacto con esta visión, se empieza a entender el valor de la información.

En EEUU la concepción del tema es muy particular. La estadística tiene un valor intrínseco para ellos. Entonces, la posibilidad de usar esa estadística de forma automática es algo natural. Yo siempre lo grafico en relación al tema del deporte. Los deportes que a ellos les gustan son muy estadísticos y ellos basan muchas de las decisiones en este tipo de datos: apuestas, fichajes de jugadores, etc. Por ejemplo, en baseball se analiza el porcentaje de golpes que batea un determinado jugador y en básquet, en la cantidad de triples por partido. Analizan videos, tienen métricas y toman la estadística como una parte natural del análisis de las cosas. Nosotros no tenemos tan arraigado ese concepto.

De todas formas, en Argentina hay grupos de ML que vienen trabajando hace 20 0 30 años sostenidamente. Es un tema que históricamente viene dándose en la estructura de investigación del Conicet. De a poco las empresas van incorporando la idea, pero está todo en un estado muy embrionario.

Hay empresas como Despegar.com o Mercado Libre que sí lo tienen implementado. Son las empresas de mayor porte en cuanto a tecnología de la información en Argentina.

¿Por qué dedicarse a esto?

Bueno, para empezar porque con todo el advenimiento de big data hay mucha necesidad de procesar los volúmenes de información que ya se tienen.

En mi caso particular, lo que me gustó de este campo es que te permite conectarte con cualquier tipo de disciplina. Ahora estoy trabajando en medicina, pero mañana podría estar trabajando en marketing o predicción del clima. Para mí eso tiene un valor agregado enorme no solo por el abanico de experiencias sino porque para poder trabajar de esto tenés que interiorizarte en el tema y aprender.

Me parece muy enriquecedor poder tocar con una disciplina puente tantas otras disciplinas. Yo tuve que aprender y profundizar sobre biotecnología para poder trabajar en problemas de genómica, pero si mañana me toca análisis bursátil tengo que aprender de cotización de bolsa o bien podría tener que interiorizarme en procesos cognitivos psicológicos para analizar estrategias de recomendación.

Para finalizar ¿qué podés aportar en relación al dilema del hombre o la máquina?

La realidad es que ya está pasando, es decir, esa maquinaria ya está funcionando. Todo el mundo lleva en sus bolsillos un dispositivo que genera información sobre nosotros que es procesada con máquinas y que se activan un montón de decisiones, desde la publicidad que vemos en Google hasta las recomendaciones de noticias basadas en noticias que hemos leido previamente o nuestra actividad en las redes sociales.

Por eso creo que ya no es relevante cuestionarse si está bien o mal, porque el mundo ya lo está haciendo. Lo que hay que plantearse es que, además de las técnicas hay que trabajar una ética para determinar cuáles son los límites y cómo protegerlos, y generar legislación que acompañe desde la ética.  

 

  ucc     hands on data     bioscience     data mining     diego llarrull     sistemas inteligentes     entrevista     data science     universidad católica de córdoba     machine learning     facultad de ingeniería     la ciencia de los datos  

Comunidad UCC

Facebook Twitter Youtube Instagram LinkedIn