La IA en la investigación pública: cada vez más democratizada pero muy competitiva

Para los investigadores astrofísicos del IAC Marc Huertas y Andrés Asensio la inteligencia artificial (IA) es un campo "competitivo pero sorprendentemente abierto", lo que supone una "enorme democratización" en un sector investigador público que carece de lo básico: infraestructura para el cálculo.

En un encuentro con EFE, Huertas asegura que, con saber un poco de programación, se hace un código “en una tarde” que resuelve un problema “de forma extraordinaria”, lo que supone ejercer un trabajo “a ciegas” sin rangos de validez.

Las conclusiones se hacen desde la sala de reuniones GTC del Instituto de Astrofísica de Canarias (IAC), un espacio en el que se reúnen hasta 15 investigadores en física solar, estelar, cosmología, galaxias y biomedicina para "polinizarse" y "optimizar" aprendizaje colectivo en IA.

La ilusión de este grupo de investigadores y doctorandos se corrompe cuando recuerdan aquello de lo que carecen: infraestructuras informáticas que les permitan progresar. “Necesitamos sitios en los que hacer cálculos”, afirma Andrés Asensio cuando comenta que en la administración hay dificultades para adquirir máquinas, "por parte de generaciones antiguas”, y cuando por fin las consiguen, "ya es demasiado tarde".

Este problema no existe para las compañías privadas, como Open AI, la empresa de investigación en inteligencia artificial que ha creado el reconocido generador de conversaciones Chat GPT

“Te pueden llegar dos años después de pedirlas, cuando ya están obsoletas y no permiten desarrollar en ellas las nuevas técnicas del sector”, agrega Marc Huertas. Este problema no existe para las compañías privadas, como Open AI, la empresa de investigación en inteligencia artificial que ha creado el reconocido generador de conversaciones Chat GPT. “Modelos de lenguaje como ese no son extraordinarios desde el punto de vista técnico. Cuentan con una potencia de cálculo brutal”, añade el investigador. La inteligencia artificial, o ‘deep learning’ (aprendizaje profundo), como prefieren llamarla, es “una ciencia de datos” en la que, aseguran, “los científicos siempre estarán por encima de los sistemas”.

El astrofísico Carlos Westendorp, uno de los investigadores del grupo, agrega que “la inteligencia natural es experta en la clasificación de datos”, un proceso vital en el desarrollo de la IA que supone que “los sistemas se guían y aprenden por nosotros”.

El doctorando en física solar Andreu Vicente confirma esta realidad cuando acelera los procesos de cálculo que deducen las propiedades de la atmósfera solar en base a las observaciones. “La solución que me ofrece la automatización es rápida y buena, pero no tiene en cuenta todos los factores físicos implicados, como la conservación de masa o la energía”, explica.

Asensio y Westendorp concuerdan en cómo la realidad mediática ha exagerado el valor de una inteligencia artificial que, en su intrahistoria, requiere de “un trabajo humano impresionante, desde el diseño del experimento hasta la introducción y limpieza de datos”. De hecho, “la pescadilla que se muerde la cola” de estos científicos está, precisamente, en una decisión científica: la presencia equilibrada o no de datos en los sistemas de IA.

La consecuencia de la cuestión es un resultado científico sesgado: “Si estudias excepciones que ocurren en el Universo, y nunca has enseñado a estos sistemas un caso excepcional, muy probablemente no lo verá”, ejemplifica Asensio.

Quien experimenta este hecho es Nataliya Ramos Chernenko, doctoranda que trabaja con técnicas de aprendizaje automático para determinar la distancia entre galaxias.

Las redes neuronales con las que investiga se entrenan con datos limitados, que se extrapolan y producen un sesgo inevitable, y la investigación astrofísica de observación de objetos lejanos, por ejemplo, tampoco ha conseguido aunar grandes datos sin sesgos.

Andrés Asensio añade que, “aunque existan formas de evitarlos, algunos no se detectan hasta pasado un tiempo”, cuando el proyecto de investigación, de entre cuatro y cinco años, ha culminado. A pesar de las dificultades presenciadas, el grupo presume de tranquilidad frente a la irrupción de generadores de imágenes creadas con IA. Sus trabajos científicos crean imágenes sintéticas, que parten de un modelo físico con parámetros controlados al 100 por 100 por ellos mismos.

Un modelo físico que parte de ecuaciones científicas que buscan “observar y entender el Universo” y con la ayuda de las técnicas de aprendizaje automático se superan, incluso, obstáculos temporales de la investigación más tradicional.

El estudio cosmológico de Francesco Sinigaglia, también doctorando de este grupo, es un ejemplo de ello. El investigador intenta recrear la estructura del Universo con ‘deep learning’ para olvidar meses de simulación en supeordenadores y modelar en minutos o, incluso en segundos, con ordenadores normales.

El equipo científico no duda en la utilidad de las técnicas de aprendizaje automático en campos como el turismo o el cambio climático, pero existen inconvenientes: no hay datos suficientes y clasificados o están restringidos.

A pesar de las colaboraciones vigentes y futuras, como la que mantienen con el Hospital Universitario de Canarias (HUC) para la detección precoz del cáncer de colon, el equipo científico ve preferentes las líneas investigación de su propio sector, que también repercuten en la vida cotidiana.

Elena G. Broock, investigadora del grupo de Física Solar, estudia la actividad del lado del Sol que no vemos desde la Tierra a través datos inferidos del lado que sí vemos. Lo hace gracias a las redes neuronales artificiales. Una línea de trabajo que busca “evitar o predecir eventos energéticos que afecten a nuestras telecomunicaciones”, añade.

Únete al canal de Whatsapp

Síguenos en Google News

Ciencia

Te puede interesar

Lo más visto