La inteligencia artificial y sus modelos de redes neuronales
Dr. Alejandro E. Rodríguez-Sánchez / Universidad Panamericana

Introducción

La inteligencia artificial se ha convertido en una fuerza transformadora en múltiples campos científicos, y no es difícil entender por qué. Los astrónomos, por ejemplo, utilizan modelos de inteligencia artificial para simular e inferir aspectos de los objetos que despiertan su interés de investigación. Es el caso de la primera imagen de un agujero negro, la cual se obtuvo por métodos de inteligencia artificial, hecho que estableció un hito en la historia de la astronomía al demostrar y validar estudios previos que inferían sobre cómo es que son los agujeros negros (véase The Event Horizon Telescope Collaboration [1]). Este logro no solo proporcionó una confirmación visual de teorías existentes, sino que también abrió nuevas vías para explorar y comprender uno de los fenómenos más misteriosos y fascinantes del universo. Pero la astronomía no es la única área de la ciencia donde se han dado éxitos rotundos a través de la inteligencia artificial; en la ciencia molecular, por ejemplo, AlphaFold [2] se ha mostrado como un sistema informático capaz de descubrir nuevas estructuras de proteínas mediante redes neuronales artificiales. Como tal, AlphaFold ha superado hitos científicos desde su creación, y gracias a sus avances se han podido predecir nuevos tipos de proteínas con precisión atómica, algo que métodos tradicionales anteriormente no pudieron realizar [2].

Así, se puede decir que, debido a su amplitud, potencial de aplicación y capacidad para resolver problemas, la inteligencia artificial ha ganado el reconocimiento de «paradigma en las ciencias»; es decir, es ahora ya una forma de hacer investigación científica, pues hoy muchos científicos y científicas usan métodos de inteligencia artificial para hacer nuevos descubrimientos.

Aunque los resultados de la inteligencia artificial son claros y perceptibles, es crucial comprender y reconocer los elementos que posibilitan a los científicos crear soluciones a problemas o nuevos descubrimientos mediante la inteligencia artificial. Esto implica entender qué son y cómo funcionan sus modelos, ya que estos son sus bases y sus cimientos. Sobre esto, la palabra modelo es tan esencial dentro del paradigma de la inteligencia artificial que a menudo se adopta sin una profundización suficiente en su significado. Comprender qué es un modelo es importante no solo para los expertos en la inteligencia artificial, sino para cualquiera que busque entender el impacto y las implicaciones de esta en nuestro entorno.

Modelos en la ciencia

En general, se puede decir que los modelos científicos son construcciones teóricas que surgen de la observación y el análisis de las relaciones entre diversas variables de algo que sucede en la naturaleza o en un sistema que puede ser de interés científico. Estos modelos funcionan bajo una premisa representacional, y se utilizan para describir, explicar o predecir esa misma parte de la realidad. Por ejemplo, un modelo climático podría describir y predecir el comportamiento del clima en una región del planeta Tierra, pero sus predicciones también pueden ser aprovechadas como información de entrada para modelos económicos que evalúen el impacto del cambio climático en el sector de la agricultura. Así, un científico en la parte económica podría aprovechar los resultados de un modelo climático para anticipar cuánto grano se puede producir si es que una zona agricultora va a vivir sequía en un periodo del año. Por lo tanto, debido a estas características, se puede afirmar que los modelos son constructos transversales a muchas disciplinas del conocimiento humano, dado que permiten establecer un vínculo que facilita la explicación e inferencias sobre algo que sucede o podría suceder en la realidad.

También es importante destacar que los modelos son herramientas para probar hipótesis y que su validez se mide por su capacidad para ajustarse a los datos conocidos de un fenómeno. Por ejemplo, en el caso del cambio climático, una forma de probar un modelo es ejecutarlo en fechas previas, para ver si puede predecir con precisión lo que ya ha sucedido. Si el modelo se ajusta a los datos, se considera un poco más confiable y a partir de ello se pueden establecer hipótesis sobre algún caso futuro (por ejemplo, si es que lloverá la mayor parte de los días de septiembre de un año específico). Además, los modelos también se utilizan cuando los experimentos de campo son demasiado costosos o peligrosos, como los modelos utilizados para predecir cómo se propaga el fuego en túneles de carreteras [3]. De esta manera, y con una comprensión clara de la naturaleza y propósitos de los modelos científicos, procedamos a examinar aquellos modelos específicamente relevantes para el campo de la inteligencia artificial.

Los modelos de la inteligencia artificial moderna

El concepto de inteligencia artificial posee diversas acepciones y perspectivas de acuerdo con el contexto en el que se usa. Sin embargo, una definición clásica y de amplia aceptación por la comunidad científica y tecnológica es la proporcionada por los profesores Peter Norvig y Stuart Russell [4], quienes definen a la inteligencia artificial como El diseño y la construcción de agentes inteligentes que reciben percepciones del entorno y emprenden acciones que afectan ese entorno. Es decir, estos autores conciben la inteligencia artificial más como una actividad humana que como un sistema que simula la inteligencia natural.

Pero la inteligencia artificial también puede entenderse como un campo del conocimiento, así como una subdisciplina de las ciencias computacionales. Por ejemplo, el diagrama de Venn presentado en la Figura 1 se utiliza frecuentemente para explicar diferentes campos y subcampos de las ciencias computacionales: aprendizaje automático, aprendizaje profundo y ciencia de datos. Cada uno de estos subcampos tiene sus propias raíces y núcleos funcionales. Aquí, sin embargo, vale la pena analizar el círculo más interno que engloba la inteligencia artificial, es decir, el del aprendizaje profundo, porque este comprende los modelos más poderosos y reconocidos que hoy día permiten lograr hazañas asombrosas en el sector tecnológico y en las ciencias: las redes neuronales artificiales.


Figura 1. Subcampos de la inteligencia artificial. Fuente: elaboración propia.


Las redes neuronales artificiales constituyen la base de muchas tecnologías modernas de inteligencia artificial, desde el reconocimiento de patrones hasta los modelos de lenguaje generativos que permiten escribir poemas, libros y artículos. Estos modelos de neuronas artificiales, inspirados en neuronas biológicas, son poderosos y han ganado gran adopción en la comunidad científica y tecnológica debido a su capacidad para predecir y simular fragmentos de la realidad con gran precisión (como el caso de AlphaFold [2]). La ventaja de estos modelos radica en su fácil construcción a partir de los datos recopilados de la realidad misma. Así, por ejemplo, una vez que se dispone de información sobre un fenómeno, y siempre que un equipo de científicos o tecnólogos define las variables que desean estudiar, es posible construir y adecuar un modelo de red neuronal artificial que termina prediciendo y simulando sobre aquello que se entrenó. Tómese como ejemplo la Figura 2, donde se ilustra un modelo diseñado específicamente para predecir la ocurrencia de días soleados. Este modelo analiza variables como la temperatura, el porcentaje de humedad en el ambiente y la velocidad del viento. La estructura de la red neuronal se detalla mostrando las entradas (datos de temperatura, humedad y viento), las neuronas artificiales que procesan esta información y, finalmente, la salida, que predice si las condiciones serán propicias para considerarlo un día soleado, es decir, con cielos mayormente despejados y sin precipitaciones.


Figura 2. Modelo de red neuronal para la predicción de días soleados basado en temperatura, porcentaje de humedad y velocidad del viento. Fuente: elaboración propia.


Pero ¿es realmente necesario tal grado de reduccionismo para definir los modelos de la inteligencia artificial? Ciertamente no, dado que estos, a su vez, están construidos a base de algoritmos y funciones matemáticas, y se conciben bajo diferentes enfoques. Lo que sí es relevante reconocer es que, en términos generales, las tecnologías más avanzadas, como los modelos de chat inteligentes, no son más que amalgamas o grandes modelos de redes neuronales artificiales, hecho que es bien reconocido por los expertos y trabajadores del sector tecnológico que las construyen. Por ejemplo, la entrevista realizada por Bloomberg en 2023 a los líderes de la empresa tecnológica que creó ChatGPT revela detalles clave sobre cómo se construyen estas tecnologías avanzadas [5]. A este respecto, es importante reconocer que dichos modelos están confinados al entorno informático, es decir, no podrían operar fuera de la memoria electrónica, ya que requieren capacidad de procesamiento que hoy día no puede ser posibilitada por medios diferentes a las unidades de procesamiento computacional.

Por lo tanto, dado el dinamismo que envuelve a las aplicaciones más sofisticadas que hacen uso de la inteligencia artificial y las redes neuronales artificiales, es justo afirmar que estas sirven para predecir, generar y estudiar cuestiones de la realidad. Esto nos permite sostener que la inteligencia artificial es, efectivamente, un paradigma que, a través de sus modelos, contribuye a estudiar regularidades de la naturaleza y la sociedad.

Para ilustrar la relevancia de los modelos en la inteligencia artificial, consideremos algunos ejemplos concretos: cuando utilizamos un asistente virtual, estamos interactuando con un modelo basado en redes neuronales artificiales experto en lenguaje, entrenado para entender nuestras preguntas y generar respuestas pertinentes. Además, al utilizar tecnologías de mapas interactivos para determinar la ruta más rápida a nuestro destino, confiamos en modelos que han aprendido a predecir el tráfico y a optimizar las rutas. También, los sistemas de recomendación que nos sugieren qué película ver a continuación de una plataforma interactiva o qué producto comprar, se basan en modelos de inteligencia artificial que aprenden nuestros gustos y preferencias a partir de nuestro historial de consumo. Así, cada una de estas aplicaciones no sería posible sin el uso de modelos de redes neuronales artificiales que simulan algún aspecto de la realidad de nuestros gustos y que nos permiten hacer inferencias útiles a partir de los datos que nosotros depositamos en ellos.

Conclusión

Comprender el concepto de modelo en el contexto de la inteligencia artificial es crucial. Los modelos más destacados e importantes de este campo y actividad son las redes neuronales artificiales, que constituyen el núcleo de las innovaciones que impulsan su uso y aplicación, permitiendo transformar datos en conocimiento. Esto nos proporciona una visión más clara de cómo la inteligencia artificial está cambiando nuestro mundo y cómo puede ser utilizada de manera más efectiva y responsable, ya que permite saber qué es aquello que hace funcionar a la misma. Por lo tanto, la próxima vez que escuche hablar de inteligencia artificial, recuerde: todo se basa en modelos.

Referencias

1. The Event Horizon Telescope Collaboration, "First M87 Event Horizon Telescope Results. IV. Imaging the Central Supermassive Black Hole" The Astrophysical Journal Letters, vol. 875, no. 1, pp. 1-52, 2019. DOI: 10.3847/2041-8213/ab0e85

2. J. Jumper, R. Evans, A. Pritzel, et al., "Highly accurate protein structure prediction with AlphaFold" Nature, vol. 596, pp. 583-589, 2021. DOI: https://doi.org/10.1038/s41586-021-03828-1

3. M. Spearpoint, "A truck and a tunnel," Science Learning Hub – Pokapū Akoranga Pūtaiao, 2009. [Online]. Disponible: https://www.sciencelearn.org.nz/resources/740-a-truck-and-a-tunnel.

4. S. Russell y P. Norvig, "Artificial Intelligence: A Modern Approach," 3ra ed., Prentice Hall Press, USA, 2009, ISBN 0136042597.

5. Bloomberg, "Inside OpenAI, the Architect of ChatGPT," 2023. [Online]. Disponible: https://youtu.be/p9Q5a1Vn-Hk.