Introducción
La inteligencia artificial se ha convertido en una fuerza transformadora en múltiples campos
científicos, y no es difícil entender por qué. Los astrónomos, por ejemplo, utilizan modelos de
inteligencia artificial para simular e inferir aspectos de los objetos que despiertan su interés de
investigación. Es el caso de la primera imagen de un agujero negro, la cual se obtuvo por métodos de
inteligencia artificial, hecho que estableció un hito en la historia de la astronomía al demostrar y
validar estudios previos que inferían sobre cómo es que son los agujeros negros (véase The Event Horizon
Telescope Collaboration [1]). Este logro no solo proporcionó una confirmación visual de teorías
existentes, sino que también abrió nuevas vías para explorar y comprender uno de los fenómenos más
misteriosos y fascinantes del universo. Pero la astronomía no es la única área de la ciencia donde se
han dado éxitos rotundos a través de la inteligencia artificial; en la ciencia molecular, por ejemplo,
AlphaFold [2] se ha mostrado como un sistema informático capaz de descubrir nuevas estructuras de
proteínas mediante redes neuronales artificiales. Como tal, AlphaFold ha superado hitos científicos
desde su creación, y gracias a sus avances se han podido predecir nuevos tipos de proteínas con
precisión atómica, algo que métodos tradicionales anteriormente no pudieron realizar [2].
Así, se puede decir que, debido a su amplitud, potencial de aplicación y capacidad para resolver
problemas, la inteligencia artificial ha ganado el reconocimiento de «paradigma en las ciencias»; es
decir, es ahora ya una forma de hacer investigación científica, pues hoy muchos científicos y
científicas usan métodos de inteligencia artificial para hacer nuevos descubrimientos.
Aunque los resultados de la inteligencia artificial son claros y perceptibles, es crucial
comprender y reconocer los elementos que posibilitan a los científicos crear soluciones a problemas o
nuevos descubrimientos mediante la inteligencia artificial. Esto implica entender qué son y cómo
funcionan sus modelos, ya que estos son sus bases y sus cimientos. Sobre esto, la palabra modelo es tan
esencial dentro del paradigma de la inteligencia artificial que a menudo se adopta sin una
profundización suficiente en su significado. Comprender qué es un modelo es importante no solo para los
expertos en la inteligencia artificial, sino para cualquiera que busque entender el impacto y las
implicaciones de esta en nuestro entorno.
Modelos en la ciencia
En general, se puede decir que los modelos científicos son construcciones teóricas que surgen de
la observación y el análisis de las relaciones entre diversas variables de algo que sucede en la
naturaleza o en un sistema que puede ser de interés científico. Estos modelos funcionan bajo una premisa
representacional, y se utilizan para describir, explicar o predecir esa misma parte de la realidad. Por
ejemplo, un modelo climático podría describir y predecir el comportamiento del clima en una región del
planeta Tierra, pero sus predicciones también pueden ser aprovechadas como información de entrada para
modelos económicos que evalúen el impacto del cambio climático en el sector de la agricultura. Así, un
científico en la parte económica podría aprovechar los resultados de un modelo climático para anticipar
cuánto grano se puede producir si es que una zona agricultora va a vivir sequía en un periodo del año.
Por lo tanto, debido a estas características, se puede afirmar que los modelos son constructos
transversales a muchas disciplinas del conocimiento humano, dado que permiten establecer un vínculo que
facilita la explicación e inferencias sobre algo que sucede o podría suceder en la realidad.
También es importante destacar que los modelos son herramientas para probar hipótesis y que su
validez se mide por su capacidad para ajustarse a los datos conocidos de un fenómeno. Por ejemplo, en el
caso del cambio climático, una forma de probar un modelo es ejecutarlo en fechas previas, para ver si
puede predecir con precisión lo que ya ha sucedido. Si el modelo se ajusta a los datos, se considera un
poco más confiable y a partir de ello se pueden establecer hipótesis sobre algún caso futuro (por
ejemplo, si es que lloverá la mayor parte de los días de septiembre de un año específico). Además, los
modelos también se utilizan cuando los experimentos de campo son demasiado costosos o peligrosos, como
los modelos utilizados para predecir cómo se propaga el fuego en túneles de carreteras [3]. De esta
manera, y con una comprensión clara de la naturaleza y propósitos de los modelos científicos, procedamos
a examinar aquellos modelos específicamente relevantes para el campo de la inteligencia artificial.
Los modelos de la inteligencia artificial moderna
El concepto de inteligencia artificial posee diversas acepciones y perspectivas de acuerdo con
el contexto en el que se usa. Sin embargo, una definición clásica y de amplia aceptación por la
comunidad científica y tecnológica es la proporcionada por los profesores Peter Norvig y Stuart Russell
[4], quienes definen a la inteligencia artificial como El diseño y la construcción de agentes
inteligentes que reciben percepciones del entorno y emprenden acciones que afectan ese entorno. Es
decir, estos autores conciben la inteligencia artificial más como una actividad humana que como un
sistema que simula la inteligencia natural.
Pero la inteligencia artificial también puede entenderse como un campo del conocimiento, así
como una subdisciplina de las ciencias computacionales. Por ejemplo, el diagrama de Venn presentado en
la Figura 1 se utiliza frecuentemente para explicar diferentes campos y subcampos de las ciencias
computacionales: aprendizaje automático, aprendizaje profundo y ciencia de datos. Cada uno de estos
subcampos tiene sus propias raíces y núcleos funcionales. Aquí, sin embargo, vale la pena analizar el
círculo más interno que engloba la inteligencia artificial, es decir, el del aprendizaje profundo,
porque este comprende los modelos más poderosos y reconocidos que hoy día permiten lograr hazañas
asombrosas en el sector tecnológico y en las ciencias: las redes neuronales artificiales.
Figura 1. Subcampos de la inteligencia artificial. Fuente: elaboración propia.
Las redes neuronales artificiales constituyen la base de muchas tecnologías modernas de
inteligencia artificial, desde el reconocimiento de patrones hasta los modelos de lenguaje generativos
que permiten escribir poemas, libros y artículos. Estos modelos de neuronas artificiales, inspirados en
neuronas biológicas, son poderosos y han ganado gran adopción en la comunidad científica y tecnológica
debido a su capacidad para predecir y simular fragmentos de la realidad con gran precisión (como el caso
de AlphaFold [2]). La ventaja de estos modelos radica en su fácil construcción a partir de los datos
recopilados de la realidad misma. Así, por ejemplo, una vez que se dispone de información sobre un
fenómeno, y siempre que un equipo de científicos o tecnólogos define las variables que desean estudiar,
es posible construir y adecuar un modelo de red neuronal artificial que termina prediciendo y simulando
sobre aquello que se entrenó. Tómese como ejemplo la Figura 2, donde se ilustra un modelo diseñado
específicamente para predecir la ocurrencia de días soleados. Este modelo analiza variables como la
temperatura, el porcentaje de humedad en el ambiente y la velocidad del viento. La estructura de la red
neuronal se detalla mostrando las entradas (datos de temperatura, humedad y viento), las neuronas
artificiales que procesan esta información y, finalmente, la salida, que predice si las condiciones
serán propicias para considerarlo un día soleado, es decir, con cielos mayormente despejados y sin
precipitaciones.
Figura 2. Modelo de red neuronal para la predicción de días soleados basado en temperatura,
porcentaje de humedad y velocidad del viento. Fuente: elaboración propia.
Pero ¿es realmente necesario tal grado de reduccionismo para definir los modelos de la
inteligencia artificial? Ciertamente no, dado que estos, a su vez, están construidos a base de
algoritmos y funciones matemáticas, y se conciben bajo diferentes enfoques. Lo que sí es relevante
reconocer es que, en términos generales, las tecnologías más avanzadas, como los modelos de chat
inteligentes, no son más que amalgamas o grandes modelos de redes neuronales artificiales, hecho que es
bien reconocido por los expertos y trabajadores del sector tecnológico que las construyen. Por ejemplo,
la entrevista realizada por Bloomberg en 2023 a los líderes de la empresa tecnológica que creó ChatGPT
revela detalles clave sobre cómo se construyen estas tecnologías avanzadas [5]. A este respecto, es
importante reconocer que dichos modelos están confinados al entorno informático, es decir, no podrían
operar fuera de la memoria electrónica, ya que requieren capacidad de procesamiento que hoy día no puede
ser posibilitada por medios diferentes a las unidades de procesamiento computacional.
Por lo tanto, dado el dinamismo que envuelve a las aplicaciones más sofisticadas que hacen uso
de la inteligencia artificial y las redes neuronales artificiales, es justo afirmar que estas sirven
para predecir, generar y estudiar cuestiones de la realidad. Esto nos permite sostener que la
inteligencia artificial es, efectivamente, un paradigma que, a través de sus modelos, contribuye a
estudiar regularidades de la naturaleza y la sociedad.
Para ilustrar la relevancia de los modelos en la inteligencia artificial, consideremos algunos
ejemplos concretos: cuando utilizamos un asistente virtual, estamos interactuando con un modelo basado
en redes neuronales artificiales experto en lenguaje, entrenado para entender nuestras preguntas y
generar respuestas pertinentes. Además, al utilizar tecnologías de mapas interactivos para determinar la
ruta más rápida a nuestro destino, confiamos en modelos que han aprendido a predecir el tráfico y a
optimizar las rutas. También, los sistemas de recomendación que nos sugieren qué película ver a
continuación de una plataforma interactiva o qué producto comprar, se basan en modelos de inteligencia
artificial que aprenden nuestros gustos y preferencias a partir de nuestro historial de consumo. Así,
cada una de estas aplicaciones no sería posible sin el uso de modelos de redes neuronales artificiales
que simulan algún aspecto de la realidad de nuestros gustos y que nos permiten hacer inferencias útiles
a partir de los datos que nosotros depositamos en ellos.
Conclusión
Comprender el concepto de modelo en el contexto de la inteligencia artificial es crucial. Los
modelos más destacados e importantes de este campo y actividad son las redes neuronales artificiales,
que constituyen el núcleo de las innovaciones que impulsan su uso y aplicación, permitiendo transformar
datos en conocimiento. Esto nos proporciona una visión más clara de cómo la inteligencia artificial está
cambiando nuestro mundo y cómo puede ser utilizada de manera más efectiva y responsable, ya que permite
saber qué es aquello que hace funcionar a la misma. Por lo tanto, la próxima vez que escuche hablar de
inteligencia artificial, recuerde: todo se basa en modelos.
Referencias
1. The Event Horizon Telescope Collaboration, "First M87 Event Horizon Telescope Results. IV. Imaging
the Central Supermassive Black Hole" The Astrophysical Journal Letters, vol. 875, no. 1, pp. 1-52, 2019.
DOI: 10.3847/2041-8213/ab0e85
2. J. Jumper, R. Evans, A. Pritzel, et al., "Highly accurate protein structure prediction with
AlphaFold" Nature, vol. 596, pp. 583-589, 2021. DOI: https://doi.org/10.1038/s41586-021-03828-1
3. M. Spearpoint, "A truck and a tunnel," Science Learning Hub – Pokapū Akoranga Pūtaiao, 2009.
[Online]. Disponible: https://www.sciencelearn.org.nz/resources/740-a-truck-and-a-tunnel.
4. S. Russell y P. Norvig, "Artificial Intelligence: A Modern Approach," 3ra ed., Prentice Hall
Press, USA, 2009, ISBN 0136042597.
5. Bloomberg, "Inside OpenAI, the Architect of ChatGPT," 2023. [Online]. Disponible:
https://youtu.be/p9Q5a1Vn-Hk.