miércoles, 26 de febrero de 2025

Cómo es una IA (y II)

Zambulléndonos este año en el mundo de la Inteligencia Artificial, esbozaba yo, el otro día, los recursos básicos a poner en juego para crear una IA ‘de amplio espectro’ (del tipo OpenAI, dueña de ChatGPT, o GROK, del twitter (X) de Elon Musk) esto es, de entrada, un poderoso hardware, mucho software, incluidos importantes algoritmos y modelos matemáticos, y potentes plataformas de internet para captar y mover una enorme cantidad de datos ‘en la nube’. Hay que decir que, sobre todos estos recursos, la tecnología avanza a pasos agigantados, y más pronto que tarde es seguro que su potencial crecerá de forma exponencial (y yo añadiría… ‘e inquietantemente’, pero esta es otra historia), con la llegada de las computadoras cuánticas, nuevas generaciones de discos duros en estado sólido (SSD), internet 6G, 7G, etc, etc…

Y es igualmente seguro que los (humanos) analistas y programadores informáticos serán capaces de crear todo tipo de software que apoye esta potenciación. Hombre, como ejemplo, leí recientemente que ya se está montando una pequeña aplicación, basada en la IA, que permitirá traducir el lenguaje (los ladridos) de los perros… por lo que llego a la conclusión de que, en muy pocos años, el ser humano podrá convertirse en un ‘verdadero doctor Doolitle’… (o, por lo menos, podrá emular a San Francisco de Asís…)

Pero, retomando el tema de los recursos que precisa una IA, me dejé un campo muy importante, y desconocido, que hoy quiero tocar: el que se refiere al ‘Aprendizaje Profundo’ (Deep Learning) y a las Redes Neuronales Artificiales, para el manejo de los datos, su filtrado, y el entrenamiento para el ajuste de la predicción o decisión (‘output’) resultante, etc.

Que sin duda son ‘la gasolina’ que necesita una AI para ‘despegar’… y llegar quizás a una velocidad de crucero ‘aterradora’. Y por tanto su meollo, o ‘busilis’. Así que aquí van unas cuantas ideas (conceptuales) sobre ello...

La idea inicial, es básica: hay que definir muy bien lo que quieres tener, porque eso condicionará todo lo demás. Así, una IA puede ser generalista, y enciclopédica, que sirva para informarte sobre cualquier área de conocimiento humano, o incluso algo más, y ser, para el usuario, no solo un instructor generalista culto, sino también ejercer como ingeniero, y como informático, y abogado, y médico, y economista y poeta… o la IA puede ser específica, y limitarse a una función determinada, como la que decía antes de poder traducir al lenguaje humano los ladridos (y gemidos) de los perros, o permitir un reconocimiento de rostros, o de defectos, etc, etc..

Y, a partir de la ‘clara definición de lo que queremos conseguir con una IA’, son conceptos fundamentales las Redes Neuronales y los procesos de ‘Aprendizaje profundo’.

Las Redes Neuronales Artificiales (RNA)
Son la base de muchos sistemas de inteligencia artificial, y están inspiradas en la forma en que funciona el cerebro humano, aunque de manera mucho más simplificada. Su funcionamiento es, más o menos, el siguiente...
1. Estructura básica de una RNA
Una Red Neuronal Artificial está formada por nodos o "neuronas" organizados en capas. Una ‘neurona artificial’ no es otra cosa que un modelo matemático informatizado que recibe una o más entradas, las procesa mediante una función, o algoritmo, determinado y genera un resultado (una salida).
Así, en una Red Neuronal Artificial hay, básicamente...
a) Una Capa de entrada, donde hay neuronas que reciben los datos iniciales (el ‘input’, como por ejemplo un texto, imágenes, sonidos, sensaciones táctiles… digitalizados) que convierten en valores numéricos, ‘etiquetando’ cada dato, para poder interrelacionar con la ‘base de datos’ (de información) que posea el modelo.

b) Unas Capas ocultas: Aquí, las ‘neuronas artificiales’ procesan la información mediante cálculos. Puede haber una o varias capas ocultas, dependiendo de la complejidad del modelo o algoritmo empleado. Su misión es, por decirlo así, ‘evaluar, filtrar y seleccionar’.

c) Una Capa de salida: Genera el resultado final (por ejemplo, una clasificación, una predicción o una respuesta) en el formato indicado.

2- El Aprendizaje Profundo
De modo general, en su funcionamiento interno, cada neurona está conectada a otras mediante "pesos" (valores numéricos que indican la importancia de una conexión) y procesa la información usando una función matemática. En conjunto se trata de conformar en ellas lo que se conoce como el Deep Learning (Aprendizaje Profundo) que se estructura, básicamente en...

2.1- Una Propagación hacia adelante (Forward Propagation)
Los datos pasan de capa en capa. Cada neurona toma las entradas, las multiplica por los pesos, suma un ‘sesgo’ (en inglés, ‘bias’, para ajustar el cálculo) y aplica una función de activación (como ReLU, sigmoide o tanh). Esta función decide si la neurona "se activa" y cuánto contribuye al resultado. A ver, ‘esto ya es hablar en chino’ pero, para aclarar, ReLU (‘Unidad Lineal Rectificada) es un activador que da valor cero (por tanto no activa la neurona) o un valor mayor de cero, según intensidad de la identificación, que transmite. Este comportamiento crea una activación dispersa, en la que sólo un subconjunto de neuronas están activas en un momento dado. Sigmoide y Tanh son parecidas, para cuestiones más específicas (tangente hiperbólica, etc).

2.2. El Aprendizaje (propiamente dicho), con el Ajuste de pesos
Las redes neuronales, al principio, no ‘saben’ nada y, como los niños, aprenden ajustándose con datos. Y esto se hace a través de ...
a) La Función de pérdida: Mide cuánto se equivoca la red al comparar su salida con la respuesta correcta (por ejemplo, en un clasificador de imágenes, si predice "perro" cuando es "gato").

b) La Retropropagación (Backpropagation): La red ajusta los pesos y sesgos para minimizar el error. Usa un algoritmo de "descenso de gradiente" para decidir cómo cambiar cada valor poco a poco.

c) El Entrenamiento: Se repite este proceso miles o millones de veces con grandes cantidades de datos hasta que la red mejora su precisión.

Y todo ello, como dije, a través de potentes ordenadores, auxiliados incluso por las TPUs, o ‘circuitos satélites’ especializados y optimizados para realizar cálculos matriciales y tensoriales a gran escala, comunes en redes neuronales… hasta que, al final podamos llegar a obtener unos datos de salida ‘ciertos, inteligentes y adecuados’.

Claro, como comenté antes, esto, para un ciudadano normal, como yo... es como ‘hablar en chino’. Pero espero que quede claro el concepto (básico) de ‘cómo es’, por dentro, la IA. Porque su ‘concepto nuclear’, es decir cómo puede llegar a funcionar, lo resumiré en dos palabras-clave:
a) los datos (las bases de datos de las que hay que disponer) que sería ‘el conocimiento’ y
b) ‘el algoritmo’ (mejor, los algoritmos… que sustituirían al cerebro, y que harían de  ‘interface’ para poder ‘procesar informáticamente el 'input' con el conocimiento’. Este input podría ser desde un texto (una pregunta escrita, incluso verbalizada), a la percepción de un sentido humano (vista u oído, tacto y, en otro orden de cosas, sabor y olor… y aún quedarían otros, que poseen algunos animales)… para llegar, mediante elevados cálculos matriciales, y de cualquier índole, a ‘conclusiones inteligentes y exactas… cada vez más exactas e inteligentes’. E incluso recrear el pensamiento.

Bueno, pues, más o menos, así es como se estructura una Inteligencia Artificial. Y, como me estoy dando cuenta de que me estoy metiendo en un ‘enorme jardín’, y tampoco pretendo escribir un ‘tratado’, voy a dejarlo aquí, invocando aquel famoso principio que siempre comentábamos, en Consulting, de que si eres capaz de hablar 5 minutos sobre cualquier tema, la gente te considera como ‘un entendido en la materia’. La vieja ‘Ley de los 5 minutos’, vamos…

Así que, aunque quedan muchas cosas en el tintero, no quiero enrollarme. Una buena amiga mía, mexicana, (de nuestro ‘club social’, o sea de las tertulias nocturnas en la cafetería de debajo de casa) está empezando a asistir a un curso, de varios meses, sobre la IA, y me ha prometido tenerme informado sobre lo que les expliquen.

Así que a lo mejor dentro de un tiempo le doy alguna otra vuelta a esto de la famosa IA… que es público y notorio que a mi (aún…) me encanta andar ‘brujuleando’ con las cosas nuevas. Vamos, que todavía funcionan mis neuronas y aún lo paso bastante bien haciendo mis ‘Deep Learnings’ y mis ‘Forward Propagations’.
Lo cual, a mi edad, tiene su mérito, carallo...

No hay comentarios:

Publicar un comentario