viernes, 5 de diciembre de 2025

Artificial Intelligence: A guide for thinking humans, de Melanie Mitchell

Se trata de un interesante libro de divulgación, cuya autora ha realizado toda su carrera en el campo de la Inteligencia Artificial (IA). Esto le da una amplia perspectiva que muchos autores del momento no tienen. Por ejemplo, le permite ser escéptica en cuanto al boom que estamos viviendo de la IA, pero con fundamentos teóricos y experiencia.

Así describe los distintos booms que ha vivido: 

"Phase 1: New ideas create a lot of optimism in the research community. Results of imminent AI breakthroughs are promised, and often hyped in the news media. Money pours in from government funders and venture capitalists for both academic research and commercial start-ups. 

Phase 2: The promised breakthroughs don’t occur, or are much less impressive than promised. Government funding and venture capital dry up. Start-up companies fold, and AI research slows. 

This pattern became familiar to the AI community: “AI spring,” followed by overpromising and media hype, followed by “AI winter.” This has happened, to various degrees, in cycles of five to ten years.

La diferencia es que ahora las cantidades de dinero que se están metiendo son colosales: las meten las empresas más grandes de la historia de la humanidad (las Big Tech: Amazon, Google, Facebook, Microsoft, Tesla) y en la mayor burbuja monetaria que conocemos.

Pero los fundamentales de la IA, que es a lo que principalmente dedica su libro la señora Mitchell no han cambiado. Al menos no lo habían hecho en 2019, que es cuando se escribe, habría que ver cómo analiza la autora el reciente fenómeno ChatGPT y la IA generativa, tecnologías que parecen verdaderamente milagrosas. Espero que no tarde en hacerlo.

Mitchell explica con claridad y para gente sin conocimientos técnicos, las principales tecnologías de IA y sus aplicaciones. Dedica mucho espacio a explicar cada una en detalle, pues está claro que quiere demostrar al lector que distan de ser brujería. Así, hay secciones dedicadas al Machine Learning, tanto supervisado como sin supervisión. Aquí nos hablará de las Deep Neural Networks, a las que prefiere llamar ConvNet. Este tecnología está en la base del reconocimiento de imágenes o de palabras. Por su parte, el aprendizaje sin supervisión se ha utilizado para que los ordenadores se hicieran superhumanos en juegos como el ajedrez o el Go, en los que han sido capaces de derrotar a los grandes campeones con relativa facilidad.

También nos describe en detalle las técnicas de encoding-decoding, usadas para procesar lenguaje natural, lo que permite, por ejemplo, su traducción a otros idiomas, o la búsqueda de información en textos. Imagino que están en la base de los fenómenos que vivimos en la actualidad.

Pero, después de maravillarse con nosotros de los avances conseguidos en cada área, nos devuelve a la cruda realidad y a los límites de la tecnología. Por ejemplo, AlphaGo, el programa campeón mundial del juego oriental, no vale absolutamente para nada más. "As far as I know, none of the abilities it has learned are general in any way; none can be transferred to any other task. AlphaGo is the ultimate idiot savant." Los ordenadores carecen de lo que se llama técnicamente "transfer learning", algo que es automático en la inteligencia humana. 

Otro ejemplo: el reconocimiento de imágenes o de voz es muy vulnerable a cambios marginales, que no serían ni notados por un ser humano. Cambiados adecuadamente unos pocos números de pixels, y el camión que se muestra en la imagen pasa a ser identificado como una avestruz. Como lo oyen. A esto le llama la autora "adversarial attacks". Imposible que tal le pase a un ser humano.

Incluso esos programas triunfadores no han podido determinar cosas tan sencillas como el número de capas de sus redes neuronales o de "neuronas" en cada capa. Eso lo han conseguido los humanos a base de prueba y error, no parece haber ningún método sistemático para ello. Así lo afirma Mitchell: "In general, it’s hard to know ahead of time how many layers of hidden units are needed, or how many hidden units should be included in a layer, for a network to perform well on a given task." Sospecho que muchos de los dineros que se están gastando en IA consiste en entrenar una y otra vez modelos neuronales reparametrizando estos y otros factores, con el problema de que cada iteración se hace sobre millones de datos. 

Y es que, en resumen, los ordenadores carecen de entendimiento, no saben lo que están haciendo, por sofisticado que parezca. "This lack of understanding is clearly revealed by the un-humanlike errors these systems can make; by their difficulties with abstracting and transferring what they have learned; by their lack of commonsense knowledge; and by their vulnerability to adversarial attacks"

A las tecnologías actuales le falta una cualidad muy humana, el sentido común. ¿En qué consiste? Mitchell nos habla de nuestra capacidad para las abstracciones y la analogía, y también de lo que llama "metacognition", la habilidad para percibir y reflexionar sobre el propio pernsamiento. Mitchell nos habla de sus esfuerzos por programar el reconocimiento de analogías volviendo al uso del lenguaje simbólico (esto es, programando un algoritmo tradicional, en lugar de usar Machine Learning), como los abandonados sistemas expertos. Pero, claro, está muy chungo hacerlo así, cuando ni siquiera entendemos cómo lo hace nuestro cerebro. 

Por ello, concluye que "I don’t believe that machine “superintelligence” is anywhere on the horizon. If general AI ever comes about, I am betting that its complexity will rival that of our own brains.". A mí la segunda parte me parece definitiva, pues por las leyes de la Cibernética nos será imposible construir algo igual de complejo que nuestro cerebro.

Yo estoy de acuerdo, lo pensaba de hecho antes de esta lectura, y lo que me ha proporcionado Mitchell es su experiencia y conocimiento para tener una opinión más fundada. 

Era inevitable que Mitchell dedicara algo de espacio a la ética y la regulación de la IA, cómo lo habría podido evitar. Se nota que no da gran importancia al tema, pues pone el capítulo por medio del libro y sus reflexiones son las típicas. Es claro que es una ingeniera a la que le preocupa la tecnología y no la política. Eso sí, recoge algunas afirmaciones en que parece apuntar al enemigo correcto, como ésta (que no es suya): "I (and my company) have come to believe that the use of commercial facial recognition in law enforcement or in government surveillance of any kind is wrong—and that it opens the door for gross misconduct by the morally corrupt.… We deserve a world where we’re not empowering governments to categorize, track and control citizens." Tampoco yo podía dejar de apuntar que el principal problema de la IA no es lo que puedan hacer con ella Google o Facebook, si no lo que vayan a hacer nuestros políticos y funcionarios; a los primeros los disciplinará el mercado, a estos segundos nadie.

Del mismo capítulo tenemos esta interesante reflexión sobre la posibilidad de las IAs tomen decisiones con criterios morales: "Reasoning about morality requires one to recognize cause-and-effect relationships, to imagine different possible futures, to have a sense of the beliefs and goals of others, and to predict the likely outcomes of one’s actions in whatever situation one finds oneself." O sea, requiere sentido común, que ya hemos visto que no sabemos cómo construir en máquinas.

Este libro es sencillo e interesante. Recoge todas las historias y anecdotas relacionadas con la historia de la IA, que es una culturilla que no viene mal tener. Mitchell escribe sin florituras pero con claridad; de vez en cuando trata de meter humor, pero siempre le queda algo forzado. Y deja unas conclusiones bastante claras y bien explicadas. Si alguien opina lo contrario que ella, nos lo tendrá que explicar. 

No hay comentarios: