miércoles, 8 de abril de 2020

Prediction Machines, de A. Agrawal, J. Gans y A. Goldfarb

Los autores de este libro son académicos bastante metidos en el muno de la AI (Inteligencia Artificial), específicamente en la que está de moda, esto es Machine Learning (ML). Eso hace este libro atractivo. Pero lo cortés no quita lo valiente: este libro es un ejemplo de posicionamiento con relativamente poco que aportar a los economistas, y no mucho más a los emprendedores.

Su punto de partida es una visión ciertamente brillante, que ahora comentaré. A partir de ahí, los autores se dedican a dar vueltas a la noria limitándose a deducciones simples trufadas de ejemplos de su experiencia, que concluyen en un capítulo lamentable sobre el impacto social de la AI en que se les olvida completamente el márchamo de economistas con el que habían empezado el libro. De hecho, en las partes dedicadas a reingeniería y estrategia ya abandonan tal rol, aunque ello no quita para que la parte de estrategia sea muy interesante.

La idea brillante y seminal del libro estan sencilla como esta: ML lo que hace es abaratar enormemente el coste de la predicción (entendida predicción como el proceso de completar la información disponible). Para los autores, la predicción es parte fundamental de la inteligencia. La predicción parte de datos disponibles, y genera información nueva. Los datos, a efectos de ML, se clasifican en datos de entrenamiento (para entrenar la máquina), datos de entrada (sobre los que ha de actúar) y datos de realimentación (para corregir y ajustar la máquina).

¿Cómo puede afectar este abaratamiento, esta comoditización, a la sociedad? Los autores evidentemente no tienen la respuesta, "What might be affected when a new technology makes something cheap is not always precisely obvious, whether the technology is artificial light, steam power, the automobile, or computing." Pero lo que es indiscutible es que nos dotan de la herramienta para poder analizar los efectos. Quizá esta idea brillante sea suficiente justificación para leer el libro.

Sí hacen una deducción: el abaratamiento de la predicción supone un incremento en el valor del juicio (coherenete con la teoría económica, al considerar predicción y juicio como recursos complementarios en la toma de decisión, y asumiendo que ésta no cambia de valor). Es más, la predicción se puede usar también para predecir cuál será el juicio de un humano. De hecho, el problema de la conducción de coches se resuelve con ML entrenando máquinas que predicen lo que ahora el conductor ante una situación dada, y lo hacen observando al conductor.

Los autores proponen una taxonomía de circunstancias para identificar en qué condiciones son efectivas las predicciones de ML.
1) Known knowns: aquí hay muchos datos, y las predicciones serán buenas.
2) Known unknowns: hay pocos datos, así que las predicciones son difíciles
3) Unknown unknowns: los cisnes negros de Taleb
4) Unknown knowns: aquí la máquina nos proporciona una respuesta aparentemente precisa, pero que puede ser completamente errónea.

Precisamente, este último es uno de los aspectos de ML sobre el que nos advierten los autores. El otro es que no se debe olvidar que las predicciones de estas máquinas NO son causales, sino basadas en correlaciones, por lo que las trampas habituales en este tipo de análisis aparecen (por ejemplo, causas comunes de los fenómenos correlados).

De las cinco partes en que se estructura el libro, la primera es, por supuesto, la mejor, dedicada a la Predicción. La segunda y la terceda, Decision Making y Tools, son flojitas, sobre todo ésta en la que hacen un amago de reingeniería de procesos basada en AI, pero de gran superficialidad para mi gusto. La cuarta la dedican a la Estrategia, y vuelve a tener algunos capítulos aprovechables. La última, impacto en la sociedad, es prescindible.

En dicha cuarta parte, se plantean temas como la completa automatización del proceso. ¿Hasta qué punto si la predicción la realiza una máquina es mejor que también sea la máquina quien decida? Por ejemplo, en casos donde la rapidez de reacción es importante, es claro que la máquina tal vez sea la mejor decisora.

También se plantea la importancia de la posesión/control de los datos como activo estratégico de la empresa. ¿En qué condiciones conviene que la empresa sea capaz de generar los datos que alimenten a sus máquinas? Por ejemplo, la estrategia comercial de Google pasa por vender predicciones basadas en sus datos, no por vender éstos. A su vez, hay una decisión estratégica en apostar por ML: quizá el servicio a corto plazo se resiente mientras las máquinas aprenden, y eso es algo a considerar cuando se toma la decisión. De hecho, los autores ponen en relación este problema con The Innovator's Dilemma, de Christensen, también comentado en este blog.


Y aunque no me ha gustado la quinta parte, sí me quedo con los tres compromisos en que, según los autores, vamos a tener que posicionarnos: productividad vs distribución (de la riqueza, que no me oíga Rothbard), innovación vs competencia (falso trade-off), y rendimiento vs privacidad.

En resumen, se trata de un libro basado en estirar una idea brillante hasta llevarla a la extensión requerida para un volumen publicable. Muy interesantes algunas de las cosas que se dicen, pero demasiado repetidas y con poca chicha.