
La tecnología aún no puede simular la inteligencia humana para resolver problemas complejos, en un entorno variable y con una información parcial. Pero se va acercando. Un ejemplo es el caso de los vehículos autónomos, capaces de tomar decisiones óptimas en tiempo real, a través de complejos algoritmos que toman en consideración una multitud de datos.
Otro ejemplo es el de AlphaZero, el programa desarrollado por DeepMind, la división de inteligencia artificial de Google, y sobre el cual la revista Science ha publicado recientemente un artículo. AlphaZero es capaz de vencer a los juegos de mesa más complejos para la mente humana: el ajedrez, el shogi (ajedrez japonés) y el go (juego de tablero tradicional chino).
El avance más significativo de AlphaZero es que está basado en un algoritmo de autoaprendizaje a partir de cero (de ahí su nombre). Es decir, que con saber las reglas del juego, es capaz de comenzar a realizar partidas y aprender solo, alcanzando niveles de conocimiento tan elevados como para derrotar a las mejores máquinas (y obviamente humanos) en tan solo unas horas de autoaprendizaje. De esta manera ha batido a programas campeones como Stockfish (al ajedrez), Elmo (al shogi), o AlphaGo (al Go). Esos otros programas basaban sus decisiones en conocimiento previo adquirido por humanos a través de miles de horas de juego y análisis.

En el caso de AlphaZero, la lógica de la máquina es diferente a la humana, lo que hace que sus estrategias de juego a veces nos sorprendan. Algunas de ellas se podrían haber considerado arriesgadas o insensatas como, por ejemplo, poner una pieza en el centro del tablero en una posición de supuesta vulnerabilidad, o sacrificar piezas que se consideran generalmente indispensables. Pero que al final, lleva a la victoria. Una de las conclusiones es que el pensamiento humano puede ser un lastre para decidir de manera racional y efectiva.
La manera en que AlphaZero aprende y se impone nos da algunas pistas sobre como nuevas ideas disruptivas pueden llegar a hacer cambiar contextos organizativos y mercados estables.
Empezar de cero, sin ideas preconcebidas
Como ha pasado en muchas industrias que han cambiado radicalmente, a menudo los protagonistas del cambio de paradigma no son los principales competidores del antiguo mercado, sino individuos, comunidades o empresas que, por un lado, conocían suficientemente las bases técnicas, y por otro, estaban suficientemente alejados de la centralidad, como para tener la libertad creativa y la osadía de proponer algo nuevo.
Así, desde la periferia, Steve Jobs, Steve Wozniak o Bill Gates, desarrollaron el PC, a la sombra de las grandes empresas de ordenadores del momento, o Netflix desafía a la industria tradicional del cine, o Uber la del taxi. Como en el caso de AlphaZero, es importante no basarse en éxitos pasados, sino aplicar el principio de Joseph Schumpeter de "destrucción creativa", según el cual las revoluciones se originan en el interior de los sistemas, a través de la destrucción de lo establecido para reemplazarlo por algo innovador.
Buscar la eficiencia en la innovación
El éxito de AlphaZero no se basa en una mayor capacidad de cálculo que otras máquinas, sino en que toma decisiones de forma más selectiva y eficiente, ya que, en vez de analizar todas las cadenas de posiciones posibles, tan solo considera los movimientos más prometedores. En el entorno competitivo actual, ser innovador es indispensable, pero no es suficiente. Falta, además, ser eficiente en la innovación, sacar productos innovadores antes que los competidores, ya que toda ventaja competitiva es temporal: sólo existirá durante el espacio de tiempo necesario para que los otros alcancen el mismo nivel de innovación.
El caso de Ferran Adrià y su restaurante elBulli es revelador. El equipo de elBulli se concentró en identificar las creaciones que representaban un mayor grado de novedad, esforzándose en no copiarse.
Tomar decisiones contraintuitivas
AlphaZero puede tomar decisiones incoherentes según el paradigma actual (el aprendizaje humano) pero, al final, triunfa. De la misma manera, en el mundo de la empresa, a veces las decisiones aparentemente más alocadas resultan ser las decisiones más acertadas. Por ejemplo, Andy Grove, CEO de Intel, a mediados de los 80 hizo entender a sus alarmados colegas e inversores que dejar de fabricar memorias para PC y apostar por los chips era lo más conveniente (y no se equivocó).

No enfocarse en el producto, sino en el proceso de innovación
Aunque AlphaZero tiene un objetivo claro, ganar la partida, no se basa en intentar replicar éxitos precedentes. Su estrategia para ganar se basa en la aplicación sistemática de un método de aprendizaje. De la misma manera, la innovación en la empresa, en muchas ocasiones el enfoque está en la mejora del producto en base a los procesos existentes. Pocas empresas se plantean la innovación en los procesos, y en especial en los procesos para innovar. Las rutinas creativas introducidas en Pixar o en Google permiten dearrollar nuevos productos que con los métodos tradicionales no hubiera sido posible.
A partir del éxito de AlphaZero en juegos de mesa sería precipitado interpretar que una máquina podrá pronto tomar decisiones como un humano. AlphaZero se basa en reglas de juego claras y estables. En entornos cambiantes, indefinidos o inciertos, necesitaría un tiempo de adaptación considerable. No obstante, podemos analizar sus procesos de toma de decisiones para mejor entender los nuestros. La máquina ya no aprende de los humanos, ya aprende sola. Ahora falta que los humanos aprendan de la máquina.
Ignasi Capdevila: Associate Professor in Management & Strategy, PSB Paris School of Business – UGEI
Últimas Noticias
Esta es la dura baja de Portugal, rival de Colombia en el Mundial de 2026, de cara a los amistosos de la fecha FIFA: se suma a Cristiano Ronaldo
Diogo Costa, portero del FC Porto, recibió tratamiento tras molestias musculares en los aductores y será examinado para definir su disponibilidad durante la próxima fecha de la selección nacional
El PP de Extremadura desmiente “rotundamente” que el pacto con Vox vaya a cerrarse próximamente: “Hemos avanzado mucho, pero queremos darle el mejor futuro a los extremeños”
El Secretario General del Partido Popular de Extremadura, Abel Bautista, ha negado que el pacto vaya a cerrarse, tal y como había asegurado esta mañana ‘El País’

Los dos pueblos “críticos” de España en los que hay más riesgo de meteotsunamis, según un estudio: hay otros seis “puntos calientes” poco investigados
A simple vista, pueden parecer una rápida subida y bajada del nivel del mar, pero su movimiento es capaz de causar daños considerables en puertos y zonas costeras

Investigación por la caída de avión Hércules C-130 en Colombia se centra en causas operacionales y peso de la aeronave
Los equipos técnicos evalúan posibles fallas mecánicas, errores humanos y eventuales excedentes en la carga que pudieron contribuir a la tragedia, considerada una de las más graves en el ámbito militar del país

Iván Duque defendió protocolos y utilidad de aviones donados por EE. UU. tras accidente aéreo en Putumayo: “Se entregan tras requisitos técnicos”
El expresidente colombiano afirmó que la antigüedad de los aviones no implica obsolescencia y pidió enfocar la investigación en factores operativos, como peso y condiciones de la pista


