La Edad de Oro (XIV): Las Vegas VIII Alphagozero IA

World 26/2/2018

$D:\Mis Imágenes\simpson 4.jpg$

"Multiplicate por Zero"

Bart Simpsons

Si la contestación punk fue todo un soplo de aire fresco en una Inglaterra amodorrada que la exporto al resto del mundo. Si esto emergió de las barriadas periféricas y los nuevos marginados generacionales. Entonces su insignia, su bandera, estaría simbolizada con aquel NO FUTURE de los Sex Pistols, a los que yo les daría un pedestal solo por su versión de "My Way" de Sinatra. Es en esas fechas y periferias cuando nace una generación emigrada a la periferia de Londres cuyo lema parece ser el opuesto a aquellos nuevos románticos que duraron un soplo. El himno de estos últimos es " SOLO HAY FUTURO."

Y si algo representa y es pionero de esto que estoy diciendo es ALPHAGOZERO , creación de la reciente adquirida empresa Deepmind por Google. La mayor inversión de Google en empresas europeas, 450 millones de euros del año 2014. Como se hubieran fichado a Messi y Ronaldo juntos. Porque lo único que compro Google hace cuatro años, es talento. En este caso, talento europeo que no alcanzaba todavía los cuarenta tacos.

Dice la Hormiga Valverde ( entrenador del Barcelona), que ser un entrenador de futbol con un nivel hoy en día, lleva consigo el acabar siendo un adicto. Que, de los que él conoce de un cierto nivel, todos lo son. El trading será una de las actividades mas adictivas que hay y no estamos aquí para dudar de Valverde, Pero esto de la adicción depende también de qué cerebro segregado de dopamina te haya tocado por suerte, y como lo excites. Mi generación ha pasado todo un Vietnam con este tema, que otras anteriores y posteriores se han librado. El mecanismo este de la dopamina que se expande y se acelera si se acostumbra al cerebro a una rutina de placer y no placer, de castigo y recompensa también cuenta. No solo es vocación y pasión del oficio. Hay muchas actividades semejantes, a las que el cerebro responde igual. Tenemos el sexo, el porno, el amor, las drogas, las apuestas, los juegos de casino, las apuesta deportivas hoy de moda ( no hay más que ver de qué va la publicidad de esta actividad en la tele) y como hemos dicho el trading. Pero la más boba de las actividades que se lleva la palma en esto de recompensa y castigo y al alcance de los más niños son los videojuegos electrónicos. Quizás las maquinas tragaperras los superen, pero estas no están tan al alcance de los críos como estos juegos. Acostumbrar a un cerebro infantil a crecer con este estimulo de recompensa /fracaso, incesante y pertinaz, creo que es lo más pernicioso y peligroso que se puede hacer con nuestros niños. Tengo asumido el papel de pelma cansino con este tema.

De eso va en parte hoy el diario. De videojuegos

Y también de cómo todo lo expuesto anteriormente puede saltar fácilmente por los aires, si nos ponemos a hablar de ALPHAGOZERO, al que vamos a empezar a nominarlo como AGZ y a nombrar a su creador Demis Hassabis. Creo que esto de que salten las ideas previas, va a empezar ser habitual cuando se hable de tecnologías inteligentes punta.

La biografía de este inmigrante hijo de griego y china, ambos profesores de letras y bohemios emigrados a Londres está ampliamente publicada en la red. Voy por lo tanto a ser sucinto. Maestro de ajedrez a los 14 años. Acaba el bachillerato tres años antes y tiene que esperar a tener 18 para entrar a ocupar la plaza de Cambridge que ha ganado con beca. En su tiempo de espera crea su primer videojuego comercial a los 17 tacos. Un videojuego que consiste en crear un parque de juego temático que tenga éxito. Se llama Theme Park y vende millones de copias.

$D:\Mis Imágenes\blog\DEEPMIND8.jpg$

Tarda solo tres años en graduarse en Cambridge, con matriculo de honor y es donde adquiere los primeros conocimientos sobre inteligencia artificial . A los 22 años acabada la Universidad funda Elixir Studios con la que llega a tener 60 empleados, y allí hace sus primeras incursiones en Inteligencia Artificial con la máquina de marcianitos como ratón de laboratorio. Eidos le paga 700.000 euros de hace 34 años por una participación del 5% de la empresa.

En ese momento su empresa de videojuegos e inteligencia artificial está por tanto valorada en unos 14 millones de euros. El tiene apenas veinte pocos años. A los 29 años vuelve matricularse en la Universidad College de Londres para especializarse en neurociencia cognoscitiva. Recibe masters y cursos de esta materia en Boston, Harvard y en el inevitable MIT de Masachusstes. En 2010 crea Deepmind con su colega de adolescencia árabe, hijo de un taxista sirio que como él paso su infancia en la periferia del norte Londres. Colega de videojuegos de adolescentes y activista tecnológico.

Luego aparece Google pagándoles 500 millones y dejándoles dirigir la empresa según su criterio. Se focaliza como objetivo a largo plazo la aplicación de la Inteligencia artificial en la medicina , sobretodo en la creación de nuevas vacunas. Mientras la metodología consiste en enseñar o crear unas maquinas que ganen a los humanos en sus juegos de inteligencia. El valor de 500 milones para alguien que ya tiene 14, no es relevante. Puede ser 300 o 800, el precio de venta pero lo que se negociaria , que es secreto y confidencial, tiene pinta de ser otro tipo de condiciones y objetivos.

Deepmind, una empresa que se dedica a crear inteligencia en las maquinas para los humanos llego a emplear a 60 frikies antes de lo de Google. No tengo otra palabra para definir a estos talentosos mirando una pantalla de mata marcianos y enseñando y exigiendo a una maquina a batir records de puntos. Ahora se les va a poder ver en el edificio de Google en el centro de Londres para unos 4000 empleados. Parece ser que los puestos de trabajo que se busca en España son de vendedores, y no de ingenieros. Sera por el ingles y esto de la falta de adicción a la tecnología que diría Valverde. Exportamos futbolistas y entrenadores y vendedores de tecnología. Parece que la unaminiana maldición de que inventen ellos, no nos la sacamos de encima.

$D:\Mis Imágenes\blog\deep mind.jpg$ $D:\Mis Imágenes\blog\deepmind 7.jpg$

Abajo tenemos una foto de Hassab ( el de gafas) con el hasta hace pocos años el campeón mundial de GO del año pasado. El coreano también residente en Londres Lee Sedol. Durante la perdida que se jugo de GO y con la sorpresa del precedente de AGZ , llamado ALPHAGO, se consiguio la primera victoria de la maquina sobre la inteligencia humana en este juego. El GO es un juego que lo juegan tres veces mas gente que el ajedrez, 55 millones.

Allí estos medio chinos de la partida son una estrellas mediáticas de multitudes. Con gafas Hassab y el del al lado es el sorprendente Lee Sedol que no tiene edad para ser campeón según una tradición donde los campeones de este juego, son más que maduros. O eso dicen ya que se trataría mas de saber ver el equilibrio y la estrategia del tablero para ganar, una especie de intuición que da el oficio, que una mente potente que calcule posibilidades de victoria. En el centro una calle del centro de Shangai retransmitiendo la partida que se está jugando en Londres.

$D:\Mis Imágenes\blog\AlphaGO_NS.jpg$

Parece ser que lo que hizo AGZ el año pasado es lo más relevante que ha pasado en los últimos cinco años con la Inteligencia artificial . Luego intentaremos entender por qué. Pero aquí se sabe que si algo empieza batiendo a los maestros de ajedrez, a los juegos amañados de casino, o ganar al GO, o al poker sin límites , tiene grandes posibilidades de acabar en el trading y en la operativa del mercado financiero. No hay más que recordar, que ha pasado con la martingala, la campana d Gauss, la teoría de probabilidades, las relaciones de Fibonacci, las simulaciones de Montecarlo, las inferencias estadísticas o el movimiento browiano . Los quants y el MIT en los sesenta ya dieron el primer aviso.

Si alguien es adicto a estos videojuegos, ese es Demis Hassabis . Aquí abajo tenemos el videojuego de la edad de piedra, la base de partida , los ratones de laboratorio de la inteligencia artificial de estos frikies suburbanos. Estamos hablando de algo tan trascendente y serio como el mata marcianos y la pared de ladrillos. Quien halla jugado alguna vez a eso, sabe que lo que se busca es ser el mejor destroyer de lo que se mueve en pantalla. Yo tenía un amigo, campeón en esto de dejar records imbatibles en esas maquinas de los bares . Le apodábamos Mazinguer Z. Si alguien compro los primeros ordenadores que se comercializaron en España, se acordara de esos juegos. Eran los dos juegos que venían de serie, juegos que pocos años antes estaban en los bares y había que pagar, para jugar con ellos y siempre estaba la maquina ocupada.

$D:\Mis Imágenes\blog\juegos 80.jpg$ $D:\Mis Imágenes\blog\matamarcianos.jpg$

Vamos a ver de qué va el nombre de AGZ.

ALPHA viene del conglomerado empresarial de Alphabet del que forma parte Google.

GO viene del trimilenario juego chino con 55 millones de practicantes. El triple del ajedrez. La mayoría asiáticos. Se podría asimilar al ajedrez occidental, de hecho se le llama el ajedrez chino. Pero a nivel de computación es equivalente al póker sin límites. No es abarcable por potencia que los ordenadores lo ganen.

El objetivo del juego es rodear con tus fichas un área mayor que el oponente colocando las piedras una a una en alternancia con tu contrincante. Abajo la modelización del árbol de computacion necesario para el Go chino. Se ha recortado porque no cabe en los límites rectangulares del grafico. Son 3 millones de posibles posiciones. Al lado una escena habitual de un jugador Chino en una sala de juego del GO. Este no necesita otro para jugar. Un antecedente pionero humano del aprendizaje reforzado de AGZ.

$D:\Mis Imágenes\blog\alpha go zero 9.jpg$ $D:\Mis Imágenes\blog\arbol de GO.png$

ZERO Antes que AGZ ha habido modelos de Inteligencia artificial precedentes de Deepmind, y al menos uno diseñado para jugar al GO. ALPHAGO fue su precedente . Las imágenes del torneo de arriba se jugaron de Lee Sedol contra APLPHAGO , no contra AGZ. Luego AGZ le metió una paliza de 100 a cero a ALPHAGO jubilándolo para siempre.

Yo no tengo muy claro cómo empezar a numerar, últimamente he elegido, cuando empiezo algo , no numerarlo, y si hago una segunda parte, numerar a esta como dos, luego tres ,,etc Todo el mundo entiende que lo no numerado es el primero si hay una segunda parte. Así me libro de saber si va a ver o no una segunda parte. Tema lioso. Además no hay algo correcto. Es más bien una concepción y un tradición de cómo se cuenta que viene de una matemática arcaica.

En América cuando entras a un hotel estas en la planta 1, en Europa la planta 1 está en el primer piso. Se debería entrar en consecuencia en Europa a la planta cero, pero te vas a encontrar con una renuncia a llamarla así. Le llamaran cualquier cosa como Planta baja, Vestíbulo, Planta principal, pero no Planta cero. El ascensor de mi edificio que uso en la planta que da a la calle , cuando llega a ese problema pone un cero a apretar en el tablero, entre el 1 y el menos 1 .

Cuando bajo en él, vivo arriba, y alguien se monta y pregunto dónde van, nunca me dicen que van a cero, o a la planta cero. Me dicen al portal, a la calle, abajo, pero nunca van al cero. Si es a la primera me dicen al primero, como pone las indicaciones numeradas del ascensor. Pero cuando llega lo de ir a la consecuente planta cero que indica el tablero del ascensor nunca van ahí. Todavía no me atrevo a preguntarles si van al cero. Ambos continentes hacen desaparecer el cero , o lo intentan. A mi últimamente me ha dado por hacer desaparecer el uno.

El Zero de Alphago no debe ir entonces de un ordenamiento sucesivo y racional. El de Bart Simpson tampoco y me tiene también con la mosca detrás de la oreja. Varias veces se lo he oído. Cuando suelta eso de que te multipliques por cero es lo que más me gusta de esos dibujos animados del que soy fan, A veces lo he usado con conocidos y en la primera reacción me suelen entender que es hora de que se esfumen o desaparezcan. No creo que sea eso a lo que Bart se refiere tampoco. Suelo tener que reaccionar rápido y decir que no se lo tomen tan en serio, que estaba vacilando. Luego le hecho la culpa a Bart y se arregla todo. A algunos no les hace ninguna gracia, pero para eso esta Bart.

El cero viene de los hindús. Pero estos tienen su mundo también, porque su cero no es más que un símbolo de un concepto de su existencia en ese mundo tan suyo y tan antiguo. Ese concepto previo no tiene nada que ver con la actividad de contar. El concepto de la nada hindu es previo a una simbolización en un número cero. Aunque el hecho de reflejarlo en un numero abstracto revela un pensamiento abstracto muy evolucionado. Aquí en Occidente lo importamos a través de Fibonacci en el siglo XIII o quizás con los árabes españoles asentados en Andalucía. Siempre nos quedara la Alhambra, que se diría entonces.

Para cuando se usa el símbolo matemático en Europa los hindús ya llevaban al menos 4 siglos con él. Para ellos el cero simboliza la nada. Y con lo que les gusta dar círculos, a la primer vuelta la nada es el vacio, a la segunda ya es nulidad, luego en la siguiente se va a algo así, como "lo que no es pero por eso puede llegar a ser", y de ahí girarían a la "ausencia de limitaciones para ser" y ya con la última vuelta antes de retornar a la nada sería algo que accede a la posibilidad del todo. Y, lo más parecido al concepto de todo que conozco sería el infinito. Y da vueltas otra vez. Un concepto de la existencia en el mundo circular y no de línea donde se hacen muescas para contar, entre otras cosas el paso del tiempo. La interpretación occidental del 0 como ocupador del espacio vacío que dejan los números positivos y negativos es bastante pobre. Parece que se la idearon los contables de la época para saber cuánto se tiene y cuánto se debe.

Me parece que el Zero de AGZ escrito con Z mayúscula va más por lo hindú que lo contable. Además tiene resonancias con el nombre de la empresa Deepmind, mente profunda, Se supone por explorarla adentrándonos en su infinita profundidad. Este Zero podría significar algo así como la libertad de exploración de una profundidad insondable y por tanto que no conoce limite. Y con esto se entendería también porque no le han colocado el número dos, que es lo que le correspondería por contabilidad. Esto además tiene su coherencia con su actividad. Aquí en el diseño de abajo un Zero con la forma del símbolo matemático cero, con marcianitos incluidos.

Buff ya me he pirado otra vez

$D:\Mis Imágenes\blog\alpha go zzero 21.jpg$

La principal diferencia entre Libratus y AGZ es que este ultimo usa redes de neuronas artificiales, y por tanto más que sucesivos recorridos por los puntos de decisión, aquí hay un constante ir y volver. Y esto es lo que facilita un denominado aprendizaje reforzado, que también consiste en aprender una y otra vez jugando contigo mismo, la maquina consigo misma.

Las redes neuronales artificiales son algoritmos tipo caja negra. Esto también le distingue de Libratus. Cuando funcionan bien, nadie sabe por qué, a eso me refiero con lo de caja negra. A diferencia de los algoritmos estadísticos, que usa Libratus, a día de hoy con las redes neuronales no se puede reconstruir el proceso seguido.

El enfoque y el merito de AGZ es combinar y acoplar estos procedimientos de las redes neuronales con la búsqueda de un árbol de posibilidades de simulaciones al futuro de método de Montecarlo. Una simulación de Montecarlo, en la que entraremos más adelante, pero que solo se ha podido hacer apenas hace 50 años de manera masiva, gratis y al alcance de todos. Y este instrumento creado en los 40 es el ideal para predecir movimientos brownianos, que fascinaron a Einstein en los años veinte, como el vuelo de una mosca, o más reciente el caótico comportamiento del precio de un activo de bolsa en relación a un tiempo futuro. Ya se explico cómo se hace esto con Excell la última vez que hablamos de Simons.

AGZ de una manera brillantes combina los dos procedimientos. La red neuronal y el lanzamiento de simulaciones al futuro mediante el método de Montecarlo. Siempre con el lema de estos periféricos del norte Londres, SOLO HAY FUTURO. Y también el de sus maquinas cargadas de IA, que les piden que no les llenen de experiencia ni de datos humanos. Ya tratamos este tema. Ya intuíamos que lo que hacia Simons y Renaissance con rentabilidades medias del 40% al año, y nunca ganado menos de un 25% al año, con sus científicos en el mejor laboratorio de trading del mundo debía ir por ahí. No tenemos información ni datos. Es solo una opinión de un diario, pero estoy convencido de ello. Lo que hace la nueva Inteligencia artificial pionera en el mundo, mediante AGZ, es aprender a investigar el futuro a través de competir en juegos simulados guiados por las redes neuronales.

Y aquí esta la principal similitud con Libratus .Ninguno los dos necesitan nada de los humanos, para batirles y para jugar consigo mismos. Me refiero a ninguna información de los maestros del Go, o del ajedrez, o del poker. Sin datos pasados, reglas u oficio humanos por favor, parece que es lo que exigen estas maquinas antes de ser cargadas para empezar a vivir y crear la nueva Inteligencia artificial .

La combinación de ambos métodos de AGZ en el SOLO HAY FUTURO, consiste en que la red neural guía la dirección de exploración a lanzar las simulaciones de Montecarlo, a través de la construcción de un árbol de posibilidades de exploración de este método. Arbol de exploración, que va siendo evaluado. El algoritmo se expande y vuelve a sus posiciones primeras del árbol, para evaluar, mejor dicho para dejar la nueva evaluación. . Es bidireccional, y en cada ir y venir trae una evaluación de cual parece ser el mejor camino, y con él una puntuación. Como en las películas del oeste o de guerra, es el indio explorador que va por delante y vuelve, y no para toda la película de ir y venir, al posible recorrido futuro indicando cual es el mejor camino a los que están rezagados para llegar al destino. Todo esto en un paisaje seco y desértico, tipo Mad Max.

La red neural evalúa las posiciones. Luego guía las direcciones a explorar. Mejor sería decir que la red neural nos va indicando cual es el camino a la victoria en cada momento, mientras ese ir al futuro y volver evaluado, aumenta en cada interacción. Esto último es el concepto del "aprendizaje reforzado de" las maquinas inteligentes.

Juegan sobre si mismo en el futuro, estos algoritmos, y el resultado es que la máquina de alguna manera" intuye" el mejor camino a optar en el juego. Difícil de asumir y entender de golpe, pero sería algo así como tener cuando jugáramos al GO contra alguien, a un experto anciano del GO dándonos consejos de que hay que hacer en cada momento del juego y al que le hubieran todo el tiempo para estudiar todas las posibilidades futuras posibles, que lleva cada movimiento de ficha que hagamos. Y luego nos dijera al oído cual es el camino óptimo de juego y por tanto la posición de la ficha a colocar mejor para la victoria final.

Luego entraremos en detalle con estos métodos y algoritmos y esta creación de inteligencia sobrehumana a través del entrenamiento que da un aprendizaje reforzado.

Un descanso

Esto de que las maquinas intuyan mas que calculen y no necesiten nada de nosotros, ningún dato, rompe muchos moldes, El primero el de los progres, que van de humanistas y acusan a la IA de Google de estar chupando de nuestros datos de una manera fraudulenta e ilegal. Me refiero en concreto a la última novela de Belen Gorpegui dedicada a la inteligencia artificial de Google. Libro falso, paleto y demagógico donde los haya .

Gracias al propio buscador de Google, que demoniza, esto se desenmascara fácilmente. La inteligencia artificial, no es propiedad de los dueños de Google. La información para crearla se expande, nadie puede adueñarse de ella, y el que más la expande y facilita es precisamente Google con su buscador. No necesita ningún dato de nosotros, eso era antes, pero no del común de los mortales, necesitaba datos de especialistas en la materias, que cobraban un pastón por ello, y que hacía que solo los poderosos pudieran acceder a ella. Ahora de alguna manera se ha democratizado, se da de gratis, porque no cuesta pagar los honorarios de los mejores. Así que no podemos ir de victimas. Luego ya lo de la relación de la madurita matemática con el yogurin joven idealista, necesitado de conocimiento y conversación con su mama-abuela es ridículo.

Parece las fantasías de las 50 sombras esas, destinadas al consumo de las que leen que son muchas más que los que leen, con una especial dedicación a las maduritas liberadas solas y a las feministas. No va la inteligencia artificial, basada en el futuro por ahí. Parte esta pagada por Google, pero otra es publica, está en los departamentos de investigación de las universidades .Lo relevante es que ambas cada vez son más baratas y son accesibles y se intercambian la información. Y esta divulgación gratis se hace mundial gracias precisamente a buscadores como el de Google. Ahora mismo la inteligencia artificial más bien se dedica a que las maquinas intuyan cual es el optimo camino y nos lo cuenten al oído de quien quiera escucharles. La resistencia a este tipo de avances es una constante históricamente. Ahora seguramente el reportero zumbado que retransmitió para la CBN el minicrack del lunes gris claro del 5 de Febrero 2018, dirá algo así como

" No veis, lo dije, las maquinas pueden intuir y cualquiera sabe que si pueden intuir , se pueden coordinar para romperse juntas en los lunes negros como yo decía. "

Otros trataran de escucharlas y entenderlas. Esto siempre ha sido así.

Hay segunda parte.