Las versiones anteriores de AlphaGo inicialmente se entrenaron observando miles de juegos profesionales y amateurs de humanos para aprender a jugar Go. AlphaGo Zero omite este paso y aprende a jugar simplemente jugando juegos contra sí mismo comenzando a jugar inicialmente al azar. Al hacerlo así, superó rápidamente el nivel de juego humano y derrotó a la versión previa de AlphaGo por 100 juegos a 0.
|
etiquetas: alphago zero , google deepmind , ia , machine learning