Hugues a écrit:Un article assez passionnant lu il y a quelques jours ou semaines:
comme pour le Go, où la manière de jouer d'Alpha Go fut la découverte d'un nouveau jeu, et même une "expérience mystique" pour Lee Sedol, les échecs ont subi la même chose le mois dernier avec Alpha Zero.
Alpha Zero affrontait le logiciel champion du monde d'échec, alors qu'Alpha Zero ne sortait que de 4h d'auto-apprentissage du jeu (il s'affrontait lui-même en étant totalement ignorant en échecs, excepté ses règles, au début des 4h et n'avait joué que 44 millions de match à l'issue des 4h)
Alpha Zero l'a emporté avec 28 victoires, 72 nuls, et 0 défaites.
Et ce qui a été vu, lors de ce match, d'un côté, ça n'est pas tellement la découverte d'un nouveau jeu, c'est un peu le retour à la manière (parfois irrationnelle) de jouer des humains avant que les ordinateurs les mènent à croire que le futur des échecs était dans un jeu conservateur.
Mais d'un autre c'est extraordinaire qu'une machine décide de jouer ainsi, comme dans cette partie en sacrifiant pièce après pièce, pour finalement pousser son adversaire logiciel dans une situation inextricable (contre tous les calculs de ces logiciels d'échecs dont les algorithmes sont basés sur le calcul de millions et milliards de combinaisons, logiciels qui dominaient loin devant les hommes jusqu'au mois dernier les échecs, et qui ne voyaient rien de bon dans tous ces sacrifices... )
https://fivethirtyeight.com/features/chesss-new-best-player-is-a-fearless-swashbuckling-algorithm/
Hugues
Waddle a écrit:Merci Hugues.
Le logiciel champion d'échc dont tu parles, il était devenu plus fort que l'homme c'est ça?
Et Alpha Zero lui a mis la misère après 4h d'aprentissage?
C'est quoi le principe de fonctionnement de Alpha Zéro ? (Tu as du l'expliquer avant je suppose mais j'ai pas vu)
Au lieu d'emmagasiner ou de calculer des millions de chemins possibles, il joue contre lui même et il "progresse" comme ça?
Concernant le fait de sacrifier beaucoup de pièces, étant donné que le logiciel n'a pas d'émotions, pourquoi est-ce si étonnant tant que c'est efficace? La tendance actuelle des logiciels ne ressemblait pas du tout à ça?
Hugues a écrit:Coup que Stockfish a été incapable d'anticiper, mais que son dispositif statistique a ensuite compris immédiatement comme néfaste
sheon a écrit::10:
Waddle a écrit:Hugues a écrit:Coup que Stockfish a été incapable d'anticiper, mais que son dispositif statistique a ensuite compris immédiatement comme néfaste
Comment on sait que Stockfish a identifié ce coup comme néfaste pour lui?
Hugues a écrit:Sans doute.
Mais le fait qu'il l'envisage signifie qu'il estime déjà qu'il a d'énormes chance de gagner malgré la moindre qualité du coup.. Sinon il se serait contenté du nul.
Hugues
sheon a écrit:Moi, ce qui me fascine, c'est le fait que faire jouer deux fois de suite les mêmes IA l'une contre l'autre ne résulte pas en exactement la même partie.
sheon a écrit:Moi, ce qui me fascine, c'est le fait que faire jouer deux fois de suite les mêmes IA l'une contre l'autre ne résulte pas en exactement la même partie.
Hugues a écrit:Une chose intéressante encore, c'est que, depuis AlphaZero actuel a dépassé son apprentissage de 4h et atteint des niveaux où il bat AlphaZero Stockfish (pour simplifier on accole le nom de l'adversaire qu'il a battu comme ça on voit de quel niveau d'apprentissage on parle) à plat de couture..
Hugues a écrit:Par exemple de ce coup de génie dans la première vidéo qui va retourner complètement le léger avantage des blancs (normal puisqu'ils commencent) en un fort avantage des noirs, coup que Stockfish a été incapable d'anticiper, mais que son dispositif statistique a ensuite compris immédiatement comme néfaste)
Je viens de regarder la vidéo 2. C'est impressionnant comment le fou noire des cases blanches est assigné à résidence et est inutile pendant toute la partie.Hugues a écrit:En vidéo, analyses passionantes de 6 parties de AlphaZero contre Stockfish. Ou le témoignage d'intuition ou de connaissance du jeu d'échec extrêmement profonde, dans certaines situations (si profonde que c'est difficile pour nous même de comprendre quelle est la véritable portée tactique par exemple de ce coup de génie dans la première vidéo qui va retourner complètement le léger avantage des blancs (normal puisqu'ils commencent) en un fort avantage des noirs, coup que Stockfish a été incapable d'anticiper, mais que son dispositif statistique a ensuite compris immédiatement comme néfaste)
Remarquable manière aussi par deux fois d'éviter le nul dans la première vidéo (alors que justement, il a été réglé en ces cas là pour évidemment favoriser le nul si la victoire est trop incertaine, preuve en choisissant d'éviter le nul qu'il savait alors qu'il allait gagner)
Hugues
Hugues a écrit:Aussi, il y a un truc fascinant, sa manière de contrôler et de tourner en ridicule le fou sur case blanche presque chaque fois.
Comme si il avait appris quelque chose que l'humanité n'a jamais compris en 800 ans d'histoire du jeu que le secret de la victoire aux échecs tenait en premier lieu en cette "mise en échec" du fou sur case blanche et non du roi. (C'est peut-être n'importe quoi comme hypothèse mais c'est quelque chose qui semble revenir avec constance dans son jeu, presque "obsessionnellement", son jeu qui est sans aucun doute celui du meilleur joueur de l'histoire des échecs)
A moins que tout simplement il révèle par cette manoeuvre une faiblesse jamais encore remarquée des logiciels ordinaires d'échecs, lié justement à leur manière d'aborder les échecs (par des simulation de millions/milliards de position)
Et qu'il exploite cette faille qu'il voit mieux que nous.
Utilisateurs parcourant ce forum: Bing [Bot] et 108 invités