Кафедра інформатики КПНУ ім. І. Огієнка

Studies in tota vita

AlphaZero — це алгоритм, розроблений компанією DeepMind (з 2014 року компанією володіє Google), який використовує узагальнений підхід AlphaGo Zero. 5 грудня 2017 року колектив DeepMind випустив AlphaZero, який впродовж 24 годин досягнув надлюдського рівня гри в шахи, Сьоґі, і ґо, перемігши чемпіонів світу серед програм, Stockfish, Elmo і 3-денний варіант AlphaGo Zero. Stockfish, який використовується для домашньої підготовки багатьох гравців, переможець Чемпіонату TCEC (Top Chess Engine Chapmpionship) і Чемпіонату Chess.com виявився значно слабшим. В матчі з 100 партій AlphaZero отримав 28 перемог при 72 нічиїх.

Системі AlphaZero виявилося достатньо 24 години тренувань, щоб за допомогою нейронних мереж навчитися грати шахи краще ніж будь-який шахіст за 1500 років історії цієї гри чи будь-яка комп'ютерна програма, створена людьми за останні два десятиліття. За цей час програма зіграла сама із собою велику кількість партій, ставши своїм власним вчителем.

Той факт, що універсальний ігровий алгоритм зміг самостійно навчитися грі на настільки високому рівні, говорить про серйозний прогрес у цій області.

Джерела: ChampionQuibbllTehnot

Comments