Статьи

19 апреля 2017

Обучение с подкреплением (будет доступно через один-два года)

Обучение с подкреплением — это процесс компьютерного обучения, когда компьютер проводит эксперименты, получает результат этих экспериментов и использует эти результаты для поиска путей выполнения задач. Фактически компьютеры обучаются, как люди, методом многократных проб и ошибок без посторонней помощи. Эту технологию, которая сейчас используется, в частности, для повышения безопасности движения самоуправляемых автомобилей, теперь пытаются применить и в других областях. Например, с ее помощью роботы могут освоить действия, которых они никогда не видели и которым их не могут научить программисты. Эта технология, в частности, позволила компьютеру AlphaGo, созданному подразделением Google — Deep Mind, освоить очень сложную стратегическую настольную игру го и в марте 2016 года обыграть в нее одного из лучших игроков мира — корейца Ли Седоля.


По материалам kommersant.ru