Команда ученых Сбера и российского Института искусственного интеллекта AIRI заняла первое место в на международных соревнованиях по ИИ NetHack Challenge. Всего в конкурсе участвовали около 500 человек из 42 двух команд.
Сберовская команда показала лучший результат в обучении ИИ прохождению одной из самых сложных в мире игр c помощью нейросетей: трудность в том, что в игре NetHack Challenge слишком много возможностей̆ исхода событий и нет заранее известной стратегии, что максимально приближает ее сценарий к условиям реального мира.
Ученым удалось построить иерархию навыков на базе классических подходов к машинному обучению и современных методов на основе «обучения с подкреплением». Такая методология строится на основе обратной связи от взаимодействия со средой, например, игрой, или реальным миром – она использовалась для победы ИИ в игре го (AlphaGo) и многих известных играх, например, StarCraft (AlphaStar), Dota 2 (OpenAI Five).
В свою очередь, игра NetHack используется в индустрии для оценки прогресса в обучении искусственного интеллекта, поскольку современные нейросети пока достаточно плохо справляются с ней, в отличие от го, шахмат, Dota 2 или Starcraft, которые модели машинного обучения освоили уже давно.
По словам первого зампреда правления Сбера Александра Ведяхина, решения, которые предложили участники конкурса, имеют гораздо более широкое применение, чем компьютерная игра: прогресс в решении подобных задач приведет к новым открытиям в области робототехники, например, для совершенствования работы беспилотных автомобилей и роботов-курьеров, а также в таких областях, как автоматизация тестирования пользовательских интерфейсов.