Дослідники з проекту DeepMind навчили штучний інтелект грати в індивідуальну версію Quake III Arena як людина.
Команда розробників зосередилася на режимі захоплення прапора, в якому карта змінюється кожної гри.
І ще: Siri перебив міністра оборони Британії під час виступу
Персонажі, які керувалися штучним інтелектом, повинні були вивчити загальні стратегії, щоб мати можливість адаптуватися до кожної нової карти. Людям зробити це набагато простіше. Агентам DeepMind також необхідно як співпрацювати з членами команди, так і конкурувати з протилежною командою і бути в змозі адаптуватися до різних стилів гри супротивника.
Наші агенти повинні вчитися з нуля, як бачити, діяти, співпрацювати і конкурувати в невидимих середовищах, все з одного сигналу підкріплення за матч: виграла їхня команда чи ні, – пишуть дослідники в блозі.
Автори роботи використовували навчання з підкріпленням – вид машинного навчання, при якому алгоритм навчається, не маючи при цьому навчальної вибірки у вигляді пари "вхідні дані – відповідь". Комп'ютер отримує відгук від середовища – наприклад, очки за успішне проходження рівня або штрафні бали за помилки – і завдяки цьому покращує свою роботу.
Дослідники виявили, що персонажі під управлінням штучного інтелекту виграють частіше, ніж люди, але вони й більш доброзичливі, ніж люди. Персонажі також вивчили людську поведінку – наприклад, слідувати за гравцями своєї команди і займати базу ворога.
За словами творців, в майбутньому нова система штучного інтелекту, ймовірно, може бути адаптована і для більш складних ігор, наприклад StarCraft II або Dota 2.
Читайте також: Брудна таємниця: Gmail потрапив у скандал, і ось чому