Японские ученые под руководством Хироаки Синкавы из Токийского университета изобрели расширенную схему фотонного обучения с подкреплением, которая позволяет достичь успеха во время игры на игральном автомате.
Исследование было опубликовано в журнале Science Partner Journal. Ученые считают, что успех схемы зависит как от фотонной системы, которая повышает качество обучения, так и от поддерживающего алгоритма.
Поэтому исследователи разработали модифицированный алгоритм и подтвердили его эффективность путем численного моделирования. В нем была использована сетка 5х5 ячеек, а процесс решения строился как сценарий.
Инновация опыта заключалась в том, что алгоритм Q-обучения был нацелен на эффективное и точное обучение оптимальному значению Q для значений «состояние – действие» во всей среде, пишет InnovaNews.ru.
Ранее МедиаПоток писал, что российскими учеными ИМП РАН найдено место падения станции «Луна-25».