SPJ: японскими учёными разработана система для борьбы с многоруким бандитом

Японские ученые под руководством Хироаки Синкавы из Токийского университета изобрели расширенную схему фотонного обучения с подкреплением, которая позволяет достичь успеха во время игры на игральном автомате.

Исследование было опубликовано в журнале Science Partner Journal. Ученые считают, что успех схемы зависит как от фотонной системы, которая повышает качество обучения, так и от поддерживающего алгоритма.

Поэтому исследователи разработали модифицированный алгоритм и подтвердили его эффективность путем численного моделирования. В нем была использована сетка 5х5 ячеек, а процесс решения строился как сценарий.

Инновация опыта заключалась в том, что алгоритм Q-обучения был нацелен на эффективное и точное обучение оптимальному значению Q для значений «состояние – действие» во всей среде, пишет InnovaNews.ru.

Ранее МедиаПоток писал, что российскими учеными ИМП РАН найдено место падения станции «Луна-25».