Пятница, 8 мая, Zoom. Начало в 18:10.
Докладчик: Н. Карпов (Indiana University).
Тема: Collaborative Top Distribution Identifications with Limited Interaction.
Abstract
В докладе мы рассмотрим задачу поиска среди n распределений m распределений с наибольшим средним. В литературе про обучении с подкреплением эта задача известка как top-m arm identifications и имеет много применений. Мы рассмотрим модель когда несколько игроков пытаются решить задачу в коллаборации. Я расскажу о нашем недавнем результате в котором мы достигаем оптимального trade-off между количеством раундов коммуникации между игроками и числом сэмплов необходимых для решения задачи совместно. В частности я рассажу как сложность задачи поиска m лучших распределений отличается от сложности поиска лучшего распределения.
Доклад будет основан на совместной работе с Qin Zhang и Yuan Zhou:
https://arxiv.org/abs/2004.09454 .
Видео доклада:
https://www.youtube.com/watch?v=rz1LjaZSu7c