«Революция в рекомендательных системах еще не случилась»
RecSys, пожалуй, самое прикладное направление исследований искусственного интеллекта. Чтобы проверить, эффективно ли работает рекомендательная система, ее обязательно нужно показать пользователям и проанализировать сценарии взаимодействия с ней. Это существенное отличие, например, от компьютерного зрения (CV) или обработки естественного языка (NLP).
«В рекомендательных системах важна обратная связь от пользователя. Если мы не показываем ему рекомендацию, он ведет себя по одному сценарию. А при показе мы можем повлиять на принятие решений пользователем, он может передумать. Без учета этого воздействия мы не можем быть уверены, насколько наша система качественная, поэтому на практике доверяем только A/B-тестам. Это лишь одна из многих особенностей RecSys, которая делает ее более прикладной сферой, чем остальные направления ML», — объясняет Марина.
Бизнес заинтересован в развитии RecSys, ведь умные системы ИИ помогают продвигать контент, товары и услуги. Чтобы системы были умнее, компаниям нужны инновации.
«Наука может дать бизнесу более совершенные алгоритмы, — говорит Марина. — Думаю, что революция в рекомендательных системах еще не случилась, как это было в других областях. Например, с появлением архитектуры трансформера или ChatGPT в NLP. Новые технологии неизбежно меняют направление, в котором область дальше развивается. В основном большинство исследователей RecSys сейчас заимствуют и адаптируют нейросетевые модели из других областей ML. Появляются области на стыке сфер исследований, например RL в RecSys. Отдельных прорывных технологий, которые бы перевернули всю индустрию рекомендательных систем, еще нет, поэтому в этой области вклад академических исследований может стать очень значимым».
Наука уже питает бизнес инновациями. Так, исследователи из рабочей группы RecSys разработали алгоритм TAIW (Time-Aware Item-based Weighting), который позволяет более точно прогнозировать, когда и какие покупки совершают пользователи. Он был представлен на главной конференции по рекомендательным системам ACM RecSys в Сингапуре в 2023 году.
«Исходно этот алгоритм был разработан для задачи предсказания следующей корзины. В нем объединяется логика использования модели на коллаборативном сигнале с физическим процессом Хоукса, в результате которого можно получить распределения по интервалам времени между повторными покупками товаров. Для каждого пользователя финальные рекомендации будут зависеть от истории предпочтений самого пользователя, похожих на него людей и прошедшего времени для актуальности покупки».
Трансформер — это вид нейросетевой архитектуры, который хорошо подходит для обработки последовательностей данных, например текста.
Как это работает
Представьте, что вы попросили искусственный интеллект продолжить предложение. Как ИИ предскажет следующее слово? Он может последовательно проанализировать все слова в предложении и, получив представление о смысле одного слова, предсказать следующее. Так работают рекуррентные нейронные сети.
Нейросеть-трансформер устроена иначе: она смотрит на контекст, на то, как связаны по смыслу все слова со всеми словами, и на основе этих связей подбирает следующее слово в предложении. Поэтому нейросети на основе трансформеров лучше понимают подтекст и генерируют более глубокий и связный текст.
Обучение с подкреплением
(Reinforcement Learning, RL) — метод машинного обучения, при котором агент учится принимать последовательные решения в среде, чтобы максимизировать награду.
Компьютерное зрение
(Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом изображений и видео. Она позволяет компьютеру «видеть» и извлекать информацию из увиденного.
Компьютерное зрение
(Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом изображений и видео. Она позволяет компьютеру «видеть» и извлекать информацию из увиденного.
A/B-тестирование — это эксперимент, который позволяет сравнить две версии продукта. Суть в том, что на протяжении какого-то времени одному сегменту аудитории («А») показывают, к примеру, старый дизайн сайта, а другому («В») — обновленную версию. И проверяют, где выше конверсия.
A/B-тестирование — это эксперимент, который позволяет сравнить две версии продукта. Суть в том, что на протяжении какого-то времени одному сегменту аудитории («А») показывают, к примеру, старый дизайн сайта, а другому («В») — обновленную версию. И проверяют, где выше конверсия.
TAIW (Time-Aware Item-based Weighting) — рекомендации с учетом периодичности покупок товаров.
ACM RecSys — международная конференция, на которой эксперты в области рекомендательных систем делятся своими наработками и исследованиями.