Как ИИ предсказывает наши интересы: исследования ученых в области RecSys

Приложение с доставкой еды знает, какие продукты вы чаще заказываете, и напомнит о них, чтобы вы не забыли пополнить корзину. Онлайн-маркетплейсы выдают только релевантные товары с персональными скидками, а соцсеть показывает больше котов в ленте, если вы часто ставите под ними лайки. Сервисы знают о нас многое благодаря большим данным и искусственному интеллекту, который их анализирует.

Рекомендательные системы повсюду. Они подбирают товары и контент для нас на основе наших предпочтений.
«Рекомендательные модели, которые мы строим, улучшают клиентский опыт, делают контент и продукт более интересным и релевантным. Мы персонализируем рекомендации на основе предпочтений и поведения пользователей. Чтобы делать это хорошо и качественно, без R&D (исследований и разработок) не обойтись. Приходится читать научные статьи, внедрять новые подходы. Часть наших задач — это новые для индустрии продукты и инновационные фичи в мобильных приложениях. RecSys — очень интересная область, которая базируется и на простых прикладных лайфхаках, и на глубоком R&D», — рассказывает Марина.
От рекомендаций выигрывают не только пользователи, но и бизнес. Так, рекомендательная система Amazon, основанная на больших данных, генерирует по 1 миллиарду долларов каждый год. А пользователи Netflix примерно в 80% случаев выбирают фильмы для просмотра на основании персонализированных рекомендаций.

Netflix, Amazon, Google и другие мировые компании ушли в области рекомендательных систем далеко вперед еще в начале 2010-х, говорит Марина Ананьева, научный руководитель команды RecSys в исследовательской лаборатории Tinkoff Research. При этом, в России в это время не было ни инфраструктуры, ни опыта и крупных успешных кейсов внедрения рекомендательных систем, ни даже хороших образовательных курсов.
Что такое рекомендательные системы и как они работают

Рекомендательные системы, или RecSys — это комплекс алгоритмов, программ или сервисов, которые на основе персональных предпочтений человека рекомендуют ему контент, товары или услуги.

Как работает технология
Один из базовых принципов в рекомендательных системах — коллаборативная фильтрация (collaborative filtering), по которой рекомендации пользователю делаются на основе поведения похожих на него людей.
Чтобы понять эту концепцию, представьте группу людей, которые смотрят фильмы в онлайн-кинотеатре. У каждого из них есть свои предпочтения: одни фильмы нравятся, другие — нет. Если пользователь A и пользователь B посмотрели один и тот же фильм и положительно оценили его, ИИ предположит, что их вкусы схожи, и порекомендует пользователю A и другие фильмы, которые понравились пользователю B.

Рекомендательные системы могут быть устроены подобным образом в музыкальных, банковских и в других сервисах, которыми вы пользуетесь.
ИИ-словарь

«Я сменила специальность на прикладную математику и информатику, чтобы машинное обучение больше не казалось магией»

Исследовательский интерес к искусственному интеллекту у Марины появился на первой работе в отделе клинических исследований фармацевтической компании.
«Все началось в 2016 году с совместных проектов Яндекса и AstraZeneca. Мои коллеги занимались задачей распознавания расположения и типа опухоли по снимкам МРТ головного мозга, причем с точностью выше, чем у врачей. Для меня это было на грани фантастики. Мне очень хотелось узнать, как эти технологии работают изнутри, поэтому я решилась сменить специальность на прикладную математику и информатику».
В 2018 году Марина получила степень магистра по прикладной математике и информатике в НИУ ВШЭ и в последние полгода магистратуры училась в Университете Гонконга (The University of Hong Kong, HKU), где успешно сдала экзамены. Во время обучения вышли первые научные статьи Марины об ИИ, а после окончания вуза она продолжила заниматься исследованиями вне университетских стен.
«После магистратуры мне было важно получить практические навыки на позиции data scientist (разработчика машинного обучения), и мой выбор пал на сильную команду в Центре технологий искусственного интеллекта Тинькофф. После первых успешно внедренных рекомендательных моделей на работе стало понятно, насколько это перспективное направление, на развитии которого я и сфокусировалась», — рассказывает Марина.
Марина Ананьева из Tinkoff Research
Марина Ананьева, руководитель направления рекомендательных систем в Центре технологий искусственного интеллекта Тинькофф

«Революция в рекомендательных системах еще не случилась»

RecSys, пожалуй, самое прикладное направление исследований искусственного интеллекта. Чтобы проверить, эффективно ли работает рекомендательная система, ее обязательно нужно показать пользователям и проанализировать сценарии взаимодействия с ней. Это существенное отличие, например, от компьютерного зрения (CV) или обработки естественного языка (NLP).
«В рекомендательных системах важна обратная связь от пользователя. Если мы не показываем ему рекомендацию, он ведет себя по одному сценарию. А при показе мы можем повлиять на принятие решений пользователем, он может передумать. Без учета этого воздействия мы не можем быть уверены, насколько наша система качественная, поэтому на практике доверяем только A/B-тестам. Это лишь одна из многих особенностей RecSys, которая делает ее более прикладной сферой, чем остальные направления ML», — объясняет Марина.
Бизнес заинтересован в развитии RecSys, ведь умные системы ИИ помогают продвигать контент, товары и услуги. Чтобы системы были умнее, компаниям нужны инновации.
«Наука может дать бизнесу более совершенные алгоритмы, — говорит Марина. — Думаю, что революция в рекомендательных системах еще не случилась, как это было в других областях. Например, с появлением архитектуры трансформера или ChatGPT в NLP. Новые технологии неизбежно меняют направление, в котором область дальше развивается. В основном большинство исследователей RecSys сейчас заимствуют и адаптируют нейросетевые модели из других областей ML. Появляются области на стыке сфер исследований, например RL в RecSys. Отдельных прорывных технологий, которые бы перевернули всю индустрию рекомендательных систем, еще нет, поэтому в этой области вклад академических исследований может стать очень значимым».
Наука уже питает бизнес инновациями. Так, исследователи из рабочей группы RecSys разработали алгоритм TAIW (Time-Aware Item-based Weighting), который позволяет более точно прогнозировать, когда и какие покупки совершают пользователи. Он был представлен на главной конференции по рекомендательным системам ACM RecSys в Сингапуре в 2023 году.
Марина Ананьева из Tinkoff Research
«Исходно этот алгоритм был разработан для задачи предсказания следующей корзины. В нем объединяется логика использования модели на коллаборативном сигнале с физическим процессом Хоукса, в результате которого можно получить распределения по интервалам времени между повторными покупками товаров. Для каждого пользователя финальные рекомендации будут зависеть от истории предпочтений самого пользователя, похожих на него людей и прошедшего времени для актуальности покупки».
Трансформер — это вид нейросетевой архитектуры, который хорошо подходит для обработки последовательностей данных, например текста.

Как это работает
Представьте, что вы попросили искусственный интеллект продолжить предложение. Как ИИ предскажет следующее слово? Он может последовательно проанализировать все слова в предложении и, получив представление о смысле одного слова, предсказать следующее. Так работают рекуррентные нейронные сети.
Нейросеть-трансформер устроена иначе: она смотрит на контекст, на то, как связаны по смыслу все слова со всеми словами, и на основе этих связей подбирает следующее слово в предложении. Поэтому нейросети на основе трансформеров лучше понимают подтекст и генерируют более глубокий и связный текст.

Обучение с подкреплением
(Reinforcement Learning, RL) — метод машинного обучения, при котором агент учится принимать последовательные решения в среде, чтобы максимизировать награду.
ИИ-словарь
Компьютерное зрение
(Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом изображений и видео. Она позволяет компьютеру «видеть» и извлекать информацию из увиденного.
Компьютерное зрение
(Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом изображений и видео. Она позволяет компьютеру «видеть» и извлекать информацию из увиденного.
ИИ-словарь
A/B-тестирование — это эксперимент, который позволяет сравнить две версии продукта. Суть в том, что на протяжении какого-то времени одному сегменту аудитории («А») показывают, к примеру, старый дизайн сайта, а другому («В») — обновленную версию. И проверяют, где выше конверсия.
ИИ-словарь
ИИ-словарь
A/B-тестирование — это эксперимент, который позволяет сравнить две версии продукта. Суть в том, что на протяжении какого-то времени одному сегменту аудитории («А») показывают, к примеру, старый дизайн сайта, а другому («В») — обновленную версию. И проверяют, где выше конверсия.
ИИ-словарь
TAIW (Time-Aware Item-based Weighting) — рекомендации с учетом периодичности покупок товаров.

ACM RecSys — международная конференция, на которой эксперты в области рекомендательных систем делятся своими наработками и исследованиями.

«Индустрия и академия до сих пор в начале пути, чтобы научиться эффективно работать в связке»

«Компании часто не позволяют провести слишком много экспериментов и глубоко нырнуть в исследование, — объясняет Марина. — В индустрии важны надежные решения, которые будут оптимальными и эффективными с точки зрения вычислительных ресурсов, поэтому часто выбор падает на самые простые подходы в рекомендательных системах. Например, коллаборативная фильтрация или градиентный бустинг».
Академия, напротив, позволяет углубиться в исследование и не слишком заботиться о его прикладной составляющей. К научным экспериментам предъявляются особые требования по научной новизне, объему и воспроизводимости — если работа им не соответствует, ее не примут для публикации в научные журналы и на конференции.

Однако, по мнению Марины, основная проблема не в том, что подходы практиков и академиков к исследованиям в ИИ различаются, а в отсутствии совместной работы между ними.
Исследования в ИИ проводятся и в научных лабораториях университетов, и в R&D-отделах крупных компаний. Но в чем разница? И как ученым учесть интересы бизнеса?

По мнению Марины, в этих двух сферах работают разные подходы к исследовательскому процессу. Бизнесу нужны быстрые решения, которые будут увеличивать выручку и другие показатели эффективности. Поэтому индустрия диктует жесткие дедлайны и базовые решения.
«Индустрия и академия живут как два отдельных мира, они до сих пор не научились эффективно работать в связке. Основные значимые открытия последних лет в области рекомендательных систем были сделаны либо в результате крупных хакатонов и соревнований, например Netflix Prize, либо благодаря инхаус-разработке в отдельных исследовательских группах крупных компаний — в основном это Netflix и Google. Но даже крупные игроки почти не работают напрямую с университетами, несмотря на открытые лаборатории и кафедры. Формат, в котором исследователи из академии и инженеры из индустрии находятся в одной рабочей группе, это большая редкость. Чтобы область активно развивалась в будущем, нужно продолжать использовать такой и другие форматы эффективного взаимодействия».
Градиентный бустинг — один из методов машинного обучения (ML), который используется для создания ансамблей моделей путем последовательного обучения слабых моделей с целью улучшения качества прогнозов. Этот метод направлен на минимизацию ошибки путем последовательного добавления моделей, каждая из которых исправляет ошибки предыдущей.
ИИ-словарь
Команда RecSys в лаборатории уже работает в тесной связке, например, с НИУ ВШЭ — курирует проектную работу в области рекомендательных систем на базовой кафедре Тинькофф на факультете компьютерных наук.
Netflix Prize — открытое соревнование компании Netflix на лучший алгоритм предсказания оценки, которую зритель поставит фильму, на основе предыдущих оценок этого и других зрителей.

«Рекомендательные системы влияют на нас здесь и сейчас, но оценить это крайне трудно»

«С начала 2000-х рекомендательные системы начали встраиваться в сервисы в явном и в неявном виде, когда пользователь не осознает, что на самом деле пользуется рекомендациями, — рассказывает Марина. — Очень сложно оценить, как рекомендательные системы комплексно влияют на нашу жизнь, определяя и меняя наш выбор и предпочтения. Например, если не показывать мне рекомендации на YouTube, какие видео я искала бы и смотрела самостоятельно? Насколько отличались бы мои интересы и предпочтения по контенту? Одна из проблем рекомендательных систем — формирование пузыря фильтров (Filter bubble), ограничивающего новые рекомендации в предыдущих предпочтениях пользователя. Тем не менее, есть техники для преодоления таких проблем».
Новым поколениям ML-инженеров и исследователей ИИ придется уделить больше внимания тому, как сделать рекомендации более разнообразными и новыми для пользователей. В этом, по словам Марины, помогает обучение с подкреплением (RL).
Уже сейчас есть влияние рекомендательных систем на нашу повседневную жизнь.
«Одно из преимуществ RL в RecSys — возможность дообучать рекомендации в режиме реального времени в зависимости от действий пользователей. Также это помогает менять доли подмешивания нового контента и уже известного, релевантного для пользователя, по его предыдущей истории предпочтений. Я думаю, что в будущем RL сделает рекомендательные системы более адаптивными и качественными», — говорит Марина.

«Я в лагере тех, кто верит, что в рекомендательных системах больше пользы, чем вреда»

«Сложно сказать, что нас ждет в будущем, но уже сейчас появляются этические комитеты и законодательные документы о регулировании использования рекомендательных систем. Это дает понимание, на чем основываются алгоритмы, на каких данных они обучаются, повышая прозрачность для пользователей. Отдельно ограничивается использование персональных данных без согласия пользователей. Однако, негативно это не влияет на качество и распространение рекомендательных систем, поскольку чаще всего такие данные не нужны», — подытожила Марина.
В будущем рекомендательные системы будут еще больше влиять на нашу повседневность, расширяя свое присутствие в различных сферах, считает ученый. Поэтому на первый план выходит этичность и безопасность ИИ, особенно в части использования персональных данных пользователей. Тренд на их защиту будет набирать обороты.
Марина Ананьева из Tinkoff Research
Информационный пузырь, или пузырь фильтров (Filter bubble) — это негативная сторона персонализированного поиска, при которой человек окружен только той информацией, которая не противоречит его точке зрения. Со временем пользователь становится интеллектуально изолированным в своем собственном информационном пузыре. Этот термин впервые предложил американский предприниматель и активист Эли Паризер в 2011 году.
ИИ-словарь