1. В начале доклада кратко вспомним основные классические подходы к построению рекомендательных систем, пройдём краткий экскурс в виды языковых моделей. Не говорим совсем базу про трансформер и т.д., но говорим про:
• RAG;
• few/zero-shot learning;
• функциональные возможности, которые они нам дают с точки зрения интеракции с пользователями (легкую и быструю дообучаемость на данных, нужных пользователю).
2. Далее разберем несколько способов объединения классических рекомендательных систем и языковых моделей для построения интерактивных рекомендаций для пользователя. Рассматриваем системы эмбеддингов:
• Эмбеддинги классических рекомендаций;
• Текст, описание, характеристики товара в дополнительные смысловые эмбеддинги через языковые модели;
• Эмбеддинг пользователя классических рекомендаций;
• Смысловой эмбеддинг пользователя исходя из текущего диалога;
• Исторический эмбеддинг пользователя по диалогам;
• Поведенческий эмбеддинг, построение психологчиского портрета через историю общения с LLM-кой.
3. Разбираем общее строение системы, объединяющий все эмбеддинги моделей:
• Добавляем в LLM-ку модуль, который считывает дополнительные эмбеддинги;
• Строим базу с эмбеддингами товаров и векторным поиском по ней;
• Рассматриваем, как выглядят обращения модифицированной LLM-ки к такой базе в соответствии с запросами пользователя.
4. Смотрим пример трех функций такой системы:
• Content Helper, ответы на вопросы по товару, подсвечивание нужных характеристик товаров по отзывам и карточке товара или на основании запроса пользователя и уточнении того, что ему важно;
• Подбор по ситуации/на основании описания ситуации пользователем;
• Подбор аналога или подбор на основании того, что пользователю важно в аналоге.
5. Также поговорим про предсбор корзин: на основании истории покупок или на основании дообучения на специализированных литературах по запросу пользователя о том, что и в каком количестве ему важно.
6. Кратко наметим, как выстроить систему, которая накапливает знания о таких обращениях/рекомендациях/финальных выборах клиентов, чтобы затем дообучать систему делать более точные предсказания о том, что пользователю нужно, меньше вовлекая его в расспросы.
7. Поговорим про проблемы, которые могут возникнуть, и потенциальные пути их решения:
• Галлюцинации: ссылки, товары;
• Схождения смысла в точки;
• Придумывания, откровенная смысловая, фактическая ложь.
Делаю AI в X5 Digital, а раньше руководила отделом OzonTech,
генеративный дизайн, ллм-ки, поведенческие модели
технологиями настоящего делаю продукты будущего реальными сейчас