Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
40_алгоритмов_Python.pdf
Скачиваний:
7
Добавлен:
07.04.2024
Размер:
13.02 Mб
Скачать

286

Глава 10. Рекомендательные системы

Перейдем к выработке рекомендаций на основе матрицы сходства (S) и матри­ цы предпочтений пользователя (U).

Выработка рекомендаций

Чтобы дать рекомендации, нужно перемножить матрицы. Пользователи с боль­ шей вероятностью заинтересуются товаром, часто встречающимся вместе с то­ варом, которому они дали высокую оценку:

Matrix[S] x Matrix[U] = Matrix[R].

Этот расчет показан на следующей диаграмме (рис. 10.6).

S

 

R

 

U

 

 

 

 

 

Рис. 10.6

 

Для каждого пользователя создается отдельная результирующая матрица. Чис­ ла в матрице рекомендаций, Matrix[R], отражают прогнозируемый интерес пользователя к каждому из товаров. Например, в итоговой матрице четвертый элемент содержит наибольшее число — 58. Поэтому этот товар настоятельно рекомендуется данному конкретному пользователю.

Теперь рассмотрим ограничения различных рекомендательных систем.

ОГРАНИЧЕНИЯ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ

Чтобы выработать рекомендации для широкого круга пользователей, исполь­ зуются алгоритмы прогнозирования. Это мощная технология, но нужно при­

Ограничения рекомендательных систем

287

нимать во внимание и ее недостатки. Рассмотрим различные ограничения ре­ комендательных систем.

Проблема холодного старта

Очевидно, что для осуществления коллаборативной фильтрации необходимы данные о предпочтениях пользователей. Для нового пользователя такие данные, скорее всего, отсутствуют. В результате алгоритм сходства будет основан на предположениях, которые могут оказаться неточными. Подробная информация о новых позициях также появляется не сразу, что затрудняет работу системы на основе контента. Требование наличия данных о позициях в ассортименте и поль­ зователях для создания высококачественных рекомендаций называется проблемой холодного старта (cold start problem).

Требования к метаданным

Методы на основе контента требуют детального описания позиций для измере­ ния сходства. Такие описания могут быть недоступны, что влияет на качество прогнозов.

Проблема разреженности данных

Среди огромного количества товаров пользователь, как правило, оценивает только несколько позиций, что приводит к очень разреженной матрице реко­ мендаций.

У Amazon около миллиарда пользователей и миллиард товаров. Говорят, что механизм рекомендаций Amazon содержит самые раз­ реженные данные по сравнению с рекомендательными системами во всем мире.

Предвзятость из-за социального влияния

Социальное влияние играет важную роль при выработке рекомендаций. Взаи­ моотношения между людьми можно рассматривать как фактор, от которого зависят предпочтения пользователя. Друзья, как правило, покупают похожие товары, а также дают схожие оценки.