Использование негативных действий пользователей для улучшения качества рекомендательных систем

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Рекомендательные системы находят все более широкое применение, охватывая множество сфер. Вместе с тем возрастает количество нестандартных случаев, связанных с необычными типами данных, на которых традиционные подходы не всегда эффективны. Например, при ограниченном количестве объектов более результативным решением становятся методы, основанные на обычных алгоритмах классификации. Предлагается способ повышения качества рекомендаций в рамках такого подхода за счет учета негативных взаимодействий пользователей с объектами. Интеграция этой информации позволяет более точно моделировать как предпочтения, так и избегаемые элементы. Представленный метод улучшает персонализацию рекомендаций даже в условиях высокой взаимосвязанности и ограниченности количества объектов.

Об авторах

М. А. Жарова

МФТИ; ФИЦ ИУ РАН

Email: zharova.ma@phystech.edu
Долгопрудный, Россия; Москва, Россия

В. И. Цурков

ФИЦ ИУ РАН

Автор, ответственный за переписку.
Email: v.tsurkov@frccsc.ru
Москва, Россия

Список литературы

  1. Cano E., Morisio M. Hybrid Recommender Systems: A Systematic Literature Review // Intelligent Data Analysis. 2017. V. 21. P. 1487–1524.
  2. Zharova M., Tsurkov V. Neural Network Approaches for Recommender Systems // J. Computer and Systems Sciences International. 2024. V. 62. P. 1048–1062.
  3. Zharova M., Tsurkov V. Boosting Based Recommender System // J. Computer and Systems Sciences International. 2024. V. 63. P. 922–940.
  4. Xinran H., Junfeng P., Ou J. Practical Lessons from Predicting Clicks on Ads at Facebook // Proc. 8th Intern. Workshop on Data Mining for Online Advertising. N.Y., USA, 2014. P 1–9.
  5. Paul C., Jay A., Emre S. Deep Neural Networks for YouTube Recommendations // Proc. 10th ACM Conf. on Recommender Systems. Boston, USA, 2016. P 191–198.
  6. Clark J. Target Variable Engineering // arXiv:2310.09440, 2023.
  7. Tschalzev A., Marton S. A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data // arXiv:2407.02112, 2024.
  8. Ke1 G., Meng Q., Finley T. LightGBM: A Highly Efficient Gradient Boosting Decision Tree // Advances in Neural Information Processing Systems. 2017. P. 3146–3154.
  9. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System //arXiv:1603.02754v3, 2016.
  10. Dorogush A., Prokhorenkova L., Gusev G. CatBoost: Unbiased Boosting with Categorical Features // arXiv:1706.09516v5, 2019.
  11. Имплементация библиотеки для подбора гиперпараметров Optuna на Python // GitHub. Optuna: webcite https://github.com/optuna/optuna (accessed: 07.02.2025).
  12. Имплементация библиотеки для подбора гиперпараметров HyperOpt на Python // GitHub. HyperOpt: webcite https://github.com/hyperopt/hyperopt (accessed: 07.02.2025).
  13. Fazulyanov D., Guseva A. Adaptive Recommendation System for Media Services: Analysis of User Interactions and Their Impact on Content Personalization // Technical sciences. 2024. № 5. P. 82–88.
  14. Hamed L., Abbar S., Haouari A. The Impact of Negative Preferences on a Recommendation Process // Intern. Conf. on Multimedia Computing and Systems (IEEE). Tangiers, Morocco, 2012. P. 675–680.
  15. Ma H., Xie R., Meng L., Feng F. Negative Sampling in Recommendation: A Survey and Future Directions // arXiv:2409.07237, 2024.
  16. Paudel B., Luck S., Bernstein A. Loss Aversion in Recommender Systems: Utilizing Negative User Preference to Improve Recommendation Quality // arXiv:1812.11422, 2018.
  17. He X., Liao L. Neural Collaborative Filtering // arXiv:1708.05031, 2017.
  18. Rendle S., Freudenthaler C. BPR: Bayesian Personalized Ranking from Implicit Feedback // arXiv:1205.2618, 2012.
  19. Weston J., Bengio S., Usunier N. Scaling Up To Large Vocabulary Image Annotation // Proc. 22nd Intern. Joint Conf. on Artificial Intelligence. Barcelona, Spain, 2011. P. 2764–2770.
  20. Lin T., Goyal P. Focal Loss for Dense Object Detection //arXiv:1708.02002, 2017.
  21. Wu Y., Xie R. DFGNN: Dual-frequency Graph Neural Network for Sign-aware Feedback // arXiv:2405.15280, 2024.
  22. Lin G., Gao C. Dual-interest Factorization-heads Attention for Sequential Recommendation // Proc. ACM Web Conf. Ostin, USA, 2017. P. 917–927.
  23. Vaswani A., Shazeer N., Parma N. Attention Is All You Need // arXiv:1706.03762, 2017.
  24. Kang W., McAuley J. Self-Attentive Sequential Recommendation // arXiv:1808.09781, 2018.
  25. Sun F., Liu J. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer // arXiv:1904.06690, 2019.
  26. Pereira Moreira G., Rabhi S. Transformers4Rec: Bridging the Gap between NLP and Sequential / Session-Based Recommendation // Proc. 15th ACM Conf. on Recommender Systems. Amsterdam, Netherlands, 2021. P. 143–153.
  27. Wang Y., Xun J. EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration // arXiv:2406.14017v1, 2024.
  28. Gao M., Zhang J. Recommender Systems Based on Generative Adversarial Networks: A Problem-Driven Perspective // arXiv:2003.02474, 2020.
  29. Liu Z., Ma Y. Contrastive Learning for Recommender System // arXiv:2101.01317, 2021.
  30. Ye H., Li X. On the Sweet Spot of Contrastive Views for Knowledge-enhanced Recommendation // arXiv:2309.13384, 2023.
  31. Serrano N. Bellogin A. Siamese Neural Networks in Recommendation // Neural Computing and Applications. 2023. V. 35. P. 13941–13953.
  32. Chen X. Yao L. Deep Reinforcement Learning in Recommender Systems: A Survey and New Perspectives // Knowledge-Based Systems. 2023. V. 264. № 110335.
  33. Ie E., Jain V. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology // arXiv:1905.12767, 2019.
  34. Cena F., Console L., Vernero F. How to Deal with Negative Preferences in Recommender Systems: a Theoretical Framework // J. Intelligent Information Systems. 2023. V. 60. P. 23–47.
  35. Alzubaidi L., Bai J., Al-Sabaawi A. A Survey on Deep Learning Tools Dealing with Data Scarcity: Definitions, Challenges, Solutions, Tips, and Applications // J. Big Data. 2023. V. 10. № 46.
  36. Grinsztajn L., Oyallon E., Varoquaux G. Why Do Tree-Based Models Still Outperform Deep Learning on Tabular Data? // arXiv:2207.08815, 2022.
  37. Alzubaidi L., Zhang J., Humaidi A. Review of Deep Learning: Concepts, CNN Architectures, Challenges, Applications, Future Directions // J. Big Data. 2021. V. 8. № 53.
  38. Borisov V., Leemann T., Sebler K. Deep Neural Networks and Tabular Data: A Survey // IEEE Transactions on Neural Networks and Learning Systems. 2024. V. 35. № 6. P 7499–7519.
  39. Bentejac C., Csorgo A., Martinez-Munoz G. A Comparative Analysis of Gradient Boosting Algorithms // Artificial Intelligence Review. 2021. V. 54. P. 1937–1967.
  40. Sahour H., Gholami V., Torkaman J. Random Forest and Extreme Gradient Boosting Algorithms for Streamflow Modeling Using Vessel Features and Tree-Rings // Environmental Earth Sciences. 2021. V. 80. № 747.
  41. Demidova L., Sharshatov M., Shykhyev A. Methods for Solving the Class Imbalance Problem in Binary Classification Task // Information Technology and Data Standardization. 2024. № 3. P. 22–33.
  42. Wang Y., Halpern Y., Chan S. Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders // Proc. 17th ACM Conf. on Recommender System. Singapore, Singapore, 2023. P. 1049–1053.
  43. Paudel B., Luck S., Bernstein A. Loss Aversion in Recommender Systems: Utilizing Negative User Preference to Improve Recommendation Quality // arXiv:1812.11422, 2018.
  44. Wang X., Wu Y. An Improved HEAPSORT Algorithm with Nlogn – 0.788928n Comparisons in the Worst Case // J. Computer Science and Technology. 2007. V. 22. P. 898–903.
  45. Zhang X., Wang H., Liu Y. Retention Depolarization in Recommender System // Proc. ACM Web Conf. Singapore, Singapore. 2024. P. 1126–1137.
  46. Jadon A., Patil A. A Comprehensive Survey of Evaluation Techniques for Recommendation Systems // arXiv:2312.16015, 2024.
  47. Имплементация модели CatBoost на Python // GitHub. CatBoost: webcite https://github.com/catboost/catboost (accessed: 07.02.2025).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».