본문 바로가기
KCI 등재

협업 필터링 성능향상을 위한 데이터 필터링 및 재분배 방법

Data Filtering and Redistribution for Improving Performance of Collaborative Filtering

한국차세대컴퓨팅학회 논문지
약어 : The Journal of KINGComputing
2021 vol.17, no.4, pp.13 - 22
DOI : 10.23019/kingpc.17.4.202108.002
발행기관 : 한국차세대컴퓨팅학회
연구분야 : 컴퓨터학
Copyright © 한국차세대컴퓨팅학회
17 회 열람

협업 필터링은 사용자의 기록을 바탕으로 선호도를 예측하여 추천하는 방법이다. 최근 협업 필터링 중 머신러닝 알고리즘을 이용하는 연구가 활발히 이루어지고 있으며 그중에서 오토인코더 모델들의 추천 성능이 뛰어났다. 오토인코더 모델들은 추천 성능 향상을 위해 별도의 데이터 셋 전처리 과정을 거친다. 하지만 현재 모델들이 사용하는 기존의 전처리에서는 차원 축소 및 복원으로 인한 정보손실 문제와 데이터 셋들의 불균일한 분포 문제를 해결하지 못한다. 따라서 본 연구에서는 사용자 기반의 오토인코더 모델에 적합한 전처리 시스템을 제안한다. 본 연구는 필터 모듈과 분배 모듈로 이루어져 있으며 기존의 전처리의 문제들을 순차적으로 개선한다. 필터 모듈에서는 정보손실 문제를 개선하고 분배 모듈에서는 데이터 셋들의 불균일한 분포 문제를 개선하였다. 그리고 각각의 모듈들을 기존의 전처리 방법과 비교하는 실험을 하여 개선된 결과를 확인하였다. 또한 제안한 방법을 적용한 데이터 셋으로 사용자 기반 오토인코더 모델을 학습시켰을 때 추천 성능이 올라가는 것을 실험을 통해 확인하였다.

Collaborative filtering(CF) is a method of recommending possible preferences of a user based on existing records. Recently, CF research using machine learning algorithms has been actively conducted, among which Autoencoder models have outstanding recommendation performances. Autoencoder models go through preprocessing to improve recommendation performance. However, traditional preprocessing used by current models cannot solve information loss due to dimensional reduction and restoration as well as uneven distribution of datasets. Therefore, in this work, we propose a preprocessing system suitable for user-based Autoencoder models. This work consists of filter modules and distribution modules, which sequentially reduce the problems of traditional preprocessing. We minimized the information loss problems in filter modules and the uneven distribution of datasets in distribution modules. We then conducted experiments comparing each module to conventional preprocessing to confirm the improved results. We also proved that recommendation performance increase when we train a user-based Autoencoder model with datasets that applied the suggested method through an experiment.

협업 필터링, 오토 인코더, 전처리 시스템
Collaborative Filtering, Autoencoder, Preprocessing System

  • 1. [학술지] 손단영 / 2011 / OllehTV 콘텐츠 지능형 추션천/검색서비스를 위한 개인단 말 어플리케이 개발 / 한국차세대컴퓨팅학회 논문지 / 7 (2) : 12 ~ 2 kci
  • 2. [학술지] 이동우 / 2017 / 스마트 환경에서의 사용자 상황인지 기반 지식필터링을 이용한 콘텐츠 추천 시스템 / 한국차세대컴퓨팅학회 논문지 / 13 (2) : 35 ~ 2 kci
  • 3. [학술대회] Minh-Phung Thi DO / 2010 / Model-based approach for collaborative filtering / The 6th International Conference on Information Technology for Education
  • 4. [학술지] Dheeraj Bokde / 2015 / Matrix factorization model in collaborative filtering algorithms : A survey / Procedia Computer Science / 49 : 136 ~
  • 5. [학술대회] Dawen Liang / 2018 / Variational Autoencoders for Collaborative Filtering / Proceedings of the 2018 World Wide Web Conference (WWW '18) : 689 ~
  • 6. [학술지] 윤경목 / 2014 / 유전알고리즘과 신경망 파라미터 값들의 변동에 의한 영화 추천시스템 성능향상 / 한국차세대컴퓨팅학회 논문지 / 10 (5) : 56 ~ 5 kci
  • 7. [학술지] Gediminas Adomavicius / 2005 / Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions / IEEE Transactions on Knowledge and Data Engineering / 17 (6) : 734 ~ 6
  • 8. [학술대회] Chun Zeng / 2003 / Similarity measure and instance selection for collaborative filtering / Proceedings of the 12th international conference on World Wide Web (WWW '03) : 652 ~
  • 9. [학술대회] Ngo Tung Son / 2017 / Combination of Dimensionality Reduction and User Clustering for Collaborative-Filtering / Proceedings of the 2017 International Conference on Computer Science and Artificial Intelligence(CSAI 2017) : 125 ~
  • 10. [학술대회] Datta H. Deshmukh / 2015 / Improving classification using preprocessing and machine learning algorithms on NSL-KDD dataset / 2015 International Conference on Communication, Information & Computing Technology (ICCICT) : 1 ~
  • 11. [학술대회] Ilya Shenbin / 2020 / RecVAE: A New Variational Autoencoder for Top-N Recommendations with Implicit Feedback / Proceedings of the 13th International Conference on Web Search and Data Mining (WSDM '20) : 528 ~
  • 12. [학술대회] Daeryong Kim / 2019 / Enhancing VAEs for collaborative filtering: flexible priors & gating mechanisms / Proceedings of the 13th ACM Conference on Recommender Systems(RecSys '19) : 403 ~
  • 13. [인터넷자료] Dor Bank / Autoencoders
  • 14. [학술대회] Kalervo Järvelin / 2000 / Ir evaluation methods for retrieving highly relevantdocuments / SIGIR 2000: Proceedings of the 23th annual international ACM SIGIR confer-ence on Research and development in information retrieval : 41 ~
  • 15. [학술지] F. Maxwell Harper / 2015 / The MovieLens Datasets: History and Context / ACM Trans. Interact. Intell. Syst / 5 (4)