본문 바로가기
AI빅데이터

추천 시스템 협업 필터링 데이터 마이닝 정리

by 매일기술사 2026. 3. 25.
AI/Big Data · 한장정리

[기술사토픽] 추천 시스템 & 데이터 마이닝 완벽 정리 - 한장정재

협업필터링·콘텐츠기반 추천, 행렬분해, 연관규칙(Apriori), 군집화(K-Means), 이상탐지까지 완벽 정리합니다.

추천시스템협업필터링행렬분해Apriori군집화이상탐지정보관리기술사

Ⅰ.추천 시스템

방식 원리 장점 단점 예시
협업 필터링 (사용자 기반) 비슷한 사용자의 아이템 추천 개인화 우수 콜드스타트·희소성 넷플릭스
협업 필터링 (아이템 기반) 비슷한 아이템을 구매한 패턴 활용 계산 효율적 아이템 메타데이터 불필요 아마존
콘텐츠 기반 아이템 속성 유사도 기반 추천 콜드스타트 해결 과도한 특화 스포티파이
하이브리드 협업+콘텐츠 결합 장점 통합 구현 복잡 넷플릭스 최신
딥러닝 기반 임베딩·신경망으로 복잡한 패턴 학습 성능 최고 해석 어려움 유튜브·틱톡
나. 행렬 분해 (Matrix Factorization)

행렬 분해는 희소한 사용자-아이템 평점 행렬을 두 개의 밀집 행렬(사용자 잠재벡터·아이템 잠재벡터)로 분해하여 누락된 평점을 예측합니다.

시험 포인트

콜드스타트: 신규 사용자/아이템에 대한 추천이 어려운 문제. 콘텐츠기반 또는 인구통계 기반으로 해결.

Ⅱ.데이터 마이닝 핵심 기법

기법 설명 알고리즘 활용
연관 규칙 함께 구매되는 아이템 패턴 발견 Apriori·FP-Growth 장바구니 분석
군집화 유사 데이터 그룹화 (비지도) K-Means·DBSCAN·계층적 고객 세분화
분류 레이블된 데이터로 클래스 예측 의사결정트리·SVM·RandomForest 이탈 예측·스팸
회귀 연속값 예측 선형회귀·Ridge·Lasso 수요 예측·가격
이상 탐지 비정상 패턴 탐지 Isolation Forest·Autoencoder 사기탐지·장애탐지
나. Apriori 알고리즘
개념 설명 기준
지지도(Support) 전체 중 {A,B} 함께 구매 비율 최소 지지도 이상
신뢰도(Confidence) A 구매 시 B 구매 확률 P(B|A) 최소 신뢰도 이상
향상도(Lift) 신뢰도/B의 지지도. 1이상이면 양의 상관 향상도>1 유의미
시험 포인트

Apriori: 지지도→신뢰도→향상도 순서로 연관 규칙 생성.
DBSCAN: 밀도 기반 군집화. K-Means와 달리 군집 수 불필요·이상치 탐지 가능.

Ⅲ.결론

결론

추천 시스템과 데이터 마이닝은 데이터에서 비즈니스 가치를 창출하는 핵심 기술입니다.
향후 실시간 추천·맥락 인식·인과추론 기반 추천으로 정교해집니다.

"추천 시스템은 디지털 세계의 큐레이터이다. 무엇을 보여주느냐가 사용자 경험의 전부다."

블로그: 기술사 학습노트 · imt-log.tistory.com