AI / Big Data · 한장정리
[기술사토픽] 지식 그래프 & 온톨로지 완벽 정리 - 한장정리
온톨로지·트리플·SPARQL·RDF/OWL, 지식 그래프 구축·활용, GraphRAG, 의미 웹까지 기술사 빈출 주제를 완벽 정리합니다.
Ⅰ.지식 표현 기술 — 온톨로지 & 지식 그래프
개념: 온톨로지(Ontology)는 특정 도메인의 개념·속성·관계를 형식적으로 명세하는 공유된 개념화의 명시적 표현입니다. 지식 그래프(Knowledge Graph)는 온톨로지 기반으로 구축된 대규모 사실 네트워크입니다.
| 기술 | 설명 | 예시 |
|---|---|---|
| RDF (자원기술프레임워크) | 주어-술어-목적어 트리플로 지식 표현 | (김철수, 근무지, 삼성전자) |
| OWL (웹온톨로지언어) | RDF 위에 고급 클래스·관계 표현 | TBox(개념) + ABox(인스턴스) |
| SPARQL | RDF 데이터 질의 언어 (SQL과 유사) | SELECT ?name WHERE {?p :worksAt :Samsung} |
| 트리플스토어 | RDF 트리플 전용 DB | Apache Jena·GraphDB·Stardog |
| 링크드 데이터 | 웹에서 데이터를 URI로 연결·공개 | DBpedia·Wikidata·Schema.org |
시험 포인트
온톨로지 3요소: 클래스(개념)·속성(관계)·인스턴스(개체)
대표 지식 그래프: Google Knowledge Graph·Wikidata·DBpedia·Freebase
Ⅱ.지식 그래프 구축 & 활용
가. 지식 그래프 구축 방법
| 방법 | 설명 | 특징 |
|---|---|---|
| 수동 구축 | 전문가가 직접 트리플 입력 | 정확하지만 비용·시간 많음 |
| 정보 추출 (IE) | 텍스트에서 개체·관계 자동 추출 | NLP 기반. 오류 포함 |
| 크라우드소싱 | Wikipedia·Wikidata 같이 다수 참여 | Wikidata·Google Knowledge Vault |
| 기존 DB 변환 | 관계형 DB→RDF 변환 (R2RML) | 레거시 데이터 활용 |
나. 지식 그래프 임베딩
| 모델 | 학습 방법 | 특징 |
|---|---|---|
| TransE | 관계를 벡터 이동으로 표현 (h+r≈t) | 단순. 1:N 관계 취약 |
| RotatE | 관계를 복소수 회전으로 표현 | 대칭·반대칭 관계 처리 |
| ComplEx | 복소수 공간 임베딩 | 비대칭 관계 처리 |
다. GraphRAG
GraphRAG(Microsoft)는 기존 RAG의 한계를 극복하기 위해 지식 그래프 위에서 검색·추론을 수행하는 고급 RAG 기법입니다.
| 비교 | 기존 RAG | GraphRAG |
|---|---|---|
| 검색 단위 | 유사도 기반 청크 | 그래프 커뮤니티·연결 경로 |
| 관계 추론 | 약함 | 강함 (연결된 노드 탐색) |
| 전역 요약 | 어려움 | 커뮤니티 요약 사전 생성 |
| 적합 질문 | 사실 검색 | 복잡한 관계·요약 질문 |
시험 포인트
SPARQL은 RDF의 SQL. SELECT·WHERE·FILTER·OPTIONAL 기본 구조.
GraphRAG: 문서에서 KG 자동 구성 → 커뮤니티 요약 → 로컬/글로벌 검색.
Ⅲ.결론
결론
지식 그래프는 AI의 상식과 도메인 지식을 구조화된 형태로 표현하는 핵심 기술입니다.
LLM + 지식 그래프 결합(GraphRAG·뉴로심볼릭 AI)이 차세대 AI의 지식 추론 방향입니다.
"LLM은 언어를 알고, 지식 그래프는 사실을 안다. 둘의 결합이 진짜 지능에 가깝다."
블로그: 기술사 학습노트 · imt-log.tistory.com
'AI빅데이터' 카테고리의 다른 글
| 다중 에이전트 시스템 물리적 AI 정리 (0) | 2026.03.25 |
|---|---|
| MLOps AI 파이프라인 구축 개념 정리 (0) | 2026.03.25 |
| AI 윤리 거버넌스 책임 원칙 정리 (0) | 2026.03.24 |
| 딥러닝 아키텍처 종류와 구조 완벽 정리 (0) | 2026.03.24 |
| 디지털 출처 검증 프로비넌스 개념 정리 (0) | 2026.03.24 |