1 minute read

(아직 블로그에 올리지는 않음)

1. 지식 그래프(Knowledge Graph)란 무엇인가?

1.1 지식 그래프의 정의

지식 그래프(Knowledge Graph, KG)는 현실 세계의 다양한 객체(엔티티) 와 이들 간의 관계(Relationship) 를 그래프 형태로 표현한 데이터 구조이다.

  • 엔티티(Entity): 사람, 장소, 사물, 개념 등
  • 관계(Relation): 엔티티 간의 연결 고리 (예: “A는 B의 친구이다”)

보통 “삼중항(Triple)” 형태로 데이터를 구성한다:

  • (주어, 서술어, 목적어) → (Subject, Predicate, Object)
    예: (스티브 잡스, 창립자, 애플) → Steve Jobs (is the founder of) Apple

이러한 구조는 단순한 데이터 저장을 넘어, 의미 기반 검색(Semantic Search), 추천 시스템, 질의응답 시스템 등에 활용된다.


1.2 지식 그래프의 등장 배경

기존의 데이터베이스(DB)나 정보 검색 시스템은 정형 데이터에 최적화되어 있었지만, 복잡한 관계나 비정형 데이터를 처리하는 데 한계가 있었다.

  • 기존 방식의 한계:
    • 데이터 간의 관계 파악이 어려움
    • 스키마 변경 시 유연성이 부족
    • 의미 기반 검색이 어려움

이러한 한계를 극복하기 위해, 구글(Google) 이 2012년 “Google Knowledge Graph” 를 도입하면서 본격적으로 주목받게 되었다.

  • 사용자가 “톰 크루즈”를 검색하면 단순한 링크가 아닌, 그의 영화, 생일, 가족 등 연결된 정보를 한눈에 보여준다.

지식 그래프와 기존 데이터베이스의 차이점

구분 관계형 데이터베이스(RDB) 지식 그래프(Knowledge Graph)
데이터 구조 테이블(표) 기반 그래프 기반(노드 & 엣지)
관계 표현 외래 키(Foreign Key)로 제한적 표현 복잡한 관계를 직관적으로 연결 가능
유연성 스키마 고정 스키마를 동적으로 확장 가능
검색 방식 SQL 쿼리 SPARQL, Cypher 등 그래프 쿼리 언어 사용
응용 분야 전통적인 비즈니스 데이터 처리 검색 엔진, 추천 시스템, 지능형 비서

SPARQL 예시는 다름 링크에
링크삽입


1.3 지식 그래프의 주요 특징

  1. 관계 중심 데이터 모델링:
    단순한 데이터 저장이 아닌, 데이터 간의 의미 있는 연결을 강조.
  2. 스케일 확장성:
    새로운 엔티티나 관계를 쉽게 추가할 수 있어 대규모 데이터 관리에 효과적.
  3. 추론(Inference) 가능:
    이미 존재하는 데이터로부터 새로운 지식을 자동으로 도출할 수 있음.
    예: (A, 부모, B) + (B, 부모, C) → A는 C의 조부모이다
  4. 의미론적 검색 지원:
    단순 키워드 검색이 아닌, 의미 기반 질의가 가능하여 더 정확한 정보 탐색을 지원.

Updated: