[Knowledge Graphs] 지식 그래프의 핵심 개념
(아직 블로그에 올리지는 않음)
2. 지식 그래프의 핵심 개념 (Core Concepts of Knowledge Graphs)
2.1 엔티티(Entity), 속성(Attribute), 관계(Relation) 개념
- 엔티티(Entity)
- 현실 세계의 객체(Object) 를 의미하며, 사람, 장소, 조직, 제품, 개념 등 모든 것이 될 수 있다.
- 예: Steve Jobs, Apple, iPhone 등
- 속성 (Attribute)
- 엔티티의 특징이나 성질을 설명하는 데이터이다.
- 예: Apple의 속성 → 설립일: 1976, 본사 위치: Cupertino
- 관계 (Relation)
- 엔티티 간의 연결 또는 상호작용을 나타낸다.
- 예: Steve Jobs → 창립자(Founder of) → Apple
삼중항 구조 예시
(주어, 서술어, 목적어) = (Subject, Predicate, Object)
( Steve Jobs, 창립자, Apple )
( Apple, 본사 위치, Cupertino )
( Steve Jobs, 출생지, San Francisco )
2.2 삼중항(Triple) 구조
지식 그래프의 핵심은 삼중항(Triple) 형태이다.
- 형식: (Subject, Predicate, Object)
- 이는 RDF(Resource Description Framework) 모델의 기본 단위이다.
(Albert Einstein, 출생지, Ulm)
(Albert Einstein, 직업, 물리학자)
(Albert Einstein, 수상, 노벨 물리학상)
- 주어(Subject): Albert Einstein (엔티티)
- 서술어(Predicate): 출생지, 직업, 수상 (관계)
- 목적어(Object): Ulm, 물리학자, 노벨 물리학상 (속성 or 또 다른 엔티티)
이러한 트리플이 수천, 수백만 개 연결되면서 지식 네트워크를 형성한다.
2.3 그래프 이론과의 연결성
지식 그래프는 이름 그대로 그래프 이론(Graph Theory) 에 기반한 데이터 모델이다.
- 노드(Node): 엔티티를 의미 (ex: 사람, 회사, 장소 등)
- 엣지(Edge): 엔티티 간의 관계를 연결하는 선
- 속성(Attribute): 노드나 엣지에 부가되는 정보
그래프 시각화 예시
[Steve Jobs] ── (창립자) ──> [Apple]
│ │
(출생지) (본사 위치)
↓ ↓
[San Francisco] [Cupertino]
2.4 온톨로지(Ontology)와 지식 그래프의 관계
온톨로지(Ontology): 데이터 간의 의미적 관계를 정의하는 체계적인 구조이다.
- 정의: 현실 세계의 개체(Entities), 개념(Concepts), 속성(Properties), 관계(Relations) 등을 형식적으로 정의한 것
- “지식 그래프의 설계도” 또는 “개념과 관계의 지도” 역할
- 목적: 데이터를 일관성 있게 관리하고, 기계가 데이터의 의미를 이해하도록 돕는 것
온톨로지의 핵심 구성 요소
- 클래스(Class): 개체들의 그룹 또는 카테고리
- 예: Person(사람), Company(회사), Location(장소)
- 인스턴스(Instance): 클래스에 속하는 실제 개체
- 예: Steve Jobs → Person 클래스의 인스턴스
- 속성(Property): 개체의 특성 또는 정보
- 예: 생년월일, 국적, 설립일 등
- 관계(Relation): 개체 간의 연결성 또는 상호작용
- 예: 창립자(Founder of), 본사 위치(Headquartered in) 등
- 공리(Axiom): 논리적 제약 조건으로, 데이터의 일관성을 유지
- 예: “모든 사람은 하나의 출생지를 가진다” 같은 규칙 정의
온톨로지 예제(회사와 사람 모델링)
- 개념 설계:
- 클래스: Person, Company
- 속성: name, birthPlace, foundedDate
- 관계: founderOf, worksAt
- 온톨로지 트리 구조
~~~text
- Person
- name: “Steve Jobs”
- birthPlace: “San Francisco”
- founderOf → Apple
- Person
- Company
- name: “Apple”
- foundedDate: 1976
- headquarteredIn → Cupertino ~~~
- 삼중항(Triple)로 표현
(Steve Jobs, 창립자, Apple) (Steve Jobs, 출생지, San Francisco) (Apple, 본사 위치, Cupertino)
온톨로지의 중요성
- 일관성 유지:
- 데이터 간의 의미적 충돌 방지
- ex) Person 클래스에는 항상 name 속성이 있어야 한다는 규칙 유지
- 지식 확장성:
- 새로운 개념을 쉽게 추가하고 기존 구조에 통합 가능
- ex) Company 클래스에 CEO 속성을 추가해도 구조가 깨지지 않음
- 기계 학습 지원:
- 온톨로지를 기반으로 기계가 데이터를 이해하고 추론할 수 있음
- ex) A는 B의 부모 → A는 B보다 나이가 많다 같은 자동 추론 가능
2.5 지식 그래프의 추론(Inference) 기능
지식 그래프는 단순한 데이터 저장소가 아닌, 새로운 지식을 스스로 생성(추론) 할 수 있는 능력을 가진다.
추론 예시:
- 주어진 지식:
- (A, 부모, B)
- (B, 부모, C)
- 추론 결과:
- A는 C의 조부모다 → (A, 조부모, C)
이러한 추론은 AI, 추천 시스템, 질의응답 서비스 등에서 강력한 기능으로 작동한다.