2 minute read

(아직 블로그에 올리지는 않음)

2. 지식 그래프의 핵심 개념 (Core Concepts of Knowledge Graphs)

2.1 엔티티(Entity), 속성(Attribute), 관계(Relation) 개념

  1. 엔티티(Entity)
    • 현실 세계의 객체(Object) 를 의미하며, 사람, 장소, 조직, 제품, 개념 등 모든 것이 될 수 있다.
    • 예: Steve Jobs, Apple, iPhone 등
  2. 속성 (Attribute)
    • 엔티티의 특징이나 성질을 설명하는 데이터이다.
    • 예: Apple의 속성 → 설립일: 1976, 본사 위치: Cupertino
  3. 관계 (Relation)
    • 엔티티 간의 연결 또는 상호작용을 나타낸다.
    • 예: Steve Jobs → 창립자(Founder of) → Apple

삼중항 구조 예시
(주어, 서술어, 목적어) = (Subject, Predicate, Object)
( Steve Jobs, 창립자, Apple )
( Apple, 본사 위치, Cupertino )
( Steve Jobs, 출생지, San Francisco )


2.2 삼중항(Triple) 구조

지식 그래프의 핵심은 삼중항(Triple) 형태이다.

  • 형식: (Subject, Predicate, Object)
  • 이는 RDF(Resource Description Framework) 모델의 기본 단위이다.
(Albert Einstein, 출생지, Ulm)  
(Albert Einstein, 직업, 물리학자)  
(Albert Einstein, 수상, 노벨 물리학상)  
  • 주어(Subject): Albert Einstein (엔티티)
  • 서술어(Predicate): 출생지, 직업, 수상 (관계)
  • 목적어(Object): Ulm, 물리학자, 노벨 물리학상 (속성 or 또 다른 엔티티)

이러한 트리플이 수천, 수백만 개 연결되면서 지식 네트워크를 형성한다.


2.3 그래프 이론과의 연결성

지식 그래프는 이름 그대로 그래프 이론(Graph Theory) 에 기반한 데이터 모델이다.

  • 노드(Node): 엔티티를 의미 (ex: 사람, 회사, 장소 등)
  • 엣지(Edge): 엔티티 간의 관계를 연결하는 선
  • 속성(Attribute): 노드나 엣지에 부가되는 정보

그래프 시각화 예시

 [Steve Jobs] ── (창립자) ──> [Apple]
       │                        │
    (출생지)                  (본사 위치)
       ↓                        ↓
[San Francisco]            [Cupertino]

2.4 온톨로지(Ontology)와 지식 그래프의 관계

온톨로지(Ontology): 데이터 간의 의미적 관계를 정의하는 체계적인 구조이다.

  • 정의: 현실 세계의 개체(Entities), 개념(Concepts), 속성(Properties), 관계(Relations) 등을 형식적으로 정의한 것
  • “지식 그래프의 설계도” 또는 “개념과 관계의 지도” 역할
  • 목적: 데이터를 일관성 있게 관리하고, 기계가 데이터의 의미를 이해하도록 돕는 것

온톨로지의 핵심 구성 요소

  1. 클래스(Class): 개체들의 그룹 또는 카테고리
    • 예: Person(사람), Company(회사), Location(장소)
  2. 인스턴스(Instance): 클래스에 속하는 실제 개체
    • 예: Steve Jobs → Person 클래스의 인스턴스
  3. 속성(Property): 개체의 특성 또는 정보
    • 예: 생년월일, 국적, 설립일 등
  4. 관계(Relation): 개체 간의 연결성 또는 상호작용
    • 예: 창립자(Founder of), 본사 위치(Headquartered in) 등
  5. 공리(Axiom): 논리적 제약 조건으로, 데이터의 일관성을 유지
    • 예: “모든 사람은 하나의 출생지를 가진다” 같은 규칙 정의

온톨로지 예제(회사와 사람 모델링)

  1. 개념 설계:
    • 클래스: Person, Company
    • 속성: name, birthPlace, foundedDate
    • 관계: founderOf, worksAt
  2. 온톨로지 트리 구조 ~~~text
    • Person
      • name: “Steve Jobs”
      • birthPlace: “San Francisco”
      • founderOf → Apple
  • Company
    • name: “Apple”
    • foundedDate: 1976
    • headquarteredIn → Cupertino ~~~
  1. 삼중항(Triple)로 표현
    (Steve Jobs, 창립자, Apple)
    (Steve Jobs, 출생지, San Francisco)
    (Apple, 본사 위치, Cupertino)
    

온톨로지의 중요성

  1. 일관성 유지:
    • 데이터 간의 의미적 충돌 방지
    • ex) Person 클래스에는 항상 name 속성이 있어야 한다는 규칙 유지
  2. 지식 확장성:
    • 새로운 개념을 쉽게 추가하고 기존 구조에 통합 가능
    • ex) Company 클래스에 CEO 속성을 추가해도 구조가 깨지지 않음
  3. 기계 학습 지원:
    • 온톨로지를 기반으로 기계가 데이터를 이해하고 추론할 수 있음
    • ex) A는 B의 부모 → A는 B보다 나이가 많다 같은 자동 추론 가능

2.5 지식 그래프의 추론(Inference) 기능

지식 그래프는 단순한 데이터 저장소가 아닌, 새로운 지식을 스스로 생성(추론) 할 수 있는 능력을 가진다.

추론 예시:

  • 주어진 지식:
    • (A, 부모, B)
    • (B, 부모, C)
  • 추론 결과:
    • A는 C의 조부모다 → (A, 조부모, C)

이러한 추론은 AI, 추천 시스템, 질의응답 서비스 등에서 강력한 기능으로 작동한다.

Updated: