온톨로지
온톨로지는, 세상에 대해 사람들이 보고 느끼고 생각하는 것이라고 합니다. 일종의 분류, 속성, 개체로 나누어 살펴볼 수 있었습니다.
분류와 속성에서 시작해서 개체(Entity)로 마무리합니다.
지식그래프(Knowledge Graph)
지식을 그래프 형태로 표현한 것입니다. 각 개체 사이의 관계를 연결해서 표현할 수 있습니다.
다빈치가 모나리자를 그리고, 모자리나는 루브르박물관에 위치한다.
온톨로지 구축 배경은, 여러 데이터베이스를 통합해서, 연결된 '지식그래프'를 만들기 위해 온톨로지를 구축해야 합니다. 초기 온톨로지 구축을 위해서 분류체계를 구축하였다고 합니다. 이게 기존의 분류체계와 다르게, 계층구조 기반으로 체계쩍인 분류체계를 생성할 수 있습니다.
온톨로지 구축 연구로는, 수동 구축, 말뭉치 이용, 위키피디아 분류 네트워크(WCN)을 이용할 수 있습니다. 수동 구축은 전문가가 수동으로 분류체계를 만들고, 말뭉치는 상 하위 관계를 나타내는 패턴 정의 후 말뭉치에서 해당 패턴을 추출하는 방식입니다. 위키피디아는, 구조화된 데이터 형식의 위키데이터 기반으로 온톨로지를 구축하는 모양입니다.
온톨로지 구축 과정
1. 분류 후보군 추출
먼저 분류 후보군을 추출합니다. 여기서 용어가 나옵니다. 라벨(label)이 있고, 여기에 식별자를 두어 각 라벨을 분류합니다. 분류에는 속성이 있고, 그 속성에 해당하는 값(value)이 있습니다.
2. 방향 비순환 그래프 (DAG) 생성
위키데이터의 subclass of 속성으로 분류 후보군관 상, 하위 관계를 정의하고, 상위 분류에서 하위 분류로 방향성을 보여주기 위한 DAG를 생성합니다. 너무 복잡하게 되므로, transitive reduction으로 정제하여 봅니다.
그 뒤에 한번 더 정제하는 그래프 가지치기를 수행합니다. 가지치기는, 한 정점에서 도달 가능한 다른 정점의 비율이라는 것이 0이면, 제거합니다.
분류 체계 특성
1. 다중 상위 분류
의미론적으로 다양한 상위 분류가 있을 수 있습니다. 국가라면, 행정 구역, 단체 등에 속하겠습니다. 기존 분류체계에는 반드시 한 개의 상위 분류를 가지므로 이러한 다중 상위 분류에 대응할 수 없네요.
2. 깊이 있는, 수직 계층 구조
분류 개수가 가장 적은 분류체계이지만, 더욱 수직적이고 중심성도 강한 분류 체계입니다. 깊이는 각 분류별 최상위 분류부터 거리의 평균을 말하고, global reaching centrality는 각 노드별 로컬도달 중심성 평균을 내린 것입니다.
온톨로지 평가 방식 및 지표
1. 온톨로지 평가 방식
Golden standard evaluation, Data driven evalution, Application/Task-based evaluation, User-based evaluation, Structure-based evaluation 이렇게 있습니다. 그 중에서 온톨로지의 구조적 특성을 기반으로 평가하는 구조 기반 평가를 살펴봅니다. 스키마 형태, 인스턴스 분포 및 클래스별 특징을 파악합니다.
2. 온톨로지 평가 지표 - 구조 기반 평가
관련 개념을 살펴봅니다.
Schema Metrics, Instance Metrics, Class Metrics가 있습니다.
스키마 지표는, 분류 체계의 구조 특성을 담은 지표입니다. ex) 클래스 당 평균 속성의 수(Attribute Richness), 클래스별 평균 서브클래스 수(Inheritance Richness)
인스턴스 지표는, 인스턴스 분포 정보를 담았습니다. ex) 인스턴스가 존재하는 클래스 비율(Class Richness), 클래스별 평균 인스턴스 수(Average Population)
클래스 지표는, 클래스별 특성을 보여줍니다. ex) 해당 클래스에 속하는 인스턴스 비율(Importance), 해당 클래스 속성 중 실제 데이터 존재하는 속성의 비율(Relationship Richness)
다음 글에서는 이러한 지표에 대해 세부적으로 살펴보겠습니다.
보기만해도 쉽지 않아보이죠? 그래프, 언젠가는 좀 쉽게 쓰는 수준까지 끌어올려봅시다!!

'Graph' 카테고리의 다른 글
[GUG] 여섯번째 세미나 <온톨로지> 후기(1) (0) | 2024.11.16 |
---|---|
GraphRAG 공부: RAG에 Graph를 붙여보자! (1) | 2024.07.06 |
Graph Dataset - OGB (0) | 2022.10.01 |