Graph

Graph Dataset - OGB

graph-dev 2022. 10. 1. 08:42
728x90

오늘은 OGB라는 사이트에서 그래프 관련 데이터셋을 확보했다.

생각보다 다양한 종류의 데이터가 있었다.

특히 최근 관심있는 것은 Drug 관련 네트워크 데이터이다.

 

약물이라는 건 신기하게도, 여러개를 사용했을 때 효과가 다른 경우가 많다.

한개만 사용했을 때에도, 그 부작용 등이 오히려 하나의 기전으로 활용되는 경우도 있다.

 

앞으로 약물과 관련된 graph 데이터를 많이 다뤄볼 예정이다.

 

데이터는 아래 링크를 통해 확인할 수 있다.

https://ogb.stanford.edu/

 

Open Graph Benchmark

A collection of benchmark datasets, data-loaders and evaluators for graph machine learning in PyTorch.

ogb.stanford.edu

Open Graph Benchmark, 줄여서 OGB라고 한다.

 

어떤 종류가 있는지 살펴봤다.

https://ogb.stanford.edu/docs/dataset_overview/

 

OGB Dataset Overview

A collection of benchmark datasets, data-loaders and evaluators for graph machine learning in PyTorch.

ogb.stanford.edu

과제의 종류에 따라 나누어 소개하고 있다.

 

Node, Links, Graph 의 property를 예측하는 과제가 있다.

데이터셋 이름도, 각 과제에 따라 다르다.

이름 규칙도 있다.

 

가령 node라면, ogbn이라 표기한다. ogb + n 이런식이다.

link면, ogbl 이 될 것이고, graph라면, ogbg 이렇게 표기된다.

 

각각의 데이터셋에 대한 소개는 다음에 게재해보겠다.