오늘은 OGB라는 사이트에서 그래프 관련 데이터셋을 확보했다.
생각보다 다양한 종류의 데이터가 있었다.
특히 최근 관심있는 것은 Drug 관련 네트워크 데이터이다.
약물이라는 건 신기하게도, 여러개를 사용했을 때 효과가 다른 경우가 많다.
한개만 사용했을 때에도, 그 부작용 등이 오히려 하나의 기전으로 활용되는 경우도 있다.
앞으로 약물과 관련된 graph 데이터를 많이 다뤄볼 예정이다.
데이터는 아래 링크를 통해 확인할 수 있다.
Open Graph Benchmark
A collection of benchmark datasets, data-loaders and evaluators for graph machine learning in PyTorch.
ogb.stanford.edu
Open Graph Benchmark, 줄여서 OGB라고 한다.
어떤 종류가 있는지 살펴봤다.
https://ogb.stanford.edu/docs/dataset_overview/
OGB Dataset Overview
A collection of benchmark datasets, data-loaders and evaluators for graph machine learning in PyTorch.
ogb.stanford.edu
과제의 종류에 따라 나누어 소개하고 있다.
Node, Links, Graph 의 property를 예측하는 과제가 있다.
데이터셋 이름도, 각 과제에 따라 다르다.
이름 규칙도 있다.
가령 node라면, ogbn이라 표기한다. ogb + n 이런식이다.
link면, ogbl 이 될 것이고, graph라면, ogbg 이렇게 표기된다.
각각의 데이터셋에 대한 소개는 다음에 게재해보겠다.
'Graph' 카테고리의 다른 글
GUG 6th 세미나(1). 온톨로지 구축과 평가 후기 (0) | 2025.01.12 |
---|---|
[GUG] 여섯번째 세미나 <온톨로지> 후기(1) (0) | 2024.11.16 |
GraphRAG 공부: RAG에 Graph를 붙여보자! (1) | 2024.07.06 |