지금은마라톤중

[Paper review] GraphRAG 논문 비교 본문

STUDY/Paper Review

[Paper review] GraphRAG 논문 비교

Ojungii 2025. 2. 22. 00:31

 

그래프 기반의 Retrieval-Augmented Generation(RAG) 기법은 추론 및 검색 효율성을 향상시키기 위해 주목받고 있습니다.

앞서 포스팅했던 논문들도 포함되어 있으며, 아직 포스팅하지 않은 논문들도 있습니다.

본 글에서는 여러 논문에서 제안된 방법을 비교하여 각각의 개념, 동작 방식을 가볍게 분석하겠습니다.

 


 

1. Reasoning on Graphs (RoG)
- "Reasoning over Knowledge Graphs with Large Language Models" (2023)

개념:

  • 질문(쿼리)을 경로(path)로 변환하여 정보 검색 수행.
  • LLM을 활용해 질문에 대한 경로를 생성하고 검색을 유도.

 

 

2. Think on Graphs (ToG)
- "Think on Graphs: Reasoning and Context-Aware Retrieval with Large Language Models" (2023)

개념:

  • LLM이 추론한 정보가 충분한지 판단하며 반복(iteration) 수행.
  • 과정:
    1. Relation 탐색
    2. Relation prune
    3. entity 탐색
    4. entity prune
    5. 충분한 정보를 바탕으로 최종 답변 생성 ( 정보가 충분하지 않으면 반복)

3. GNN-RAG
- "GNN-RAG: Graph Neural Networks for Retrieval-Augmented Generation" (2024)

개념:

  • GNN 기반 검색 결과와 LLM 기반 검색 결과를 합집합하여 답변 생성.
  • 검색 증강(RA): GNN 경로 + LLM 경로 → 결합(Union).

왜 GNN 경로만 활용하지 않을까?

  • GNN 검색은 multi-hop reasoning에서 강력하지만, 간단한 질문에서는 텍스트 기반 RAG가 더 효과적임.
  • 두 접근법을 결합하여 성능을 보완함.
  • RoG, ToG 같은 LLM 반복 호출 방식보다 비용 효율적.

4. GraphCoT
- "Graph Chain-of-Thought: Structured Reasoning with Graphs" (2024)

개념:

  • LLM이 질문을 작은 쿼리로 분해하여 검색 후 교집합을 통해 답변을 도출하는 방식.
  • 과정:
    1. 질문에서 필요한 엔티티 추출
    2. 그래프 검색을 통해 관련 정보 확보
    3. 검색 결과 교집합을 활용해 최종 답변 생성

 

5. structRAG
- "structRAG: Structured Retrieval-Augmented Generation for Knowledge Graphs" (2024)

개념:

  • 데이터를 최적의 포맷으로 가공하여 답변 생성.
  • 검색된 정보를 다음과 같은 구조로 변환하여 활용:
    • 그래프(Graph), 청크(Chunk), 카탈로그(Catalogue), 알고리즘(Algorithm), 표(Table)

 

6. SimGRAG
- "SimGRAG: Similarity-Aware Graph Retrieval for Augmented Generation" (2024)

개념:

  • 패턴 정렬 기반 서브그래프 추출 방식.
  • 과정:
    1. Query-to-Pattern: 질문을 패턴으로 변환.
    2. Pattern-to-Subgraph: 의미론적 거리를 고려하여 서브그래프 추출.
    3. Verbalized Subgraph Augmented Generation: 서브그래프를 활용해 답변 생성.

 

 

요약

방법 핵심 접근법 장점
RoG 쿼리를 경로로 변환하여 검색 LLM을 통한 경로 설정으로 검색 최적화
ToG LLM을 활용한 반복적 검색 최적화 동적으로 관계와 엔티티를 조정
GNN-RAG GNN + LLM 검색 + 합집합 성능과 비용 효율성이 우수
GraphCoT 쿼리 분해 기반 검색 + 교집합 다중 추론에서 정보 소실이 적음
structRAG 최적 데이터 구조화를 통한 답변 다양한 데이터 형식 지원을 통한 풍부한 답변
SimGRAG 의미적 거리 기반 서브그래프 추출 패턴 정렬을 활용한 검색 정확도 증가

 

연구 동향 

  • 최근 GraphRAG 연구에서는 Framework 수준의 방법론들이 활발히 개발되고 있음.
  • 반복적(iterative) 프레임워크를 통한 추론력 향상이 주요 목표이지만, LLM에 대한 의존도가 높아지는 경향이 있음.
  • 반복적인 function calling으로 인해 연산 비용이 증가하는 것이 주요 문제점으로 지적됨.
  • 기존 GNN 기반 접근법보다 KG(Knowledge Graph) + LLM 조합이 더 많이 연구됨.
  • LLM을 에이전트(agent)로 활용하여 판단과 추론을 수행하는 방식이 주류를 이루고 있음.

 

 


 

 

언급한 논문 외에도 여러 논문들이 있으며, 더 나은 방법론이 제안되고 있습니다. 

추후에 업데이트된 논문들을 가지고 다시 한번 비교 분석하겠습니다.

Comments