GraphRAG 완전 정리 — Microsoft·LlamaIndex·Neo4j 3종 비교와 다중 홉 추론 가이드

벡터 임베딩 기반 RAG가 LLM 환각을 어느 정도 줄여 줬지만, 여전히 어렵게 남아 있는 영역이 있다. "A는 B와 어떻게 연결되어 있고, 다시 C와는 어떤 관계인가" 같은 다중 홉 질문, 그리고 "이 문서 전체에서 가장 중요한 테마는 무엇인가" 같은 종합 질문이다. 임베딩 유사도 검색은 분산된 청크 간 관계를 본질적으로 이해하지 못해, LLM이 봉합 과정에서 사실을 잘못 결합하는 경우가 잦다.

이 문제를 정공법으로 해결하는 접근이 GraphRAG이다. 문서에서 엔티티·관계를 추출해 지식 그래프를 만든 뒤 그래프 탐색 결과를 LLM 컨텍스트로 전달한다. Microsoft·LlamaIndex·Neo4j가 각각 자체 GraphRAG 구현을 오픈소스로 공개했고, 2024～2025년에 걸쳐 엔터프라이즈 RAG 인프라의 새 표준으로 자리 잡고 있다. 이 글은 세 도구의 차이, 공통 동작 흐름, 환각 감소 효과, 그리고 어떤 상황에서 어떤 도구를 선택할지 정리한다.

이 글의 구성

01GraphRAG 정의와 등장 배경

02Vector RAG vs GraphRAG 차이

03Microsoft GraphRAG

04LlamaIndex Property Graph

05Neo4j GraphRAG

063종 한눈에 비교

07환각 감소·실무 적용·선택 가이드

Q&A자주 묻는 질문 5가지

01 GraphRAG 정의와 등장 배경

GraphRAG는 "Graph-augmented Retrieval-Augmented Generation"의 약자다. 일반 RAG가 벡터 임베딩으로 청크를 찾아 LLM 컨텍스트에 주입하는 방식이라면, GraphRAG는 문서에서 엔티티·관계를 추출해 지식 그래프를 먼저 만들고, 질문에 대해 그래프를 탐색한 결과를 LLM에 전달한다. 그래프 탐색 경로 자체가 LLM의 답변 근거가 되므로 다중 홉 추론·종합 질문에서 정확도가 크게 올라가고, 답변의 출처를 추적하기도 용이해진다.

핵심 기법은 커뮤니티 탐지(Leiden·Louvain), 계층적 요약, 글로벌·로컬 쿼리 분리 세 가지다. Microsoft가 2024년 7월 GraphRAG를 오픈소스로 공개하면서 시장 표준 어휘가 정착됐고, LlamaIndex·Neo4j가 비슷한 시기에 자체 구현을 내놓아 세 도구가 사실상 GraphRAG 생태계의 삼각 구도를 이룬다.

02 Vector RAG vs GraphRAG 차이

항목	Vector RAG	GraphRAG
검색 방식	임베딩 유사도(Cosine)	그래프 탐색(다중 홉)
단일 사실 질문	강함	동등 또는 약간 약함
다중 홉 추론	약함	매우 강함
전체 문서 종합 질문	매우 약함	강함(커뮤니티 요약 활용)
설명 가능성	청크 단위 출처	노드·관계 경로 추적
구축 비용	낮음	상대적으로 높음(LLM 추출 비용)

실무에서는 보통 두 가지를 함께 쓰는 하이브리드 구성이 권장된다. Vector로 광범위한 recall을 잡고, Graph로 관계·다중 홉을 보강하는 방식이다.

03 Microsoft GraphRAG

Microsoft Research가 2024년 7월 오픈소스로 공개한 구현체로, 현재 GraphRAG 어휘의 표준 격이다. GitHub microsoft/graphrag 저장소에서 활발히 갱신 중이며, 핵심 파이프라인은 다섯 단계다.

PIPELINE

1. 엔티티·관계 추출 (LLM)
2. 지식 그래프 구축
3. Leiden 알고리즘으로 계층적 커뮤니티 탐지 (Level 0 leaf → Level N root)
4. 각 커뮤니티 요약 사전 생성
5. 인덱싱 완료

질의는 Global Query와 Local Query 두 가지로 나뉜다. Global Query는 데이터셋 전체 테마를 묻는 질문으로, 상위 커뮤니티 요약을 map-reduce 방식으로 결합해 답한다. Local Query는 특정 엔티티 중심 질문으로, 인근 노드·관계·원본 청크를 retrieval해 LLM에 넘긴다.

장점은 대규모 문서 컬렉션의 글로벌 요약·테마 분석에 강하다는 점이고, 단점은 인덱싱 단계의 LLM 호출 비용이 크다는 점이다. Parquet 파일 기반이라 외부 DB가 필수는 아니지만, 운영 단계에서는 결과를 그래프 DB로 적재해 함께 쓰는 경우가 많다.

04 LlamaIndex Property Graph

LlamaIndex의 PropertyGraphIndex는 청크별로 kg_extractor를 실행해 엔티티·관계를 노드 메타데이터로 부착하는 방식이다. 추출 방식이 두 가지로 명확히 나뉜다는 점이 특징이다.

Schema-guided

DynamicLLMPathExtractor · pydantic 기반 엄격한 스키마 강제. 데이터 품질·일관성 우선.

Implicit

ImplicitPathExtractor · 노드 relationships 속성을 그대로 추출. LLM 호출 없이 비용 절감.

검색 측면에서도 유연하다. TextToCypherRetriever로 자연어를 Cypher로 변환하거나, CypherTemplateRetriever로 템플릿에 파라미터만 채워 안전하게 쿼리할 수 있다. Vector 검색과 자연스럽게 결합되므로 LlamaIndex 스택에 이미 익숙한 팀에 적합하다. 백엔드 그래프 DB는 Neo4j·Memgraph·기타 호환 옵션을 선택할 수 있다.

05 Neo4j GraphRAG

Neo4j가 공식 패키지 neo4j-graphrag-python을 제공하면서 Neo4j 인프라와 가장 깊이 통합된 GraphRAG 옵션이 됐다. 핵심은 세 가지다.

Text2Cypher — 자연어를 Cypher로 자동 변환. 사용자가 직접 Cypher를 작성하지 않아도 자연어 질문이 그대로 그래프 쿼리로 변환된다.
Hybrid Cypher Retriever — 벡터 인덱스와 풀텍스트 인덱스로 1차 검색 후, Cypher로 인접 노드를 확장해 컨텍스트를 완성하는 하이브리드 검색 방식.
Knowledge Graph Builder — spaCy 기반 자동 엔티티·관계 추출 후 Neo4j에 적재.

이미 Neo4j 운영 그래프가 있는 조직이라면 도입 비용이 가장 낮다. 새로 Neo4j 인프라를 깔아야 한다면 비용·운영 부담이 부담스러울 수 있다.

06 3종 한눈에 비교

항목	Microsoft GraphRAG	LlamaIndex PG	Neo4j GraphRAG
라이선스	MIT	MIT	Apache-2.0
언어	Python	Python	Python
KG 자동 구축	강함 (Leiden 커뮤니티)	강함 (Schema·Implicit 선택)	강함 (KG Builder · spaCy)
쿼리 방식	Global / Local Search	Cypher · Vector 혼합	Text2Cypher · Hybrid
통합 LLM	OpenAI · Azure · 로컬	다중 프로바이더	다중 프로바이더
DB 의존	Parquet · 외부 DB	Neo4j · Memgraph 등	Neo4j 필수

07 환각 감소·실무 적용·선택 가이드

환각 감소 효과는 도구·벤치마크별로 수치가 다양하지만 큰 흐름은 일관된다. FalkorDB가 공개한 Diffbot 벤치마크 재현에서는 Vector RAG 정확도 56.2% → GraphRAG 90% 이상으로 향상됐다. ACL 2025의 FinanceBench 논문은 환각 약 6% 감소와 토큰 사용량 약 80% 절감을 함께 보고했다. "환각 감소율"은 출처마다 다르게 표현되므로 단일 수치보다 다중 홉 질문 정확도라는 일관된 지표가 더 신뢰성 있다.

💡 도메인별 적용

2026년 기준 GraphRAG는 의료(임상시험·약물·유전자 관계), 법률(판례·조항·당사자 네트워크), 금융(실시간 사기 탐지·규제 매핑·기업 관계도) 같은 규제 산업에서 프로덕션 적용이 시작되고 있다. 대다수 일반 기업은 여전히 PoC 단계로 효과를 검증하는 흐름이다.

선택 가이드는 단순하다. 대규모 문서 컬렉션의 글로벌 요약·테마 분석이 핵심이면 Microsoft GraphRAG, LlamaIndex 스택을 이미 쓰고 있다면 Property Graph, Neo4j 인프라가 있다면 Neo4j GraphRAG가 가장 자연스러운 선택이 된다. 셋 모두 Python·MIT/Apache-2.0 라이선스라 진입 장벽은 비슷하다.

08 자주 묻는 질문 5가지

Q1. GraphRAG는 Vector RAG를 완전히 대체하나?

아니다. 단일 사실 질문에서는 Vector RAG가 여전히 강하고, 비용도 낮다. 실무에서는 두 가지를 하이브리드로 결합해 광범위 recall은 Vector, 다중 홉·종합 질문은 Graph로 보강하는 방식이 가장 효과적이다.

Q2. 인덱싱 비용이 부담스럽다. 어떻게 줄이나?

엔티티·관계 추출에 LLM 호출이 많이 들어가는 것이 비용의 핵심이다. LlamaIndex의 Implicit 추출이나 spaCy 기반 추출(Neo4j KG Builder)을 활용하면 LLM 호출을 크게 줄일 수 있다. Microsoft GraphRAG도 작은 청크부터 시작해 점진적으로 확장하는 전략이 권장된다.

Q3. 커뮤니티 탐지(Leiden)는 왜 필요한가?

지식 그래프 전체를 한 번에 LLM에 넘기기에는 너무 크다. Leiden·Louvain 같은 커뮤니티 탐지 알고리즘은 그래프를 의미적으로 응집된 클러스터로 나누고, 각 클러스터의 요약을 사전 생성해 둔다. 글로벌 질문은 상위 클러스터 요약을 map-reduce로 결합해 답하므로 토큰 효율과 응답 품질이 동시에 올라간다.

Q4. Cypher를 모르는데 Neo4j GraphRAG를 쓸 수 있나?

Neo4j GraphRAG의 Text2Cypher 기능이 자연어를 Cypher로 자동 변환한다. 운영팀이 직접 Cypher를 작성할 일이 줄어들고, 사용자 질문이 그대로 그래프 쿼리로 변환된다. 단, 복잡한 쿼리 튜닝이나 디버깅에는 Cypher 이해가 결국 도움이 된다.

Q5. GraphRAG가 환각을 완전히 없애 주나?

아니다. 그래프 자체가 잘못 구축됐다면 GraphRAG도 잘못된 답을 만든다. 환각 감소 효과는 다중 홉·종합 질문에서 가장 크고, 단일 사실 질문에서는 Vector RAG와 큰 차이가 없을 수 있다. 그래프 품질 관리(추출 정확도·중복 엔티티 머지·관계 검증)가 함께 갖춰져야 의미 있는 효과가 난다.

마무리

GraphRAG는 LLM과 지식 그래프를 결합하는 검증된 패턴으로 자리 잡고 있다. Vector RAG가 흩어진 청크를 임베딩 유사도로 끌어모으는 방식이라면, GraphRAG는 엔티티·관계를 명시적 그래프로 표현해 다중 홉 추론과 종합 질문에서 한 단계 위의 답변 품질을 만든다. Microsoft·LlamaIndex·Neo4j 세 도구가 같은 흐름을 서로 다른 강점으로 구현했고, 어떤 환경에서 시작하든 진입 비용은 비슷한 수준이다.

도입을 고려한다면 PoC 단계에서 작은 문서 컬렉션 한 묶음으로 다중 홉 질문 정확도와 토큰 비용을 동시에 측정해 보는 것이 가장 빠른 검증 방법이다. 그래프 품질을 관리할 운영 체계가 함께 갖춰져야 효과가 지속되며, Vector RAG와의 하이브리드 구성을 기본으로 두면 양쪽 장점을 모두 챙길 수 있다.

GraphRAG 도입 체크리스트

01다중 홉·종합 질문이 핵심이면 GraphRAG, 단일 사실 위주면 Vector RAG 유지.

02Microsoft GraphRAG — 글로벌 요약·테마 분석에 적합.

03LlamaIndex Property Graph — 기존 LlamaIndex 스택, 스키마·암묵 추출 혼합.

04Neo4j GraphRAG — 기존 Neo4j 인프라, Text2Cypher·Hybrid Retriever.

05Vector RAG + GraphRAG 하이브리드를 기본 설계로 두기.

06인덱싱 비용 → Implicit·spaCy 기반 추출로 LLM 호출 최소화.

07그래프 품질 관리(엔티티 머지·관계 검증) 운영 체계 사전 구축.

본 글은 GraphRAG의 정의·구현체 비교·환각 감소 효과·실무 선택 가이드를 정리한 일반 정보다. 도구 버전·벤치마크 수치는 변동될 수 있으므로 microsoft/graphrag·LlamaIndex·Neo4j 공식 문서의 최신 기준을 직접 확인한다.

#GraphRAG #MicrosoftGraphRAG #LlamaIndex #PropertyGraph #Neo4jGraphRAG #KnowledgeGraph #LLM_RAG #LeidenAlgorithm #CommunityDetection #MultiHopReasoning #Text2Cypher #HybridRetriever #VectorRAG #HallucinationReduction #SemanticSearch

저작자표시 비영리 변경금지 (새창열림)

'IT' 카테고리의 다른 글

LLM + 지식 그래프 하이브리드 아키텍처 — Vector DB·Graph DB 통합 전략 완전 정리 (0)	2026.05.20
Neo4j vs Stardog vs FalkorDB — 그래프 DB 3종 선택 가이드와 LPG·RDF 비교 (0)	2026.05.20
Protégé 0부터 튜토리얼 — 가족 관계 온톨로지 만들고 HermiT·Pellet 추론기 돌리기 (0)	2026.05.20
OWL 2 프로파일 완전 비교 — EL·QL·RL 언제 무엇을 쓰는가 선택 가이드 (0)	2026.05.20
Schema.org JSON-LD SEO 실전 — 리치 스니펫 적용과 구조화 데이터 검증 가이드 (0)	2026.05.19

샤나엘의 일상

GraphRAG 완전 정리 — Microsoft·LlamaIndex·Neo4j 3종 비교와 다중 홉 추론 가이드

GraphRAG 완전 정리 — Microsoft·LlamaIndex·Neo4j 3종 비교와 다중 홉 추론 가이드

01 GraphRAG 정의와 등장 배경

02 Vector RAG vs GraphRAG 차이

03 Microsoft GraphRAG

04 LlamaIndex Property Graph

05 Neo4j GraphRAG

06 3종 한눈에 비교

07 환각 감소·실무 적용·선택 가이드

08 자주 묻는 질문 5가지

마무리

'IT' 카테고리의 다른 글

댓글

티스토리툴바

GraphRAG 완전 정리 — Microsoft·LlamaIndex·Neo4j 3종 비교와 다중 홉 추론 가이드

GraphRAG 완전 정리 — Microsoft·LlamaIndex·Neo4j 3종 비교와 다중 홉 추론 가이드

01 GraphRAG 정의와 등장 배경

02 Vector RAG vs GraphRAG 차이

03 Microsoft GraphRAG

04 LlamaIndex Property Graph

05 Neo4j GraphRAG

06 3종 한눈에 비교

07 환각 감소·실무 적용·선택 가이드

08 자주 묻는 질문 5가지

마무리

'IT' 카테고리의 다른 글

관련글

댓글

티스토리툴바