[리뷰] 랭체인으로 RAG 개발하기 : VectorRAG & GraphRAG
<책 표지>
<책 정보>
- 제목: 랭체인으로 RAG 개발하기: VectorRAG & GraphRAG
- 저자: 서지영 (마이크로소프트 Data & AI Specialist 근무 中)
- 출판사: 길벗
- 총 페이지수: 312페이지
- 판매처
교보문고: https://product.kyobobook.co.kr/detail/S000216352492
알라딘: http://aladin.kr/p/PRZxx<챕터>
1장 VectorRAG & GraphRAG 개념 이해하기
1.1 RAG란 무엇인가?
____1.1.1 RAG란?
____1.1.2 RAG의 필요성
____1.1.3 RAG 핵심 원리
____1.1.4 RAG 구현 방법
1.2 VectorRAG란 무엇인가?
____1.2.1 벡터란?
____1.2.2 벡터 처리 과정
____1.2.3 벡터 저장소
____1.2.4 VectorRAG란?
____1.2.5 VectorRAG는 언제 사용하나요?
1.3 GraphRAG란 무엇인가?
____1.3.1 그래프란?
____1.3.2 GraphDB: Neo4j
____1.3.3 GraphRAG란?
____1.3.4 GraphRAG는 언제 사용하나요?
2장 OpenAI 개념과 원리 이해하기
2.1 OpenAI란?
2.2 OpenAI 모델
____2.2.1 GPT 시리즈
____2.2.2 ChatGPT
____2.2.3 DALL·E 시리즈
____2.2.4 Whisper
____2.2.5 Sora
____2.2.6 임베딩
2.3 ChatGPT의 원리
____2.3.1 트랜스포머란?
____2.3.2 트랜스포머가 등장한 이유
2.4 OpenAI 추론 모델: o3-mini
____2.4.1 추론을 해야 하는 질문
____2.4.2 정답이 확실한 질문
2.5 OpenAI 모델 사용 시 고려사항
3장 DeepSeek 개념과 원리 이해하기
3.1 DeepSeek란?
3.2 DeepSeek가 부각된 배경
3.3 DeepSeek-R1의 원리
3.4 DeepSeek 모델
3.5 DeepSeek 모델 사용 시 고려사항
4장 실습 환경 준비하기
4.1 아나콘다 설치 및 구성
____4.1.1 아나콘다 설치하기
____4.1.2 아나콘다 가상 환경 구성하기
4.2 API 키 준비하기
4.3 DeepSeek 모델 준비하기
4.4 Neo4j 설치 및 구성하기
____4.4.1 Neo4j 설치하기
____4.4.2 Neo4j 사용 방법 익히기
____4.4.3 Neo4j에서 Cypher 사용하기
5장 VectorRAG 실습: OpenAI API 사용
5.1 자동차 데이터 검색하기
5.2 웹 데이터 검색하기
5.3 PDF에서 다육이 데이터 검색하기
5.4 랭체인의 메모리 사용하기
5.5 여러 파일에서 데이터 가져와 검색하기
5.6 랭체인 & 라마인덱스 비교
5.7 VectorRAG에 부적합한 사례
6장 VectorRAG 실습: DeepSeek 모델 사용
6.1 자동차 데이터 검색하기
6.2 웹 데이터 검색하기
6.3 PDF에서 다육이 데이터 검색하기
6.4 랭체인의 메모리 사용하기
6.5 여러 파일에서 데이터 가져와 검색하기
7장 GraphRAG 실습
7.1 랭체인에서 그래프 사용하기
7.2 축구 데이터 검색하기
____7.2.1 축구 데이터 생성하기
____7.2.2 축구 데이터 검색하기
7.3 PDF 파일 불러와서 검색하기
7.4 영화 데이터 검색하기
____7.4.1 영화 데이터 생성하기
____7.4.2 영화 데이터 검색하기
7.5 자동차 데이터 검색하기
____7.5.1 자동차 데이터 생성하기
____7.5.2 자동차 데이터 검색하기
7.6 건강 데이터 검색하기
____7.6.1 건강 데이터 생성하기
____7.6.2 건강 데이터 검색하기
8장 Copilot과 GraphRAG 비교 및 RAG의 사회적 영향
8.1 Copilot에서 사용하는 그래프 기반 검색과 GraphRAG 비교
____8.1.1 Copilot에서 사용하는 검색
____8.1.2 일반적인 RAG와 Copilot 검색 비교
8.2 RAG 패러다임 이후: 다음 단계는?
____8.2.1 RAG의 한계와 발전 방향
____8.2.2 AI Agent와 강화학습
8.3 RAG의 사회적 영향
____8.3.1 신뢰성과 투명성 문제
____8.3.2 AI의 윤리적 고려 사항
____8.3.3 정책 및 규제 이슈
8.4 인간 삶의 변화
____8.4.1 업무의 변화
____8.4.2 개인 삶의 변화
<리뷰>
ChatGPT 같은 생성형 AI가 뭔지 아는 사람들 대부분은 LLM (대형 언어 모델)에 대해 들어봤으나, RAG에 대해서는 비교적 생소할 것이다. 하지만 RAG는 상대적으로 생소하게 느껴질 수 있는데, RAG는 '검색 증강 생성(Retrieval-Augmented Generation)'으로, LLM의 활용성을 극대화할 수 있는 핵심 기술이다. 이 책은 바로 그 RAG에 대한 깊이 있는 이해를 돕는 안내서이다.
RAG의 심층 탐구: VectorRAG와 GraphRAG
AI 기술, 특히 LLM 기반 애플리케이션 개발에 관심이 있는 사람이라면 랭체인(Langchain) 등을 활용한 경험이 있을 것이다.
필자도 다양한 AI 활용 기술 관련 서적들을 통해 LLM 개발에 대한 지식을 쌓아왔다.
이 책은 단순히 LLM을 넘어, 그 핵심적인 활용 방안인 RAG에 초점을 맞추고, 거기서 더 나아가 RAG를 VectorRAG와 GraphRAG라는 두 가지 세부 개념을 상세하게 다뤄 RAG를 보다 깊이있게 이해할 수 있도록 한다.
실제로, 필자도 RAG라는 개념은 알고 있었지만, VectorRAG와 GraphRAG와 같은 세부적인 구현 방식은 이 책을 통해 처음 접해봤다. 특히, GraphRAG의 원리와 이를 구현하는 데 필수적인 Cypher 쿼리 언어, 그리고 그래프 데이터베이스인 Neo4j 의 소개는 매우 인상 깊었다. 이러한 기술들이 실제 AI 모델 개발에 어떻게 적용할 수 있는지 구체적인 통찰을 얻을 수 있어 도움이 많이 됐다.
실용적인 예제와 활용 가이드
이 책에서는 RAG 입문책 답게 RAG와 관련된 핵심 개념들과 내용들을 비교적 쉽고 간단하게 설명하여 AI 기술에 대해 배워보고 싶은 입문자들이 읽기에 크게 어렵지 않을 것으로 생각된다.
AI 기술에 대한 배경 지식이 많지 않은 이들도 충분히 이해하며 따라갈 수 있도록 구성되어 있고, 제공되는 예제들은 난이도가 높지 않으면서도 실제 서비스에 적용 가능한 수준의 실용성을 가지고 있다.
특히, 엑셀, PDF, 웹데이터 등 다양한 형식의 데이터들을 다루는 라이브러리 활용법을 제시하여, 책의 예제를 넘어 독자 스스로 아이디어에 맞는 맞춤형 AI 모델을 구현할 수 있는 기반을 제공한다.
필자 역시, 이 책을 읽으면서 현재 구상 중인 아이디어를 보다 현실적으로 구현할 수 있는 구체적인 방안을 얻게 되어 매우 유용했다.
최신 AI 모델 분석과 심층 비교
이 책은 OpenAI의 다양한 모델들을 소개하고, 주요 모델들의 성능과 비용을 면밀히 비교 분석하여 어떤 모델이 특정 프로젝트에 적합지 판단하는 데 실질적인 도움이 준다. 필자의 경우, 최근 OpenAI API를 활용하여 프로젝트를 진행하면서 다양한 모델 중 최적의 선택을 하는 데 어려움을 겪었는데, 만약 이 책에서 제공하는 비교 정보를 미리 봤다면 좀 더 효율적인 모델 선택이 가능했을 것이다.
또한, 최근 화제가 되었던 딥시크(DeepSeek)와 OpenAI 모델 간의 성능 및 비용 비교 분석 또한 흥미로웠다. 이 책은 딥시크가 저렴한 비용으로 고성능을 추구하지만, 특정 측면에서는 아직 보완이 필요하다는 점을 객관적으로 제시하여 독자들에게 균형 잡힌 시각을 제공한다.
이 책 누가 읽어야 하지?
단순한 챗봇을 넘어, 전문적인 정보를 제공하는 AI 모델을 개발하고 싶지만 어디서부터 시작해야 할지 막막하다면 이 책이 훌륭한 시작점이 될 것으로 보인다.
물론, 이미 RAG에 대한 깊은 이해와 높은 기술 활용 능력을 갖춘 사람에게는 다소 기초적일 수 있다.
하지만 만약 당신이 RAG라는 개념이 생소하거나, GraphRAG에 대해 처음 들어봤고, Neo4j가 무엇인지 궁금하다면
이 책은 분명 당신의 지평을 넓혀줄 것이다. 이 책을 통해 LLM 기반 AI 모델 개발의 새로운 가능성을 발견하고, 실제 프로젝트에 적용할 수 있는 통찰을 얻을 수 있길 강력히 추천한다.
* 이 책은 길벗 개발자 리뷰어에 선정되어 제공 받았습니다.