카테고리 없음

RAG (Retrieval-Augmented Generation)란?

Captain Herlock 2025. 3. 26. 23:45
반응형

**RAG (Retrieval-Augmented Generation)**는 **검색(Retrieval)과 생성(Generation)**을 결합한 자연어 처리(NLP) 기법입니다.

쉽게 말해, 외부 지식을 검색해서 활용하는 AI 기반 텍스트 생성 방식입니다.
→ "모르는 건 검색해서 보고 대답하는 AI"


🔹 RAG의 핵심 구조

  1. Retrieval (검색)
    • 질문을 받고, 관련 정보를 **외부 데이터베이스(문서, 논문, 웹 등)**에서 검색
    • 일반적인 LLM (예: GPT)처럼 학습된 지식만 사용하지 않고, 최신 정보를 가져옴
  2. Augmentation (보강)
    • 검색된 정보를 추가 컨텍스트로 활용
    • 단순한 질문-응답이 아니라, 관련 문서를 바탕으로 AI가 더 정확한 답을 생성
  3. Generation (생성)
    • LLM이 검색된 정보를 기반으로 최종 답변을 생성
    • 원래 학습된 내용 + 검색된 내용을 조합하여 더 정확하고 신뢰성 있는 결과 제공

🔹 RAG의 장점

최신 정보 반영 가능 → 모델이 미리 학습하지 않은 데이터도 활용 가능
지식 확장 가능 → 모델 크기를 키우지 않고도 더 많은 정보 접근 가능
사실 기반 응답 → 헛소리(할루시네이션) 감소, 검색된 데이터 기반 답변 제공
데이터 업데이트 용이 → 새로운 정보를 학습 없이 반영 가능


🔹 RAG vs. 일반 LLM

기존 LLM (GPT-4 등) RAG 모델

지식 업데이트 학습된 데이터까지만 가능 검색을 통해 최신 정보 반영 가능
데이터 저장 파라미터에 내장 외부 DB 검색 활용
정확성 제한된 범위 내에서 답변 검색한 정보로 정확성 향상
예시 ChatGPT 기본 모드 ChatGPT + 웹 검색

🔹 RAG 활용 예시

  1. 챗봇 → 고객 질문에 실시간 최신 데이터 기반 답변
  2. 의료 정보 검색 → 최신 논문 검색 후 답변 생성
  3. 법률 서비스 → 법률 문서를 검색하여 근거 있는 답변 생성
  4. 기업 내 검색 AI → 사내 문서를 검색하여 직원에게 적절한 정보 제공

🔹 대표적인 RAG 기반 모델

  • Meta의 RAG Model
  • OpenAI + 벡터DB (FAISS, Pinecone 등)
  • LangChain을 활용한 RAG 시스템

🔹 RAG의 한계

❌ 검색 데이터가 없으면 답변 품질 저하
❌ 검색된 정보가 부정확하면 잘못된 답 생성
❌ 검색 속도가 느려질 경우 성능 저하


✅ 결론

📌 RAG는 "검색 + AI 생성" 방식으로 최신 정보 기반 답변을 생성하는 기술!
📌 LLM의 한계를 보완하여 신뢰성과 정확성을 높이는 방법! 🚀