카테고리 없음
RAG (Retrieval-Augmented Generation)란?
Captain Herlock
2025. 3. 26. 23:45
반응형
**RAG (Retrieval-Augmented Generation)**는 **검색(Retrieval)과 생성(Generation)**을 결합한 자연어 처리(NLP) 기법입니다.
쉽게 말해, 외부 지식을 검색해서 활용하는 AI 기반 텍스트 생성 방식입니다.
→ "모르는 건 검색해서 보고 대답하는 AI"
🔹 RAG의 핵심 구조
- Retrieval (검색)
- 질문을 받고, 관련 정보를 **외부 데이터베이스(문서, 논문, 웹 등)**에서 검색
- 일반적인 LLM (예: GPT)처럼 학습된 지식만 사용하지 않고, 최신 정보를 가져옴
- Augmentation (보강)
- 검색된 정보를 추가 컨텍스트로 활용
- 단순한 질문-응답이 아니라, 관련 문서를 바탕으로 AI가 더 정확한 답을 생성
- Generation (생성)
- LLM이 검색된 정보를 기반으로 최종 답변을 생성
- 원래 학습된 내용 + 검색된 내용을 조합하여 더 정확하고 신뢰성 있는 결과 제공
🔹 RAG의 장점
✅ 최신 정보 반영 가능 → 모델이 미리 학습하지 않은 데이터도 활용 가능
✅ 지식 확장 가능 → 모델 크기를 키우지 않고도 더 많은 정보 접근 가능
✅ 사실 기반 응답 → 헛소리(할루시네이션) 감소, 검색된 데이터 기반 답변 제공
✅ 데이터 업데이트 용이 → 새로운 정보를 학습 없이 반영 가능
🔹 RAG vs. 일반 LLM
기존 LLM (GPT-4 등) RAG 모델
지식 업데이트 | 학습된 데이터까지만 가능 | 검색을 통해 최신 정보 반영 가능 |
데이터 저장 | 파라미터에 내장 | 외부 DB 검색 활용 |
정확성 | 제한된 범위 내에서 답변 | 검색한 정보로 정확성 향상 |
예시 | ChatGPT 기본 모드 | ChatGPT + 웹 검색 |
🔹 RAG 활용 예시
- 챗봇 → 고객 질문에 실시간 최신 데이터 기반 답변
- 의료 정보 검색 → 최신 논문 검색 후 답변 생성
- 법률 서비스 → 법률 문서를 검색하여 근거 있는 답변 생성
- 기업 내 검색 AI → 사내 문서를 검색하여 직원에게 적절한 정보 제공
🔹 대표적인 RAG 기반 모델
- Meta의 RAG Model
- OpenAI + 벡터DB (FAISS, Pinecone 등)
- LangChain을 활용한 RAG 시스템
🔹 RAG의 한계
❌ 검색 데이터가 없으면 답변 품질 저하
❌ 검색된 정보가 부정확하면 잘못된 답 생성
❌ 검색 속도가 느려질 경우 성능 저하
✅ 결론
📌 RAG는 "검색 + AI 생성" 방식으로 최신 정보 기반 답변을 생성하는 기술!
📌 LLM의 한계를 보완하여 신뢰성과 정확성을 높이는 방법! 🚀