RAG
15 posts
- Updated:
AI Agent 과정을 정리합니다. LLM 기초와 프롬프트 엔지니어링에서 시작해 RAG, Evaluation, Agent 설계, Observability, Cost, Security, Fine-tuning까지 운영 가능한 AI 시스템을 만들기 위해 필요한 흐름을 되짚습니다.
- Updated:
LLM/RAG 시스템의 품질을 숫자로 증명하는 평가 체계를 소개합니다. Golden Dataset, Calibration Dataset, LLM-as-a-Judge, RAGAS 메트릭을 통해 감에 의존하는 평가에서 데이터 기반 의사결정으로 전환하는 방법을 다룹니다.
- Updated:
Naive RAG의 한계를 Query, Retrieval, Generation 3단계로 나누어 보완하는 Advanced RAG 기법들을 실무 관점에서 정리합니다. Hybrid Search와 Re-ranking 등 우선 적용할 기법부터 GraphRAG, Agentic RAG 같은 최신 아키텍처까지 전체 지형을 다룹니다.
- Updated:
Advanced RAG는 Hybrid Search로 의미와 키워드를 동시에 검색하고, Re-ranking과 메타데이터 필터링으로 정확성을 높입니다. 벡터 검색과 BM25를 결합하여 RAG의 검색 정밀도와 재현율 문제를 해결합니다.
- Updated:
RAG 파이프라인 구축 시 Golden Dataset으로 품질을 객관적으로 측정하고, PDF 로더, 청킹 전략, 임베딩 모델을 단계별로 최적화하여 신뢰성 높은 AI 시스템을 만드는 방법을 소개합니다.
- Updated:
토큰 제한과 할루시네이션 문제를 해결하는 RAG(검색-증강-생성)의 개념과 구조를 소개합니다. 청킹, 임베딩, 벡터 저장소를 통한 의미론적 검색과 LangChain, LlamaIndex 등 주요 프레임워크를 다룹니다.
- Updated:
Bedrock의 Qwen3-VL 모델로 PDF 테이블을 추출할 때 rowspan/colspan 병합 셀 처리 오류를 프롬프트 개선으로 해결하는 방법을 소개합니다.
ReRanking 모델을 사용하여 RAG의 출력 품질을 향상시킬 수 있습니다.
벡터 검색 품질을 향상시키기 위한 Sentence-window 청킹 방식을 테스트해보고 정리하였습니다.
UpstageDocumentParser를 사용하여 PDF를 분석하였습니다. 이를통해 이미지, 그래프를 분석하고 다각도 분석을 수행할 수 있도록 구성합니다.
- Updated:
최근 여러 RAG 기법들을 활용하고 있습니다. 여러 방식으로 데이터를 파싱해보고 RAG 구조를 구현해보며 각 방식의 장점과 단점을 확인해보았습니다.
Pinecone 환경에서 Sparse Vector와 Dense Vector를 활용한 검색부터 DeepEval을 활용한 평가까지 테스트하였습니다.
- Updated:
RAG 성능 평가를 위한 프레임워크 Deepeval을 통해 검색과 생성 성능을 정밀 측정하고, 서비스 품질과 사용자 만족도를 향상시킬 수 있습니다.
BM25: 검색어와 문서 관련성을 TF, IDF, 문서 길이로 정교하게 계산하여 최적 검색 결과를 찾아주는 핵심 알고리즘.
Llamaindex와 Llama3로 RAG, Text-to-SQL, 에이전트 등 GenAI 핵심 패턴 구축 방법을 학습하고 테스트합니다. 실용적인 AI 앱 개발 방법을 익혀보세요.