Fine-tuning
5 posts
- Updated:
AI Agent 과정을 정리합니다. LLM 기초와 프롬프트 엔지니어링에서 시작해 RAG, Evaluation, Agent 설계, Observability, Cost, Security, Fine-tuning까지 운영 가능한 AI 시스템을 만들기 위해 필요한 흐름을 되짚습니다.
- Updated:
LLM의 Pre-training과 Post-training 차이를 정리하고 Fine-tuning의 목적, 데이터 구조와 설계 방법을 정리했습니다.
- Updated:
GRPO를 활용해 Qwen3-VL을 강화학습으로 파인튜닝하는 실전 가이드. Unsloth와 TRL로 수학 문제 해결 능력을 향상시키는 방법과 보상함수 설계법을 제시합니다.
- Updated:
LoRA를 활용하여 Qwen3-VL-8B을 건설현장 균열 이미지 데이터셋(2,057개)으로 효율적으로 파인튜닝하고 SageMaker vLLM으로 배포하는 전체 파이프라인을 확인합니다
Sagemaker를 통해 LLM 모델을 파인튜닝하고 테스트합니다.