"데이터사이언스" 키워드로 분류된 글 모음.
LLM 기반 RAG 시스템의 성능을 단순 출력 비교를 넘어 근본적으로 진단하는 방법을 제시합니다. Faithfulness, Context Relevancy 등 핵심 평가 지표의 정의부터 실전 테스트 케이스 설계 및 점수 계산 로직까지, AI 엔지니어가 즉시 적용할 수 있는 실무 가이드를 제공합니다.