1. 도입부

1.1 왜 이 시스템이 필요했는가?

이전에 CDP 활용: AI 전략 분석을 위한 배치 프로세스 구현을 통해 지표 데이터를 성공적으로 추출했습니다. 하지만 핵심 문제가 남아있었습니다.

"이번 달 매출이 어떻게 됐어?"

사용자가 이렇게 자연어로 질문했을 때, AI는 이것이 "총매출액" 지표와 관련된 질문임을 어떻게 알 수 있을까요? 단순히 데이터를 추출하는 것을 넘어, 사용자의 자연어 질문과 실제 지표 데이터를 연결하는 지능적인 시스템이 필요했습니다.

1.2 RAG(Retrieval-Augmented Generation)가 답이다.

LLM의 근본적 한계

기존 LLM 모델들은 다음과 같은 한계를 가지고 있어 RAG 시스템이 필요했습니다:

  1. 시간적 제약: GPT 같은 모델은 특정 시점까지만 학습되어 그 이후의 정보를 모름
  2. 도메인 제약: 특정 기업의 내부 데이터나 전문 도메인 지식 부족
  3. 실시간성 부족: 계속 변화하는 데이터에 대한 실시간 반영 불가

RAG를 통한 해결 방안

이러한 한계점들을 극복하기 위해 RAG 시스템은 다음과 같은 방식으로 작동합니다:

image.png

2. 시스템 개요

2.1 전체 플로우

image.png