인공지능(AI)의 기초 – 데이터: 2025년 LLM 시대의 마케팅 AI 데이터 전략
인공지능의 본질은 사람 지능의 패턴을 모사하는 것이다. 알파고가 바둑 경우의 수를 정복했듯, AI는 제한된 환경 안에서 인간의 판단 패턴을 학습해 자동화한다. 그리고 이 모든 것의 출발점은 데이터다.
AI가 작동하려면 데이터가 필요한 3가지 이유
머신러닝 기반 AI는 사람이 모든 판단 기준을 프로그래밍하는 것이 아니라, 데이터에서 스스로 패턴을 학습한다. 좋은 AI를 만들려면 데이터가 갖춰야 할 3가지 조건이 있다:
- 데이터화(Digitization): 정보가 디지털 데이터로 존재해야 한다. 종이 서류, 구두 합의, 직관적 판단은 AI가 학습할 수 없다
- 충분한 양(Volume): 통계적으로 의미 있는 패턴을 찾으려면 충분한 데이터 량이 필요하다. 마케팅 AI 예측 모델은 최소 수천~수만 건의 데이터가 필요하다
- 반복성(Recurrence): 일회성이 아닌 반복·지속 발생하는 데이터여야 패턴이 형성된다. 고객의 구매 이력, 클릭 패턴, 이탈 행동이 좋은 예다
마케팅 AI를 위한 데이터 수집 전략
- 퍼스트파티 데이터 우선: 쿠키리스 시대에 자사가 직접 수집한 이메일·행동·구매 데이터가 핵심 자산이다
- 이벤트 트래킹: GA4·Mixpanel로 클릭·스크롤·구매·이탈 등 모든 고객 행동을 이벤트로 수집하라
- 데이터 통합(CDP): 웹·앱·이메일·오프라인 데이터를 하나의 고객 프로필로 통합하는 Customer Data Platform(CDP) 도입을 검토하라
2025년 패러다임 전환: LLM이 바꾼 AI의 기초
2019년까지 마케팅 AI의 기초는 “자사 데이터로 모델을 학습시키는 것”이었다. 2025년은 다르다. ChatGPT, Claude, Gemini 같은 대형 언어 모델(LLM)은 이미 수조 건의 텍스트 데이터로 사전 학습되어 있다. 마케터는 이제 처음부터 AI를 훈련시킬 필요 없이, 잘 학습된 AI에게 자사 데이터 맥락을 주입(RAG·Fine-tuning)해서 바로 활용할 수 있다.
- RAG (Retrieval-Augmented Generation): AI에게 자사 제품 카탈로그·FAQ·정책 문서를 연결해 정확한 답변 생성
- Fine-tuning: 브랜드 목소리(Brand Voice)를 학습시켜 AI가 항상 브랜드 톤으로 콘텐츠를 생성하도록 최적화
- AI 에이전트: 데이터 수집·분석·리포트·캠페인 실행까지 자율적으로 수행하는 마케팅 AI 에이전트의 시대가 열리고 있다
데이터는 여전히 AI의 기초다. 다만 2025년에는 “얼마나 많은 데이터를 가지고 있느냐”보다 “어떤 데이터를 AI에게 어떻게 활용시키느냐”가 더 중요해졌다.