LLM 자동화의 비용은 호출 수 × 입력 토큰 × 단가로 빠르게 커집니다. 호출별 비용·일일 합계·모델별 단위 경제학을 분기 보고에 박는 한 가지 표 양식.
LLM 자동화 한 자리에 비용이 매월 얼마나 드는지 즉답할 수 있나요? 첫 청구서를 받기 전까지는 의외로 어렵습니다. 호출 수 × 입력 토큰 × 단가가 각각 어떻게 움직이는지 모르고 자동화를 운영하면, 분기 마감일에 "이번 분기 LLM 비용이 예상보다 3배"라는 숫자만 받게 됩니다. 이 글은 그 숫자를 분기 보고로 끌고 가는 단위 경제학 한 묶음을 정리합니다.
마케터가 이 글을 읽어야 하는 이유: LLM 자동화는 ROI가 큰 만큼 비용도 빠르게 커집니다. 호출당 비용·일일 합계·모델별 단가 차이를 미리 알면 분기 예산 결정이 정확해지고, 어느 자동화에 어느 모델을 쓸지 결정할 때 데이터가 따라옵니다. 비용 청구서가 통제 안에 들어와야 LLM 자동화가 운영의 표준 도구가 됩니다.
1. LLM 비용의 4개 변수
LLM API 비용은 단순한 공식으로 계산됩니다.
- : 호출당 입력 토큰
- : 호출당 출력 토큰
- : 호출당 캐시 히트 토큰
- : 토큰당 단가 (모델·종류별 다름)
이 4개 변수가 자동화 한 자리의 매월 비용을 거의 결정합니다.
2. 모델별 단가 — 자릿수 차이
2026년 기준 주요 모델 단가(1M 토큰당, USD).
| 모델 | 입력 | 출력 | 캐시 히트 | 추론(thinking) |
|---|---|---|---|---|
| GPT-5 | $5 | $15 | $2.5 | $15 |
| GPT-5-mini | $0.50 | $1.50 | $0.25 | — |
| Claude Opus 4.7 | $15 | $75 | $1.5 | — |
| Claude Sonnet 4.6 | $3 | $15 | $0.30 | — |
| Claude Haiku 4.5 | $0.80 | $4 | $0.08 | — |
| Gemini 2.5 Pro | $1.25 | $5 | $0.31 | — |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.075 | — |
같은 작업이라도 모델 선택만으로 비용이 10-30배 차이. 입력 토큰이 많은 자리(긴 컨텍스트)는 입력 단가, 출력이 긴 자리(보고서 생성)는 출력 단가가 핵심.
3. 호출당 비용 계산 — 한 자동화의 단위 경제학
캠페인 분류 자동화를 예로 들겠습니다.
| 항목 | 값 |
|---|---|
| 시스템 프롬프트 | 500 토큰 |
| Few-shot 예시 | 1500 토큰 |
| 사용자 입력 | 100 토큰 |
| 출력 | 200 토큰 |
| 일일 호출 | 1000회 |
3-1. GPT-5 사용 시
호출당 비용:
- 입력: (500 + 1500 + 100) / 1\text{M} \times \5 = $0.0105$
- 출력: 200 / 1\text{M} \times \15 = $0.003$
- 호출당: \0.0135$
일일 1000회: \13.5$405$.
3-2. GPT-5-mini 사용 시
호출당:
- 입력: 2100 / 1\text{M} \times \0.50 = $0.00105$
- 출력: 200 / 1\text{M} \times \1.50 = $0.0003$
- 호출당: \0.00135$
일일 1000회: \1.35$40.5$. GPT-5의 1/10.
3-3. Caching 적용 GPT-5
Prompt caching을 적용하면 시스템 프롬프트·few-shot이 캐시 히트:
- 입력 (캐시 안 됨): 100 / 1\text{M} \times \5 = $0.0005$
- 입력 (캐시 히트): 2000 / 1\text{M} \times \2.5 = $0.005$
- 출력: \0.003$
- 호출당: \0.0085$ (37% 절감)
| 옵션 | 호출당 | 일일 1000회 | 월 비용 |
|---|---|---|---|
| GPT-5 (no cache) | $0.0135 | $13.5 | $405 |
| GPT-5 + caching | $0.0085 | $8.5 | $255 |
| GPT-5-mini | $0.00135 | $1.35 | $40.5 |
| GPT-5-mini + caching | $0.001 | $1.0 | $30 |
같은 작업에 모델·캐싱 조합으로 월 $30-405. 13배 차이.
4. 코드 한 묶음 — 호출별 비용 추적
이게 글에 박는 유일한 코드입니다.