[운영#5] 비용 최적화 & 모델 선택 전략(o4-mini, GPT-4.1, 임베딩, 캐싱, 요청 구조)
한줄 요약:자동화가 제대로 돌아가기 시작하면 가장 먼저 눈에 띄는 문제는 “비용”.👉 모델 선택, 프롬프트 최적화, 배치 전략, 캐싱만 잘 하면 비용 70~95% 절감이 가능하다. 1. 비용 구조를 이해해야 절감이 가능하다 LLM 비용은 이 3개로 결정된다: 즉, 2. 모델 선택 전략 — 저렴한 모델을 기본값으로 모델 추천 용도 장점 비용 o4-mini 요약·초안·추출 빠름·저렴·충분히 우수 최저 비용 … 더 읽기