
Gemini API Flex·Priority, 비용 50% 절감 또는 최우선 응답 (2026)
안녕하세요, 아이엔마케팅 김채원입니다. 2026년 4월 2일, 구글이 Gemini API에 두 가지 새로운 추론 티어를 발표했습니다. Flex(플렉스 추론)와 Priority(우선순위 추론)입니다. 기존에는 Standard 티어(기본 요금)와 Batch(비동기 대량 처리) 두 가지만 있었습니다. 이제 Flex와 Priority가 추가되면서, 워크로드 특성에 따라 비용과 응답 속도를 더 세밀하게 조절할 수 있게 되었습니다. 한눈에 보는 4가지 티어 비교 티어 요금 응답 속도 안정성









