Náklady na AI mohou rychle eskalovat. Naučte se je předvídat a optimalizovat.
Cenová struktura
Aktuální ceny (2025)
| Model | Input (1M tokens) | Output (1M tokens) |
|---|---|---|
| Opus 4.5 | $15.00 | $75.00 |
| Sonnet 4.5 | $3.00 | $15.00 |
| Haiku 3.5 | $0.25 | $1.25 |
Co je token?
Přibližně:
- 1 token ≈ 4 znaky anglicky
- 1 token ≈ 3 znaky česky
- 100 tokens ≈ 75 slov
- 1000 řádků kódu ≈ 5000-8000 tokens
Typické úlohy - kalkulace
Code Review (denně)
Scénář: 5 PR denně, každý 500 řádků
Tokens per review:
- Input: ~4000 (kód + prompt)
- Output: ~1000 (review)
Měsíční náklady (20 dní):
- Opus: 100 reviews × (4K×$15 + 1K×$75)/1M = $13.50/měsíc
- Sonnet: 100 reviews × (4K×$3 + 1K×$15)/1M = $2.70/měsíc
- Haiku: 100 reviews × (4K×$0.25 + 1K×$1.25)/1M = $0.23/měsíc
Dokumentace projektu
Scénář: 50 stránek dokumentace
Per stránka:
- Input: ~2000 tokens (context + spec)
- Output: ~3000 tokens (dokumentace)
Celkem:
- Opus: 50 × (2K×$15 + 3K×$75)/1M = $12.75
- Sonnet: 50 × (2K×$3 + 3K×$15)/1M = $2.55
- Haiku: 50 × (2K×$0.25 + 3K×$1.25)/1M = $0.21
Daily Development Assistant
Scénář: 8 hodin denně, 50 queries
Average query:
- Input: ~1500 tokens
- Output: ~800 tokens
Měsíčně (20 dní, 1000 queries):
- Opus: $65/měsíc
- Sonnet: $13/měsíc
- Haiku: $1.10/měsíc
Optimalizační strategie
1. Model Routing
Použijte správný model pro správnou úlohu:
def select_model(task_type, complexity):
if task_type == "critical_analysis" or complexity == "high":
return "claude-opus-4-5"
elif task_type == "coding" or complexity == "medium":
return "claude-sonnet-4-5"
else:
return "claude-haiku-3-5"
2. Context Compression
Redukujte input tokens:
# Místo celého souboru
# full_file = open("large_file.py").read() # 50K tokens
# Pošlete jen relevantní část
relevant_code = extract_function("large_file.py", "target_function") # 2K tokens
3. Prompt Caching
# Anthropic prompt caching - 90% sleva na cached prompts
client.messages.create(
model="claude-opus-4-5",
system=[{
"type": "text",
"text": large_system_prompt,
"cache_control": {"type": "ephemeral"}
}],
messages=[...]
)
4. Batch Processing
# Místo 10 jednotlivých calls
# Kombinujte do jednoho
combined_prompt = """
Analyze these 10 functions:
1. [function1]
2. [function2]
...
"""
ROI Framework
Pro každou úlohu zvažte:
ROI = (Časová úspora × Hodinová sazba) / Cost
Příklad - Code Review:
- Manuální review: 30 min = 0.5h × $50 = $25
- Opus review: $0.18
- ROI: $25 / $0.18 = 139x
V další lekci vytvoříme rozhodovací framework pro výběr modelu.