Lesson 14 of 30 ~15 min
Course progress
0%

Cost Analysis & Optimization

Detailní cost kalkulace a strategie pro optimalizaci nákladů při práci s Claude modely.

Náklady na AI mohou rychle eskalovat. Naučte se je předvídat a optimalizovat.

Cenová struktura

Aktuální ceny (2025)

ModelInput (1M tokens)Output (1M tokens)
Opus 4.5$15.00$75.00
Sonnet 4.5$3.00$15.00
Haiku 3.5$0.25$1.25

Co je token?

Přibližně:
- 1 token ≈ 4 znaky anglicky
- 1 token ≈ 3 znaky česky
- 100 tokens ≈ 75 slov
- 1000 řádků kódu ≈ 5000-8000 tokens

Typické úlohy - kalkulace

Code Review (denně)

Scénář: 5 PR denně, každý 500 řádků

Tokens per review:
- Input: ~4000 (kód + prompt)
- Output: ~1000 (review)

Měsíční náklady (20 dní):
- Opus:  100 reviews × (4K×$15 + 1K×$75)/1M = $13.50/měsíc
- Sonnet: 100 reviews × (4K×$3 + 1K×$15)/1M = $2.70/měsíc
- Haiku:  100 reviews × (4K×$0.25 + 1K×$1.25)/1M = $0.23/měsíc

Dokumentace projektu

Scénář: 50 stránek dokumentace

Per stránka:
- Input: ~2000 tokens (context + spec)
- Output: ~3000 tokens (dokumentace)

Celkem:
- Opus:  50 × (2K×$15 + 3K×$75)/1M = $12.75
- Sonnet: 50 × (2K×$3 + 3K×$15)/1M = $2.55
- Haiku:  50 × (2K×$0.25 + 3K×$1.25)/1M = $0.21

Daily Development Assistant

Scénář: 8 hodin denně, 50 queries

Average query:
- Input: ~1500 tokens
- Output: ~800 tokens

Měsíčně (20 dní, 1000 queries):
- Opus:  $65/měsíc
- Sonnet: $13/měsíc
- Haiku:  $1.10/měsíc

Optimalizační strategie

1. Model Routing

Použijte správný model pro správnou úlohu:

def select_model(task_type, complexity):
    if task_type == "critical_analysis" or complexity == "high":
        return "claude-opus-4-5"
    elif task_type == "coding" or complexity == "medium":
        return "claude-sonnet-4-5"
    else:
        return "claude-haiku-3-5"

2. Context Compression

Redukujte input tokens:

# Místo celého souboru
# full_file = open("large_file.py").read()  # 50K tokens

# Pošlete jen relevantní část
relevant_code = extract_function("large_file.py", "target_function")  # 2K tokens

3. Prompt Caching

# Anthropic prompt caching - 90% sleva na cached prompts
client.messages.create(
    model="claude-opus-4-5",
    system=[{
        "type": "text",
        "text": large_system_prompt,
        "cache_control": {"type": "ephemeral"}
    }],
    messages=[...]
)

4. Batch Processing

# Místo 10 jednotlivých calls
# Kombinujte do jednoho

combined_prompt = """
Analyze these 10 functions:
1. [function1]
2. [function2]
...
"""

ROI Framework

Pro každou úlohu zvažte:

ROI = (Časová úspora × Hodinová sazba) / Cost

Příklad - Code Review:
- Manuální review: 30 min = 0.5h × $50 = $25
- Opus review: $0.18
- ROI: $25 / $0.18 = 139x

V další lekci vytvoříme rozhodovací framework pro výběr modelu.