DeepSeek V4 Pro — честное сравнение

Данные: LiveBench (июнь 2026) + официальные цены API. Без маркетинга.

💰 Цена за 1 млн токенов (вход)

$0.44
GPT-5.5 ≈ $3–5 | Claude Opus ≈ $15

📊 Общий балл LiveBench

73.6 / 100
Топ (GPT-5.5): 80.7 — отставание всего 7 баллов

🧮 Математика

90.7 / 100
Почти как GPT-5.5 (96.3) — разрыв всего 5.6

💻 Кодинг

70.0 / 100
Слабое место — GPT-5.5 набирает 82.5

Что означают эти цифры?

🌐 Global Average (общий балл)
Средняя оценка по всем тестам. Выше = умнее в целом. Как средний балл в школе — если 80, то «отличник», если 60 — «троечник». Pro набирает 73.6 — это «твёрдый хорошист».
🧠 Reasoning (рассуждение)
Насколько модель умеет логически мыслить: анализировать, делать выводы, решать многошаговые задачи. Это главный показатель «интеллекта». Pro: 82.7 — очень достойно.
🧮 Math (математика)
Решение математических задач — от школьных до олимпиадных. Pro тут почти на уровне топов (90.7 против 96.3 у GPT-5.5). Разница в 5 баллов — это одна-две сложные задачи из десятка.
💻 Coding (написание кода)
Насколько хорошо пишет рабочий код с первой попытки. Pro: 70 — слабее топов (80+). Код пишет, но чаще требует правок.
🤖 Agentic Coding (автономное программирование)
Способность самостоятельно решать сложные задачи с кодом: искать файлы, править, тестировать — как я сейчас работаю. Pro: 56.7 — наравне с GPT-5.5. Лучше Claude 4.8 Opus (60.0 — почти одинаково).
📋 IF — Instruction Following (следование инструкциям)
Делает ли модель ровно то, что попросили. Pro: 62.4 — средний результат. Иногда уходит в сторону, надо чётче ставить задачу.

График: Pro против конкурентов

Общий балл и ключевые метрики

Цена: сколько стоит 1 миллион входных токенов

Сравнение цен (API)

МодельВход (1M токенов)Выход (1M токенов)Во сколько раз дороже Pro
DeepSeek V4 Pro $0.44 $0.87
DeepSeek V4 Flash $0.14 $0.28 ×0.3 (дешевле)
GPT-4o (OpenAI, 2025) $2.50 $10.00 ×6–11
Claude Sonnet 4 (Anthropic, 2025) $3.00 $15.00 ×7–17
GPT-5.5 Thinking (OpenAI, 2026) ~$3–5 ~$15–25 ×7–29

Вердикт: стоит ли Pro своих денег?


Если коротко: да. Ты получаешь ~90% качества топовых моделей за ~3% их цены.


  • СИЛЬНАЯ СТОРОНА Математика и логика — почти на уровне GPT-5.5. Если задача требует рассуждений, Pro не разочарует.
  • СИЛЬНАЯ СТОРОНА Автономная работа — Agentic Coding на уровне GPT-5.5. Как агент (я) Pro работает не хуже топов.
  • СЛАБАЯ СТОРОНА Написание кода с нуля — тут отставание заметное. Сложный код чаще требует ручных правок.
  • СРЕДНЕ Следование инструкциям — иногда надо переспрашивать и уточнять. Формулируй задачи чётко.

Flash vs Pro: если бюджет жмёт — Flash всё ещё хорош для простых задач. Но Pro на голову выше в reasoning и математике. Разница в цене ×3, разница в уме — ощутимая.


💡 Совет: для сложных многошаговых задач используй Pro. Для простых вопросов и рутинных операций — Flash. Комбинируй.