DeepSeek V4 Pro — честное сравнение

Данные: LiveBench (июнь 2026) + официальные цены API. Без маркетинга.

💰 Цена за 1 млн токенов (вход)

$0.44

GPT-5.5 ≈ $3–5 | Claude Opus ≈ $15

📊 Общий балл LiveBench

73.6 / 100

Топ (GPT-5.5): 80.7 — отставание всего 7 баллов

🧮 Математика

90.7 / 100

Почти как GPT-5.5 (96.3) — разрыв всего 5.6

💻 Кодинг

70.0 / 100

Слабое место — GPT-5.5 набирает 82.5

Что означают эти цифры?

🌐 Global Average (общий балл): Средняя оценка по всем тестам. Выше = умнее в целом. Как средний балл в школе — если 80, то «отличник», если 60 — «троечник». Pro набирает 73.6 — это «твёрдый хорошист».
🧠 Reasoning (рассуждение): Насколько модель умеет логически мыслить: анализировать, делать выводы, решать многошаговые задачи. Это главный показатель «интеллекта». Pro: 82.7 — очень достойно.
🧮 Math (математика): Решение математических задач — от школьных до олимпиадных. Pro тут почти на уровне топов (90.7 против 96.3 у GPT-5.5). Разница в 5 баллов — это одна-две сложные задачи из десятка.
💻 Coding (написание кода): Насколько хорошо пишет рабочий код с первой попытки. Pro: 70 — слабее топов (80+). Код пишет, но чаще требует правок.
🤖 Agentic Coding (автономное программирование): Способность самостоятельно решать сложные задачи с кодом: искать файлы, править, тестировать — как я сейчас работаю. Pro: 56.7 — наравне с GPT-5.5. Лучше Claude 4.8 Opus (60.0 — почти одинаково).
📋 IF — Instruction Following (следование инструкциям): Делает ли модель ровно то, что попросили. Pro: 62.4 — средний результат. Иногда уходит в сторону, надо чётче ставить задачу.

График: Pro против конкурентов

Общий балл и ключевые метрики

Цена: сколько стоит 1 миллион входных токенов

Сравнение цен (API)

Модель	Вход (1M токенов)	Выход (1M токенов)	Во сколько раз дороже Pro
DeepSeek V4 Pro	$0.44	$0.87	—
DeepSeek V4 Flash	$0.14	$0.28	×0.3 (дешевле)
GPT-4o (OpenAI, 2025)	$2.50	$10.00	×6–11
Claude Sonnet 4 (Anthropic, 2025)	$3.00	$15.00	×7–17
GPT-5.5 Thinking (OpenAI, 2026)	~$3–5	~$15–25	×7–29

Вердикт: стоит ли Pro своих денег?

Если коротко: да. Ты получаешь ~90% качества топовых моделей за ~3% их цены.

СИЛЬНАЯ СТОРОНА Математика и логика — почти на уровне GPT-5.5. Если задача требует рассуждений, Pro не разочарует.
СИЛЬНАЯ СТОРОНА Автономная работа — Agentic Coding на уровне GPT-5.5. Как агент (я) Pro работает не хуже топов.
СЛАБАЯ СТОРОНА Написание кода с нуля — тут отставание заметное. Сложный код чаще требует ручных правок.
СРЕДНЕ Следование инструкциям — иногда надо переспрашивать и уточнять. Формулируй задачи чётко.

Flash vs Pro: если бюджет жмёт — Flash всё ещё хорош для простых задач. Но Pro на голову выше в reasoning и математике. Разница в цене ×3, разница в уме — ощутимая.

💡 Совет: для сложных многошаговых задач используй Pro. Для простых вопросов и рутинных операций — Flash. Комбинируй.