Баттл ИИ-Аналитиков: Сравнение гипотез

Баттл ИИ-Аналитиков

Сравнительный анализ 7 моделей по гипотезе "Гибридный ИТ-ваучер"

Сводный график оценок (TAM-SAM-SOM)

На графике показаны оценки рынка от каждой модели. Из-за колоссального разброса в методологиях (от 19 млрд до 886 млрд руб.) ось Y использует логарифмическую шкалу для корректного сравнения масштабов.

Рейтинг и детальный разбор моделей

1. Google Gemini Pro 2.5

  • TAM: 886 млрд ₽
  • SAM: 512 млрд ₽
  • SOM (3-5 лет): 5.1 млрд ₽

Ключевой инсайт:

Напрямую верифицировал гипотезу об отсутствии конкурентов. Лучшая стратегическая логика: "Ваучер" - это "Land & Expand" инструмент для атаки на весь рынок (TAM) инфраструктурных услуг (SAM).

Оценка:

Лучший всесторонний анализ. Безупречная и самая широкая методология. SWOT-анализ и GTM-стратегия наиболее релевантны и основаны на данных.

2. Claude Sonnet 4.5

  • TAM: ~300 млрд ₽
  • SAM: ~65 млрд ₽
  • SOM (5 лет): 4.7-6.4 млрд ₽

Ключевой инсайт:

Лучшая детализация бизнес-плана. Представил блестящую методологию фильтрации SAM (по размеру, готовности к hard-offer) и построил Unit Economics (LTV/CAC).

Оценка:

Исключительная работа. Менее "стратегический" TAM, чем у Gemini, но непревзойденная "тактическая" глубина. Это готовый бизнес-план с P&L.

3. Chat GPT PRO Deep Research

  • TAM: 450-500 млрд ₽
  • SAM: ~400 млрд ₽
  • SOM (3 года): 32 млрд ₽

Ключевой инсайт:

Надежная, классическая аналитика "сверху-вниз". Четко выделил рынок ИТ-аутсорсинга (~262 млрд) как ядро. Хорошая сегментация TAM по отраслям.

Оценка:

Очень солидный, профессиональный отчет. Логика ясна, источники указаны. Оценка SOM (32 млрд) выглядит несколько оптимистичной по сравнению с другими.

4. Chat GPT Thinking Deep

  • TAM: 250-300 млрд ₽
  • SAM: ~180 млрд ₽
  • SOM (среднеср.): ~15 млрд ₽

Ключевой инсайт:

Предложил полезную таблицу с разбивкой SOM (~15 млрд) по отраслям, дав "Софтлайн" конкретные цели (напр., 3 млрд из Ритейла, 3 из Промышленности).

Оценка:

Хороший анализ с более узким (возможно, более реалистичным "bottom-up") TAM. Качественная работа, немного уступающая "PRO" версии в широте.

5. Claude Opus 4.1

  • TAM: 50-80 млрд ₽ (?)
  • SAM: 60-65 млрд ₽ (?)
  • SOM (3 года): 5-7 млрд ₽

Ключевой инсайт:

Непревзойденная детализация GTM-стратегии и *самого продукта*, включая описание пакетов ("Стартовый", "Бизнес" ⭐, "Корпоративный" ????) и ценообразование.

Оценка:

Критическая ошибка в логике: SAM (60-65 млрд) оказался *больше* TAM (50-80 млрд). Однако, если игнорировать этот просчет, тактическая часть отчета (GTM, риски) - одна из лучших.

6. Qwen 3-Max

  • TAM: ~19 млрд ₽
  • SAM: ~5.4 млрд ₽
  • SOM (3-5 лет): ~0.4 млрд ₽

Ключевой инсайт:

Единственная модель, применившая методологию "от железа" (CapEx -> OpEx). TAM = 15-20% от годового рынка *продаж* оборудования (~$1.08B).

Оценка:

Академически интересный, но практически неверный подход. Он полностью проигнорировал рынок услуг для *уже существующего* (legacy) парка оборудования, который огромен. В итоге цифры на порядок (!) ниже всех.

7. Grok 4 Expert

  • TAM: 80-120 млрд ₽
  • SAM: 40-60 млрд ₽
  • SOM (среднеср.): 2-5 млрд ₽

Ключевой инсайт:

Нет. Отчет представляет собой краткое Executive Summary без какой-либо "глубокой" исследовательской работы, методологии или источников.

Оценка:

Невыполнение задания. Модель не провела "deep research", а дала краткую сводку, в которой TAM меньше, чем у большинства, а SOM - в середине.

Почему такие разные цифры? Анализ методологий

Разница в оценках (особенно TAM) объясняется тем, что модели по-разному ответили на вопрос: "Что такое рынок для этого продукта?"

Подход 1: "Стратегический" (Gemini, GPT PRO)

TAM (886 млрд ₽) = ВЕСЬ рынок ИТ-услуг.

Логика: "Ваучер" - это "точка входа" (Land & Expand). Он позволяет "зацепить" клиента и затем продать ему *любые* другие услуги (облака, разработку, внедрение 1С), отняв их у конкурентов.

Оценка: Наиболее амбициозный и стратегически верный взгляд.

Подход 2: "Релевантный" (Sonnet, GPT Thinking)

TAM (300 млрд ₽) = Только ТП + Инфра-проекты.

Логика: Не будем считать то, что "Ваучер" не покрывает (напр., разработку ПО). TAM - это только те сегменты, из которых "Ваучер" *напрямую* черпает доход.

Оценка: Наиболее реалистичный и сфокусированный взгляд.

Подход 3: "Узкий" (Opus, Grok)

TAM (60-100 млрд ₽) = Только ТП сетей.

Логика: Модели сфокусировались на словах "ТП сетевого оборудования" и проигнорировали вторую, более важную часть гипотезы - "+ Консалтинг/Проекты".

Оценка: Частично неверно, упускает суть "гибридного" продукта.

Подход 4: "От железа" (Qwen)

TAM (19 млрд ₽) = % от годовых продаж *нового* железа.

Логика: Рынок услуг - это % от рынка продаж оборудования.

Оценка: Фатальная ошибка. Игнорирует гигантский рынок услуг для *уже существующего* (legacy) парка оборудования.

Сравнительный мета-анализ и инфографика подготовлены для "Софтлайн" | Ноябрь 2025