Executive Summary
Исследование применимости локальных LLM (Open Weights) для Enterprise-задач в контуре безопасности. Фокус на сценарии аналитики и CRM без передачи данных третьим лицам.
Ключевая Рекомендация
Гибридный подход
Basket A (70B+) для сложной аналитики + Basket B (14-32B) для high-load CRM задач.
Инфраструктура
vLLM + OpenAI API
Стандартизированный слой инференса с поддержкой метрик и совместимости.
Главный Риск
Точность RAG
Галлюцинации требуют строгого 'Grounding' и фильтрации контекста.
Матрица Критериев Выбора
Распределение весов при выборе модели для корпоративного сегмента. Приоритет отдается качеству на русском языке и безопасности.
Итоговая Рекомендация (Shortlist)
DeepSeek-R1 (Distill 70B) / Qwen2.5-72B
Лучшие показатели Reasoning и работы с документами. Требуют 2xA100 (80GB) или 4xA6000.
Qwen2.5-32B / Gemma-2-27B
Идеальный баланс скорости и качества. Помещаются на одну карту A100/A6000 или даже потребительские 3090/4090 (в 4-bit).