Enterprise Local LLM Strategy Report

Executive Summary

Исследование применимости локальных LLM (Open Weights) для Enterprise-задач в контуре безопасности. Фокус на сценарии аналитики и CRM без передачи данных третьим лицам.

Ключевая Рекомендация

Гибридный подход

Basket A (70B+) для сложной аналитики + Basket B (14-32B) для high-load CRM задач.

Инфраструктура

vLLM + OpenAI API

Стандартизированный слой инференса с поддержкой метрик и совместимости.

Главный Риск

Точность RAG

Галлюцинации требуют строгого 'Grounding' и фильтрации контекста.

Матрица Критериев Выбора

Распределение весов при выборе модели для корпоративного сегмента. Приоритет отдается качеству на русском языке и безопасности.

Итоговая Рекомендация (Shortlist)

Basket A: Analytics & Complex RAG

DeepSeek-R1 (Distill 70B) / Qwen2.5-72B

Лучшие показатели Reasoning и работы с документами. Требуют 2xA100 (80GB) или 4xA6000.

Basket B: CRM & Fast Tasks

Qwen2.5-32B / Gemma-2-27B

Идеальный баланс скорости и качества. Помещаются на одну карту A100/A6000 или даже потребительские 3090/4090 (в 4-bit).

On-Premise LLM Analysis Report • 2025