Mistral представляет новую эру ИИ: мощные большие модели и компактные решения для бизнеса

Французский стартап Mistral представил новое семейство моделей Mistral 3 — десять моделей, среди которых крупная многоязычная и мультимодальная модель и девять компактных, офлайн-совместимых моделей, которые можно полностью настроить под задачи заказчика.

Компания, основанная бывшими исследователями DeepMind и , делает ставку не на максимальный размер модели, а на эффективность и гибкость. По словам сооснователя и главного научного сотрудника Гийома Лампла, многие корпоративные задачи успешно решаются компактными моделями, которые при дообучении могут не уступать и даже превосходить крупные закрытые решения.

Крупная модель Mistral Large 3 объединяет возможности обработки текстов и изображений, поддерживает множество языков и конкурирует с лучшими закрытыми продуктами, такими как GPT-4o и Gemini 2. Ее архитектура с «гранулярной смесью экспертов» позволяет эффективно работать с объемными текстами и автоматизировать сложные бизнес-процессы.

Малые модели Mistral 3 представлены в трех размерах (14B, 8B и 3B параметров) и трех вариантах: базовая, оптимизированная для диалогов и для сложных логических задач. Они отличаются высокой производительностью, энергоэффективностью и могут работать на одном GPU, что делает их доступными для широкого круга пользователей — от корпораций до студентов и робототехнических команд в удаленных условиях.

Mistral активно внедряет свои решения в роботов, дроны и автомобили, сотрудничая с технологическими и оборонными компаниями по всему миру. Важной задачей для компании является обеспечение надежности и независимости от внешних сервисов, что особенно критично для крупных предприятий.

Таким образом, Mistral предлагает современный взгляд на развитие искусственного интеллекта, делая акцент на практичность, доступность и адаптивность своих моделей.

Tion