представила собственную передовую генеративную модель искусственного интеллекта под названием Llama. В отличие от многих крупных моделей, таких как Claude, Gemini или ChatGPT, Llama выделяется тем, что является открытой — разработчики могут свободно скачивать и использовать её с некоторыми ограничениями.
Для удобства разработчиков сотрудничает с такими компаниями, как AWS, Google Cloud и Microsoft Azure, предоставляя облачные версии Llama. Также компания предлагает инструменты и библиотеки для тонкой настройки и адаптации модели под нужды различных областей. Новые версии, например Llama 3 и Llama 4, включают поддержку мультимодальных возможностей и расширяют доступность в облаках.
Семейство моделей Llama включает в себя несколько вариантов, последняя версия — Llama 4, выпущенная в апреле 2025 года. Она состоит из трёх моделей:
— Scout: 17 млрд активных параметров, 109 млрд всего, контекстное окно на 10 миллионов токенов.
— Maverick: 17 млрд активных параметров, 400 млрд всего, контекстное окно на 1 миллион токенов.
— Behemoth: ещё не выпущена, будет иметь 288 млрд активных параметров и 2 триллиона всего.
Контекстное окно — это объем данных, который модель учитывает при создании ответа, что помогает ей не забывать содержание и избегать ошибок. Например, окно в 10 миллионов токенов у Scout примерно равно тексту 80 обычных романов.
Все модели Llama 4 обучались на огромных объемах неразмеченного текста, изображений и видео, что даёт им широкий визуальный и языковой охват, включая 200 языков. Scout и Maverick — первые мультимодальные модели с архитектурой «смеси экспертов», которая повышает эффективность работы.
Llama способна решать широкий спектр задач: от программирования и математических вычислений до обработки и резюмирования документов на 12 языках, включая английский, испанский, французский, хинди и другие. Каждая модель ориентирована на разные задачи: Scout — на большие объемы данных, Maverick — на баланс скорости и мощности, Behemoth — для сложных научных и исследовательских целей.
Модель интегрируется с внешними сервисами, такими как поисковые системы и вычислительные платформы, но для этого требуется специальная настройка.
Llama уже используется в чат-ботах на платформах по всему миру, а версии Scout и Maverick доступны для разработчиков через Llama.com и партнеров, включая Hugging Face. работает с более чем 25 партнерами, которые предоставляют хостинг и дополнительные сервисы на базе Llama.
При этом существуют ограничения по лицензии: приложения с более чем 700 млн пользователей должны получать специальное разрешение от .
Для повышения безопасности использования модели предлагает набор инструментов, таких как Llama Guard для модерации контента, Prompt Guard для защиты от атак на модель, а также CyberSecEval для оценки киберрисков. Эти инструменты помогают отсекать нежелательный и опасный контент и обеспечивают защиту при работе с моделью.
Однако у Llama есть и ограничения. Например, мультимодальные возможности пока лучше работают на английском языке. Модель обучена на больших объемах данных, включая спорные источники, что может вызывать вопросы авторских прав и этики. Также Llama иногда генерирует ошибочный или небезопасный код, поэтому рекомендуется проверять результаты экспертом.
В целом Llama — мощный и гибкий инструмент, который открывает широкие возможности для разработчиков и исследователей в области искусственного интеллекта.


