OpenAI представила два открытых AI-моделя для интеллектуального анализа

OpenAI запустила два новых открытых AI-моделя, обладающих аналогичными возможностями своим закрытым моделям серии o. Эти модели доступны для бесплатного скачивания на платформе Hugging Face и считаются передовыми по ряду показателей среди открытых AI-моделей.

Два варианта моделей отличаются по размеру: более крупная и мощная gpt-oss-120b, которую можно запустить на одной видеокарте Nvidia, и облегчённая gpt-oss-20b, способная работать на обычном ноутбуке с 16 ГБ оперативной памяти.

Это первый открытый языковой AI-модель OpenAI с момента выпуска GPT-2 более пяти лет назад. Модели способны отправлять сложные запросы к облачным AI, позволяя разработчикам подключать их к более продвинутым закрытым моделям для решения специализированных задач, например, обработки изображений.

OpenAI ранее придерживалась стратегии закрытого исходного кода, что способствовало развитию бизнеса по продаже доступа к AI через API. Однако в свете растущей конкуренции со стороны китайских лабораторий и давления на открытость технологий, компания решила расширить свой открытый стек, делая акцент на демократических ценностях и свободном доступе.

По результатам тестов, новинки показали высокие результаты в задачах программирования и общих знаниях, превзойдя популярные открытые модели конкурентов, хотя уступают собственным закрытым версиям. При этом они демонстрируют более высокий уровень ошибок в ответах, что связано с меньшим объёмом знаний по сравнению с топовыми моделями.

Модели обучались с использованием методов усиленного обучения с подкреплением и технологии mixture-of-experts, что позволяет активировать лишь часть параметров для повышения эффективности. Они ориентированы на работу с текстом и не поддерживают обработку изображений или аудио.

OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, что позволяет коммерческое использование без дополнительных разрешений. Однако компания не раскрыла данные, на которых обучались модели, учитывая текущие юридические риски.

Релиз был несколько раз отложен для обеспечения безопасности и предотвращения возможного использования моделей в злонамеренных целях. По итогам проверок, модели не достигли высокого уровня угрозы в биологических или кибернетических сферах.

OpenAI стремится укрепить свои позиции в области открытых AI-моделей, одновременно готовясь к новым конкурентам и развитию технологий.