
В эпоху стремительного роста инвестиций в стартапы, связанные с искусственным интеллектом, исследователям с инновационными идеями стало легче получить необходимые ресурсы, особенно в независимых компаниях. Стартап Inception, который разрабатывает диффузионные AI-модели, объявил о привлечении $50 миллионов в рамках посевного раунда финансирования от ряда влиятельных инвесторов.
Проект возглавляет профессор Стэнфордского университета Стефано Эрмон, специализирующийся на диффузионных моделях — технологиях, которые создают результаты через итеративное уточнение, а не поэтапное формирование текста. Эти модели уже используются в известных системах генерации изображений, таких как Stable Diffusion и Midjourney. Теперь Эрмон и его команда стремятся расширить применение этой технологии на задачи, связанные с обработкой текста и программированием.
Новая версия модели Mercury, предназначенной для разработки программного обеспечения, уже интегрирована в несколько инструментов для разработчиков. Диффузионный подход в моделях Inception позволяет значительно снижать задержку отклика и вычислительные затраты, что является критически важным для производительности.
В отличие от традиционных авторегрессионных моделей, которые последовательно прогнозируют каждый следующий элемент текста, диффузионные модели работают более комплексно, постепенно улучшая общий результат. Это дает им преимущества при обработке больших объемов текста и сложных кодовых баз, а также позволяет эффективно использовать параллельные вычисления, что значительно ускоряет работу.
По словам Эрмона, скорость обработки достигает более 1000 токенов в секунду — это существенно выше того, что может предложить существующая авторегрессионная технология. Такой прорыв открывает новые возможности для разработки более быстрых и эффективных AI-систем.


