
В четверг Laude Institute объявил первый набор грантов Slingshots, направленных на развитие науки и практики искусственного интеллекта.
Программа Slingshots задумана как акселератор для исследователей и предоставляет ресурсы, которые обычно недоступны в академической среде — финансирование, вычислительные мощности, а также поддержку в разработке и инженерии. Взамен участники обязуются создать конечный результат, будь то стартап, открытая кодовая база или другой продукт.
В первый набор вошли пятнадцать проектов, с особым вниманием к сложной задаче оценки ИИ. Среди них известные проекты, такие как командный тест Terminal Bench и новая версия долгосрочного проекта ARC-AGI.
Другие проекты предлагают свежий взгляд на задачу оценки. Например, Formula Code от исследователей из CalTech и Университета Техаса в Остине оценивает способность ИИ оптимизировать существующий код, а проект BizBench из Колумбийского университета предлагает комплексный бенчмарк для «беловоротничковых» ИИ-агентов. Также гранты поддерживают исследования новых структур для обучения с подкреплением и сжатия моделей.
Соучредитель SWE-Bench Джон Бода Янг возглавляет новый проект CodeClash, который оценивает код через динамичные соревнования. Янг считает, что независимые бенчмарки стимулируют прогресс и выражает опасение, что в будущем оценки могут стать слишком специфичными для отдельных компаний.


