DeepSeek представила модель с ‘разреженным вниманием’, сокращающую расходы на API вдвое
Компания DeepSeek выпустила экспериментальную модель V3.2-e, которая значительно снижает стоимость обработки длинных контекстов. Главной инновацией стала технология «разреженного внимания» — […]










