Чипы для искусственного интеллекта: история стартапа Cerebras

В Cerebras уже помогли Meta (признана экстремистской и запрещена в России) поставить рекорд вывода языковой модели семейства Llama с открытым исходным кодом. Llama 3 8B с 8 млрд параметров обучили и выпустили в открытый доступ всего за несколько часов. При этом она генерирует 1800 токенов в секунду, что в 20 раз быстрее работы решений на базе GPU. Стоимость генерации составляет всего 10 центов за миллион токенов. Более крупная модель Llama 3 70B с 70 млрд параметров генерирует 450 токенов в секунду, а стоимость генерации составляет 60 центов за 1 млн токенов. При этом они демонстрируют более высокую производительность в многопоточных разговорах, математике и задачах на рассуждения.

Как отметили в Cerebras, вывод — это самый быстрорастущий сегмент вычислений ИИ, на который приходится примерно 40% от общего рынка оборудования. Появление высокоскоростного вывода, уверены в стартапе, открывает новые возможности для приложений ИИ, в том числе позволяет обучать ИИ-агентов.

Cerebras уже работает над внедрением CS-3 в состав своего суперкластера Condor Galaxy AI для решения задач с применением ИИ. Проект поддержала компания G42. В рамках него планируют создать девять суперкомпьютеров в разных частях мира, а две первые системы уже собрали в 2023 году. В каждой из них содержится по 64 платформы Cerebras CS-2 с совокупной ИИ-производительностью 4 экзафлопса.


Источник: https://trends.rbc.ru/trends/innovation/679764729a79473341d49612

Межтекстовые Отзывы
Посмотреть все комментарии
guest