Конкурент Nvidia: чипы Groq ускоряют системы искусственного интеллекта

Groq предоставляет платформу для разработчиков под названием GroqCloud, которая предлагает модели ИИ с открытым исходным кодом, такие как Llama от Meta, OpenAI Whisper и Mistral Mixtral. Число ее пользователей превысило 1 млн человек.

Также стартап разработал API (аппаратно-программный интерфейс) GroqRack, который позволяет клиентам использовать его чипы в облаке для локального развертывания моделей. Наконец, у Groq есть чат-бот GroqChat.

Чат-бот GroqChat моментально выполняет запрос  (Фото: groq.com)

Где применяются разработки Groq

ИИ-чипы Groq могут использоваться в разных областях:

  • Обработка естественного языка (NLP). Использование LPU для запуска больших языковых моделей ускоряет и повышает точность их ответов, а также позволяет улучшить распознавание контекста.
  • Компьютерное зрение. Скорость работы ИИ-чипов обеспечивает улучшенный анализ изображений и видео в реальном времени, что потенциально может использоваться в продвинутых системах наблюдения и кибербезопасности. Аналитическая группа армии США (AAG) применяет LPU Groq для систем кибербезопасности.
  • Вычисления высокой производительности (HPC). Чипы Groq ускоряют сложные вычисления, необходимые в научных исследованиях и анализе информации. Ускоритель способен обрабатывать большие объемы генетических данных с высокой скоростью, чтобы исследователи могли быстрее выявлять закономерности и делать открытия. Например, Аргоннская национальная лаборатория Министерства энергетики США применяет оборудование Groq для высокопроизводительных вычислений в сфере термоядерной энергетики, проектирования материалов и разработки лекарств.
  • Продвинутые приложения. ИИ-чипы потенциально могут революционизировать новые технологии, например, обеспечить работу продвинутого автопилота в робомобилях или выполнение сложных задач автономными роботами.

Среди клиентов Groq — компании технологической сферы, здравоохранения, образования и т. д.

Сами разработчики стартапа в 2024 году представили Project Media QA — приложение для транскрипции видео и аудио, а также для ответов на вопросы о содержании контента. Оно использует возможности моделей с открытым исходным кодом, а также технологию автоматического распознавания речи (Automatic Speech Recognition).

Project Media QA можно использовать для записи аудио, загрузки медиафайлов или контента по ссылкам. Приложение быстро транскрибирует аудио, а также может отвечать на вопросы о нем.

Интерфейс Project Media QA  (Фото: groq.com)

Перспективы Groq

Groq сталкивается с растущей конкуренцией как со стороны новичков в области чипов для ИИ, так и со стороны самой Nvidia. Последняя контролирует, по разным оценкам, от 70% до 95% рынка чипов ИИ.

Помимо Nvidia, Groq конкурирует с Amazon, Google и Microsoft, которые также разрабатывают специальные чипы для рабочих нагрузок ИИ в облаке. Amazon уже предлагает процессоры Trainium, Inferentia и Graviton в своем облаке Amazon Web Sevices (AWS); Google же предлагает нейропроцессоры через облако Google Cloud, а недавно представила усовершенствованный ИИ-ускоритель Ironwood; наконец, Microsoft размещает экземпляры облака Azure для своего процессора Cobalt 100.

В гонке ИИ-процессоров также участвуют Arm, Intel и AMD.

Благодаря спросу на инструменты генеративного ИИ рынок чипов продолжит расти. Аналитики предсказывают, что его объем превысит $500 млрд в течение следующих восьми лет.

На этом фоне даже стартапам удается получать солидные инвестиции. Например, D-Matrix, которая разрабатывает платформу ИИ-вычислений, в конце 2024 года привлекла $110 млн, а в июне того же года стартап Etched получил $120 млн на разработку процессора, созданный для ускорения развития архитектуры нейросетей-трансформеров.

Groq же занимается усовершенствованием своего технологического процесса. В августе 2023 года стартап объявил, что заключит контракт с литейным бизнесом Samsung на производство чипов по 4-нм техпроцессу, чтобы обеспечить прирост производительности по сравнению с 13-нм чипами первого поколения.

Также Groq активно налаживает международное сотрудничество. В 2025 году стартап планирует поставить десятки тысяч своих чипов в центр обработки данных европейской фирмы Earth Wind & Power в Норвегии. Также он сотрудничает с консалтинговой фирмой из Саудовской Аравии Aramco Digital для поставок процессоров в строящиеся ЦОД на Ближнем Востоке. В феврале стартап получил $1,5 млрд на реализацию проекта.

Эксперты отмечают, что Groq превосходит даже крупных конкурентов за счет переосмыслении эффективности вычислений ИИ. LPU стартапа можно легко интегрировать в повседневную жизнь, они не требуют сложного аппаратного обеспечения и более энергоэффективны, чем распространеные сейчас, что сокращает затраты на содержание ИИ-систем.


Источник: https://trends.rbc.ru/trends/industry/68077b979a794776b878d1ac

Межтекстовые Отзывы
Посмотреть все комментарии
guest