Компания Илона Маска xAI анонсировала обновленную версию большой языковой модели Grok-1.5.
Согласно пресс-релизу, возможности чат-бота приблизятся по производительности к открытым и закрытым LLM, включая GPT-4 от OpenAI и Claude 3 от Anthropic.
Илон Маск отметил, что Grok-1.5 станет доступна на платформе X. Следующая модель нейросети уже находится на стадии обучения. По его словам, она будет способна «превзойти текущий ИИ по всем показателям», но не уточнил дату ее релиза.
Should be available on 𝕏 next week. Grok 2 should exceed current AI on all metrics. In training now. https://t.co/s7rVxvK8mZ— Elon Musk (@elonmusk) March 29, 2024
Компания ожидает, что Grok-1.5 будет лучше предыдущей модели во многих тестах, в том числе в программировании и математике.
Сравнение прохождения тестов различных ИИ-моделей. Данные: xAI.
«Grok-1.5 набрал 50,6 % баллов в MATH и 90% в GSM8K — двух математических показателях, охватывающих широкий спектр конкурсных задач для школьников и старшеклассников. Кроме того, она набрала 74,1% в HumanEval, который оценивает способности к генерации кода и решению задач», — отметила xAI в блоге.
В тесте MMLU, который оценивает возможности моделей ИИ в понимании языка для различных задач, новая модель набрала 81,3%, значительно опередив предшественника с 73%.
Также xAI сообщила, что Grok-1.5 имеет контекстное окно до 128 000 токенов. Оно позволяет модели воспринимать и обрабатывать большие объемы информации единовременно — в 16 раз больше, чем Grok-1. Это делает ее подходящей для анализа, обобщения и извлечения информации из длинных документов.
Согласно заявлениям компании, изначально новую ИИ-модель получат тестировщики и те, кто уже использует Grok на платформе X. Развертывание произойдет поэтапно: компания улучшит чат-бота и введет несколько новых функций. Постепенно он станет доступным для более широкого круга пользователей.Напомним, в марте xAI открыла исходный код Grok после того, как Илон Маск обвинил OpenAI в непубличном подходе к разработке ChatGPT.