Forklog
2024-03-29 08:53:31

Claude 3 Opus превзошла GPT-4 по оценкам пользователей

ИИ-модель Claude 3 Opus от компании Anthropic впервые превзошла GPT-4 на Chatbot Arena. The king is deadRIP GPT-4Claude opus #1 ELoHaiku beats GPT-4 0613 & Mistral largeThat’s insane for how cheap & fast it is https://t.co/XWmvTE6h75 pic.twitter.com/fAwzJScLTH— Nick Dobos (@NickADobos) March 26, 2024 «Король мертв. Покойся с миром GPT-4», — написал разработчик программного обеспечения Ник Добос. Chatbot Arena используется исследователями нейросетей для оценки возможностей чат-ботов. GPT-4 добавлен на платформу в мае 2023 года, его вариации занимали лидирующие позиции до 26 марта 2024 года пока не уступили Claude 3. Согласно данным арены, одна из небольших моделей Anthropic — Haiku также показывает хорошие результаты. «Впервые лучшие из доступных моделей представлены не OpenAI. Opus наиболее подходящая модель для сложных задач, а Haiku сочетает в себе баланс экономичности и эффективности», — сообщил исследователь ИИ Саймон Уиллисон. Chatbot Arena управляется организацией Large Model Systems Organization, которая занимается исследованиями в области открытых моделей. Она сотрудничает со студентами и преподавателями Университета Калифорнии в Беркли, Университета Калифорнии в Сан-Диего и Университета Карнеги-Меллон. Особенность платформы в отсутствии объективных критериев оценки. При посещении сайта пользователь видит поле для ввода данных и два окна с результатами работы необозначенных ИИ-моделей. Основная задача — решить, какой результат кажется лучшим, основываясь на личных предпочтениях. Благодаря такому подходу Chatbot Arena определяет лидеров и регулярно обновляет таблицу, отражая полученные результаты. Ранее компания Amazon увеличила объем инвестиций в Anthropic до $4 млрд. Напомним, в марте ИИ-стартап представил чат-бота Claude 3, оказавшегося самым быстрым и мощным среди всех конкурентов по результатам тестов компании.

Get Crypto Newsletter
Read the Disclaimer : All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.