Forklog
2024-12-11 10:33:20

«Т-банк» выложил LLM на 32 млрд параметров в открытый доступ

«Т-банк» открыл доступ к двум большим языковым моделям (LLM) T-Pro и обновленной версии T-Lite. Об этом пишут «Ведомости» со ссылкой на представителя банка. Профессиональная версия нейросети обладает 32 млрд параметров, T-Lite — 7 млрд. Вторую представили в июле 2024 года.  Количество параметров отражает способность модели учитывать больше контекста, лучше запоминать информацию и давать точные ответы. Для сравнения, у Llama 3.1 405B от Meta 405 млрд параметров, у Large 2 от французского стартапа Mistral — 123 млрд. Открытый доступ к T-Pro и T-Lite позволит бизнесу бесплатно применять нейросети для решения внутренних задач и создавать новые продукты на базе разработанных моделей. В пример «Ведомости» привели умные чат-боты для службы поддержки и ассистентов для сотрудников вроде инструментов по написанию кода, составления отчетов или исследований. Представленные модели входят в семейство LLM Gen-T, предназначенное для решения узкоспециализированных задач. Этим они отличаются от ChatGPT, который универсален. T-Lite и T-Pro созданы на базе Qwen-2.5 от китайского разработчика Alibaba Group и адаптированы под русский язык. «Такой подход позволяет “Т-технологиям” существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — отметил представитель банка. Бизнес может запустить языковые модели на своих серверах и дообучить под конкретный кейс, подчеркнул CEO Dbrain Алексей Хахунов. Напомним, в декабре в России представили виртуального ассистента на базе ИИ для психологов, который в два раза повышает продуктивность, качество услуг и выручку. В том же месяце российские ученые презентовали новую открытую среду XLand-MiniGrid, которая предназначена для разработки алгоритмов контекстного обучения с подкреплением — отдельного направления в ИИ-исследованиях.

Hankige Crypto uudiskiri
Loe lahtiütlusest : Kogu meie veebisaidi, hüperlingitud saitide, seotud rakenduste, foorumite, ajaveebide, sotsiaalmeediakontode ja muude platvormide ("Sait") siin esitatud sisu on mõeldud ainult teie üldiseks teabeks, mis on hangitud kolmandate isikute allikatest. Me ei anna meie sisu osas mingeid garantiisid, sealhulgas täpsust ja ajakohastust, kuid mitte ainult. Ükski meie poolt pakutava sisu osa ei kujuta endast finantsnõustamist, õigusnõustamist ega muud nõustamist, mis on mõeldud teie konkreetseks toetumiseks mis tahes eesmärgil. Mis tahes kasutamine või sõltuvus meie sisust on ainuüksi omal vastutusel ja omal äranägemisel. Enne nende kasutamist peate oma teadustööd läbi viima, analüüsima ja kontrollima oma sisu. Kauplemine on väga riskantne tegevus, mis võib põhjustada suuri kahjusid, palun konsulteerige enne oma otsuse langetamist oma finantsnõustajaga. Meie saidi sisu ei tohi olla pakkumine ega pakkumine