Новости «Т-банк» выложил LLM на 32 млрд параметров в открытый доступ

Тема в разделе "Новости криптовалют", создана пользователем CoinProject.info, 11 Декабрь 2024.

Реклама
  1. CoinProject.info

    CoinProject.info Топ Мастер ПРЕМИУМ

    Сообщения:
    34,412
    Симпатии:
    41
    Пол:
    Мужской
    Сайт:
    Биржи на которых я торгую:


    «Т-банк» открыл доступ к двум большим языковым моделям (LLM) T-Pro и обновленной версии T-Lite. Об этом пишут «Ведомости» со ссылкой на представителя банка.

    Профессиональная версия нейросети обладает 32 млрд параметров, T-Lite — 7 млрд. Вторую представили в июле 2024 года.

    Количество параметров отражает способность модели учитывать больше контекста, лучше запоминать информацию и давать точные ответы. Для сравнения, у Llama 3.1 405B от Meta 405 млрд параметров, у Large 2 от французского стартапа Mistral — 123 млрд.

    Открытый доступ к T-Pro и T-Lite позволит бизнесу бесплатно применять нейросети для решения внутренних задач и создавать новые продукты на базе разработанных моделей. В пример «Ведомости» привели умные чат-боты для службы поддержки и ассистентов для сотрудников вроде инструментов по написанию кода, составления отчетов или исследований.

    Представленные модели входят в семейство LLM Gen-T, предназначенное для решения узкоспециализированных задач. Этим они отличаются от ChatGPT, который универсален.

    T-Lite и T-Pro созданы на базе Qwen-2.5 от китайского разработчика Alibaba Group и адаптированы под русский язык.


    «Такой подход позволяет “Т-технологиям” существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — отметил представитель банка.

    Бизнес может запустить языковые модели на своих серверах и дообучить под конкретный кейс, подчеркнул CEO Dbrain Алексей Хахунов.

    Напомним, в декабре в России представили виртуального ассистента на базе ИИ для психологов, который в два раза повышает продуктивность, качество услуг и выручку.

    В том же месяце российские ученые презентовали новую открытую среду XLand-MiniGrid, которая предназначена для разработки алгоритмов контекстного обучения с подкреплением — отдельного направления в ИИ-исследованиях.

    Новость «Т-банк» выложил LLM на 32 млрд параметров в открытый доступ на сайте CoinProject.info.
     

    Понравился пост? Поделись с друзьями!

Реклама
Похожие темы:
  1. CoinProject.info
    Ответов:
    0
    Просмотров:
    1,504
  2. CoinProject.info
    Ответов:
    0
    Просмотров:
    1,786
  3. CoinProject.info
    Ответов:
    0
    Просмотров:
    255
  4. CoinProject.info
    Ответов:
    0
    Просмотров:
    271
  5. CoinProject.info
    Ответов:
    0
    Просмотров:
    11
Загрузка...