Новости Исследователи создадут большую языковую модель с открытым исходным кодом

Тема в разделе "Новости криптовалют", создана пользователем CoinProject.info, 25 Март 2022.

Реклама
  1. CoinProject.info

    CoinProject.info Топ Мастер ПРЕМИУМ

    Сообщения:
    33,681
    Симпатии:
    41
    Пол:
    Мужской
    Сайт:
    Международная команда разработчиков BigScience запустила обучение языковой модели искусственного интеллекта с открытым исходным кодом на 176 млрд параметров.


    BigScience main training just startedИсследователи создадут большую языковую модель с открытым исходным кодом A large language model created as a tool for researchИсследователи создадут большую языковую модель с открытым исходным кодом

    Model: 176 billion parameters
    Исследователи создадут большую языковую модель с открытым исходным кодомhttps://t.co/7gz2Gibybx

    Data: 46 languages
    Исследователи создадут большую языковую модель с открытым исходным кодомhttps://t.co/EOgshEDrnw

    Cluster: 416 GPU — low carbon energy
    Исследователи создадут большую языковую модель с открытым исходным кодомhttps://t.co/VA1u4OpnVr

    Follow it liveИсследователи создадут большую языковую модель с открытым исходным кодом

    — BigScience Research Workshop (@BigscienceW) March 15, 2022

    Алгоритм обучают на данных 46 языков. Модель тренируют на суперкомпьютере Jean Zay французского Института развития и ресурсов в области интенсивных научных вычислений. Он построен на основе видеоускорителей Nvidia V100 и A100. Пиковая производительность установки превышает 28 петафлопс.

    Руководитель отдела исследований Hugging Face Дау Киела сообщил, что процесс обучения займет три-четыре месяца.

    По словам разработчиков, проект предназначен для исследовательских целей. Проприетарные языковые модели компаний вроде OpenAI, Google или Microsoft демонстрируют одинаково проблемное поведение, порождая токсичную речь, предвзятость и дезинформацию, считают инженеры. Алгоритм с открытым исходным кодом поможет исследователям понять эти проблемы и исправить их, добавили они.


    «Если мы заботимся о демократизации исследовательского прогресса и хотим убедиться, что весь мир может использовать эту технологию — мы должны найти решение для этого. Это именно то, чем должна заниматься большая наука», — сказал Киела.

    Открытый проект BigScience объединяет около тысячи разработчиков со всего мира, создающих и поддерживающих больших наборов данных для обучения языковых моделей.

    Напомним, в январе OpenAI сообщила о создании менее токсичной версии GPT-3.

    В декабре 2021 года DeepMind представила языковую модель с 280 млрд параметров.

    В октябре Microsoft и Nvidia разработали алгоритм в три раза больше GPT-3.


    Новость Исследователи создадут большую языковую модель с открытым исходным кодом на сайте CoinProject.info.
     

    Понравился пост? Поделись с друзьями!

Реклама
Похожие темы:
  1. CoinProject.info
    Ответов:
    0
    Просмотров:
    286
  2. CoinProject.info
    Ответов:
    0
    Просмотров:
    214
  3. Tishka
    Ответов:
    2
    Просмотров:
    298
  4. navigator
    Ответов:
    0
    Просмотров:
    94
  5. CoinProject.info
    Ответов:
    0
    Просмотров:
    58
Загрузка...