Новости Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель

Тема в разделе "Новости криптовалют", создана пользователем CoinProject.info, 27 Декабрь 2024 в 18:03.

Реклама
  1. CoinProject.info

    CoinProject.info Топ Мастер ПРЕМИУМ

    Сообщения:
    34,303
    Симпатии:
    41
    Пол:
    Мужской
    Сайт:
    Биржи на которых я торгую:


    Китайский ИИ-стартап DeepSeek представил собственную большую языковую модель, которая превзошла по тестам конкурентов от Meta и OpenAI.


    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель Introducing DeepSeek-V3!

    Biggest leap forward yet:
    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель 60 tokens/second (3x faster than V2!)
    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель Enhanced capabilities
    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель API compatibility intact
    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель Fully open-source models & papers

    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель 1/n pic.twitter.com/p1dV9gJ2Sd

    — DeepSeek (@deepseek_ai) December 26, 2024

    DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.

    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель
    Сравнение DeepSeek V3 с конкурентами. Данные: DeepSeek.

    Компания из Ханчжоу обучила нейросеть за два месяца и $5,58 млн, используя значительно меньше вычислительных ресурсов (2048 графических процессоров) по сравнению с более крупными технологическими компаниями. Она обещает предоставление лучшего соотношения цена/качество на рынке.


    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель API Pricing Update

    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель Until Feb 8: same as V2!
    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель From Feb 8 onwards:
    Input: $0.27/million tokens ($0.07/million tokens with cache hits)
    Output: $1.10/million tokens

    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель Still the best value in the market!

    Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель 3/n pic.twitter.com/OjZaB81Yrh

    — DeepSeek (@deepseek_ai) December 26, 2024

    В будущем запланировано добавление мультимодальности и «других передовых функций».

    Член команды OpenAI Андрей Карпати отметил, что DeepSeek продемонстрировала весьма впечатляющие исследования и разработки в условиях ограниченных ресурсов.


    DeepSeek (Chinese AI co) making it look easy today with an open weights release of a frontier-grade LLM trained on a joke of a budget (2048 GPUs for 2 months, $6M).

    For reference, this level of capability is supposed to require clusters of closer to 16K GPUs, the ones being… https://t.co/EW7q2pQ94B

    — Andrej Karpathy (@karpathy) December 26, 2024

    «Означает ли это, что вам не нужны большие кластеры GPU для пограничных LLM? Нет, но вы должны быть уверены, что не растрачиваете то, что у вас есть. Это выглядит как хорошая демонстрация того, что еще многое предстоит сделать как с данными, так и с алгоритмами», — добавил он.

    Ранее DeepSeek представила «конкурента o1 от OpenAI» — думающую «сверхмощную» ИИ-модель DeepSeek-R1-Lite-Preview.

    Напомним, в июле китайская компания Kuaishou открыла ИИ-модель для генерации видео Kling для всех желающих.

    Новость Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель на сайте CoinProject.info.
     

    Понравился пост? Поделись с друзьями!

Реклама