DeepSeek V3

Open Source
DeepSeek Vydaný 26. decembra 2024

DeepSeek V3 je výkonný open-source model od čínskej spoločnosti DeepSeek s 671 miliardami parametrov, využívajúci architektúru Mixture of Experts (MoE), kde je pri každom dotaze aktívnych iba 37 miliárd parametrov. Pri svojom uvedení prekvapil výkonom porovnateľným s najlepšími uzavretými modelmi ako GPT-4o a Claude 3.5 Sonnet pri zlomku trénovacích nákladov. Vyniká v programovaní, matematike a čínštine. Je dostupný pod licenciou MIT, čo umožňuje neobmedzené komerčné použitie a ďalší výskum.

Kontextové okno
128k tokenov
Max výstup
8k tokenov
Cena vstup
$0.27 / 1M tokenov
Cena výstup
$1.10 / 1M tokenov

Schopnosti

Text
Generovanie a spracovanie textu
Kód
Generovanie a analýza kódu
Funkcie
Volanie externých funkcií a nástrojov
JSON
Štruktúrovaný výstup v JSON formáte

Benchmarky

MMLU 88.5
HumanEval 82.6
GPQA 59.1
MATH 90.2

Technické detaily

Poskytovateľ deepseek
API identifikátor deepseek-chat
Kontextové okno 128 000 tokenov
Max výstupných tokenov 8 192
Multimodálny Nie
Licencia MIT

Odkazy

Ďalšie modely od deepseek