DeepSeek wird den 75%igen Rabatt auf sein Flaggschiff-Modell V4-Pro dauerhaft beibehalten, der ursprünglich am 31. Mai ablaufen sollte, teilte das Unternehmen am Samstag mit. V4-Pro API-Output-Tokens kosten jetzt $0,87 pro Million, gegenüber $3,48 beim Launch vor einem Monat.
DeepSeek gab am Samstag bekannt, dass der 75%ige Rabatt auf sein Flaggschiff-Modell V4-Pro nun dauerhaft gilt, wodurch die API-Kosten auf bis zu $0,0035 pro Million Tokens sinken und der Preiskampf mit OpenAI, Anthropic und Google verschärft wird.

Das chinesische KI-Startup hatte die Aktion ursprünglich laut seiner Preisseite auf den 31. Mai befristet. Stattdessen erklärte das Unternehmen in einer Stellungnahme, dass die V4-Pro API-Preise dauerhaft bei einem Viertel der Einführungspreise bleiben würden, mit Kosten zwischen 0,025 und 6 Yuan ($0,003625 bis $0,87) pro Million Tokens, je nach Nutzungsart.
Mit der neuen Preisstruktur kosten die V4-Pro Output-Tokens $0,87 pro Million Tokens. Claude Opus 4.7 kostet $25 pro Million Tokens. Die Kosten für GPT-5.5 betragen $30.
Laut CloudZero kostet Googles Gemini 2.5 Pro $12. Andere günstigere westliche LLMs wie Claude Sonnet ($15) und GPT-4.1 ($8) sind 9- bis 17-mal teurer.
Eine Anwendung, die 100 Millionen Output-Tokens pro Monat generiert, würde bei V4-Pro zum neuen Tarif etwa $87 kosten, gegenüber $2.500 bei Opus 4.7 oder $3.000 bei GPT-5.5, laut MindStudio.
Wie Cryptopolitan bereits beim Launch von V4 letzten Monat berichtete, erklärte DeepSeek, dass die Pro-Version aufgrund von „Engpässen bei der High-End-Rechenkapazität" zunächst bis zu 12-mal mehr kosten würde als die leichtere Flash-Version.
Das Unternehmen fügte hinzu, dass die Preise sinken würden, sobald Huawei Ascend 950 Supernodes in größeren Mengen in der zweiten Jahreshälfte 2026 ausgeliefert würden. Der dauerhafte Preisschnitt kam Monate vor diesem Ziel.
DeepSeek legte nicht offen, ob der dauerhafte Preisschnitt auf die erhöhte Versorgung mit Huaweis Ascend 950-Chips zurückzuführen ist.
Huaweis KI-Chip-Verkäufe haben von US-Exportkontrollen profitiert, die Nvidia daran hindern, seine fortschrittlichsten Halbleiter in China zu verkaufen. Separate Beschränkungen für Chipfertigungsanlagen haben Huaweis Fähigkeit eingeschränkt, die Ascend-Produktion zu skalieren.
Huawei strebt laut Branchenschätzungen 750.000 KI-Chip-Lieferungen im Jahr 2026 an, obwohl seine Gesamtproduktion etwa 3% bis 5% von Nvidias kombinierter Rechenleistung ausmacht.
Vier chinesische Chip-Unternehmen (Huawei Ascend, Cambricon, Hygon Information und Moore Threads) bestätigten, dass ihre Hardware ab dem ersten Tag mit V4-Pro funktionierte.
Als V4 Anfang April eingeführt wurde, fielen die Aktienkurse einiger chinesischer Unternehmen für künstliche Intelligenz an der Hongkonger Börse. Zhipu AI fiel um etwa 8%–9%, während MiniMax einen Rückgang von 7%–8% verzeichnete.
Laut CNBC fiel Manycore Tech um 9%. Die Aktien von Chipherstellern stiegen entgegen dem Trend.
DeepSeeks Preisstrategie hat auch Reibungen mit westlichen Wettbewerbern ausgelöst. Anthropic hat das Unternehmen zuvor laut Engadget der „Destillationsangriffe" beschuldigt, die unzulässig von Claudes Modellen lernen.
Das Weiße Haus beschuldigte China letzten Monat, geistiges Eigentum US-amerikanischer KI-Labore gestohlen zu haben. Die chinesische Botschaft in Washington wies diese Vorwürfe zurück.
DeepSeek befindet sich gleichzeitig zum ersten Mal in Gesprächen über externe Finanzierung, wobei Tencent und Alibaba laut Cryptopolitan zu den potenziellen Investoren bei einer Bewertung von über $20 Milliarden gehören.
Agenten, die mehrstufige Aufgaben autonom ausführen, können pro Sitzung Millionen von Tokens verbrauchen.
Die täglichen Kosten für den Betrieb eines Agenten wie Claude Opus zu einem Preis von $25 pro Million Output-Tokens belaufen sich auf Hunderte von Dollar. DeepSeek V4-Pro bei $0,87 liegt unter $40.
Krypto-Trading-Bots, DeFi-Watch-Agenten, Code-Review-Prozesse und Marktanalyse-Anwendungen sind alle davon abhängig, dass die Inferenzkosten unterhalb einer Schwelle bleiben, bei der der Wert des Outputs größer ist als die Rechenkosten.
Die Ankündigung von DeepSeek über seine dauerhaften Preise ermöglicht eine Kategorie von Agenten-Anwendungen, die auf seiner Plattform realisierbar sind, die auf westlichen Plattformen zum aktuellen Tarif nicht realisierbar sind.
OpenAI hat seine Preise im vergangenen Jahr kontinuierlich gesenkt. Anthropic hat Claude Haiku 4.5 für $1/$5 pro Million Tokens veröffentlicht. Google hat Gemini Flash zu einem Eingabepreis von $0,30 eingeführt. Keiner von ihnen konnte jedoch mit DeepSeeks Preismodell mithalten.
Das V4-Pro ist kein Budget-Modell. Es verfügt über 1,6 Billionen Parameter, ein 1-Million-Token-Kontextfenster und Benchmarks, die laut MindStudio-Analyse bei Mathematik- und Reasoning-Aufgaben nahe an GPT-5.4 liegen.
Lesen Sie nicht nur Krypto-Nachrichten. Verstehen Sie sie. Abonnieren Sie unseren Newsletter. Er ist kostenlos.


