Das KI-Modell DeepSeek aus China hat am Montag die weltweiten Aktienmärkte erschüttert und für Turbulenzen bei US-Technologieaktien gesorgt. Nach einer Rekordjagd in der vergangenen Woche gerieten vor allem die Aktien von KI-Profiteuren wie ASML, Nvidia und Co. zu Wochenbeginn massiv unter Druck. Die Qualität des neuen KI-Modells und die niedrigen Entwicklungskosten lassen Zweifel aufkommen, ob die extrem hohen Bewertungen der US-Konkurrenz – und damit auch von Ausrüstern wie Nvidia – gerechtfertigt sind. Der amerikanischen KI-Blase entweicht wegen DeepSeek die Luft. Doch was genau ist DeepSeek?
Das KI-Startup DeepSeek ist gerade einmal ein Jahr alt, hat aber im Silicon Valley bereits mit seinem bahnbrechenden Modell für künstliche Intelligenz, das zu einem Bruchteil der Kosten eine mit den besten Chatbots der Welt vergleichbare Leistung erbringt, für Erstaunen und Bestürzung gesorgt. DeepSeek wurde in Hangzhou, China, entwickelt und hat weitreichende Auswirkungen auf die globale Technologiebranche und die Lieferkette. Einem Bericht von Bloomberg zufolge bietet es einen Kontrapunkt zu der weit verbreiteten Annahme, dass die Zukunft der künstlichen Intelligenz immer mehr Leistung und Energie für ihre Entwicklung benötigt.
Was genau ist DeepSeek?
DeepSeek ist ein chinesisches Start-up, das 2023 von Liang Wenfeng, dem Chef des KI-getriebenen Quant-Hedgefonds High-Flyer, gegründet wurde. Das Unternehmen entwickelt Open-Source-KI-Modelle und die gleichnamige mobile App erreichte nach ihrer Veröffentlichung die Spitze der iPhone-Downloadcharts in den USA.
Die DeepSeek-Anwendung unterscheidet sich von anderen Chatbots wie ChatGPT von OpenAI dadurch, dass sie ihre Argumente artikuliert, bevor sie auf eine Anfrage antwortet. Das Unternehmen behauptet, dass seine R1-Version die gleiche Leistung wie die neueste Version von OpenAI bietet, und hat Einzelpersonen, die Chatbots auf der Grundlage dieser Technologie entwickeln möchten, eine Lizenz erteilt, um darauf aufzubauen.
Wie steht DeepSeek R1 im Vergleich zu OpenAI oder Meta AI?
Obwohl das Unternehmen keine genauen Angaben macht, scheinen die Kosten für das Training und die Entwicklung der DeepSeek-Modelle nur einen Bruchteil dessen zu betragen, was für die besten Produkte von OpenAI oder Meta Platforms erforderlich ist. Die weitaus höhere Effizienz des Modells stellt die Notwendigkeit in Frage, enorme Kapitalausgaben für den Erwerb der neuesten und leistungsfähigsten KI-Beschleuniger von Unternehmen wie Nvidia zu tätigen. Damit rücken auch die US-Exportbeschränkungen für diese fortschrittlichen Halbleiter nach China in den Blickpunkt, die einen Durchbruch der Art, wie ihn DeepSeek darstellt, verhindern dürften.
DeepSeek R1 schneidet in mehreren führenden Benchmarks wie AIME 2024 für mathematische Aufgaben, MMLU für Allgemeinwissen und AlpacaEval 2.0 für die Frage- und Antwort-Leistung gleichwertig oder besser ab als konkurrierende Modelle. Auch in der Chatbot Arena, einer von der UC Berkeley initiierten Rangliste, belegt es einen Spitzenplatz.
Was sorgt in den USA für Aufregung?
Washington hat den Export von Spitzentechnologien wie GPU-Halbleitern nach China verboten, um die Fortschritte Chinas im Bereich der künstlichen Intelligenz zu bremsen, die im Mittelpunkt des Wettstreits zwischen den USA und China um die technologische Vorherrschaft steht. Die Fortschritte von DeepSeek deuten jedoch darauf hin, dass chinesische KI-Ingenieure die Beschränkungen umgangen haben und sich auf die Steigerung der Effizienz bei begrenzten Ressourcen konzentrieren. Es bleibt unklar, auf wie viel fortschrittliche KI-Trainingshardware DeepSeek Zugriff hatte, aber das Unternehmen hat genug demonstriert, um zu zeigen, dass die Handelsbeschränkungen Chinas Fortschritte nicht vollständig aufhalten konnten. Da das neue Modell DeepSeek R1 deutlich kostengünstiger ist und auch auf Chips mit geringerer Kapazität läut, könnte es die Dominanz der USA im Technologiebereich in Frage stellen.
Seit wann erregt DeepSeek weltweites Interesse?
Der KI-Entwickler wird seit der Veröffentlichung seines ersten Modells im Jahr 2023 aufmerksam beobachtet. Im November gewährte das Unternehmen der Welt einen Einblick in sein Denkmodell DeepSeek R1, das menschliches Denken nachahmen soll. Dieses Modell bildet die Grundlage für die mobile Chatbot-Anwendung des Unternehmens, die zusammen mit der Webschnittstelle im Januar weltweit als deutlich kostengünstigere OpenAI-Alternative an Bekanntheit gewonnen hatte und von Investor Marc Andreessen als „Sputnik-Moment der KI“ bezeichnet wurde.
Die DeepSeek-App wurde bis zum 25. Januar 1,6 Millionen Mal heruntergeladen und war laut Daten des Marktforschungsunternehmens App Figures die Nummer 1 in den iPhone App Stores in Australien, Kanada, China, Singapur, den USA und Großbritannien.
Wer ist der Gründer von DeepSeek?
Der 1985 in Guangdong geborene Liang hat einen Bachelor- und einen Masterabschluss in Elektronik und Informationstechnologie von der Zhejiang University. Laut der Unternehmensdatenbank Tianyancha gründete er DeepSeek mit einem Startkapital von nur 10 Millionen Yuan (1,4 Millionen US-Dollar).
Der Engpass für weitere Fortschritte liege nicht in der Finanzierung, sagte Liang in einem Interview mit der chinesischen Ausgabe 36kr, sondern in den US-Beschränkungen beim Zugang zu den besten Chips. Die meisten seiner Spitzenforscher seien frische Absolventen chinesischer Spitzenuniversitäten, sagte er und betonte die Notwendigkeit, dass China sein eigenes inländisches Ökosystem entwickelt, ähnlich dem, das um Nvidia und seine KI-Chips herum aufgebaut wurde.
„Mehr Investitionen führen nicht unbedingt zu mehr Innovation. Andernfalls würden große Unternehmen die gesamte Innovation übernehmen“, sagte Liang.
Wo steht DeepSeek in Chinas KI-Landschaft?
Chinas Technologieführer, von der Alibaba Group Holding über Baidu bis hin zu Tencent Holdings haben viel Geld und Ressourcen in den Wettlauf um Hardware und Kunden für ihre KI-Projekte gesteckt. Neben Kai-Fu Lees Startup 01.AI hebt sich DeepSeek durch seinen Open-Source-Ansatz ab, der darauf abzielt, schnell eine möglichst große Zahl von Nutzern zu gewinnen, um dann auf der Grundlage dieses großen Publikums Monetarisierungsstrategien zu entwickeln.
Da die Modelle von DeepSeek erschwinglicher sind, hat das Unternehmen bereits dazu beigetragen, die Kosten für KI-Entwickler in China zu senken, wo sich die größeren Anbieter in den letzten anderthalb Jahren einen Preiskrieg geliefert haben, der zu mehreren Preissenkungswellen geführt hat.
Welche Auswirkungen wird dies auf den globalen KI-Markt haben?
Der Erfolg von DeepSeek könnte OpenAI und andere US-Anbieter dazu zwingen, ihre Preise zu senken, um ihren Vorsprung zu halten. Er stellt auch die enormen Ausgaben von Unternehmen wie Meta und Microsoft in Frage, die in diesem Jahr 65 Milliarden Dollar oder mehr investiert haben, größtenteils in KI-Infrastruktur, wenn effizientere Modelle mit weitaus geringeren Kosten konkurrieren können. Dies hat die asiatischen Aktienmärkte in Aufruhr versetzt, da Anleger chinesische Unternehmen wie Iflytek Co. mit DeepSeek in Verbindung brachten und sich von Unternehmen wie Advantest abwandten, die in der Chip-Lieferkette tätig sind und von einem möglichen Rückgang der erwarteten Nachfrage nach KI-Halbleitern betroffen sein könnten.
Entwickler auf der ganzen Welt experimentieren bereits mit der Software von DeepSeek und versuchen, damit Werkzeuge zu entwickeln. Dies könnte die Einführung fortgeschrittener KI-Schlussfolgerungsmodelle beschleunigen – und gleichzeitig zusätzliche Bedenken hinsichtlich der Notwendigkeit von Sicherheitsvorkehrungen für ihre Verwendung wecken. Die Fortschritte von DeepSeek könnten die Regulierung der KI-Entwicklung beschleunigen.
Welche Schwächen hat DeepSeek?
Wie alle anderen chinesischen KI-Modelle zensiert auch DeepSeek Themen, die in China als heikel gelten. Anfragen zum Platz des Himmlischen Friedens oder zu geopolitisch brisanten Themen wie einer möglichen Invasion Taiwans durch China sind nicht möglich. In Tests ist der DeepSeek-Bot in der Lage, detaillierte Antworten zu politischen Persönlichkeiten wie dem indischen Premierminister Narendra Modi zu geben, weigert sich aber, dies zum chinesischen Präsidenten Xi Jinping zu tun.
Die plötzliche Popularität von DeepSeek dürfte die Coud-Infrastruktur auf eine harte Probe stellen. Das Unternehmen hatte am 27. Januar kurzzeitig einen größeren Ausfall und wird noch mehr Datenverkehr bewältigen müssen, da neue und wiederkehrende Nutzer mehr Anfragen an den Chatbot stellen.
FMW/Bloomberg
Kommentare lesen und schreiben, hier klicken













Die Zensur ist allerdings nicht im Modell, nur auf dem offiziellen Server.
Wer sich die KI lokal installiert, sieht davon nix.
Und das ist der große Punkt: mit effizienteren KI wird es viel mehr Anwendungen direkt auf den Geräten geben können.
Game changer.
Der Knackpunkt sind die Kosten. Sollte DeepSeek tatsächlich mit 10% der Kosten gleichwertige Ergebnisse wie OpenAI liefern, dann ist das der Black Swan schlechthin. Aber lassen sich diese Aussagen wirklich verifizieren?
PS Thema Zensur: Absurd die Annahme, dass die westlichen Modelle da in irgendeiner Weise besser wären. Wir erinnern uns alle an die schwarzen, indischen, chinesischen, weiblichen „Wehrmachtssoldaten“…
Also ich habe mal intensiv mit DeepSeek über den Holocaust diskutiert. Ergebnis: die App ist wertlos. Sie wurde richtig drohend.
Ich warte jetzt auf ein iranisches KI-Modell.
;o)…schön gelacht