Open Source & Effizienz: Wie DeepSeek die KI-Welt in Aufruhr versetzt

Erstellt von Terrence Schweizer am Jan 29, 2025 10:00:00 AM
Terrence Schweizer
Vernetzen auf:

Was wir bisher wissen:
OpenAI, ein Branchenriese, wurde vor 10 Jahren gegründet, beschäftigt rund 4.500 Mitarbeiter und hat bisher 6,6 Milliarden Dollar an Kapital aufgenommen.

DeepSeek hingegen ist ein echter Newcomer: Das Unternehmen existiert seit weniger als 2 Jahren, beschäftigt nur 200 Mitarbeitende und soll mit einem vergleichsweise geringen Budget von rund 5 Millionen Dollar entwickelt worden sein – eine Zahl, die jedoch schwer unabhängig zu verifizieren ist.

Das Disruptive daran:
Während Unternehmen wie OpenAI und Anthropic über 100 Millionen Dollar investieren, um ihre KI-Modelle zu trainieren, hat das kleine Team von DeepSeek aus China ein KI-System geschaffen, das die Leistung von GPT-4 erreicht – und das zu einem Bruchteil der Kosten. In den USA spricht man bereits von einem «AI-Sputnik-Moment», da DeepSeek die bestehende Dynamik der KI-Welt grundlegend erschüttert hat.

Wie haben sie das geschafft?
Durch drei revolutionäre Ansätze, die alles auf den Kopf stellen:

  1. Präzision neu definiert

DeepSeek hat bewiesen, dass weniger oft mehr ist. Anstatt enorme Rechenleistung für 32 Dezimalstellen zu verschwenden, haben sie gezeigt, dass 8 Dezimalstellen völlig ausreichen. Das Ergebnis? Eine Reduktion des Speicherbedarfs um 75 %. Dieser simple, aber radikale Ansatz zeigt, wie bahnbrechend es sein kann, etablierte Annahmen zu hinterfragen.

  1. Geschwindigkeit revolutioniert

Traditionelle KI liest Wort für Wort, ähnlich wie ein Erstklässler: «Die… Katze… läuft…». DeepSeeks Multi-Token-System hingegen verarbeitet ganze Phrasen auf einmal. Das Ergebnis: doppelte Geschwindigkeit bei einer Genauigkeit von 90 %. Für die Verarbeitung von Milliarden Wörtern ist das ein Gamechanger.

  1. Ein System der Spezialisten

Anstatt ein gigantisches Alleskönner-Modell zu bauen, das wie ein Mensch, Arzt, Ingenieur und Anwalt zugleich sein will, setzt DeepSeek auf ein Netzwerk von spezialisierten Modellen. Herkömmliche KI-Modelle arbeiten mit 1,8 Billionen ständig aktiven Parametern. DeepSeek nutzt insgesamt 671 Milliarden Parameter – jedoch nur 37 Milliarden gleichzeitig. Das Ergebnis ist eine beispiellose Effizienz.

Die beeindruckenden Ergebnisse:

  • Trainingskosten: Reduktion von 100 Millionen auf 5 Millionen Dollar
  • GPU-Anforderungen: Rückgang von 100.000 auf nur 2.000 GPUs
  • API-Kosten: 95 % günstiger
  • Hardware: Läuft auf Gaming-GPUs statt auf spezialisierter Hardware
  • Teamgrösse: Ein Team von weniger als 200 Personen erreichte, was normalerweise Tausende benötigen würden

Das Revolutionäre daran:
DeepSeek hat all seine Innovationen Open Source gemacht. Jeder kann die Ansätze nachvollziehen, weiterentwickeln und frei nutzen.
Auch wenn nicht alle Zahlen unabhängig verifiziert werden können, steht eines fest: Dies ist weit mehr als nur ein technologischer Fortschritt – es markiert die Demokratisierung der Künstlichen Intelligenz in einem bisher beispiellosen Ausmass. Gleichzeitig bringt es erhebliche Unruhe in den amerikanischen KI-Markt und könnte bestehende Strukturen nachhaltig destabilisieren. Spannend wird es zu beobachten, welche Auswirkungen dies auf SaaS-Plattformen und deren Preismodelle haben wird. Diese könnten durch den radikalen Kostenvorteil erheblich unter Druck geraten. Es bleibt abzuwarten, wie sich der Markt und die Branche darauf einstellen werden.

Die Frage ist nicht, ob dies die Entwicklung von KI verändern wird – sondern was DU mit dieser demokratisierten Technologie erschaffen wirst. Wir leben in einer Zeit, in der bahnbrechende Innovationen nicht nur möglich, sondern für jeden zugänglich sind.

Stelle sicher, dass du keinen Beitrag zum Thema AI verpasst und in Zukunft direkt über Neuigkeiten im Bereich Artificial Intelligence informiert bleibst. Registriere dich jetzt für das kostenlose Blog-Abo.

✍️✍️✍️

 

Hast du weitere Fragen? Dann zögere nicht und kontaktiere uns. Wir helfen dir gerne unter marketing@bithawk.ch weiter.


Weitere Themen auf unserem Blog

 

Themen: Artificial intelligence