🍾 Anthropic veröffentlicht neues Spitzenmodell

PLUS: 4 weitere Stories, wöchentliche Shorts & Tipps sowie KI-Ranking

Guten Abend 🌙

Eine Woche ist vergangen, und KI WEEKLY+ hält Dich auf dem neuesten Stand der KI-Welt.

KI-Tools der Woche

  1. 🎥Avatar V - HeyGens KI-Avatar-Modell, das Videos in Studioqualität erzeugt

  2. ⚙️ Cursor 3 - Cursors neue Oberfläche für parallele Programmieragenten

  3. ⚖️ Harvey Agents - KI-Agenten für juristische Texte wie Memos, Due-Diligence-Berichte und mehr

  4. ⚙️ Skills in Chrome - Wiederverwendbare Workflows für Gemini in Chrome

  5. 🌎 Lyra 2.0 - NVIDIAs KI, die Text und Kamerabewegungen in 3D-Szenen verwandelt

01

OpenAI stellt spezialisiertes KI-Modell für Biowissenschaften vor

Bildquelle: OpenAI

OpenAI hat mit GPT-Rosalind sein erstes domänenspezifisches Modell für die Life Sciences vorgestellt, das gezielt für Medikamentenentwicklung und biologische Forschung entwickelt wurde. Es ist zugleich ein weiterer Schritt in Richtung spezialisierter KI-Systeme, nachdem kurz zuvor mit GPT-5.4-Cyber ein Modell für Cybersicherheit präsentiert wurde.

Die Details:

  • GPT-Rosalind kann wissenschaftliche Publikationen analysieren, Labordatenbanken durchsuchen, Experimente entwerfen und eigenständig biologische Hypothesen formulieren. Dadurch werden zentrale Teile des Forschungsprozesses automatisiert.

  • Auf fachspezifischen Benchmarks zeigt das Modell deutliche Leistungssteigerungen gegenüber GPT-5.4, insbesondere in Bereichen wie Biochemie, Versuchsplanung und Nutzung externer Tools.

  • In einem Blindtest mit RNA-Daten des Gentherapieunternehmens Dyno Therapeutics waren die Antworten des Modells bei Vorhersageaufgaben besser als die von 95 Prozent der beteiligten Wissenschaftlerinnen und Wissenschaftler.

  • Das Modell ist aktuell nur für ausgewählte Unternehmenskunden in einer Testphase verfügbar, darunter Unternehmen wie Amgen, Moderna und das Allen Institute.

  • Mit GPT-5.4-Cyber hat OpenAI wenige Tage zuvor ein weiteres spezialisiertes Modell veröffentlicht. Es wurde gezielt für Cybersicherheit entwickelt und unterstützt Aufgaben wie Schwachstellenanalyse, Angriffssimulation und Sicherheitsbewertungen. Dieses Modell ist für verifizierte User in Codex zugänglich.

Warum das wichtig ist: Innerhalb weniger Tage bringt OpenAI zwei spezialisierte Modelle für völlig unterschiedliche Industrien auf den Markt. Dies deutet auf einen klaren Strategiewechsel hin: weg von universellen Allzweckmodellen, hin zu hochoptimierten Systemen für konkrete Anwendungsfelder. Gerade in Bereichen wie Biotechnologie oder Cybersicherheit, in denen Präzision und Fachwissen entscheidend sind, könnten solche Modelle deutlich schneller echten wirtschaftlichen Nutzen schaffen. In Zukunft könnte weniger entscheidend sein, welches Modell insgesamt am stärksten ist, sondern welches für die jeweilige Aufgabe am präzisesten arbeitet.

02

KI weltweit auf dem Vormarsch, aber Vertrauen bricht ein

Bildquelle: Stanford HAI

Der Stanford AI Index 2026 zeigt, wie schnell sich Künstliche Intelligenz global verbreitet hat: Inzwischen erreicht sie mehr als die Hälfte der Weltbevölkerung und verbreitet sich damit deutlich schneller als Technologien wie der PC oder das Internet. Gleichzeitig befindet sich das Vertrauen in diese Technologie auf einem historischen Tiefstand, während erste Auswirkungen auf den Arbeitsmarkt bereits messbar sind.

Die Details:

  • Während fast drei Viertel der KI-Expertinnen und -Experten optimistisch in Bezug auf die Auswirkungen auf den Arbeitsmarkt blicken, teilen nur 23 Prozent der Bevölkerung diese Einschätzung. Dies stellt die bisher größte gemessene Wahrnehmungslücke dar.

  • Die USA entwickeln den Großteil der globalen KI-Systeme, liegen bei der tatsächlichen Nutzung mit 28,3 Prozent jedoch nur auf Platz 24 und damit hinter Ländern wie Singapur, den Vereinigten Arabischen Emiraten und großen Teilen Südostasiens.

  • China hat den technologischen Vorsprung der USA bei wichtigen KI-Benchmarks nahezu aufgeholt: Das führende Modell von Anthropic liegt nur noch 2,7 Prozent vorne. Gleichzeitig ist die Zahl der KI-Forschenden, die in die USA wechseln, um 89 Prozent zurückgegangen.

  • Die Beschäftigung von Entwickler:innen im Alter von 22 bis 25 Jahren ist seit 2024 um fast 20 Prozent gesunken, während die Zahl älterer Fachkräfte steigt und Unternehmen weitere Stellenkürzungen planen.

  • Deutschland liegt bei der KI-Nutzung im internationalen Mittelfeld. Laut Index setzen rund ein Drittel der Unternehmen aktiv KI ein. Insbesondere kleine und mittlere Unternehmen adaptieren jedoch deutlich langsamer als in den USA oder Asien.

Warum das wichtig ist: Der Bericht macht sichtbar, dass sich KI schneller durchsetzt als frühere Basistechnologien, während die gesellschaftliche Akzeptanz nicht Schritt hält. Gerade in Deutschland zeigt sich ein strukturelles Problem, weil die Nutzung hinter dem technologischen Potenzial zurückbleibt. Die wachsende Kluft zwischen Expertensicht und öffentlicher Wahrnehmung wird politisch und wirtschaftlich zum Risiko. Gleichzeitig deuten die Daten darauf hin, dass sich der Arbeitsmarkt schneller verändert, als viele erwarten oder akzeptieren wollen.

03

Anthropic veröffentlicht neues Spitzenmodell

Bildquelle: Anthropic

Anthropic hat mit Claude Opus 4.7 sein derzeit leistungsstärkstes öffentlich verfügbares Modell vorgestellt und positioniert es klar vor GPT-5.4 und Gemini 3.1 Pro im Bereich agentisches Coding.

Die Details:

  • Claude Opus 4.7 verbessert sich im Programmiertest SWE-bench Pro von 53,4 Prozent bei Version 4.6 auf 64,3 Prozent, während das interne Anthropic-Modell „Mythos Preview“, das nicht öffentlich verfügbar ist und nur ausgewählten Partnern zugänglich gemacht wird, mit 77,8 Prozent weiterhin deutlich vorausliegt.

  • Das Modell bleibt preislich identisch zu Opus 4.6 in der API-Nutzung, verarbeitet jedoch Tokens spürbar schneller, was in der Praxis zu höheren Nutzungskosten führen kann.

  • Neu ist zudem eine standardmäßig aktivierte „xhigh“-Denkstufe für Claude Code, die zwischen „high“ und „max“ liegt und komplexere Aufgaben präziser bearbeiten soll.

  • Anthropic betont im Blogpost, dass Opus 4.7 vor allem bei mehrstufigem Reasoning und Tool-Nutzung Fortschritte macht, also genau dort, wo Modelle zunehmend als autonome Systeme eingesetzt werden.

  • Die Veröffentlichung folgt auf Kritik an Leistungseinbrüchen bei Version 4.6, wobei auch die ersten Rückmeldungen zu 4.7 trotz starker Benchmarks gemischt ausfallen.