📊 Microsoft plant Claude-Integration in Office 365

PLUS: 4 weitere Stories, wöchentliche Tipps, Shorts & Events sowie 8 KI-Tools

Guten Abend, 🌙

eine Woche ist vergangen, und KI WEEKLY+ hält Dich auf dem neuesten Stand des KI-Universums.

In dieser Ausgabe

KI-Tools der Woche

  1. 🔎AI Mode - KI-gestützte Suche von Google ist jetzt in neuen Sprachen verfügbar.

  2. 🗣️ Qwen3-ASR - Das neue Spracherkennungsmodell von Alibaba

  3. 🎥 Capcut AI Suite - Erstelle, editiere oder remixe Inhalte mit KI

  4. 📓 NotebookLM - Neue Tools wie Karteikarten, Quizfragen und neu gestaltete Berichte

  5. 🎆 HunyuanImage 2.1 - Das neue Open-Source-Modell von Tencent

  6. 🎧 ElevenLabs SFX v2 - Erzeuge Soundeffekte aus Textvorgaben

  7. 📊 Claude - Erstellt jetzt Dateien für PowerPoint-Folien, Excel-Tabellen und PDFs

- 01 -

🔬 OpenAI erklärt, warum Chatbots halluzinieren

OpenAI Logo

Bildquelle: Unsplash

OpenAI hat ein neues Forschungspapier veröffentlicht, das zeigt, dass KI-Systeme halluzinieren, weil gängige Trainingsmethoden selbstbewusstes „Raten” belohnen, während ehrliche Unsicherheit bestraft wird. Damit könnte ein neuer Weg aufgezeigt sein, das Qualitätsproblem von KI zu lösen.

Die Details:

  • Forscher fanden heraus, dass Modelle Fakten erfinden, weil die Bewertung im Training volle Punkte für zufällige Treffer vergibt, aber null Punkte für ein „Ich weiß es nicht“.

  • Die Studie zeigt, dass dadurch ein Widerspruch entsteht: Modelle, die auf maximale Genauigkeit getrimmt sind, lernen zu raten, selbst wenn sie völlig unsicher sind.

  • OpenAI testete diese These, indem Modelle nach exakten Geburtstagen und Dissertationstiteln gefragt wurden. Das Ergebnis: Sie lieferten jedes Mal selbstsichere, aber unterschiedliche falsche Antworten.

  • Die Forscher schlagen deshalb vor, Bewertungsmaßstäbe neu zu gestalten und selbstsichere Fehler stärker zu bestrafen als das Eingeständnis von Unsicherheit.

Warum das wichtig ist: Dieser Bericht macht das Halluzinationsproblem zu einem Thema, das sich womöglich bereits im Training entschärfen lässt. Wenn KI-Labore beginnen, Ehrlichkeit mehr zu belohnen als glückliche Treffer, könnten Modelle entstehen, die ihre Grenzen kennen und damit an Zuverlässigkeit gewinnen. Die einzige Frage ist: Möchte man auf messbare Performance zugunsten von Verlässlichkeit verzichten?

- 02 -

📊 Microsoft plant Claude-Integration in Office 365