Wie hat dir die Folge gefallen?
Gut 👍
Schlecht 👎
(Keine Anmeldung erforderlich)
In dieser Folge der AI News begrüßen euch Dennis und Philipp. Philipp meldet sich direkt aus den USA und steht gerade kurz vor der Google Cloud Next in Las Vegas. Gemeinsam tauchen die beiden tief in die neuesten Veröffentlichungen von Anthropic ein.
Den Anfang macht ein Modell, das fast schon zu gut für die Öffentlichkeit ist: Claude Mythos. In einer Preview-Phase zeigt Anthropic hier Fähigkeiten im Bereich Security und Vulnerability Research, die so weit fortgeschritten sind, dass das Modell vorerst nur ausgewählten Partner:innen im Rahmen des „Project Glasswing“ zur Verfügung gestellt wird, um das Internet sicherer zu machen, bevor es in falsche Hände gerät. Erinnert ihr euch noch an die Anfänge von GPT-2? Wir diskutieren, ob dieser „Safety-First“-Ansatz Marketing oder Notwendigkeit ist.
Ganz konkret für euch nutzbar ist dagegen das Update auf Claude Opus 4.7. Die Benchmarks, besonders im Coding-Bereich, machen einen ordentlichen Satz nach vorne. Aber Vorsicht beim Budget: Durch einen neuen Tokenizer verbraucht das Modell bis zu 35 % mehr Tokens für den gleichen Text. Wir besprechen, was das für eure API-Kosten bedeutet und warum das Modell trotzdem ein No-Brainer für komplexe Aufgaben bleibt. Passend dazu hat Anthropic Claude Design gelauncht – ein Tool, mit dem ihr ganze Design-Systeme und interaktive Prototypen direkt per Prompt erstellen könnt. Ob das wirklich der viel beschworene „Figma-Killer“ ist oder eher eine mächtige Brücke zwischen Idee und Code, erfahrt ihr in der Folge.
Auch bei OpenAI gibt es Neuigkeiten, speziell für die Codex MacOS Anwendung. Mit der neuen „Computer Use“-Integration kann die KI nun direkt auf eurem System agieren, sei es in Slack, im Browser oder direkt in eurer Entwicklungsumgebung für Swift-Projekte. Wir schauen uns an, wie die neuen In-App-Browser-Editoren und die Integration von Image 1.5 euren Workflow beschleunigen können – auch wenn einige Features in der EU noch auf sich warten lassen oder nur über Feature-Flags erreichbar sind.
Zum Abschluss werfen wir einen Blick nach China, wo sich das Karussell der Open-Weights-Modelle immer schneller dreht. Kimi 2.6 beeindruckt mit extremen Fähigkeiten für „Long-Horizon Agentic Use Cases“ und tausenden parallelen Tool-Calls. Gleichzeitig schickt Alibaba Qwen 3.6 ins Rennen, das in der MoE-Variante (Mixture of Experts) sogar Googles Gemma in einigen lokalen Szenarien den Rang abläuft.
Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback:
[email protected]Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.
Bluesky
Instagram
LinkedIn
Meetup