Aus der Community

Bildgenerierung als Weg zur AGI: Reflexion über GPT-Image-2
Eine Analyse der fortschreitenden Entwicklungen bei GPT-Image-2 und dessen Bedeutung für den Weg zur Artificial General Intelligence. Der Artikel reflektiert über die anhaltende 'Explosion' der Bildgenerierungstechnologie.
Mehr lesen →Pip 26.1 führt Lockfiles und Dependency Cooldowns ein
Python's Standard-Paketmanager pip erhält in Version 26.1 wichtige neue Features: Lockfiles für reproduzierbare Builds und Dependency Cooldowns für mehr Sicherheit bei der Paketinstallation. Die neue Version unterstützt außerdem kein Python 3.9 mehr.
Mehr lesen →Talkie: 13B Sprachmodell trainiert ausschließlich auf historischen Texten vor 1931
Forscher um Alec Radford haben 'talkie' veröffentlicht - ein 13B-Parameter Sprachmodell, das ausschließlich auf historischen englischen Texten vor 1931 trainiert wurde. Das Modell soll erforschen, wie gut KI die Zukunft vorhersagen kann und ob sie Erfindungen jenseits ihres Wissenshorizonts entwickeln könnte.
Mehr lesen →
Microsoft VibeVoice: Neues Whisper-ähnliches Audio-Modell mit Speaker-Trennung
Microsoft hat VibeVoice veröffentlicht, ein MIT-lizenziertes Speech-to-Text-Modell im Whisper-Stil mit eingebauter Speaker-Diarization. Das Modell kann Audio in Text umwandeln und dabei verschiedene Sprecher automatisch identifizieren und trennen.
Mehr lesen →OpenAI-Microsoft AGI-Klausel endgültig beendet
Simon Willison dokumentiert die jahrelange Geschichte der AGI-Klausel zwischen OpenAI und Microsoft, die besagte, dass Microsofts kommerzielle IP-Rechte enden würden, sobald AGI erreicht ist. Diese Klausel wurde heute offiziell beendet.
Mehr lesen →Google Meet rollt Sprach-Übersetzung für mobile Geräte aus
Google Meet führt eine neue Echtzeit-Sprach-Übersetzung ein, die es Nutzern ermöglicht, in verschiedenen Sprachen zu sprechen und automatisch übersetzt zu werden. Das Feature unterstützt zunächst sechs Sprachen und befindet sich noch im Alpha-Stadium.
Mehr lesen →
DeepSeek V4 Pro (1.6T) und Flash (284B) veröffentlicht mit Huawei Ascend Support
DeepSeek hat die neuen Modelle V4 Pro (1.6T Parameter, aktive 49B) und Flash (284B Parameter, aktive 13B) veröffentlicht, die auf Huawei Ascend Chips lauffähig sind. Beide sind als Base- und Instruct-Varianten verfügbar.
Mehr lesen →LLM 0.31 mit GPT-5.5 Unterstützung veröffentlicht
Simon Willisons LLM-Tool erhält in Version 0.31 Unterstützung für das neue GPT-5.5 Modell von OpenAI. Zusätzlich wurden neue Optionen für Textverbosität und Bilddetailgrade sowie asynchrone Modellregistrierung hinzugefügt.
Mehr lesen →Honker bringt Postgres NOTIFY/LISTEN-Funktionalität zu SQLite
Die neue Rust-Extension 'Honker' implementiert Postgres-ähnliche NOTIFY/LISTEN-Semantiken für SQLite und ermöglicht damit Job-Queues und Event-Streams. Das Tool unterstützt das transactional outbox pattern und bietet sowohl Python- als auch SQL-APIs für asynchrone Messaging-Funktionen.
Mehr lesen →Anthropic erklärt Qualitätsprobleme bei Claude Code der letzten Monate
Anthropic hat ein Postmortem zu Qualitätsproblemen bei Claude Code veröffentlicht, die über zwei Monate hinweg auftraten. Drei separate Bugs in der Claude Code-Infrastruktur, nicht in den Modellen selbst, verursachten die gemeldeten Probleme.
Mehr lesen →Bluesky's For You Feed: Ein Gaming-PC versorgt 72.000 Nutzer
Der populäre For You Feed von Bluesky läuft auf einem Gaming-PC im Wohnzimmer seines Betreibers und versorgt 72.000 Nutzer. Das System nutzt Go, SQLite und verbraucht nur 30 Dollar monatlich für Betrieb und Infrastruktur.
Mehr lesen →
LiteParse für den Browser: PDF-Text-Extraktion ohne Server
Simon Willison hat eine Browser-Version von LlamaIndex's LiteParse erstellt, die PDF-Text-Extraktion vollständig im Browser ermöglicht. Das Tool verwendet räumliche Text-Parsing-Algorithmen und OCR, um auch komplexe PDF-Layouts korrekt zu verarbeiten, ohne dass Daten den lokalen Rechner verlassen.
Mehr lesen →
GPT-5.5 über inoffizielle Codex-API nutzen
Simon Willison zeigt, wie man GPT-5.5 trotz fehlender offizieller API über die Codex-Schnittstelle nutzen kann. Er entwickelte ein Plugin, das bestehende Codex-Abonnements für API-Zugriff verwendet.
Mehr lesen →
Qwen3.6-27B: Flagship-Level Coding-Performance in kompaktem 27B Modell
Qwen hat Qwen3.6-27B veröffentlicht, ein 27B-Parameter-Modell, das laut Hersteller flagship-level Coding-Performance erreicht und dabei das größere Qwen3.5-397B-Modell in allen wichtigen Coding-Benchmarks übertrifft. Simon Willison testete das Modell mit beeindruckenden Ergebnissen bei SVG-Generierung.
Mehr lesen →Firefox 150 behebt 271 Sicherheitslücken mit Hilfe von Claude Mythos Preview
Mozilla hat in Zusammenarbeit mit Anthropic eine frühe Version von Claude Mythos Preview zur Sicherheitsanalyse von Firefox eingesetzt. Das Firefox 150 Update behebt 271 identifizierte Schwachstellen und zeigt das Potenzial von KI für die Cybersicherheit auf.
Mehr lesen →GitHub Copilot erhöht Preise und verschärft Nutzungslimits für Individual-Tarife
GitHub kündigt umfassende Änderungen für Copilot Individual-Tarife an: verschärfte Nutzungslimits, pausierte Neuanmeldungen, Beschränkung von Claude Opus 4.7 auf den teureren Pro+-Plan für 39$/Monat und Wegfall älterer Opus-Modelle. Als Grund werden die stark gestiegenen Compute-Anforderungen durch agentic Workflows genannt.
Mehr lesen →
Cursor erhält 10-Milliarden-Dollar-Vertrag mit xAI
Das KI-Code-Editor-Unternehmen Cursor hat einen 10-Milliarden-Dollar-Vertrag mit Elon Musks xAI abgeschlossen. Zusätzlich erhält xAI ein Erwerbsrecht für Cursor im Wert von 60 Milliarden Dollar.
Mehr lesen →
OpenAI veröffentlicht ChatGPT Images 2.0 - Test mit Waschbär und Funkgerät
OpenAI hat ChatGPT Images 2.0 veröffentlicht, ihr neues Bildgenerierungsmodell. Simon Willison testete das neue Modell gegen die Vorgängerversion und Googles Nano Banana mit einem 'Wo ist Waldo'-Style Prompt nach einem Waschbären mit Funkgerät. Die Ergebnisse zeigen deutliche Unterschiede in der Bildqualität und Promptverständnis.
Mehr lesen →
Moonshot Kimi K2.6: Weltführendes Open-Source-Modell erhält Update
Moonshot hat sein Kimi-Modell auf Version K2.6 aktualisiert, das laut Ankündigung mit Claude Opus 4.6 konkurrieren kann. Das Update positioniert Kimi weiterhin als führendes Open-Source-Sprachmodell vor dem erwarteten DeepSeek v4 Release.
Mehr lesen →
Noetik entwickelt Transformer-Modell TARIO-2 zur Optimierung von Krebsstudien
Das Unternehmen Noetik nutzt autoregressive Transformer-Modelle wie TARIO-2, um das Problem der 95%igen Ausfallrate bei Krebstherapie-Studien zu lösen. Das Unternehmen betrachtet dies als ein Matching-Problem zwischen Patienten und Behandlungen.
Mehr lesen →KI-News direkt ins Postfach
Jeden Morgen um 8:30 Uhr — die wichtigsten KI-Nachrichten zusammengefasst.