Neue KI-Modelle
CyberSecQwen-4B: Spezialisiertes 4B-Parameter-Modell für Cybersicherheit veröffentlicht
Hugging Face hat CyberSecQwen-4B vorgestellt, ein kompaktes 4-Milliarden-Parameter-Modell, das speziell für defensive Cybersicherheitsaufgaben entwickelt wurde. Das Modell kann lokal betrieben werden und adressiert spezifische Sicherheitsanforderungen, die große allgemeine Modelle nicht optimal erfüllen.
Mehr lesen →
OpenAI veröffentlicht GPT-Realtime-2, -Translate und -Whisper APIs
OpenAI hat neue hochmoderne Echtzeit-Sprach-APIs vorgestellt: GPT-Realtime-2, GPT-Translate und GPT-Whisper. Diese neuen APIs setzen neue Standards für Echtzeit-Sprachverarbeitung und erweitern OpenAIs Angebot um spezialisierte Sprachfunktionen.
Mehr lesen →
OpenAI veröffentlicht GPT-5.5 Instant als neues Standard-Modell für ChatGPT
OpenAI hat GPT-5.5 Instant als neues Standard-Modell für ChatGPT eingeführt. Das Modell soll Halluzinationen in sensiblen Bereichen wie Recht, Medizin und Finanzen reduzieren, während es die niedrige Latenz seines Vorgängers beibehält.
Mehr lesen →
OpenAI stellt GPT-5.5 Instant vor - 52% weniger Halluzinationen
OpenAI hat GPT-5.5 Instant als neues Standard-Modell für ChatGPT eingeführt. Das Unternehmen behauptet, dass das Modell laut internen Evaluierungen 52,5% weniger halluzinierte Behauptungen produziert und signifikante Verbesserungen bei der Faktentreue aufweist.
Mehr lesen →
IBM Granite 4.1 3B: SVG-Experiment zeigt begrenzte Zeichenfähigkeiten
IBM hat seine Apache 2.0-lizenzierten Granite 4.1 LLMs in 3B, 8B und 30B Varianten veröffentlicht. Simon Willison testete 21 quantisierte Versionen des 3B-Modells mit SVG-Generierung und stellte fest, dass alle Varianten schlechte Zeichenergebnisse lieferten.
Mehr lesen →
OpenAI kündigt GPT-5.5-Cyber für ausgewählte Cybersecurity-Experten an
OpenAI entwickelt ein spezielles Cybersecurity-Modell namens GPT-5.5-Cyber, das ausschließlich vertrauenswürdigen 'Cyber-Verteidigern' zur Verfügung gestellt wird. Das Modell soll Institutionen dabei helfen, ihre Cyberdefense zu stärken und wird nicht öffentlich zugänglich sein.
Mehr lesen →IBM stellt Granite 4.1 LLM-Familie vor
IBM hat die Granite 4.1 Familie großer Sprachmodelle veröffentlicht und detaillierte Einblicke in deren Entwicklung und Architektur gegeben. Die Modelle wurden mit verbesserter Trainingstechnik und spezieller Fokussierung auf Enterprise-Anwendungen entwickelt.
Mehr lesen →NVIDIA veröffentlicht Nemotron 3 Nano Omni mit langen Kontextfenstern für multimodale KI
NVIDIA hat Nemotron 3 Nano Omni vorgestellt, ein multimodales KI-Modell mit erweiterten Kontextfenstern für die Verarbeitung von Dokumenten, Audio und Video. Das Modell ist speziell für den Einsatz in intelligenten Agenten optimiert.
Mehr lesen →Talkie: 13B Sprachmodell trainiert ausschließlich auf historischen Texten vor 1931
Forscher um Alec Radford haben 'talkie' veröffentlicht - ein 13B-Parameter Sprachmodell, das ausschließlich auf historischen englischen Texten vor 1931 trainiert wurde. Das Modell soll erforschen, wie gut KI die Zukunft vorhersagen kann und ob sie Erfindungen jenseits ihres Wissenshorizonts entwickeln könnte.
Mehr lesen →
Microsoft VibeVoice: Neues Whisper-ähnliches Audio-Modell mit Speaker-Trennung
Microsoft hat VibeVoice veröffentlicht, ein MIT-lizenziertes Speech-to-Text-Modell im Whisper-Stil mit eingebauter Speaker-Diarization. Das Modell kann Audio in Text umwandeln und dabei verschiedene Sprecher automatisch identifizieren und trennen.
Mehr lesen →OpenAI vereinheitlicht Codex und GPT-5.5 mit starken Verbesserungen für Computer-Nutzung
OpenAI hat seit GPT-5.4 Codex und das Hauptmodell zu einem einheitlichen System zusammengeführt. GPT-5.5 bringt erhebliche Verbesserungen bei agentic coding, Computer-Nutzung und allgemeinen Computeraufgaben mit sich.
Mehr lesen →
DeepSeek V4 Pro (1.6T) und Flash (284B) veröffentlicht mit Huawei Ascend Support
DeepSeek hat die neuen Modelle V4 Pro (1.6T Parameter, aktive 49B) und Flash (284B Parameter, aktive 13B) veröffentlicht, die auf Huawei Ascend Chips lauffähig sind. Beide sind als Base- und Instruct-Varianten verfügbar.
Mehr lesen →OpenAI veröffentlicht Prompting-Leitfaden für GPT-5.5
OpenAI hat einen umfassenden Prompting-Leitfaden für das neue GPT-5.5 Modell veröffentlicht, das nun über die API verfügbar ist. Der Leitfaden empfiehlt, GPT-5.5 als völlig neue Modellfamilie zu behandeln und nicht als Drop-in-Ersatz für frühere Versionen.
Mehr lesen →
DeepSeek kündigt neue KI-Modelle an, die 'Lücke zu Frontier-Modellen schließen'
DeepSeek hat neue KI-Modelle angekündigt, die effizienter und leistungsfähiger als DeepSeek V3.2 sein sollen. Das Unternehmen behauptet, mit den neuen Modellen fast die Lücke zu führenden offenen und geschlossenen Modellen bei Reasoning-Benchmarks geschlossen zu haben.
Mehr lesen →
DeepSeek stellt V4-Vorschau vor - neues chinesisches KI-Modell konkurriert mit US-Rivalen
Das chinesische KI-Unternehmen DeepSeek hat eine Vorschau auf sein neues Open-Source-Modell V4 veröffentlicht, das mit führenden geschlossenen Systemen von Anthropic, Google und OpenAI konkurrieren soll. Das Modell zeigt besonders bei Programmieraufgaben deutliche Verbesserungen gegenüber Vorgängerversionen.
Mehr lesen →
DeepSeek veröffentlicht V4-Modelle: Frontier-Performance zu Bruchteilkosten
DeepSeek hat die V4-Serie mit zwei Preview-Modellen veröffentlicht: V4-Pro (1,6T Parameter) und V4-Flash (284B Parameter). Beide Modelle bieten 1 Million Token Kontext und kosten deutlich weniger als vergleichbare Frontier-Modelle von OpenAI, Anthropic und Google.
Mehr lesen →
OpenAI veröffentlicht GPT-5.5 als Schritt zur KI-Super-App
OpenAI hat sein neuestes Sprachmodell GPT-5.5 veröffentlicht, das laut Unternehmen verbesserte Fähigkeiten in einer Vielzahl von Kategorien bietet. Die Veröffentlichung wird als weiterer Schritt in Richtung einer KI-'Super-App' positioniert.
Mehr lesen →
OpenAI veröffentlicht GPT-5.5 mit verbesserter Programmier-Performance
OpenAI hat sein neues GPT-5.5 Modell angekündigt, das als das "intelligenteste und intuitivste" Modell des Unternehmens beworben wird. Das Modell soll besonders bei Aufgaben wie Code-Schreiben und Debugging überzeugen und stellt eine Weiterentwicklung des erst letzten Monat veröffentlichten GPT-5.4 dar.
Mehr lesen →
Qwen3.6-27B: Flagship-Level Coding-Performance in kompaktem 27B Modell
Qwen hat Qwen3.6-27B veröffentlicht, ein 27B-Parameter-Modell, das laut Hersteller flagship-level Coding-Performance erreicht und dabei das größere Qwen3.5-397B-Modell in allen wichtigen Coding-Benchmarks übertrifft. Simon Willison testete das Modell mit beeindruckenden Ergebnissen bei SVG-Generierung.
Mehr lesen →Gemma 4 VLA läuft auf Jetson Orin Nano Super
Google demonstriert Gemma 4 VLA (Vision-Language-Action) auf NVIDIA's Jetson Orin Nano Super. Das multimodale Modell kann visuelle Eingaben verarbeiten und entsprechende Aktionen ausführen.
Mehr lesen →KI-News direkt ins Postfach
Jeden Morgen um 8:30 Uhr — die wichtigsten KI-Nachrichten zusammengefasst.