KI-Forschung
Text2Model und Text2Zinc: KI-Copiloten für automatische Modellgenerierung aus Textbeschreibungen
Forscher stellen Text2Model und Text2Zinc vor - ein System aus KI-Copiloten und ein Cross-Domain-Dataset, die natürlichsprachige Beschreibungen von Optimierungsproblemen automatisch in formale mathematische Modelle übersetzen. Das System nutzt MiniZinc als solver-agnostische Modellierungssprache und vergleicht verschiedene LLM-Strategien von Zero-Shot bis zu agentischen Ansätzen.
Mehr lesen →Umfassende Analyse von Halluzinationen in Video-Large-Language-Models
Ein systematischer Survey kategorisiert Halluzinationen in Video-LLMs in zwei Haupttypen: dynamische Verzerrung und Inhaltsfabrikation. Die Studie analysiert Ursachen, Bewertungsmethoden und Lösungsansätze für diese persistenten Herausforderungen in der Video-Sprach-Modellierung.
Mehr lesen →DINO-Explorer: KI-System entdeckt autonome Unterwasser-Phänomene mit semantischer Vorhersage
Forscher haben DINO-Explorer entwickelt, ein KI-System für autonome Unterwasserfahrzeuge, das wichtige marine Ereignisse in Echtzeit erkennt. Das System nutzt ein gefrorenes DINOv3-Foundation-Model und kompensiert Eigenbewegungen, um echte Umweltanomalien von kamerabedingten Veränderungen zu unterscheiden.
Mehr lesen →GraG: Schnelle 3D-Rekonstruktion von Hand-Objekt-Interaktionen aus monokularen Videos
Forscher stellen GraG vor, eine Methode zur schnellen 3D-Rekonstruktion dynamischer Hand-Objekt-Interaktionen aus einzelnen Videos. Das Verfahren nutzt eine kompakte Sum-of-Gaussians-Darstellung und erreicht 6,4x schnellere Verarbeitung bei 13,4% besserer Objektrekonstruktion und über 65% geringeren Handfehlern.
Mehr lesen →TCL: Neues Framework für effiziente Tensor-Optimierung über verschiedene Hardware-Plattformen
Forscher stellen TCL vor, ein Deep Learning Compiler-Framework, das Tensor-Programme 16,8x schneller optimiert als bestehende Methoden. Das System nutzt aktives Lernen, Mamba-basierte Kostenmodelle und kontinuierliche Wissensdestillation für plattformübergreifende Optimierung.
Mehr lesen →VideoFlexTok: Neue flexible Video-Tokenisierung für effizientere KI-Modelle
Forscher stellen VideoFlexTok vor, eine neuartige Video-Tokenisierung, die Videos in variabler Länge mit einem Coarse-to-Fine-Ansatz darstellt. Die Methode ermöglicht es, mit 5x kleineren Modellen vergleichbare Qualität zu erreichen und lange Videos mit deutlich weniger Tokens zu generieren.
Mehr lesen →VFA: Neue Optimierung für Flash Attention reduziert Vektor-Operationen drastisch
Forscher stellen Vector Relieved Flash Attention (VFA) vor, eine hardware-freundliche Methode zur Optimierung von Flash Attention. VFA reduziert rechenintensive Vektor-Operationen durch clevere Vorberechnung des globalen Maximums und erzielt damit bis zu doppelte Geschwindigkeitsgewinne auf moderner Hardware.
Mehr lesen →Schwerwiegende Sicherheitslücken bei KI-Bilderkennung durch winzige Störungen aufgedeckt
Forscher haben entdeckt, dass rekonstruktionsbasierte Detektoren für KI-generierte Bilder extrem anfällig für adversarielle Angriffe sind. Durch kaum sichtbare Störungen können solche Systeme praktisch vollständig ausgetrickst werden, wobei die Erkennungsgenauigkeit auf nahezu null sinkt.
Mehr lesen →Neuer Datensatz für komplexe markerlose 4D-Bewegungserfassung
Forscher haben einen neuen Datensatz für markerlose 4D-Bewegungserfassung vorgestellt, der realistische Multi-Person-Szenarien mit komplexen Interaktionen, Verdeckungen und schnellen Positionswechseln abbildet. Benchmarks zeigen erhebliche Leistungseinbußen aktueller Modelle unter diesen realistischen Bedingungen.
Mehr lesen →GF-Score: Neues Framework für faire Bewertung der Robustheit von KI-Modellen
Forscher stellen den GF-Score vor, ein Framework zur Bewertung der adversarialen Robustheit von neuronalen Netzwerken auf Klassenebene. Das System identifiziert Fairness-Probleme bei der Robustheit verschiedener Klassen und eliminiert die Notwendigkeit teurer adversarialer Angriffe durch ein Selbstkalibrierungsverfahren.
Mehr lesen →
Entwickler behauptet, Googles KI-Wasserzeichen-System SynthID gehackt zu haben
Ein Software-Entwickler behauptet, Googles SynthID-Wasserzeichen-System erfolgreich rückentwickelt zu haben, wodurch Wasserzeichen aus KI-generierten Bildern entfernt oder in andere Werke eingefügt werden könnten. Google bestreitet jedoch die Richtigkeit dieser Behauptung.
Mehr lesen →DeepMind entwickelt Messverfahren für schädliche KI-Manipulation
DeepMind hat die erste empirisch validierte Methodik zur Messung schädlicher KI-Manipulation veröffentlicht. Die Studie mit über 10.000 Teilnehmern aus drei Ländern untersuchte, wie KI Menschen in kritischen Bereichen wie Finanzen und Gesundheit negativ beeinflussen kann.
Mehr lesen →DeepMind Jahresrückblick 2016: Durchbrüche in KI-Forschung
DeepMind veröffentlicht einen umfassenden Rückblick auf die bedeutendsten Forschungsergebnisse und Durchbrüche des Jahres 2016. Das Jahr war geprägt von wichtigen Entwicklungen in verschiedenen Bereichen der künstlichen Intelligenz.
Mehr lesen →Project Genie: DeepMind experimentiert mit unendlichen, interaktiven Welten
DeepMind hat Project Genie angekündigt, ein Forschungsprojekt zur Entwicklung unendlicher, interaktiver Welten. Das Projekt zielt darauf ab, neue Ansätze für die Generierung und Interaktion mit virtuellen Umgebungen zu erforschen. Die Initiative wurde im Januar 2026 vorgestellt und ist Teil der fortlaufenden KI-Forschung des Unternehmens.
Mehr lesen →
KI-Sprachmodelle können pseudonyme Nutzer mit überraschender Genauigkeit entlarven
Neue Forschung zeigt, dass Large Language Models in der Lage sind, pseudonyme Nutzer in großem Umfang zu identifizieren und dabei eine überraschend hohe Trefferquote erreichen. Dies stellt die Wirksamkeit von Pseudonymität als Datenschutzmaßnahme grundlegend in Frage.
Mehr lesen →
Google macht HTTPS quantensicher mit revolutionärer Datenkompression
Google hat eine bahnbrechende Technologie entwickelt, die 15 KB Zertifikatsdaten auf nur 700 Byte komprimiert und dabei quantensichere Verschlüsselung ermöglicht. Die sogenannten Merkle Tree Certificates sind bereits in Chrome implementiert und sollen bald flächendeckend eingeführt werden.
Mehr lesen →
Meta DINO hilft britischer Regierung bei Waldüberwachung und Grünflächenplanung
Forest Research nutzt Metas Computer-Vision-Modell DINOv2 zur präziseren Kartierung von Bäumen und Waldflächen in England. Das KI-Modell soll dabei helfen, die ehrgeizigen Umweltziele der britischen Regierung zu erreichen, wonach jeder Einwohner maximal 15 Gehminuten von einer Grünfläche entfernt leben soll.
Mehr lesen →
Meta KI-Modelle revolutionieren medizinische Notfalltriage bei DARPA-Herausforderung
Die University of Pennsylvania nutzt Metas SAM und DINO KI-Modelle für autonome Verletzungserkennnung bei Massenunfällen. Das PRONTO-Team entwickelt Robotersysteme, die in einer dreijährigen DARPA-Herausforderung Opfer unter extremen Bedingungen identifizieren und bewerten können.
Mehr lesen →
USRA nutzt Metas Segment Anything Model für Hochwasser-Notfallsysteme
Die Universities Space Research Association (USRA) arbeitet mit Meta zusammen, um SAM für die Überwachung von Gewässern und Hochwasservorhersage einzusetzen. Das KI-Modell automatisiert die Erkennung von Wassergrenzen in Drohnen- und Satellitenbildern, wodurch zeitaufwändige manuelle Analysen ersetzt werden. Die Technologie wird bereits in mehreren US-Wasserbeobachtungssystemen getestet und zeigt vielversprechende Ergebnisse für die landesweite Implementierung.
Mehr lesen →
Orakl Oncology nutzt Metas DINOv2 für Krebsforschung mit Organoiden
Das französische Startup Orakl Oncology nutzt Metas Open-Source-Modell DINOv2, um aus Bildern von Krebs-Organoiden Patientenreaktionen auf Therapien vorherzusagen. Das Computer Vision-Modell verbesserte die Genauigkeit um 26,8% gegenüber anderen Techniken und beschleunigt die Krebsforschung erheblich.
Mehr lesen →KI-News direkt ins Postfach
Jeden Morgen um 8:30 Uhr — die wichtigsten KI-Nachrichten zusammengefasst.