D-ID bringt eine neue Generation ausdrucksstarker KI-Avatare auf den Markt, die sich durch geringe Latenz und hohe Kosteneffizienz auszeichnen.
Berlin, 16. März 2026 – D-ID, ein führender Anbieter von KI-Avatarlösungen für Unternehmen, hat heute die Einführung seines neuesten KI-Modells bekannt gegeben. V4 Expressive Visual Agents ist die neue Generation hochrealistischer digitaler Menschen, die sowohl für Echtzeit-Gespräche mit LLM-Anbindung als auch für die einfache Erstellung längerer Videoinhalte entwickelt wurde.
Die V4 Expressive Visual Agents basieren auf einem neuen diffusionsbasierten Modell, das mit echten Schauspielern trainiert wurde. Das ermöglicht schnellere Generierung, extrem niedrige Gesprächslatenzen (unter 0,5 Sekunden), präzise Lippensynchronität und Auflösungen bis zu 4K. Das Ergebnis sind ausdrucksstarke, natürliche Mensch-Maschine-Interaktionen, skalierbar für verschiedenste Enterprise-Anwendungsfälle.
Bis dato wurden mit früheren D-ID-Modellen bereits mehr als 800.000 visuelle Agenten sowie über 300 Millionen nicht-interaktive Avatare erstellt. Die V4-Avatare stehen ab sofort den 1.500 D-ID-Enterprise-Kunden sowie Nutzern in allen D-ID-Aboplänen bereits ab 5,90 US-Dollar pro Monat zur Verfügung, was die außergewöhnliche Kosteneffizienz des neuen V4-KI-Modells widerspiegelt.
Studien zeigen, dass menschliche Gesichtsausdrücke den Wissenstransfer, die Merkfähigkeit und das Verständnis verbessern. Deshalb setzen Unternehmen zunehmend auf hochrealistische Avatare für Onboarding, Schulungen, Kundeninteraktionen und interne Kommunikation – insbesondere dort, wo Klarheit, Vertrauen und konsistente Botschaften entscheidend sind.
Die V4 Expressive Visual Agents sind die ersten hochwertigen, ausdrucksstarken Avatare, die sich dynamisch an ausgewählte Stimmungen (Sentiments) anpassen. Dadurch stimmen Tonfall und Intention mit der jeweiligen Botschaft überein. Gesprochene Inhalte werden so klarer und überzeugender vermittelt – mit natürlichem Timing und passenden Betonungen.
Visual Agents dienen als visuelle Schnittstelle für KI-Systeme. Statt einseitiger Videowiedergabe ermöglichen sie bidirektionale Echtzeit-Interaktionen. Während ein LLM antwortet, passt der Avatar automatisch Ausdruck und Stimme an den Kontext und die Stimmung an. So wirken KI-Agenten – ob im Kundenkontakt oder intern – natürlicher, vertrauenswürdiger und effektiver.
Darüber hinaus können Nutzer optional ihre Kamera aktivieren. Der Visual Agent erkennt in Echtzeit die Stimmung des Gegenübers und passt seine Antwort entsprechend an. Nonverbale Signale wie Mimik oder Reaktionen fließen dabei sowohl in die Antwort des LLM als auch in den Tonfall und den Gesichtsausdruck des Avatars ein.
Zusätzlich können V4 Expressive Visual Agents interaktive UI-Elemente direkt in der Konversation anzeigen. Dazu gehören visuelle Inhalte wie Bilder, Diagramme und Videos, aber auch strukturierte Interaktionen wie Formulare oder Quizze, ermöglicht durch D-IDs MCP-Apps.
Während viele KI-Videotools nur kurze Clips erzeugen, sind V4-Avatare für längere Inhalte und kontinuierliche Interaktionen entwickelt worden. Unternehmen können mit demselben Avatar Minuten oder Stunden an Video produzieren und gleichzeitig Echtzeit-Gespräche in großem Maßstab führen – und das zu deutlich geringeren Kosten (bis zu 70-mal günstiger als Google VEO 3 Fast).
Das macht V4 besonders wirtschaftlich für Kurse, Erklärvideos, mehrsprachige Trainingsinhalte und wiederkehrende Videoformate. Vor allem bei Echtzeit-Interaktionen summieren sich diese Vorteile, da Gespräche mit D-ID nur wenige Cent pro Chat kosten.
„Seit unseren ersten Modellen, die statische Bilder in sprechende Porträts verwandelt haben, hat sich unsere Technologie enorm weiterentwickelt“, sagt Gil Perry, Mitgründer und CEO von D-ID. „Mit V4 erreichen wir ein neues Niveau an Realismus und Performance. Unsere Avatare können in Echtzeit reagieren und bieten gleichzeitig die Stabilität, Effizienz und Sicherheit, die Unternehmen im großen Maßstab brauchen. Damit wird KI-Kommunikation deutlich natürlicher – und genau darauf kommt es an, wenn Unternehmen KI in ihre Interaktionen integrieren wollen.“
Nach der Übernahme von simpleshow im September 2025 hat D-ID seine Enterprise-Distribution deutlich ausgebaut und seine KI-Avatartechnologie in das Ökosystem für Erklärvideos und Corporate Training von simpleshow integriert. Seitdem ist der jährlich wiederkehrende Umsatz (ARR) von D-ID um 250 % gewachsen, getrieben durch Cross-Selling-Effekte und eine steigende Nachfrage von Unternehmen nach interaktiven, KI-gestützten Videolösungen.
D-ID ist weltweit führend im Bereich generativer KI für Video und digitale Menschen und ermöglicht reibungslose Echtzeit-Interaktion über seine Real-Time Streaming API. Die Technologie des Unternehmens treibt lebensechte digitale Präsentatoren, Lernbegleiter und virtuelle Assistenten für viele Fortune-500-Unternehmen an. Im September 2025 übernahm D-ID das deutsche Unternehmen simpleshow, einen Pionier für KI-basierte Erklärvideo-Erstellung. Zusammen stellt D-ID damit die umfassendste Enterprise-Lösung für KI-Videos und interaktive Echtzeit-Agenten dar.
Kontakt
simpleshow GmbH (a D-ID company)
Viktoria Koleva
Rosenstraße 16
10178 Berlin
+49 30 809 502 133

https://www.d-id.com/
- d-id (Wikipedia)
DID steht für: Decentralized Identifier Documents steht für die englische Bezeichnung von Differenz-von-Differenzen-Ansatz Difference in differences, Schätzmethode für Kausalbeziehungen, siehe Differenz-von-Differenzen-Ansatz Digital Image Design, britischer Spielehersteller Direct Inward Dial, siehe Durchwahl Dissociative identity disorder, siehe Dissoziative Identitätsstörung DiD steht für: Dahoam is Dahoam, deutsche Fernsehserie (ab 2007) did steht für: Didinga (ISO-639-3-Code), eine Sprache, siehe Surmische Sprachen #Gliederung Siehe auch: Damsel in Distress - KI (Wikipedia)
KI steht für: sumerische Gottheit, siehe Uraš (Göttin) Adam Air, ehemalige indonesische Fluggesellschaft nach dem IATA-Code Canadian Regional Airlines (IATA-Code), kanadische Fluggesellschaft Kaliumiodid, chemische Verhältnisformel Kanzerogenitätsindex, Gefahreneinstufung von Mineralfasern Karolinska-Institut, medizinische Hochschule bei Stockholm Kategorischer Imperativ, grundlegendes ethisches Prinzip des Philosophen Immanuel Kant Kiribati, Ländercode nach ISO 3166 Knabeninstitut Wilhelmsdorf, heute Gymnasium Wilhelmsdorf in Wilhelmsdorf (Württemberg) Kombiinstrument, Instrumentenblock in Kraftfahrzeugen Kommunistische Internationale, auch Komintern Konfidenzintervall, statistischer Vertrauensbereich Konfigurationsidentifizierung, Teil des Konfigurationsmanagements Konstanzer Inventar, Sammlung kriminologischer und kriminalstatistischer Informationen Kontraindikation, in der Medizin ein Umstand, der gegen eine Maßnahme spricht Kreditinstitut Künstliche Insemination, künstliche Befruchtung bei Rindern und anderen Tieren Künstliche Intelligenz, Teilgebiet der Informatik Trabajos Aéreos del Sahara (ICAO-Code), ehemalige spanische Fluggesellschaft Wasserstraßen- und Schifffahrtsamt Kiel-Holtenau, Kleinfahrzeugkennzeichen der Binnenschifffahrt KI als Unterscheidungszeichen auf Kfz-Kennzeichen: Deutschland: kreisfreie Stadt Kiel Griechenland: Kilkis Mazedonien: Kičevo Österreich: Bezirk Kirchdorf, Oberösterreich Serbien: Kikinda Slowakei: Košice (noch nicht vergeben) Tschechien: Karviná (auslaufend) KÍ steht für: KÍ Klaksvík, färöischer Fußballverein aus Klaksvík K.I steht für: AEG K.I (AEG G.I), (das „I“ steht aber für „römisch eins“), deutsches Doppeldecker-Bombenflugzeug Fokker K.I (Fokker M.9), (das „I“ steht aber für „römisch eins“), deutsches Zweirumpf-Experimentalflugzeug Ki steht für: Ki, Papuasprache, siehe Amto Ki (Papua), Distrikt (Distrik) in der indonesischen Provinz Papua Selatan Einheitenvorsilbe mit dem Zahlenwert 1024, siehe Binärpräfix Ki (Album) des kanadischen Musikers Devin Townsend Ki (Klan), alte Familie in Japan Begriff für Kraft bzw. Lebensenergie in der japanischen Philosophie, siehe Qi Kikuyu (Sprache) nach ISO 639-1 Ki ist der … - Künstliche Intelligenz (Wikipedia)
Künstliche Intelligenz (KI), englisch artificial intelligence, daher auch artifizielle Intelligenz (AI), bezeichnet ein Forschungsgebiet der Informatik, sowie daraus hervorgegangene verschiedene Klassen algorithmischer Problemlösungsverfahren, die anhand von Eingaben aus ihrer Umgebung bestimmte Handlungen durchführen. Historisch ist der Begriff nicht einheitlich definiert, sondern kann sich einerseits auf „Intelligenz“ im Sinne der Nachbildung menschlichen Verhaltens beispielsweise bei der Bilderkennung oder der Interaktion in menschlicher Sprache beziehen, andererseits auf die Fähigkeit zu rationalem, logikbasierten Schlussfolgern. In der öffentlichen Wahrnehmung werden häufig maschinelles Lernen und die auf diesem Prinzip aufbauenden Chatbots mit dem Begriff der künstlichen Intelligenz gleichgesetzt. Maschinelles Lernen ist jedoch nur eines mehrerer Teilgebiete des Felds, ihm stehen beispielsweise logik- und regelbasierte Ansätze wie die der symbolischen Künstlichen Intelligenz gegenüber. Mit der Zeit haben sich viele Bereiche zu den Methoden der KI entwickelt. Weiterhin wird unterschieden, welche Probleme mit den Methoden der KI beschrieben werden. Dabei entstanden zwei Bereiche: schwache KI und starke KI. Der ingenieurwissenschaftliche Teil der Informatik befasst sich damit, wie solche Systeme realisiert werden können. Beispiele dafür sind Multiagentensysteme, Expertensysteme, Transformer oder serviceorientierte Architekturen.