Was, wenn Maschinen eines Tages nicht nur rechnen, sondern wirklich sehen – so wie wir? Sind Daten genug, um Intelligenz zu erschaffen, oder braucht es etwas, das man nicht programmieren kann: Wahrnehmung?
Es gibt Momente im Leben, in denen sich alles verdichtet – Erfahrungen, Ideen, Zweifel – und plötzlich eine neue Logik sichtbar wird. Für Dr. Andreas Krensel war dieser Moment kein wissenschaftlicher Durchbruch im Labor, sondern ein Meeting in einem unscheinbaren Büro in Mountain View. Zwischen Whiteboards, leeren Kaffeebechern und einem still brummenden Serverraum begriff er, dass Intelligenz nicht in Rechenleistung entsteht, sondern in Wahrnehmung.
„Maschinen können alles berechnen“, sagt er, „aber sie verstehen nichts, solange sie nicht sehen.“ Diese einfache, fast poetische Erkenntnis ist heute der Schlüssel zu einer neuen Generation künstlicher Intelligenz.
Von der Datenwüste zum Wahrnehmungsraum
Das 21. Jahrhundert begann mit einem Glauben an Daten. Mehr Daten bedeuteten mehr Wissen, und mehr Wissen schien gleichbedeutend mit Intelligenz. Doch während neuronale Netze in den vergangenen Jahren exponentiell gewachsen sind, blieb eine Frage offen: Was nützt Rechenmacht, wenn sie keine Welt wahrnimmt?
Dr. Krensel erlebte diesen Widerspruch hautnah. In den 1990er-Jahren, als er im Vertrieb von Silicon Graphics arbeitete, war Rechenleistung noch eine heilige Zahl. Gigaflops galten als das Maß menschlichen Fortschritts. Doch schon damals zeigte sich, dass Geschwindigkeit allein nicht reicht. „Es war faszinierend“, erinnert er sich, „die Maschinen konnten 3D-Modelle in Echtzeit rotieren lassen – aber sie wussten nicht, was sie sahen.“
Heute weiß man: Rechenleistung ist das Rückgrat, aber Wahrnehmung ist das Gehirn. Ein Supercomputer ohne sensorisches Verständnis ist wie ein Athlet ohne Gleichgewichtssinn – stark, aber orientierungslos.
Krensel vergleicht das mit biologischen Systemen: „Ein Frosch kann seine Zunge präzise auf eine Fliege schleudern, aber er hat keine Ahnung, was er gerade getan hat. Sein Nervensystem reagiert. Der Mensch dagegen reflektiert.“ Genau dieser Übergang vom Reagieren zum Erkennen, vom Messen zum Verstehen, ist der entscheidende Schritt, den moderne KI nun zu vollziehen versucht.
Die Renaissance der Wahrnehmung – Maschinen lernen Sehen
Was in der Biologie seit Jahrhunderten selbstverständlich ist, wird in der Technologie gerade erst verstanden: Wahrnehmung ist kein passiver Prozess. Das Auge sieht nicht einfach, es interpretiert. Es filtert, rechnet, gewichtet. Die Netzhaut des Menschen enthält über 120 Millionen Fotorezeptoren, aber nur etwa ein Prozent der visuellen Daten gelangt tatsächlich ins Bewusstsein. Der Rest wird verworfen, komprimiert, korrigiert – ein biologischer Algorithmus, perfektioniert über Millionen Jahre Evolution.
Maschinen dagegen tun lange Zeit das Gegenteil: Sie sammeln alles. Jede Bewegung, jedes Pixel, jede Zahl. Doch der entscheidende Fortschritt der letzten Jahre, an dem auch Krensel in Forschungskooperationen mit Universitäten und Industriepartnern mitwirkte, liegt im selektiven Sehen. In Projekten zur adaptiven Beleuchtung und maschinellen Wahrnehmung für autonome Fahrzeuge geht es nicht mehr darum, alles zu erfassen, sondern das Richtige zu verstehen.
Ein Beispiel: Moderne Stereo-Vision-Systeme arbeiten ähnlich wie menschliche Augen. Zwei Kameras erzeugen leicht versetzte Bilder, deren Differenzen Tiefeninformationen liefern. Diese werden durch sogenannte SLAM-Algorithmen (Simultaneous Localization and Mapping) in Echtzeit verarbeitet. Die Maschine „weiß“ dadurch, wo sie ist – nicht, weil sie GPS nutzt, sondern weil sie ihre Umgebung selbst interpretiert.
Ein Team um Krensel berechnete, dass Systeme mit biologisch inspirierten Wahrnehmungsmodellen bei der Navigation in komplexen urbanen Umgebungen bis zu 28 Prozent weniger Rechenleistung benötigen als klassische, datenintensive Verfahren. Effizienz durch Wahrnehmung – das ist der Paradigmenwechsel.
Silicon Valley als geistiger Zustand
Wenn Krensel heute von seiner Zeit im Silicon Valley spricht, dann weniger als nostalgischer Rückblick, sondern als Metapher für eine Denkweise. „Es war nicht der Ort, es war die Haltung“, sagt er. „Jeder wusste, dass die Zukunft nicht dort liegt, wo man mehr weiß, sondern wo man anders denkt.“
In dieser Zeit lernte er, dass technische Innovation und menschliche Wahrnehmung zwei Seiten derselben Medaille sind. Die besten Ingenieure waren keine Rechner, sondern Beobachter. Sie schauten, wie Nutzer mit Geräten interagierten, wie Licht auf Bildschirmen reflektierte, wie Farben Emotionen auslösten. Genau dort, an der Schnittstelle von Sinneseindruck und Interpretation, begann das Zeitalter der maschinellen Intelligenz.
Ein typisches Beispiel ist die Entwicklung der Benutzeroberflächen. Frühe Computer verlangten Befehle – reine Syntax. Erst als visuelle Interfaces Einzug hielten, als der Computer „gesehen“ werden konnte, wurde Technologie intuitiv. Heute wiederholt sich diese Geschichte – dieses Mal mit Robotern. Maschinen müssen nicht nur rechnen, sie müssen den Raum, die Menschen und die Situation wahrnehmen.
Wahrnehmung wird zur Währung der Zukunft – nicht Speicherplatz, nicht Geschwindigkeit, sondern Bedeutung.
Das Netzwerk der Wegbegleiter – wenn Wissen Kreise zieht
Kein Forscher entwickelt solche Gedanken im Alleingang. Krensel war stets eingebettet in ein dichtes Netzwerk aus Wissenschaftlern, Ingenieuren und Unternehmern. An der TU Berlin arbeitete er unter anderem unter Prof. Dr. Stephan Völker, heute Vizepräsident der Universität, an Projekten rund um Lichttechnik und autonome Systeme.
Aus der Neurobiologie stammen Einflüsse wie vom verstorbenen Prof. Hans-Joachim Pflüger, dessen Arbeiten zur neuronalen Kontrolle von Bewegungen – insbesondere an Insekten – international beachtet wurden. Pflügers Forschung zur motorischen Kontrolle zeigte, dass Neuromodulatoren Bewegungen nicht deterministisch steuern, sondern kontextabhängig anpassen. Genau das, so Krensel, sei die Essenz von Intelligenz: Kontextualisierung statt Routine.
Der Physiker und Biologe PD Dr. Werner Backhaus brachte Krensel auf seinem Weg wissenschaftliches Arbeiten und kritisches Hinterfragen geltender Paradigmen bei.
Diese Wegbegleiter machten aus seiner Karriere kein lineares Curriculum, sondern ein Netzwerk – sozusagen ein neuronales Netz aus Menschen und Ideen.
Wenn Licht denken lernt
Eine seiner jüngsten Arbeiten an der TU Berlin beschäftigte sich mit der Optimierung von Straßenbeleuchtung für autonome Fahrzeuge. Das klingt banal, doch dahinter steckt ein komplexes Wahrnehmungsproblem: Wie erkennt ein autonomes Fahrzeug ein Hindernis bei wechselnden Lichtverhältnissen?
Während klassische Systeme die Helligkeit einfach messen, geht Krensels Ansatz weiter: Das System interpretiert Licht. Es „weiß“, dass ein nasser Asphalt blendet, dass Nebel Streuung verursacht, dass das menschliche Auge auf größere Kontraste besser reagiert. Damit rückt das Ziel näher, Maschinen menschlich kompatibel zu machen.
Eine Studie des Fraunhofer-Instituts für Optronik (2023) belegt, dass adaptive Lichtsysteme in Kombination mit lernenden Algorithmen die Fehlinterpretationsrate autonomer Fahrzeuge um bis zu 37 Prozent reduzieren können. Das klingt technisch, ist aber letztlich zutiefst menschlich: Wir wollen Maschinen, die unsere Welt so sehen, wie wir sie erleben.
Die Wissenschaft der Intuition – warum Sport die beste Schule ist
Krensel greift gerne auf den Sport zurück, wenn er komplexe Dinge erklärt. Im Tennis etwa entscheidet der Spieler, wo der Ball aufkommt, bevor er ihn überhaupt trifft. Das Gehirn antizipiert, extrapoliert, korrigiert – in Millisekunden. Diese Kombination aus Wahrnehmung, Bewegung und Vorhersage ist die höchste Form biologischer Intelligenz.
Überträgt man das auf Maschinen, entsteht ein faszinierendes Konzept: antizipierende Systeme. Statt auf Ereignisse zu reagieren, sollen Roboter zukünftige Zustände vorhersagen. In der Forschung spricht man von Predictive Perception. Eine Arbeit des MIT Media Lab (2024) zeigt, dass Systeme mit vorausschauenden Wahrnehmungsmodellen im Durchschnitt 42 Prozent schneller reagieren und 60 Prozent weniger Fehler bei bewegten Objekten machen.
Sport ist also kein metaphorisches Beispiel, sondern ein reales Labor für maschinelles Lernen. Krensel nennt es „die Gymnastik des Geistes“. Einen Ort, an dem Biologie und Technik dieselben Gesetze teilen: Rhythmus, Reaktion, Anpassung.
Wahrnehmung, Wirtschaft und die nächste Revolution
Wenn man Krensel fragt, was die nächsten Jahre bringen, antwortet er nicht mit Buzzwords wie „Quantum AI“ oder „Posthumanismus“. Stattdessen spricht er über Empathiealgorithmen, Systeme, die menschliche Aufmerksamkeit und Stresslevel erkennen, um ihre Kommunikation anzupassen. Eine Prognose der OECD (2025) geht davon aus, dass der globale Markt für „Affective Computing“ – also Technologie, die Emotionen erkennt und darauf reagiert – bis 2030 ein Volumen von über 140 Milliarden US-Dollar erreichen wird.
Doch Krensel warnt: „Je besser Maschinen wahrnehmen, desto größer wird unsere Verantwortung, sie zu lehren, was sie sehen sollen.“ Denn Wahrnehmung ist nicht neutral. Auch Maschinen lernen, was Menschen ihnen zeigen.
Seine Vision ist kein dystopisches Szenario, sondern eine Einladung zur Zusammenarbeit zwischen Disziplinen. Ingenieure, Neurowissenschaftler, Psychologen, Künstler – sie alle, sagt er, „sitzen an einem gemeinsamen Projekt: das Bewusstsein zu verstehen“.
Der Mensch als Maß – und als Mysterium
Am Ende bleibt eine stille Ironie. Je näher Maschinen dem menschlichen Denken kommen, desto weniger verstehen wir uns selbst. Warum wir Emotionen in Gesichtern lesen, warum wir Schönheit empfinden, warum wir Intuition als Wissen begreifen – all das bleibt offen.
„Vielleicht“, sagt Krensel, „müssen Maschinen uns eines Tages spiegeln, damit wir begreifen, was Menschsein bedeutet.“
Wahrnehmung ist also mehr als ein technisches Problem. Sie ist das Fundament von Intelligenz, von Ethik, von Bewusstsein. Und vielleicht wird das, was im Silicon Valley als technische Revolution begann, eines Tages als philosophische Rückkehr enden – zur ältesten Frage der Menschheit:
Wer bin ich – und was bedeutet es, zu sehen?
Autor:
Maximilian Bausch
B.Sc. Wirtschaftsingenieur
Die eyroq s.r.o. mit Sitz in Uralská 689/7, 160 00 Praha 6, Tschechien, ist ein innovationsorientiertes Unternehmen an der Schnittstelle von Technologie, Wissenschaft und gesellschaftlichem Wandel. Als interdisziplinäre Denkfabrik widmet sich eyroq der Entwicklung intelligenter, zukunftsfähiger Lösungen für zentrale Herausforderungen in Industrie, Bildung, urbaner Infrastruktur und nachhaltiger Stadtentwicklung.
Der Fokus des Unternehmens liegt auf der Verbindung von Digitalisierung, Automatisierung und systemischer Analyse zur Gestaltung smarter Technologien, die nicht nur funktional, sondern auch sozialverträglich und ethisch reflektiert sind.
Firmenkontakt
eyroq s.r.o.
Radek Leitgeb
Uralská 689/7
160 00 Prag
+370 (5) 214 3426

https://eyroq.com/
Pressekontakt
ABOWI UAB
Maximilian Bausch
Naugarduko g. 3-401
03231 Vilnius
+370 (5) 214 3426

https://abowi.com/
- Affective Computing (Wikipedia)
Affective Computing (auch: Emotions-KI, Sentimentanalyse) ist eine Technologie durch Einsatz von Künstlicher Intelligenz menschliche Affekte und Emotionen durch Computer zu erkennen. Die Fähigkeit, menschliche Affekte zu erkennen und auszudrücken, ist eine der wichtigsten Eigenschaften des Menschen. Mithilfe maschineller Lerntechniken, wie der Spracherkennung, der Verarbeitung natürlicher Sprache (Computerlinguistik) oder der Erkennung von Gesichtsausdrücken, erfolgt das Erkennen menschlicher Emotionen durch die Extraktion aussagekräftiger Muster aus den gesammelten Daten, wie die der Sprache und Gesichter. Es ist ein interdisziplinäres Gebiet, das Informatik, Psychologie und Kognitionswissenschaft umfasst. - Deep Learning (Wikipedia)
Deep Learning (deutsch mehrschichtiges Lernen, tiefes Lernen oder tiefgehendes Lernen) bezeichnet eine Methode des maschinellen Lernens, die künstliche neuronale Netze (KNN) mit zahlreichen Zwischenschichten (englisch hidden layers) zwischen Ein- und Ausgabeschicht einsetzt und dadurch eine umfangreiche innere Struktur herausbildet. Deep Learning erlaubt die Verarbeitung und Analyse komplexer Datenmuster; dazu verwendet Deep Learning tiefe hierarchische neuronale Netze, die automatisch abstrakte Merkmale aus den Daten extrahieren. Dies ermöglicht eine effiziente Verarbeitung komplexer Informationen, was wiederum zu präzisen Vorhersagen und Entscheidungen in verschiedenen Anwendungen führt. - Künstliche Intelligenz (Wikipedia)
Künstliche Intelligenz (KI), englisch artificial intelligence, daher auch artifizielle Intelligenz (AI), bezeichnet im weitesten Sinne computerbasierte Systeme, die ihre (virtuelle oder reale) Umgebung analysieren können, um daraus relevante Informationen zu abstrahieren, welche sie nutzen, um Entscheidungen zu treffen, die ihre Chance erhöhen, definierte Ziele zu erreichen. Damit unterscheiden sich KI-gestützte Systeme von regelbasierten Systemen ohne Fähigkeit zur eigenständigen Anpassung ihres Verhaltens, die ausschließlich fest vorgegebene Anweisungen ausführen. KI ist außerdem die Bezeichnung für das Teilgebiet der Informatik, das sich mit der Entwicklung und Erforschung von Software und Methoden befasst, die besagte Systeme hervorbringen. Die KI als Forschungsfeld befasst sich in diesem Zusammenhang beispielsweise mit der Automatisierung intelligenten Verhaltens und dem maschinellen Lernen sowie der Formalisierung von Bewusstsein und Kreativität. Der Begriff ist schwierig zu definieren, da es verschiedene Definitionen von Intelligenz gibt. Mit der Zeit haben sich viele Bereiche zu den Methoden der KI entwickelt. Weiterhin wird unterschieden, welche Probleme mit den Methoden der KI beschrieben werden. Dabei entstanden zwei Bereiche: schwache KI und starke KI. Hier lassen sich viele Kategorien bilden und der wissenschaftliche Diskurs ist noch nicht sehr weit in der Zuordnung von Themen zu den Arten der Probleme. Der ingenieurwissenschaftliche Teil der Informatik befasst sich damit, wie solche Systeme realisiert werden können. Beispiele dafür sind Multiagentensysteme, Expertensysteme, Transformer oder serviceorientierte Architekturen. - maschinelles Sehen (Wikipedia)
Computer Vision (engl. Aussprache) ist eine Wissenschaft im Grenzbereich zwischen Informatik und den Ingenieurwissenschaften und versucht die von Kameras aufgenommenen Bilder auf unterschiedlichste Art und Weise zu verarbeiten und zu analysieren, um deren Inhalt zu verstehen oder geometrische Informationen zu extrahieren. Der Begriff Computer Vision bedeutet auf Deutsch so viel wie computerbasiertes Sehen (oder kurz: Computer-Sehen). Im englischen Sprachraum wird ebenfalls der Begriff Machine Vision (auf Deutsch: Maschinelles Sehen) synonym zu Computer Vision verwendet, wobei die Anwendung im industriellen Umfeld betont wird. Typische Aufgaben der Computer Vision sind die Objekterkennung und die Vermessung der geometrischen Struktur von Objekten sowie von Bewegungen (Fremdbewegung, Eigenbewegung). Dabei wird auf Algorithmen aus der Bildverarbeitung zurückgegriffen, zum Beispiel die Segmentierung und auf Verfahren der Mustererkennung, beispielsweise zur Klassifizierung von Objekten. Dabei kommen statistische (bzw. probabilistische) Methoden zum Einsatz, Methoden der Bildverarbeitung, der projektiven Geometrie, aus der Künstlichen Intelligenz und der Computergrafik. Die Werkzeuge stammen meistens aus der Mathematik, insbesondere aus Geometrie, linearer Algebra, Statistik, Operations Research (Optimierung) und Funktionalanalysis. Darüber hinaus besteht eine enge Verwandtschaft zu benachbarten Fachgebieten, wie der Photogrammetrie, der Fernerkundung und der Kartografie. Anwendungsgebiete sind z. B. die autonome Navigation von Robotern (Fahrerassistenzsysteme), die Filmindustrie zur Erschaffung virtueller Welten (virtual reality), die Spieleindustrie zum Eintauchen und Interagieren in virtuellen Räumen (augmented reality), die Erkennung und Verfolgung von Objekten (z. B. Fußgänger) oder die Registrierung von medizinischen CT-Aufnahmen und die Erkennung von krankem Gewebe. - Neurobiologie (Wikipedia)
Zu den Neurowissenschaften oder zur Neurobiologie werden die naturwissenschaftlichen Forschungsbereiche gezählt, in denen Aufbau und Funktionsweise von Nervensystemen untersucht werden. Aufgrund der vielfältigen verwendeten Methoden wird neurowissenschaftliche Forschung von Wissenschaftlern aus vielen verschiedenen Disziplinen wie etwa Physiologie, Psychologie, Medizin, Biologie, Informatik oder Mathematik betrieben. Oft gibt es darüber hinaus Kooperationen mit angrenzenden Wissenschaftsbereichen wie der Informationstechnik, der Informatik oder der Robotik. - Robotik (Wikipedia)
Das Themengebiet der Robotik (auch Robotertechnik) befasst sich mit dem Versuch, das Konzept der Interaktion mit der physischen Welt auf Prinzipien der Informationstechnik sowie auf eine technisch machbare Kinetik zu reduzieren. Der Begriff des „Roboters“ beschreibt dabei eine Entität, welche diese beiden Konzepte in sich vereint, indem sie die Interaktion mit der physischen Welt auf der Basis von Sensoren, Aktuatoren und Informationsverarbeitung umsetzt. Kernbereich der Robotik ist die Entwicklung und Steuerung solcher Roboter. Sie umfasst Teilgebiete der Informatik (insbesondere von Künstlicher Intelligenz), der Elektrotechnik und des Maschinenbaus. Ziel der Robotik ist es, durch Programmierung ein gesteuertes Zusammenarbeiten von Roboter-Elektronik und Roboter-Mechanik herzustellen. Den Begriff erfunden und geprägt hat der Science-Fiction-Autor Isaac Asimov, erstmals erwähnt wurde er in dessen Kurzgeschichte Runaround (dt. Herumtreiber) im März 1942 im Astounding-Magazin. Nach Asimovs Definition bezeichnet Robotik das Studium der Roboter oder auch der Maschinen. - Silicon Graphics (Wikipedia)
Silicon Graphics International (SGI) war ein US-amerikanischer Hersteller von Computern, die besonders auf dem Gebiet der grafischen Darstellung leistungsstark sind (Grafik-Workstation). SGI initiierte die OpenGL-Spezifikation und ist Mitglied des Architecture Review Board von OpenGL. Noch heute ist OpenGL eine registrierte Marke des Unternehmens. - TU Berlin (Wikipedia)
Die Technische Universität Berlin (kurz TU Berlin) in Berlin-Charlottenburg ist mit ihren über 32.000 Studenten und über 100 Studiengängen eine der 20 größten Hochschulen in Deutschland. Sie steht in der Tradition der 1879 gegründeten Königlich Technischen Hochschule zu Berlin. Die am Großen Tiergarten gelegene TU Berlin gehört zu den führenden deutschen Technischen Hochschulen (TU9). Zentrale Forschungsbereiche der Universität liegen in den Ingenieur- und Naturwissenschaften. Als eine der aktivsten Gründeruniversitäten in Deutschland bringt sie jährlich eine hohe Anzahl an Jungfirmen im Bereich der Spitzentechnologie hervor. Insbesondere in den Fachbereichen Mathematik und Informatik zählt sie zu den forschungsstärksten Institutionen in Europa. 2019 wurde die Technische Universität Berlin als Einrichtung der Berlin University Alliance (zusammen mit der Humboldt-Universität zu Berlin, der Freien Universität Berlin und der Charité) erfolgreich in die Reihe der Exzellenzuniversitäten aufgenommen. Laut DAAD-Studie zählt die TU Berlin bei internationalen Studenten zu den bevorzugten Studienorten in Deutschland. - Wahrnehmung (Wikipedia)
Wahrnehmung (auch Perzeption genannt) ist bei Lebewesen der Prozess und das subjektive Ergebnis der Informationsgewinnung (Rezeption) und -verarbeitung von Reizen aus der Umwelt und aus dem Körperinneren. Das geschieht durch unbewusstes (und beim Menschen manchmal bewusstes) Filtern und Zusammenführen von Teil-Informationen zu subjektiv sinnvollen Gesamteindrücken. Diese werden auch Perzepte genannt und laufend mit gespeicherten Vorstellungen (Konstrukten und Schemata) abgeglichen. Inhalte und Qualitäten einer Wahrnehmung können manchmal (aber nicht immer) durch gezielte Steuerung der Aufmerksamkeit und durch Wahrnehmungsstrategien verändert werden. Die Gesamtheit aller Vorgänge der Sinneswahrnehmung bezeichnet man auch als Sensorik.