Deep Learning, Neuronale Netze, Reinforcement Learning: Diese Worte sind in aller Munde, wenn es um Künstliche Intelligenzen (KI) geht. Dabei handelt es sich um Algorithmen, die es zulassen, dass eine Maschine „lernt“. Die Konstruktion einer KI beginnt allerdings schon viel früher. Noch bevor man sich überhaupt Gedanken zu passenden Algorithmen machen kann, müssen einige andere Punkte geklärt werden, denn KI-Systeme brauchen viel mehr als nur ausgefeilte Algorithmen.

daten – auf quantität und qualität kommt es an

Ein Mensch lernt im Laufe seines ganzen Lebens. Möchte ein Mensch beispielsweise Autofahren lernen, so macht er den Führerschein innerhalb weniger Wochen. Dies ist aber nicht alles, auch die (in Deutschland) mindestens knapp 17 Jahre Lebenserfahrung sind wichtig für das Erlernen. Dazu gehören Dinge wie: Was ist eine Ampel, ein Zebrastreifen, wie verhalte ich mich selbst als Fußgänger, als Radfahrer? Wie spiegelt sich das Licht in nassem Asphalt? Wie sieht meine Umgebung aus, wenn die Sonne blendet?

So viel Zeit hat eine Künstliche Intelligenz aber in der Regel nicht. Sie muss innerhalb weniger Monate/Jahre alles lernen, was relevant für ihre Aufgabe (zum Beispiel Auto fahren) ist. Es muss also Vorarbeit geleistet werden. Ein Mensch, der bereits weiß, welche Informationen relevant für diese Aufgabe sind, muss Daten zusammenstellen oder Übungssituationen simulieren, damit die Künstliche Intelligenz schnell alles lernen kann. Und hier fängt die Arbeit an.

Wenn dann die relevanten Informationen für eine Aufgabe identifiziert wurden, müssen dafür Daten in ausreichender Menge und Qualität zur Verfügung gestellt werden. Die Daten müssen sowohl die Information beinhalten, die die KI später zur Verfügung hat, wie z.B. Videoaufnahmen aus dem Cockpit, als auch Informationen über das richtige Handeln in jedem Moment: z.B. „Bremsen“, wenn ein Kind auf die Straße rennt, „Nicht bremsen“, wenn ein Schatten über die Straße wandert. Wo kommen diese Daten her? Wurden bereits zu einem anderen Zweck ausreichend Daten mit den benötigten Informationen zusammengetragen oder müssen erst einmal Daten gesammelt werden? Wer bewertet, ob die Reaktionen des Menschen in den vorhandenen Daten richtig war? Müssen möglicherweise Daten simuliert werden? Diese Fragen müssen alle geklärt sein, bevor es an die weitere Planung eines KI-Systems geht.

Sind die Daten gesammelt und annotiert, also mit dem richtigen Verhalten zu jedem Zeitpunkt getaggt, geht es um die Aufbereitung für den später verwendeten Algorithmus. Hier muss man sich zum ersten Mal richtig Gedanken über den eingesetzten Algorithmus machen. Bei sehr einfachen, klassischen Machine Learning Algorithmen müssen die vorliegenden Daten zuerst aufwändig von Fachexperten in Merkmalsvektoren umgewandelt werden. Bei komplexeren Algorithmen, wie Deep Learning, ist das nicht notwendig. Hier kann das Videomaterial direkt als Input verwendet werden, zusammen mit Angaben zu den Zeitpunkten, in denen eine Aktion (z.B. Bremsen) geschehen soll. Dann müssen die Daten nur normalisiert werden. Das ist einer der Gründe, warum bei komplexen Aufgabenstellungen wie autonomem Fahren, Deep Learning verwendet wird.

mozottad
mozottad
Abbildung: Input-Daten für Deep Learning

Es zeigt sich, dass schon bevor der echte ML-Algorithmus für eine KI zum Einsatz kommt, schon einiges an Vorarbeit geleistet werden muss. Je nach Komplexität des Anwendungsfalls und bereits vorhandenen Daten kann dies bereits mehrere Jahre in Anspruch nehmen.

Es ist deshalb essentiell, sich bereits in der frühesten Phase eines KI-Projekts Gedanken über benötigte Daten und mögliche Quellen zu machen.

datenschutz und KI – ein widerspruch?

Unbestritten, die Nutzung von KI kann gewinnbringend in der Ausgestaltung von Prozessen eingesetzt werden und dabei maßgeblich zur Prozessoptimierung beitragen. Da KI-Systeme Unmengen an Daten verarbeiten, die in vielen Fällen auch personenbezogene Daten enthalten, ergeben sich Risiken für die Rechte der betroffenen Personen, deren Daten von KI-Systemen automatisiert verarbeitet werden. Daher müssen das Thema Datenschutz und die Regelungen der Datenschutz-Grundverordnung frühzeitig in der Planung eines KI-Projektes betrachtet werden. Sollen für eine Fahrerunterstützung im Fahrzeug Videoaufnahmen aus dem Cockpit verwendet werden, ist zu beachten, dass darauf Personen zu sehen sein werden. Sollen Kontobewegungen eines Kunden durch ein KI-System überwacht werden, handelt es sich dabei auch um personenbezogene Daten, auch wenn die berechneten Auswertungen nur für den Kunden gedacht sind. 

Sollen personenbezogene Daten vom KI-System verarbeitet werden, muss hierfür zunächst geprüft werden, ob eine Rechtmäßigkeit der Verarbeitung im Sinne von Artikel 6 DSGVO gegeben ist bzw. wie diese erreicht werden kann – ggf. muss z.B. das Einverständnis der betroffenen Personen (z.B. des Bank-Kunden) eingeholt werden. Wichtig ist aber auch, die Betroffenenrechte im Sinne von Artikel 3 der DS-GVO abzusichern und zu klären, wo die Daten verarbeitet und gespeichert werden dürfen (nur auf lokalen Rechnern, in der Cloud, etc.). In jedem Fall ist es ratsam, sich einen Datenschutz-Experten zur Hand zu nehmen und mit ihm alle relevanten Themen im Vorfeld abzuklären.

Immer dort wo es möglich ist, müssen personenbezogene Daten anonymisiert werden. Beispielsweise im Videomaterial aus dem Cockpit ist es nicht wichtig, die Personen am Straßenrand zu identifizieren, es ist nur wichtig, sie als Person wahrzunehmen, um im Notfall für sie zu bremsen.  Eine Anonymisierung kann hier dadurch erreicht werden, dass die Gesichter der Personen im Videomaterial automatisch verpixelt werden, bevor diese gespeichert oder verarbeitet werden. 

Wenn man sich mit einem geplanten KI-System im Anwendungsbereich der DSGVO bewegt, wird i.d.R. die Durchführung einer Datenschutz-Folgenabschätzung (Art. 35 DSGVO) erforderlich sein. Dabei bringt es die konsequente Anwendung dieses Instruments mit sich, dass datenschutzrechtliche Aspekte bereits in der Planungsphase eines KI-Projekts berücksichtigt werden können. Auch hier ist es ratsam, einen Datenschutz-Experten zu Hilfe zu nehmen, um so die vermeintlichen Widersprüche, welche die Anforderungen aus dem Datenschutz und die gewünschten Funktionalitäten des geplanten KI-Systems mit sich bringen, durch geeignete Maßnahmen aufzulösen.

ethik und recht – vertrauen ist gut, kontrolle ist besser

Auch ethische und rechtliche Aspekte müssen in der Planung eines KI-Projekts beachtet werden. Welche Auswirkungen haben Entscheidungen der KI und vor Allem welche Auswirkungen haben Fehlentscheidungen der KI, die trotz ausgefeilter Algorithmen immer auftauchen werden. Können die Auswirkungen einer Fehlentscheidung hingenommen werden? Wie niedrig muss der Anteil an Fehlentscheidungen sein, damit ein KI-System nach Entwicklung und Tests überhaupt zum Einsatz kommt? Wer haftet für die Fehler, die eine KI macht?

Ein sehr bildlicher Fall ist da das autonome Fahren. Trifft die KI eine Fehlentscheidung stehen unter Umständen viele Menschenleben auf dem Spiel. Ab welcher Performanz der KI kann dieses Risiko eingegangen werden? Kann es überhaupt eingegangen werden? Ab welcher Performanz ist das Vertrauen in eine KI höher als in einen menschlichen Fahrer? Wer trägt die Schuld an einem Unfall, der von einer KI verursacht oder auch nur nicht verhindert wurde?

Aber es gibt auch andere KI-Systeme, bei denen die Fehlentscheidungen nicht so offensichtlich festgestellt werden können. Ein interessantes Thema ist hier das automatische Scannen und Aussortieren von Bewerbungen. Hier muss sichergestellt werden, dass Bewerber anhand ihrer Qualifikationen für die ausgeschriebene Stelle aussortiert werden. Es kann schnell passieren, dass das Modell eine voreingenommene Tendenz beinhaltet, beispielsweise Männer für Führungspositionen bevorzugt, da in den Trainingsdaten kaum Frauen in Führungspositionen vorhanden waren. Oder beim Predictive Policing, der automatischen Vorhersage von Verbrechen, könnten Personen anhand ihres Äußeren zu Verbrechern abgestempelt werden, weil dies statistisch gesehen wahrscheinlicher ist. Es ist ratsam bei solchen Entscheidungen ein KI-System immer noch durch menschliche Mitarbeiter zu kontrollieren. Denn eine KI kann nicht unterscheiden, ob ein Merkmal zu einem bestimmten Verhalten führt oder nur zufällig häufig gemeinsam mit einem Verhalten auftritt.

Außerdem können Entscheidungen, die von KIs getroffen wurden, nicht begründet nachvollzogen werden. Wenn ein autonomes Fahrzeug grundlos bremst und dadurch einen Unfall auslöst, kann nicht festgestellt werden warum gebremst wurde. Das ist auch im Bankenumfeld relevant, wo Entscheidungen nachvollziehbar sein müssen. Es muss daher vor der Entwicklung einer KI abgeklärt werden, inwiefern sie die ethischen und rechtlichen Vorgaben der Aufgabenstellung überhaupt erfüllen kann.

Diese Herausforderungen werden auch in der Politik immer relevanter. Anfang 2020 veröffentlichte die Europäische Kommission ein Weißbuch zur Künstlichen Intelligenz mit Maßnahmen und politischen Handlungsoptionen beim Umgang mit KI. In einer Stellungnahme dazu lobt die Bundesrepublik Deutschland den Ansatz und spricht sich dafür aus, die Entwicklung von KIs zu überwachen aber gleichzeitig neue Innovationen voranzubringen.

Nachdem die Entwicklung von KI-Systemen mittlerweile längst nicht mehr neu ist, wird es Zeit den Fokus nicht mehr nur auf die Technik und ausgefeilte Algorithmen zu setzen, sondern auch die hier genannten Aspekte ernst zu nehmen und mit einzubeziehen, damit die entwickelten Systeme nicht in einem Forschungslabor verstauben, sondern auch wirklich zum Einsatz kommen können und uns alle in unserem Alltag unterstützen.