Das „schmutzige Geheimnis“ der Gesichtserkennung
15. März 2019Einerseits scheint es so, als wäre Gesichtserkennung sehr nützlich: man kann sich zum Beispiel in sein Smartphone einloggen, Verkehrsrowdys schnappen und flüchtende Kriminelle in Menschenmengen verfolgen. Dennoch ist diese Technologie nicht perfekt, ja, sie ist auch umstritten. Sehr häufig scheiterte sie, wenn es darum ging, Schwarze eindeutig zu identifizieren. Damit sich diese Technik weiter verbessert, werden Millionen von Fotos benötigt. Doch woher nehmen und das aus einem Datenschatz, der das Recht am eigenen Foto nicht verletzt?
Eine bevorzugte Quelle ist das Internet. Dort werden ohne Wissen der Betroffenen , die ihre Fotos während vieler Jahre irgendwohin gepostet haben ohne sich abzusichern, was mit diesen Fotos geschieht, Millionen Abbilder herausgefischt, kategorisiert nach Alter, Geschlecht, Hautton und Dutzenden anderer Metriken und – wenn es höchstwahrscheinlich ohne Folgen bleibt – mit Forschern an Universitäten „geteilt“.
Zwar werden die Algorithmen immer besser und sorgen dafür, das Menschen mit dunkler Hautfarbe schon viel besser erkannt werden. Dennoch schlagen Juristen und Anwälte für Bürgerrechte Alarm, wenn Forscher Fotos von gewöhnlichen Menschen verwenden. Ihre Warnung lautet zusammen gefaßt: Die Gesichter dieser Menschen werden ohne ihre Zustimmung verwendet, um eine Technologie anzutreiben, die letztendlich dazu verwendet werden könnte, ihnen zu schaden. „Dies ist das schmutzige kleine Geheimnis von KI-Trainingssets. Die Forscher greifen oft nur die Bilder heraus, die in der freien Natur verfügbar sind “, sagte Jason Schultz, Professor der NYU School of Law gegenüber NBC News, der Nachrichtensparte des amerikanischen Fernsehsenders.
NBC berichtet auch, das IBM im Januar eine Sammlung von fast einer Million Fotos veröffentlichte, die von der Foto-Hosting-Site Flickr aufgenommen und für das Erscheinungsbild der Personen codiert wurden. IBM hat die Sammlung den Forschern als fortschrittlichen Schritt zur Verringerung der Voreingenommenheit bei der Gesichtserkennung vorgestellt.
Einige Fotografen, deren Bilder in den Datensatz von IBM aufgenommen wurden, waren jedoch überrascht und beunruhigt, als NBC ihnen mitteilte, dass ihre Fotos mit Details wie Gesichtsgeometrie und Hautton versehen wurden und zur Entwicklung von Gesichtserkennungsalgorithmen verwendet werden könnten. „Keiner der Leute, die ich fotografiert habe, wusste, dass ihre Bilder auf diese Weise verwendet wurden“, sagte Greg Peverill-Conti, ein in Boston ansässiger PR-Manager, der mehr als 700 Fotos in der IBM-Sammlung hat, die als „Trainingsdatensatz“ bezeichnet werden. ”
John Smith, der die KI-Forschung bei IBM betreut, sagte, das Unternehmen habe sich verpflichtet, „die Privatsphäre von Einzelpersonen zu schützen“ und „mit allen zusammenarbeiten, die eine URL aus dem Datensatz verlangen.“
Trotz der Zusicherung von IBM, dass Flickr-Benutzer die Datenbank deaktivieren können, stellte NBC News fest, dass es fast unmöglich ist, Fotos entfernt zu bekommen. IBM verlangt von Fotografen, dass sie Links zu Fotos senden, die entfernt werden sollen. Das Unternehmen hat jedoch die Liste der Flickr-Benutzer und Fotos, die im Datensatz enthalten sind, nicht öffentlich freigegeben. Daher ist es nicht einfach, herauszufinden, welche Fotos enthalten sind. IBM habe auf Fragen zu diesem Prozess nicht geantwortet, so NBC News.