Es gibt Fälle, da instrumentalisieren große IT-Unternehmen Milliarden von Computernutzern, um für sich Arbeit zu leisten. Die Arbeit besteht dabei zumeist aus sogenannten „micro tasks“. Die Abarbeitung derselben erfolgt ohne Entlohnung und häufig ohne Wissen der Betroffenen. Ein Beispiel, an welchem sich dies veranschaulichen lässt, ist der Dienst reCAPTCHA von Google. Zum Einsatz kommen reCAPTCHA etwa dann, wenn man sich bei Onlinediensten anmelden oder Onlineformulare ausfüllen will. Hierbei stoßt man früher oder später auf eine Eingabemaske, in welcher verzerrte Buchstaben erkannt, Straßen- oder Hausschilder korrekt identifiziert oder andere Abbildungen indexiert werden müssen. Die reCAPTCHA dienen der Abwehr von Bots, da die gestellten Miniaufgaben in der Regel nicht automatisiert von Computern gelöst werden können. Dies ist zumindest der vorgeschobene Grund. Faktisch jedoch dienen reCAPTCHA primär dazu, Computern dabei zu helfen, nicht eindeutig erkennbare Buchstaben, Hausnummern oder Straßennahmen aus dem Google Books Projekt sowie Google Street View digital zu erfassen. Somit wirken zahllose Mediennutzer, indem sie reCAPTCHA lösen, an der Verbesserung von Text- und Bilderkennungssoftware mit. Und dies zumeist, ohne es zu wissen.
Dieses Prinzip jedoch, dass Mediennutzer unwissend und ohne Entlohnung eine geringfügige Arbeitsleistung erbringen, welche anschließend in akkumulierter Form zur Verbesserung von Software verwendet wird, kommt in einem Bereich ganz entscheidend zum Tragen – nämlich bei der Entwicklung von künstlicher Intelligenz. Wenn von KI gesprochen wird, wird meistens auch über Automatisierung, autonome Maschinen, Computerentscheidungen etc. gesprochen. Dies erweckt den Eindruck, als wären Computer selbstständig tätig, als bräuchten sie lediglich einige Programmierer, die sozusagen den „Anstoß“ geben. Doch weit gefehlt. Die Anmutung von Autonomie und Eigenständigkeit, welche der Begriff der künstlichen Intelligenz andeutet, leitet fehl. Tatsächlich wären signifikante Teile des aktuellen Booms rund um künstliche Intelligenz undenkbar ohne den massenhaften Beitrag von Millionen und Milliarden von Mediennutzern. Erst sie machen künstliche Intelligenz kollektiv zu dem, was sie ist. Sie macht dies, indem sie ihre Maus bewegen, Links anklicken, Scrollen, Suchmaschinen benutzen, Kurzvideos auf Instagram posten, Wikipedia-Artikel ergänzen, Produktbewertungen schreiben, Tweets absetzen, Fotos in Clouds laden, Fitnessarmbänder nutzen und vieles mehr. Alle diese Aktivitäten werden verwendet, um Datensätze zu generieren, anhand derer Lernalgorithmen trainiert werden können, welche wiederum die Basis für künstliche Intelligenz bilden. Die Datensätze können dabei handschriftliche Zeichen, Gesichtsabbildungen, Nachrichtentexte, Radioaufzeichnungen, Gesundheitsdaten und vieles mehr enthalten. Die am häufigsten eingesetzten Formen künstliche Intelligenz benötigen solche großen Datensätze, also „Big Data“, um überhaupt funktionieren zu können.
Die „Datenarbeit“ bedeutet für Mediennutzer meistens nur einen geringen Aufwand. Daher kommen Menschen eher selten auf die Idee, eine Entschädigung zu fordern, wenn sie ein kurzes Handyvideo auf YouTube hochladen, Kartendaten durch eigene GPS-Daten verbessern, Körperdaten preisgeben oder unfreiwillig an einem A/B-Test mitwirken. Gerade letztere sind zum Synonym geworden für die intransparente Nutzung des Internets als behaviorelles Großlabor. Bei A/B-Tests werden zwei Versionen eines Nachrichtentextes, einer Werbeanzeige, eines Webseitendesigns etc. an jeweils getrennte Nutzergruppen ausgegeben. So kann gemessen werden, welche Version eher gelesen, angeklickt oder flüssiger benutzt wird. Die Nutzer bekommen dabei nicht mit, dass das, was sie im Browser sehen, bei anderen Nutzern vielleicht ganz anders aussieht. Durch ein umfassendes Tracking des jeweiligen Nutzerverhaltens kann letztlich nahezu jede Interaktion im Netz aufgezeichnet und mit Lernalgorithmen analysiert werden. Künstliche Intelligenz wird durch ihre Angewiesenheit auf ein solches Tracking zu einem Spiegel menschlicher Verhaltensmuster.
Unabhängig davon ist entscheidend, dass es eine Veränderung der Art, wie IT-Unternehmen Gewinne machen, gibt. In den letzten zehn bis fünfzehn Jahren lag der Fokus vieler Unternehmen primär darauf, möglichst viele Daten zu sammeln, um Marketing und Datenhandel zu betreiben. In Zukunft jedoch werden die größten Gewinne diejenigen Firmen einfahren, welche die besten KI-Systeme besitzen. Man hat es demnach mit einer paradoxen Situation zu tun. Auf der einen Seite besteht eine große Furcht vor den Risiken künstlicher Intelligenz, sei es aufgrund drohender Massenarbeitslosigkeit, algorithmischer Diskriminierung, automatisierter Propaganda und vielem mehr. Dennoch sind zahllose Mediennutzer es, die die „Datenarbeit“ leisten, anhand derer die Kreierung künstlich intelligenter Anwendungen überhaupt erst möglich wird. Kurz gesagt: Die Mediennutzer erzeugen selbst die Maschinen, die sie eigentlich fürchten.
In diesem Zusammenhang gilt es, insbesondere die ökonomischen Umstände der gegenwärtigen Situation kritisch zu bedenken. Der Einsatz von künstlicher Intelligenz ist ein wachsendes Multimilliardengeschäft. Doch das Geld landet nicht bei denen, die konstitutiv sind für die Entwicklung von KI. Paradigmatisch dafür steht eine von Google stammende App namens Crowdsourcing. Die App zeigt unter anderem Handschrift, Fotos oder Übersetzungen an, wobei die Nutzer Buchstaben oder Motive identifizieren sowie Übersetzungen verbessern sollen. Google wirbt im PlayStore für die App mit folgenden Worten: „Alle Aufgaben sind in fünf bis zehn Sekunden erledigt. Warum also nicht ein paar davon machen, wenn Sie das nächste Mal in der Schlange stehen oder mit der Bahn nach Hause fahren?“ Belohnt wird das Lösen jener „micro tasks“ durch Pokale oder Levelaufstiege.
Doch es gibt Alternativen, die durch Plattformen und Firmen wie Amazons Mechanical Turk, Mighy AI, Clickworker, Microworker, Upwork, Zhubajie, Freelancer, Taskcn, Figure Eight, Samasource und vielen weiteren bereitgestellt werden. Schätzungen zufolge arbeiten 100 Millionen Menschen als registrierte „clickworker“ auf jenen Plattformen. Auf ihnen werden ebenfalls verschiedenste „human intelligence tasks“ oder kurz HITs angeboten, die durch Menschen gelöst werden können und der Verbesserung von künstlicher Intelligenz dienen. So wurde beispielsweise die bekannte Bilddatenbank ImageNet entwickelt. Diese besteht aus unzähligen Bildern, welche händisch indexiert worden sind. Die Indexierung ist entscheidend, damit Muster und Regelmäßigkeiten erkannt werden und funktionierende KI-Modelle entstehen können. Die Bilddatenbank begründete vor einigen Jahren den Erfolg des Deep Learning, einer Methode, welche heute im Zentrum des KI-Booms steht. Beim Labeln von Bildern oder anderen Kleinstaufgaben auf der Mechanical Turk Plattform oder bei anderen Diensten verdienen die zurecht so genannten „clickworker“ kleinste Geldbeträge, die durch diejenigen Organisationen zur Verfügung gestellt werden, welche auch die HITs ausgeben. Zumindest dem Prinzip nach findet so eine Entlohnung statt, wenngleich eine sehr geringe. Folglich findet das „clickworking“ häufig in Entwicklungsländern statt, wie etwa in den Slums von Nairobi, wo Klickarbeiter unwissend für das Militärprojekt „Maven“ Satellitenbilder labelten. Die Klickarbeit wird also entweder gänzlich unbezahlt oder von „Billigarbeitern“ ausgeführt. Nicht verschwiegen werden soll dabei, dass es auch den Ansatz gibt, Flüchtlingen durch das Labeln von Datensätzen zu einem geringen Einkommen zu verhelfen. So stellt etwa die Non-Profit-Organisation Refunite mit LevelApp eine Anwendung zur Verfügung, mit der Menschen, die ein Smartphone besitzen, bis zu 20 Dollar am Tag zu verdienen können.
In vielen Fällen ist unbekannt, wer für die Erstellung händischer Label verantwortlich ist. So etwa bei einem zu Google gehörigen Datensatz mit der Bezeichnung „JFT“, der mehrere Hundert Millionen Bilder umfasst, die mit über zehntausend verschiedenen Labels indexiert sind. Sicher ist nur, dass Nutzer von Google-Produkten daran mitgewirkt haben. So ist es Google möglich, leistungsstarke Bilderkennungssoftware anzubieten. Gleiches strebt auch Facebook an. So werden Nutzer der eigenen Plattform beispielsweise dazu aufgefordert, Personen, die auf Fotos abgebildet sind, mit einem Namens-Label zu versehen. Durch dieses „Tagging“ kann Facebook sukzessive seine Gesichtserkennungssoftware optimieren. Chinesische KI-Firmen gehen noch einen deutlichen Schritt weiter. Sie lassen gleich ganze Heerschafen an schlecht bezahlten Arbeitern in fabrikartigen Hallen Bilder, Videos, Audiospuren etc. labeln. China wird, so ist zu vermuten, den Wettstreit um die beste KI gegen die amerikanischen Unternehmen nicht nur deshalb gewinnen, weil sie mengenmäßig über die meisten Daten verfügen. China wird gewinnen, weil das Land die geringsten Skrupel hat, Menschen als „clickworker“ zur Daten-Indexierung auszubeuten. Subtile Methoden wie Label-Anwendungen a la Crowdsourcing oder reCAPTCHA sind da weit weniger effektiv als chinesische Datenfabriken.
Die Intelligenz der Maschinen ist in Wahrheit eine Akkumulation von durch Menschen gelösten kognitiven Kleinstaufgaben. Aus der Ausbeutung der damit verbundenen Arbeitskraft, die im Einzelnen klein, in der Summe jedoch gewaltig ist, entstehen die Geschäftsmodelle, mit denen jetzt und in Zukunft Milliarden umgesetzt werden. Massen an Mediennutzern werden als Daten-Geber, Daten-Indexierer oder schlicht Daten-Arbeiter in die Entwicklungsschleifen der künstlichen Intelligenz eingebunden, nicht aber als Empfänger einer gerechten Entlohnung für ihre Mühen. Und weil diese Massen am ehesten den einschlägigen Plattformunternehmen wie Google, Facebook, Alibaba oder Tencent zur Verfügung stehen, können diese auch die leistungsstärksten und damit zugleich nützlichsten und gefährlichsten KIs entwickeln.
Was den heutzutage erfolgreichsten IT-Unternehmen gelungen ist, ist, das kapitalistische Verwertungsgeschehen auf undurchsichtige und nicht-entlohnte Datenproduktions- und Indexierungsarbeiten auszudehnen. Wie aber kann die Arbeit, durch die künstliche Intelligenz erst entstehen kann, entlohnt werden? Schwierig ist eine zeitliche Bemessung der Arbeit, ganz zu schweigen von der spezifischen Zuordnung von Wertigkeiten. Datenarbeit kann nicht mit Lohnarbeit gleichgesetzt werden. Gleichzeitig kann ein ausreichend gerechter Ausgleich nicht darin bestehen, dass Menschen lediglich mit den Vorteilen der Assistenz- und Dienstfunktionen der Plattformen, deren Nutzer und Unterstützer sie sind, „ausgezahlt“ werden. Ein besserer Ansatz läge vielmehr darin, sich von der Vorstellung zu distanzieren, Daten seien das neue „Öl“. Daten sind kein Rohstoff, welcher lediglich abgebaut werden muss. Daten sind, wie auch der berühmte Internettheoretiker Jaron Lanier immer wieder betont, Arbeit. Und als solche sollten sie behandelt werden. So wäre beispielsweise denkbar, dass Unternehmen, welche durch massenhafte „Datenarbeit“ gewinnbringende KI-Systeme entwickeln können, dazu verpflichtet werden, gewisse Abgaben zu leisten. Diese könnten wiederum der Gemeinwohlförderung zukommen, also etwa dem Ausbau digitaler Infrastrukturen, der Medienbildung oder anderen kulturellen Projekten. Umso größer also die monetären Vorteile ausfallen, welche durch KI-Anwendungen erzielt werden, desto größer ist auch die Verantwortung der jeweils involvierten Firmen, ihrerseits etwas zurückzuzahlen an all jene, denen sie ihren eigenen Erfolg verdanken.