KI in Afrika: Hey Alexa – sprichst du IGBO?

KI in Afrika: Hey Alexa – sprichst du IGBO?

1. Mai 2020 0 Von Horst Buchwald

KI in Afrika: Hey Alexa – sprichst du IGBO?

 

London, 1.4.2020

 

Bonaventure Dossou hat viel darüber nachgedacht, wie die Telefongespräche mit seiner Mutter verbessert werden können. Sie schickt ihm oft Sprachnachrichten in Fon, einer beninischen Sprache, da er gerade in Russland studiert. Er versteht jedoch einige der von ihr verwendeten Ausdrücke nicht. „Meine Mutter kann Fon nicht schreiben, und ich spreche die Sprache nicht sehr gut, aber ich spreche fließend Französisch“, sagte Herr Dossou gegenüber der BBC. „Ich bitte meine Schwester häufig, mir zu helfen, einige der von meiner Mutter verwendeten Ausdrücke zu verstehen“, sagte er.

 

Fon-Sätze auf Englisch

Nùkócé nɔn yìnMein Name ist

Oun yìn wàn nouwé Ich liebe dich

Ouh fɔn gangjiI geht es gut

NùnùɖùFood

Quelle: Bonaventura Dossou

Eine Verbesserung seiner Fon durch Studium kommt nicht in Frage, da sie wie Hunderte anderer afrikanischer Sprachen meist gesprochen und selten dokumentiert wird, so dass es, wenn überhaupt, nur wenige Bücher zur Vermittlung der Grammatik und Syntax gibt.

Angetrieben von Neugierde und angetrieben von Daten, die aus einer Fon in eine französische Bibel der Zeugen Jehovas integriert wurden, entwickelten Herr Dossou und Chris Emezue, ein nigerianischer Freund, ein Sprachübersetzungsmodell der Künstlichen Intelligenz (KI), ähnlich wie Google Translate, das sie FFR genannt haben. Es ist noch in Arbeit.

Die beiden Studenten gehören zu mehreren KI-Forschern, die afrikanische Sprachen in Natural Language Processing (NLP) verwenden, einem Zweig der KI, der dazu dient, Computer beim Verstehen menschlicher Sprachen zu unterrichten und zu unterstützen.

Wäre die Welt nach der Covid-19-Pandemie nicht zum Stillstand gekommen, hätten Herr Dossou und Herr Emezue ihre Schöpfung diese Woche Hunderten von Teilnehmern auf einer der weltweit grössten KI-Konferenzen, der ICLR, in Äthiopiens Hauptstadt Addis Abeba vorgestellt.

Es wäre das erste Mal gewesen, dass die Veranstaltung in Afrika stattgefunden hätte.

Anstatt die Veranstaltung abzusagen, beschlossen die Organisatoren, sie virtuell abzuhalten.

KI-Innovationen wurden als treibende Kraft der so genannten vierten industriellen Revolution hervorgehoben, die radikale Veränderungen in fast jedem Aspekt unseres Lebens, einschließlich unserer Arbeitsweise, mit sich bringen wird.

Gegenwärtig gilt Afrika als Verlierer bei der Gestaltung der KI-Zukunft, da die Mehrheit der schätzungsweise 2.000 Sprachen des Kontinents als „ressourcenarm“ eingestuft wird, was bedeutet, dass es einen Mangel an Daten über sie gibt und/oder dass das, was verfügbar ist, nicht indiziert und in Formaten gespeichert wurde, die nützlich sein können.

 

Das war ein schwerer Schlag

 

Afrikanische Sprachen werden bei der Erstellung von NLP-Anwendungen wie Sprachassistenten, Bilderkennungssoftware, Verkehrswarnsystemen und anderen nicht berücksichtigt.

Doch afrikanische Forscher arbeiten daran, dieses Handicap zu beseitigen.

„Wir konzentrieren uns darauf, Afrika auf die Landkarte der NLP- und KI-Forschung zu setzen“, sagte Dr. Ignatius Ezeani von der Universität Lancaster gegenüber der BBC.

„Solange Sie Ihre Sprachressourcen nicht öffentlich, frei und offen zur Verfügung haben, werden die Forscher nicht im Handumdrehen über die Daten für kreative Lösungen verfügen. Wir werden uns immer auf, sagen wir, Google verlassen müssen, um die Richtung der Forschung zu bestimmen“, sagte Dr. Ezeani.

Die Konferenz in Äthiopien sollte eine große Sache für afrikanische Forscher sein, denen unter anderem Visa für die Teilnahme an früheren IKLR-Konferenzen in den USA und Kanada verweigert wurden, wodurch sie von globalen KI-Gesprächen ausgeschlossen sind.

„Die Konferenz nicht in Addis stattfinden zu lassen, war ein schwerer Schlag, es hätte eine massive Veränderung in der Vielfalt der Konferenz bedeutet“, sagte Jade Abbott, Gründerin von Masakhane, einer Forschungsbewegung für maschinelle Übersetzung für afrikanische Sprachen, gegenüber der BBC.

 

Meistens fangen wir bei Null an

 

Masakhane, was in isiZulu „Wir bauen zusammen“ bedeutet, hat 150 Mitglieder in 20 afrikanischen Ländern. Die Mitgliedschaft steht allen offen, die an Sprachübersetzung interessiert sind.

„Wir bauen eine Gemeinschaft von Menschen auf, denen die afrikanischen Sprachen am Herzen liegen und die daran interessiert sind, Übersetzungsmodelle aufzubauen. 30% der Sprachen der Welt sind afrikanisch, warum haben wir also nicht 30% der NLP-Publikationen? fragte Frau Abbott.

Das Netzwerk konzentriert sich auf die Förderung der Sprachübersetzung von Afrikanern für Afrikaner durch Afrikaner und ermutigt zum offenen Austausch von Ressourcen und zur Zusammenarbeit, damit die Forscher auf der Arbeit der anderen aufbauen können.

Meistens bedeutet es jedoch, bei Null anzufangen. Eine mit Masakhane verbundene Forscherin beispielsweise sammelt derzeit Daten von Sprechern der Damara, einer Khoisan-Sprache – berühmt für ihren Klickton – in Namibia, sagte Frau Abbott. Bislang hätten Masakhane-Angehörige 35 Übersetzungen in 25 afrikanische Sprachen angefertigt, fügte sie hinzu.

 

Neben Masakhane gibt es noch andere Initiativen, die die Netzwerke von KI-Forschern auf dem Kontinent aufbauen und stärken:

– Deep Learning Indaba, die KI in Afrika fördert und eine jährliche Konferenz abhält

– Data Science Africa, die die Forscher des Kontinents verbindet

– BlackinAI, eine Initiative, die die Einbeziehung von Schwarzen in den Bereich der künstlichen Intelligenz fördert

Dr. Ezeani nennt sie „stille Kämpfe“ von Afrikanern, die im Bereich der KI arbeiten.

Er sieht diese Engagements als Beitrag zur Erweiterung der Kapazitäten des Kontinents, sowohl in Bezug auf den Aufbau der KI-Infrastruktur als auch auf die Fähigkeiten von Forschern und Entwicklern. „Dies ist nicht nur für die Anerkennung, sondern auch für die tatsächliche Bewältigung unserer lokalen Herausforderungen, z.B. in den Bereichen Gesundheit, Landwirtschaft, Bildung und Regierungsführung, mit hausgemachten und zielgerichteten Lösungen unerlässlich“, sagte er. „Vielleicht können wir irgendwann auch die Verantwortung übernehmen und die Erzählung kontrollieren“, fügte er hinzu.

Hey Alexa, sprichst du Igbo?

Dr. Ezeani arbeitet derzeit an einer maschinellen Übersetzung der nigerianischen Igbo-Sprache ins Englische. „In fünf bis zehn Jahren, denke ich, werde ich in der Lage sein, mit Alexa in Igbo oder in jeder beliebigen Minderheitensprache zu interagieren, was eine große und erfüllende Leistung sein wird“, sagte Dr. Ezeani.

Gegenwärtig unterstützen weder Alexa von Amazon, noch Siri von Apple oder Google Home, die Hauptakteure auf dem globalen Markt für Sprachassistenten, eine einzige afrikanische Muttersprache. Google Translate ist für 13 afrikanische Sprachen, einschließlich Igbo, aktiviert, aber es ist bei weitem nicht perfekt.

Dr. Ezeani sagte, dass die Arbeit, die er und andere leisten, Technologieunternehmen dazu verleiten könnte, afrikanische Sprachen in ihre Geräte zu integrieren. Er warnt jedoch davor, dass afrikanische Forscher, die auf dem Gebiet der KI arbeiten, sich von originellen Ideen leiten lassen sollten, „die für die Menschen tatsächlich nützlich sind“, und keine Eitelkeitsprojekte verfolgen sollten. „Wir können prüfen, ob z.B. eine Übersetzung von Igbo nach Yoruba und umgekehrt tatsächlich nützlicher ist als eine Übersetzung von Igbo ins Englische, oder ob Sprach- oder visuelle Systeme mehr erforderlich sind als Text-zu-Text“, sagte er.

Was Herrn Dossou und seinen Mitschöpfer, Herrn Emezue, betrifft, so haben sie große Ambitionen für den FFR, wenn sie die Finanzierung sichern können. Sie sehen Fon, eine Bantu-Sprache, die von mehr als zwei Millionen Menschen in Benin, aber auch in Teilen von Nigeria und Togo gesprochen wird, als Hilfe für die Ausweitung ihrer Arbeit auf andere Märkte.

Fon ist Teil der Niger-Kongo-Sprachfamilie, d.h. sie hat eine gemeinsame Abstammungslinie mit Sprachen, die in Teilen des westlichen, zentralen, östlichen und südlichen Afrikas gesprochen werden. Vorerst liegt ihr Schwerpunkt jedoch darauf, FFR weiter zu schulen, damit sie die tägliche Konversation besser übersetzen können. „Vielleicht werden im nächsten Jahr oder so die Botschaften meiner Mutter in Fon in französische Texte übersetzt“, sagte Herr Dossou.