Wikipedia in Maschinenschrift


Foto: Wikimedia/Robertolyra/Lizenz: CC BY-SA 3.0
Foto: Wikimedia/Robertolyra/Lizenz: CC BY-SA 3.0
Weil die Wikipedia an ihre Grenzen stößt, sollen Computerprogramme das Online-Lexikon weiterschreiben. Das ändert unseren Zugang zu Wissen grundlegend.

Von Anton Weste | Technology Review

Stellen Sie sich eine Welt vor, in der das gesamte Wissen der Menschheit jedem frei zugänglich ist. Das ist unser Ziel!“ Die Vision von Wikipedia-Gründer Jimmy Wales hat eine Online-Enzyklopädie hervorgebracht, die über 40 Millionen Artikel in fast 300 Sprachen umfasst. Eine gewaltige Erfolgsgeschichte.

Allerdings nur dann, wenn man die richtige Sprache spricht: Bengali beispielsweise ist die Muttersprache von über 215 Millionen Menschen, doch die bengalische Wikipedia weist gerade einmal 42000 Artikel auf – weniger als ein Hundertstel der Artikel in der englischen Wikipedia. Und das ist nicht das einzige Beispiel. Über die Hälfte der Wiki-Sprachversionen besitzt weniger als zehn aktive Autoren und zeigt ein entsprechend rudimentäres Angebot.

Weil das Wikipedia-Projekt nicht genügend Freiwillige findet, soll jetzt Software das Versprechen vom universellen, freien Zugang zu Wissen einlösen. Das Ziel: Programme, die Wikipedia-Artikel bei Bedarf in allen möglichen Sprachen vollautomatisch aus einer Datenbank heraus generieren können. „Die Automatisierung ist die einzige Möglichkeit, um 300 Sprachversionen der Wikipedia aktuell zu halten“, sagt der Informatiker und Ontologe Denny Vrandečić, Gründer der Datenplattform Wikidata. In der von Wikimedia Deutschland gestarteten Datenbank sind Fakten und Daten für Wikipedia-Artikel in sämtlichen verfügbaren Sprachen zentral gespeichert – in einer maschinenlesbaren und sprachunabhängigen Form.

weiterlesen