Eine Welt aus Daten
Geschrieben am 20.12.2016 von HNF
Ende 1984 begannen der amerikanische Informatiker Douglas Lenat und einige Mitarbeiter, formalisierte englische Sätze in eine Datenbank einzutragen. Das Ziel war dabei eine umfassende Beschreibung der Welt, die wir um uns haben. Das Projekt trug den Namen Cyc; es endete im Frühjahr 2016. Die gesammelten sprachlichen Daten stehen seitdem für eine kommerzielle Nutzung zur Verfügung.
In unserem Blog schilderten wir schon mehrmals die Künstliche Intelligenz, abgekürzt KI. Dieses Teilgebiet der Informatik widmet sich Aufgaben, die über reines Rechnen hinausgehen, etwa dem Spielen von Schach oder Go, dem Übersetzen von fremdsprachigen Texten oder dem Lenken von Autos im fließenden Verkehr. Das Fach ist auch als Artificial Intelligence oder AI bekannt.
Das längste und ehrgeizigste Projekt der Künstlichen Intelligenz war Cyc, gesprochen „Saik“ mit scharfem S. Der Name leitete sich aus Cyclopaedia ab. So hieß das erste enzyklopädische Lexikon in englischer Sprache; es erschien 1728. Cyc startete Ende 1984 und endete ohne große Medienresonanz im Frühjahr 2016. Die Resultate, die in den gut 31 Jahren Laufzeit anfielen, gingen aber nicht verloren. Sie sollen nun gegen Geld für die unterschiedlichsten Anwendungen genutzt werden.
Der Vater von Cyc ist der Amerikaner Douglas Lenat. Geboren 1950 in Philadelphia, studierte er Mathematik und Physik an der Universität von Pennsylvania. Den Doktor machte er 1976 an der kalifornischen Stanford University. Er schrieb ein Programm, das selbsttätig mathematische Zusammenhänge aufspürte. Sein Doktorvater war der prominente KI-Forscher Edward Feigenbaum. Anschließend lehrte Lenat Informatik an der Carnegie Mellon University in Pittsburgh sowie in Stanford.
In der zweiten Hälfte des Jahres 1984 wechselte Douglas Lenat nach Austin in Texas. Hier arbeitete seit 1982 die Microelectronics and Computer Technology Corporation MCC, ein Forschungsverbund, der von amerikanischen Computer- und Chipfirmen finanziert wurde. Er sollte der damals als gefährlich angesehenen japanischen IT-Industrie Paroli bieten. Leiter des Konsortiums war der frühere NSA-Direktor Bobby Inman. Lenat bezog ein Büro im MCC-Gebäude und begann mit Cyc.
Das Projekt erstellte eine sprachliche und logisch organisierte Datenbank. Lenat dachte dabei nicht nur an umfangreiche Listen von Wörtern und Sätzen, sondern auch an die Bedeutung der Ausdrücke und Aussagen. Sie sollten sämtliche Aspekte des täglichen Lebens erfassen, das menschliche Denken und Handeln wie den grundsätzlichen Aufbau der belebten und unbelebten Welt. Ein besonderes Augenmerk richtete Lenat auf implizite Annahmen, die bei vielen Beschreibungen vielleicht mitgedacht, aber niemals ausgesprochen werden.
Der Datenbank wurden – die Sätze stammen von Douglas Lenat – etwa folgende Tatsachen mitgeteilt: (1) Man muss wach sein, um etwas zu essen. (2) Man kann in der Regel die Nase eines Menschen sehen, doch nicht sein Herz. (3) Von zwei Berufen ist der eine ein Spezialfall des anderen, oder sie sind voneinander unabhängig. (4) Man kann sich nur an etwas erinnern, das zuvor passierte. (5) Teilt man ein Stück Butter, erhält man zwei Stück Butter; teilt man einen Tisch, hat man nicht zwei Tische.
Um solche Inhalte abzuspeichern, entwickelten Douglas Lenat und sein Mitarbeiter Ramanathan Guha eine Datenbanksprache namens CycL. Sie basiert auf der Prädikatenlogik, liest sich aber wie rudimentäres Englisch. Aus CycL-Aussagen kann man logische Schlüsse ziehen. Thematisch verwandte Aussagen bilden sogenannte Mikrotheorien. Die einzelnen Statements wurden von Wissenssammlern eingegeben, den „knowledge enterers“. Am Schluss des Projekts enthielt die Cyc-Datenbank mehr als sieben Millionen Sätze mit über 630.000 Begriffen.
Wie erwähnt, begann die Arbeit an Cyc 1984 im MCC-Verbund. Zehn Jahre später gründete Lenat die Firma Cycorp und führte sein Projekt eigenständig weiter. 2008 startete in der texanischen Stadt das IT-Unternehmen Lucid. Michael Stewart, sein Gründer und Leiter, und Douglas Lenat kannten sich aus der Zeit, als beide in der MCC tätig waren. Sie beschlossen, Cyc nach der Fertigstellung auf den Markt zu bringen. Im Frühjahr 2016 stellte Lucid die kommerzielle Version der Datenbank vor. Hier steht mehr dazu, und hier spricht Douglas Lenat selbst über Computer mit gesundem Menschenverstand.