Ein Computer lernt Russisch
Geschrieben am 05.01.2024 von HNF
Eine Maschine, die fremde Sprachen kennt, ist ein alter Traum der Technik. Am 7. Januar 1954 wurde er in der New Yorker IBM-Zentrale im Ansatz erfüllt. Ein dort befindlicher Elektronenrechner vom Typ IBM 701 übertrug rund sechzig Sätze aus dem Russischen ins Englische. Das Grundkonzept des Programms stammte von zwei Wissenschaftlern der Georgetown-Universität in Washington.
„Sprachwissenschaftler des […] Institutes of Language and Linguistics in Georgetown haben Anfang des Jahres zum ersten Mal erfolgreich den Versuch unternommen, den Bau einer Übersetzungsmaschine in zunächst noch ganz kleinem Maßstab zu verwirklichen. Diese Aufgabe ist so schwierig, dass sie bereits für das Versuchsmodell eine der größten und schnellsten existierenden elektronischen Rechenmaschinen, eine IBM 701 der International Business Machines Corporation, heran ziehen mußten.“
Das schrieb der Computerpionier Heinz Billing in Heft 20/1954 des Magazins „Umschau in Wissenschaft und Technik“. Er schilderte eine Veranstaltung der Firma IBM in ihrer Zentrale in New York. Im Erdgeschoss stand eine IBM 701, auch bekannt als Defense Calculator. Es war der erste Computer, den IBM auf den Markt brachte. Am 7. Januar 1954 lud IBM die Presse ein, und die Journalisten sahen, dass er mehr konnte als das Land zu verteidigen. Er druckte russische Sätze, die man per Lochkarte eingab, korrekt übersetzt auf Englisch aus.
Schon Jahrzehnte vorher träumten Erfinder von mechanischen Wörterbüchern. Am 28. Oktober 1922 meldeten Jürgen Claussen und Otto Rostock – beide kamen aus Elmshorn – eine Übersetzungsmaschine zum Patent an. Sie erhielten es am 17. Februar 1927, danach erschienen weitere Patente in England, Frankreich und Österreich. Von Otto Rostock wissen wir, dass er eine Margarinefabrik besaß und am 18. November 1952 im Alter von 76 Jahren starb. Seine Villa gibt es noch. Zu Jürgen Claussen ist außer Patenten nichts bekannt.
Andere Apparate erdachten der Italiener Federico Pucci, der Russe Peter Trojanskij und der Armenier Georges Artsrouni; über die beiden letzten steht hier etwas mehr. Artsrouni baute ein funktionierendes Modell seiner Erfindung und zeigte es 1937 auf der Weltausstellung von Paris, es gelangte später ins Depot des Musée des Arts et Métiers. Aktenmäßig fassbar ist der Franzose Victor Sorin. Er meldete 1947 eine „Maschine für die Übersetzung lebender Sprachen“ zum Patent an, das ihm 1948 erteilt wurde.
Die moderne Forschung zur maschinellen Übersetzung begann am 15. Juli 1949. An jenem Tag verfasste der amerikanische Mathematiker Warren Weaver ein Memorandum mit dem Titel Translation; er schickte es an Kollegen, bei denen er ein Interesse für das Thema vermutete. Weaver wurde 1894 in Wisconsin geboren und studierte Mathematik. Ab 1920 lehrte er das Fach an der Universität des US-Bundesstaates. Von 1932 bis 1955, unterbrochen durch den Zweiten Weltkrieg, leitete er die Wissenschaftsabteilung der Rockefeller-Stiftung. Er starb 1978 in Connecticut.
In seinem Memorandum schlug Warren Weaver den Einsatz von Elektronenrechnern für die Sprachübersetzung vor. Er wies ebenso auf Probleme hin, die man dabei lösen müsste, etwa die Mehrdeutigkeit von Worten. Weaver dachte schon an das Übersetzen von Sätzen und längeren Texten. Seine Überlegungen regten einige Wissenschaftler zu Aktivitäten an, und im Juni 1952 fand im Massachusetts Institute of Technology eine Konferenz zur „Mechanical Translation“ statt. Hier geht es zu den Referaten.
Ein Konferenzteilnehmer war Léon Dostert. Er war Jahrgang 1904 und stammte aus Longwy in Nordfrankreich. 1921 kam er in die USA, blieb und studierte. Ab den frühen 1930er-Jahren unterrichtete er Sprachen an der Georgetown-Universität in Washington; damals lernte er auch IBM-Chef Thomas Watson kennen. Im Krieg war Dostert der Dolmetscher von General Eisenhower. 1945 und 1946 stand er dem Dolmetscher-Team beim Nürnberger Prozess vor; hier führte er die Simultan-Übersetzung ein. Die nötige Schaltungstechnik lieferte IBM. Danach wurde er Direktor des sprachwissenschaftlichen Instituts in Georgetown.
Die Tagung des MIT begeisterte Léon Dostert, worauf er sich an seinen Bekannten Thomas Watson wandte. Der beauftragte den IBM-Manager Cuthbert Hurd und Dostert mit einem Projekt, um die Realisierbarkeit von Computer-Übersetzungen zu beweisen. Dritter im Bunde war der tschechisch-amerikanische Linguist Paul Garvin, der gleichfalls an der Hochschule von Georgetown lehrte. Programmierhilfe leistete der Mathematiker Peter Sheridan. Von Anfang an stand fest, dass der Computer russische Aussagen bearbeiten würde.
Präsentiert wurde das Programm, wie erwähnt, vor siebzig Jahren. Léon Dostert und Paul Garvin verfassten etwa sechzig Sätze, die teils chemische Technik und teils allgemeine Themen behandelten, und ließen sie vom Elektronengehirn ins Englische übersetzen. Zwei Beispiele auf Deutsch: „Die Qualität der Kohle wird durch den Brennwert bestimmt“ und „Wir übertragen Gedanken durch Sprache“ Das ist ein Artikel zur Vorführung aus dem Jahr 2006; hier findet sich die IBM-Pressemitteilung vom 8. Januar 1954. Dieses Foto zeigt Hurd, Dostert und Watson – er steht ganz rechts – einen Tag vorher am Drucker.
Die Medien waren vom Rechner im IBM-Haus höchst angetan, die Wochenschau feierte das latest electronic marvel. Fachleute erwarteten schnelle Fortschritte auf dem Feld der digitalen Übersetzung. Es dauerte aber länger als gedacht, bis Computer wirklich gute Kenntnisse von Fremdsprachen erwarben. Den Durchbruch brachte erst in unseren Tagen das maschinelle Lernen. Léon Dostert hat es nicht mehr erlebt, er starb am 1. September 1971 während einer Reise in Bukarest. In dieser Wochenschau vom Nürnberger Prozess erleben wir ihn noch einmal in Aktion, bitte zu Minute 8:10 vorgehen.