Hallo Siri! So lernte das Smartphone sprechen
Geschrieben am 04.10.2021 von HNF
Smartphones gibt es seit 1996, reden können sie erst seit zehn Jahren. Am 4. Oktober 2011 stellte die Firma Apple am Stammsitz Cupertino das iPhone 4S vor. Das große S stand für Siri, den mitgelieferten Sprachassistenten mit Künstlicher Intelligenz. Hinter der Stimme von Siri steckte aber eine Frau, die Sängerin und professionelle Sprecherin Susan Bennett.
Die Sprechmaschine ist ein alter Traum der Informatik. Eine der ersten baute in den 1780er-Jahren Wolfgang von Kempelen, der Schöpfer des Schachtürken. Thomas Edison erfand ein Jahrhundert später eine Puppe mit einem Phonographen. Seine Laute wurden von einer Frau eingesprochen. 1933 startete das Pariser Observatorium eine anrufbare Zeitansage; die Worte kamen von kurzen Tonfilmen. In den 1950er-Jahren wurden für den gleichen Zweck Magnettonbänder benutzt.
1966 beschrieb der Informatiker Joseph Weizenbaum den Chatbot Eliza, der ein neues Forschungsfeld der Künstlichen Intelligenz eröffnete. Es widmete sich dem Verstehen von Sätzen, dem Führen von Dialogen und der Sprachübersetzung. Deutsche Pioniere waren Walther von Hahn und Wolfgang Wahlster. In den 1990er-Jahren boten Personal Computer Programme zur Spracherkennung an. 2007 stellte Steve Jobs das iPhone von Apple vor; 2009 erschien die Version iPhone 3GS. Sie verstand mehrere gesprochene Kommandos und gab auch kurze Rückmeldungen.
Am 4. Oktober 2011 enthüllte Apple-Marketing-Chef Philip Schiller das iPhone 4S. Ort der Präsentation war die Firmenzentrale im kalifornischen Cupertino. Die Stimmung im Saal war gedämpft. Man wusste, dass Steve Jobs sterbenskrank war; er sollte den nächsten Tag nicht überleben. Schiller konzentrierte sich auf sein Produkt; wie das Video zeigt, erläuterte er den A5-Chip mit schnellen Grafiken, die acht Stunden Telefonzeit, die beiden Antennen, die Acht-Megapixel-Kamera mit fünf Linsen und hochaufgelösten Filmen sowie den Anschluss des Smartphones an den Fernseher.
Bei Minute 19:30 des Videos brachte Philip Schiller die letzte Attraktion – Siri. Sie war das große S im Namen des Produkts. Die Software war ein Sprachassistent; er machte das iPhone 4S intelligent und dialogfähig. Der Benutzer konnte ihm Fragen stellen, zum Beispiel über das Wetter oder nach der Uhrzeit; es antwortete eine sympathische Frauenstimme. Im Unterschied zum Typ 3GS wusste Siri mehr als einige ausgesuchte Worte. Sie verstand unterschiedliche Formulierungen einer Frage und schien Wortbedeutungen zu erkennen.
Siri war keine Schöpfung von Apple, sondern kam aus der Firma gleichen Namens. Die Siri Inc. wurde im Dezember 2007 in Kalifornien gegründet; sie ging aus einem KI-Projekt des Forschungsinstitut SRI International hervor. Für die Vorgeschichte verweisen wir auf einen Artikel der Huffington Post von 2013. Hier sehen wir Dag Kittlaus, einen der Siri-Gründer, im Jahr 2009 am iPhone. Im Februar 2010 tauchte die Urversion von Siri im App Store von Apple auf; dieses Video zeigt ihre Fähigkeiten. Am 26. Februar 2010 erschien im Internet eine positive Kritik mit Details.
Die Applikation war stumm, sie konnte aber gesprochene Sprache aufnehmen und in Daten umsetzen. Dafür sorgte eine Software der Firma Nuance Communications. Im April 2010 übernahm Apple die Siri Inc.; in den Monaten danach lernte Siri sprechen. Der zugehörige Programmteil stammte ebenfalls von Nuance. Sein Output wurde nicht synthetisch erzeugt, sondern durch Konkatenation. So nennen die Experten das Zusammenfügen von Worten und Wortreihen, die ein Mensch produzierte, zu neuen sinnvollen Sätzen.
Damit kommt Susan Bennett ins Spiel. Sie wurde am 31. Juli 1949 als Susan Cameron in Burlington im US-Bundesstaat Vermont geboren. Sie studierte fürs Lehramt; daneben machte sie Musik, sang und spielte Theater. Nach dem Ende des Studiums zog sie nach Atlanta. Ab 1974 arbeitete sie als „voice artist“ und sprach unzählige Texte für Werbespots, Informationsdienste und Computerprogramme. Den Juli 2005 verbrachte sie mit dem Ablesen von mehr oder weniger sinnfreien Passagen für eine akustische Datenbank.
Der Auftraggeber war die Firma ScanSoft, die auf den KI-Pionier Ray Kurzweil zurückgeht. Ab 2005 nannte sie sich Nuance Communications – es ist das oben erwähnte Unternehmen. Als es die Stimme des iPhone 4S lieferte, steckte darin das von Susan Bennett aufgenommene Wortmaterial. Apple hat diese Tatsache jahrelang verschwiegen. Die Sprecherin erfuhr davon durch einen Bekannten, der das neue Smartphone benutzt hatte. Wahrscheinlich wollte Apple die Beiträge von Nuance und der Siri Inc. nicht an die große Glocke hängen.
Mittlerweile haben sich Susan Bennetts Verdienste herumgesprochen, und wir empfehlen ihren tollen Vortrag aus dem Jahre 2016. Sie ist auch eine exzellente Blues-Sängerin, wie im Video zu hören. Schon 2011 brachte Apple eine deutsche Siri heraus; ihre Konkatenationen klingen allerdings leicht roboterhaft (ab Minute 4:00). In England startete eine männliche Siri, die von Jon Briggs gesprochen wurde. Mit dem Betriebssystem iOS 7 führte Apple 2013 eine neue Siri ein, und heute dürfte die von Susan Bennett nicht mehr aktiv sein.