Gezippt – Geheimnisse der Speichernutzung
Geschrieben am 14.04.2020 von HNF
Dateien sind meist größer als gedacht, und schnell ist der Speicher voll. Seit langem beschäftigt die Informatik das Problem, wie man mit vielen Bits fertig wird. Eine Methode ist die Kompression: Daten werden umgeformt, sodass sie weniger Platz benötigen. Im Lauf der Zeit entstanden teils vernünftige und teils kuriose Methoden, um Speicher besser auszunutzen.
Vor 25 Jahren geschah ein Technikwunder. In Kalifornien, so berichtete der SPIEGEL im September 1995, hätte „der aus Deutschland stammende Rainer Poertner eine Software-Lösung für das Speicherproblem erfunden“. Sein Programm SoftRAM würde durch ein raffiniertes Datenmanagement den Arbeitsspeicher von Windows-Computern erweitern. Es wären schon 800.000 Disketten mit dem „Ram-Verdoppler“ verkauft worden.
Ram steht für Random access memory und meint jenen Speicher. Das Wunderprogramm stellte sich allerdings als Luftnummer heraus. Es war reiner Betrug und leistete nichts. Was es damals durchaus gab, waren Programme wie DiskDoubler oder AutoDoubler, die Dateien auf Apple-Computern verkleinerten. Anfang 1994 erschien für den Macintosh die Software RAM Doubler. Sie fahndete im Arbeitsspeicher nach ungenutztem Platz und schuf neuen, indem sie im Speicher abgelegte Daten komprimierte. Womit wir beim Thema sind.
Seit Beginn der Informationstechnik kämpft der Mensch gegen die Datenflut. Das 19. Jahrhundert brachte uns die elektrische Telegrafie und damit den Telegrammstil und die Code-Bücher. Sie enthielten Buchstabenfolgen, die in Depeschen mehrere Worte ersetzten. So konnte man beim Telegrafieren Geld sparen, vorausgesetzt, dass der Empfänger das gleiche Codelexikon besaß. Im 20. Jahrhundert erschien die Datenkompression. Erfunden hat sie in den 1940er-Jahren der amerikanische Informatik-Pionier Claude Shannon.
In seinem Konzept werden Ausdrücke, die im Text häufig vorkommen, durch kurze Bitfolgen ersetzt, und seltene Ausdrücke durch längere. Man kann auch bei mehrfach auftretenden Worten Verweise einführen: „To be or not 1 2 that is the question.“ Erraten Sie das Prinzip? Aus diesen beiden Grundideen entstand eine Fülle von Verfahren, um größere Datenmengen zu verkleinern. Dabei betrachten wir nur die verlustfreien Methoden: Bei ihnen lässt sich die ursprüngliche Nachricht durch Umkehren des Algorithmus wieder rekonstruieren.
In den 1980er-Jahren erfasste die Datenkompression die Welt der Mikrocomputer. Im US-Bundesstaat New Jersey entwickelte die kleine Firma System Enhancement Associates ein entsprechendes Programm namens ARC. Ab 1985 bot sie es in der schon florierenden Mailbox-Szene zum Herunterladen an. ARC galt als Shareware; es konnte einen Monat kostenlos getestet werden, danach wurde bezahlt. Oder auch nicht, falls der betreffende User keinerlei Gewissensbisse spürte. ARC war dennoch ein Erfolg.
1986 veröffentlichte SEA den Quellcode der Software. Im selben Jahr kam im US-Staat Wisconsin ein ähnliches Programm ebenfalls als Shareware heraus. Es hieß PKARC und verkürzte Dateien schneller als ARC; Autor des Programms war der 24-jährige Phil Katz. 1988 verklagte SEA die Firma von Phil Katz. Ein Gutachter wies vor Gericht nach, dass er viele Zeilen aus der SEA-Software abgeschrieben hatte. Die beiden Parteien einigten sich außergerichtlich. Der Prozess erschütterte die Mailbox-Gemeinde aber gewaltig.
1989 brachte Phil Katz ein neues Kompressionsprogramm PKZIP heraus; das gewählte Dateiformat hieß zip. Die Software verbreitete sich schnell und wurde zum Standard in der gesamten Computerwelt. Das Programm ARC geriet ebenso schnell in Vergessenheit, 1992 schluckte eine japanische Firma den Urheber SEA. Phil Katz hatte auf ganzer Linie gesiegt. Er wurde aber seines Erfolgs nicht froh und verfiel dem Alkoholismus. Am 14. April 2000 fand man ihn tot in einem Hotel seiner Heimatstadt Milwaukee. Er wurde nur 37 Jahre alt.
Zum Schluss wollen wir noch zwei Programme behandeln, die ein neues Zeitalter des Computers einläuten wollten. 1995 verkündete der holländische Fernsehtechniker Jan Sloot die Erfindung eines Systems, das einen Kinofilm auf acht Kilobyte komprimieren würde. Jan Sloot war fünfzig Jahre alt und besaß einen Betrieb in Nieuwegein bei Utrecht. Seine Kompression war eigentlich unmöglich, sie lockte aber Investoren an. Einen Überblick über das Konzept verdanken wir Pieter Spronck, Informatikprofessor an der Universität Tilburg.
Hat Sloots Kompression vielleicht doch funktioniert? Das werden wir nie erfahren, denn der Erfinder erlag am 11. Juli 1999 ziemlich plötzlich einem Herzinfarkt. Im Netz blieben seine Patente erhalten; bitte „Jan Sloot“ in die Suchmaschine des Patentamts eingeben. Weitere Links über sein Leben liefern die englische und niederländische Wikipedia. In deutscher Sprache erschien zu ihm das Buch „Der Supercode“ von Eric Smit. Ein Prototyp von Sloots Kompressor existiert, konnte aber niemals zum Laufen gebracht werden.
Revolutionär war auch das Pile-System des Israeli Erez Elul. Es entstand um das Jahr 2000 und organisierte Daten nach vorher nie gesehenen Prinzipien; Dokumente lassen sich im Internet-Archiv durchlesen. Bei uns fand Elul einen Förderer in Gestalt des Filmemachers Peter Krieg. 2005 hat Eluls System tatsächlich gearbeitet. 2008 trennten sich die beiden wieder, 2009 starb Peter Krieg. Der Nachlass des Pile-Projekts überlebte, er findet sich hier – natürlich gezippt.