|
Fast jeder PC-Anwender hat Dateien mit der Extension
.ZIP auf der Platte.
Fast so viele haben eine lizensierte oder nicht lizensierte Version
von Winzip
oder einem kompatiblem Programm am Rechner. Wer macht sich überhaupt noch
Gedanken darüber, was man mit dieser Technik eigentlich alles machen kann?
Eigentlich enthält Windows XP die nötigen Bordmittel, um ZIP-Archive zu verarbeiten.
Dieses Utility ist allerdings reichlich schwachbrüstig. Also besser abschalten
[2] und durch Leistungsfähigeres ersetzen:
- Start/Ausführen
- regsrv32 /u zipfldr.dll
- Winzip o.ä. installieren
Dateien zusammenfassen und komprimieren
Diese Basisfunktionen des Archivierens sind wohl jedem geläufig:
Mehrere Dateien werden zu einer zusammengefaßt, das Datenvolumen sinkt dabei.
- Das Zusammenfassen von Dateien ermöglicht, den Inhalt eines Verzeichnisses
oder eines Unterverzeichnisbaums einzufrieren. Im UNIX-Bereich
gibt es dafür das Werkzeug TAR.
- Das Komprimieren der Dateien nutzt aus, daß viele Datenformate viel
Redundanz enthalten. So läßt sich die Information jetzt kommen
40 Bindestriche sicher kürzer codieren als in 40 Byte.
Im UNIX-Bereich schickt man TAR-Archive gerne durch COMPRESS.
Das führt dann erst mal zur Doppel-Extension .TAR.Z, die oft zu TAZ
zusammengeführt wird.
Diese ausdrückliche Trennung beider Funktionen ist im PC-Bereich unüblich,
für eine grundlegende Betrachtung aber durchaus hilfreich.
Manche Dateiformate lassen sich gut komprimieren, andere wieder kaum.
Letztere Formate enthalten entsprechend wenig Redundanz, z.B. weil sie
bereits selber komprimieren. Einen 10-MB-Screenshot im BMP-Format habe ich aber
schon mal auf rund 200 kB komprimiert - um den Faktor 50!
Eines bleibt festzuhalten: Das ZIP-Format komprimiert ohne Veränderung
der Daten, im Gegensatz zu verlustbehafteten Komprimierungsverfahren
wie JPEG (Bilder, Extension .JPG) oder MPEG (Tondateien, speziell Musik,
Extension .MP3).
Die versteckten Feinheiten
Über die Grundfunktionen hinaus bietet das ZIP-Format eine Reihe von Eigenschaften,
die weniger bekannt sind. Mit ihnen läßt sich aber so manches Detailproblem lösen:
- Größere Dateien auf Disketten zu speichern
ist nicht so ganz einfach -
1,4 MB sind heute sicher nicht mehr viel, aber gelegentlich gibt es keinen
anderen gemeinsamen Datenträger als Disketten. Viele Probleme erledigen sich
allein dadurch, daß die zu transportierende Datei durch das Komprimieren
klein genug wird, um sie auf einer Diskette unterzubringen. Außerdem bieten
die meisten Programme zum Erzeugen von ZIP-Dateien auch Möglichkeiten,
ein Archiv über mehrere Disketten hinweg zu verteilen.
- ZIP-Archive beschleunigen die Datenübertragung. Sicher kostet es
Rechenzeit, Archive zu erzeugen oder zu zerlegen. Die heutigen Rechner
sind aber so schnell, daß diese Zeit eine vergleichsweise kleine Rolle
spielt. 500 kleine Textdateien einzeln auf Diskette zu speichern dauert
eine halbe Ewigkeit, während die 200 kB des entsprechenden Archivs
innerhalb von ein paar Sekunden auf der Diskette stehen. Bei anderen
Übertragungs- und Speichermedien gilt ähnliches. Sogar auf der eigenen
Festplatte kann die Datenkompression sinnvoll sein, wenn viele große,
gut komprimierbare Dateien verwandt werden müssen.
- Beschädigungen an Archiven werden sicher entdeckt. Jede Datei in einem
ZIP-Archiv wird mit einem CRC-Prüfwert versehen. Dieser
32-bit-Wert wird
nach einem Algorithmus berechnet, der extrem empfindlich auf Datenänderungen
reagiert. Zwar arbeiten praktisch alle Datenträger ebenfalls mit
CRC-Werten, die werden aber bei jedem Speichern neu berechnet. Zwischendurch
passiert da durchaus mal was.
- Lange Dateinamen oder Sonderzeichen in
Dateinamen machen auf
manchen Rechnern oder Übertragungskanälen Probleme. Ein ZIP-Archiv
läßt sich problemlos mit einem
Dateinamen versehen, an dem sich kein Betriebssystem verschluckt.
- Die CRC-Werte reagieren extrem empfindlich auf Datenveränderungen.
Den Einsatz bei der Fehlersicherung habe ich schon beschrieben,
der Anwendungsbereich ist aber noch viel breiter: Wie sichern Sie Ihre
elektronisch ausgelieferten Dokumente dagegen, daß ein Fremder sie
verändert? Wenn Lieferschein bzw.
Rechnung die CRC-Werte der übergebenen
Dateien enthalten, sind die Dateien mit hoher Wahrscheinlichkeit eindeutig
charakterisiert. So ist später nachzuvollziehen, ob der Dienstleister
oder der Kunde die falsche Zahl eingebaut hat, die einen Neudruck erzwang.
- Archive speichern den Projektzustand zu
einem bestimmten Zeitpunkt.
Programme im PC-Bereich unterstützen nur ausnahmsweise das gezielte
Festhalten eines Projektstandes. Jede Woche das komplette Projekt
in einen eigenen Unterverzeichnisbaums wegzuspeichern ist schon deshalb
keine Lösung, weil die kopierten Daten dann immer noch mit normalen
Mitteln zugänglich (und zu verändern!) sind
und in kürzester Zeit ein riesiger Dateiwust entsteht.
In ZIP-Archive hineinzulangen fällt den meisten Anwendungsprogrammen
schon bedeutend schwerer und jeder Änderungsstand steckt in einer einzigen
Datei.
Konventionen für Archivnamen
Grundsätzlich lassen sich Archivnamen ebenso frei wählen wie bei allen anderen
Dateien. Es gibt aber ein paar Gesichtspunkte, die hier bestimmte Konventionen
nahelegen:
- Ausgesprochen sinnvoll ist, das Erstellungsdatum in den Archivnamen
einzubauen. Dabei verwende ich das Format JJMMTT,
also etwa 010502 für den 2. Mai 2001. Diese Reihenfolge hat den Vorteil,
daß Dateien beim alphabetischen Sortieren auch chronologisch sortiert werden.
- Der Archivname sollte für den Empfänger hilfreich sein.
Archive werden häufig benutzt, um Dateien weiterzugeben.
Wer einem Herrn Meier das Archiv meier.zip schickt,
wird mit ziemlicher Sicherheit einen schmerzhaften Aufschrei
des Empfängers verursachen: Womöglich hat er soeben beim Empfang
Ihrer Mail eine wichtige Datei überschrieben.
Zumindest muß er sofort darüber nachdenken,
wie er Ihre Datei umbenennt.
Meine Kooperationspartner kennen meine übliche Konvention: Damit der Dateiname
in der alten 8.3-Konvention bleibt, verkürze ich meine Initialen auf "ao"
und hänge wie oben erläutert das Datum an.
Falls es an einem Tag mehrere Archive werden, hänge ich noch die Buchstaben a, b usw. an.
Wenn der Empfänger z.B.
nach einem meiner Archive aus dem Mai 2001 sucht, dann wirft er die
Suchfunktion des Explorers an und sucht nach ao0105*.zip.
Probleme mit verschlüsselten Archiven
Der Erfinder des ZIP-Datenformates, die Firma PKware
hat den Verschlüsselungsmechanismus seiner neuen PKZIP-Version 5 patentieren lassen. Das
zwingt die Hersteller kompatibler Programme, inkompatibel zu werden. Laut
[1] benutzt Winzip seit der Version 9 ein anderes
Verschlüsselungsverfahren und einige Hersteller verzichten ganz auf
Verschlüsselungsmöglichkeiten. Meine Winzip-8.1-Version vom Mai 2001 kommt aber noch
problemlos mit der Ur-Version PKZIP 2.04g unter MS-DOS klar.
ZIP-Programme kostenlos
Schon auf vielen Rechnern sah ich verschiedene Winzip-Versionen im unregistrierten
Zustand - bei jedem Aufruf konnt die Registrierbox hoch. Es gibt aber auch
ZIP-Utilities, die sind kostenlos.
- ZIP Genius
- ist kostenlos und kann offensichtlich eine Menge. Die ganze heiße
Marketing-Luft auf der Website war mir aber zuwieder.
Literatur
- Schüler, Hans-Peter: Patentstreit um ZIP-Verschlüsselung
- In: c't 17/2003, S. 41
- Hoffmann, Christoph; Müller, Burkhard:
Wenn Windows nervt...
- In: PC Professionell 9/2004, S. 40ff
|