Exkurs - Experimente mit einem Hexeditor

Aufgabe 1: Binärdarstellung von Zeichen

Wir benutzen im Folgenden den Hexeditor, den man in den Texteditor Notepad++ integrieren kann. Mit Hilfe dieses Hexeditors kann man sich die Binärdarstellung von Zeichen, die man zur Erstellung eines Textes benutzt, anschauen.

Die Screenshots zeigen, wie der abgebildete Text binär dargestellt wird:

Screenshot mit TextBinärdarstellung zum Text

Welches Bitmuster wird zur Darstellung des Buchstaben A benutzt, welche Bitmuster werden wohl zur Darstellung der Buchstaben B, C usw. benutzt?

Was hat es mit den beiden Bitmustern 00001101 und 00001010 auf sich? Führe gezielt Experimente durch, um das herauszufinden.

In der gezeigten Binärdarstellung von Zeichen werden 8 Bits zur Kodierung benutzt. Wie viele verschiedene Zeichen können so dargestellt werden?

Untersuche, wie Umlaute und andere Sonderzeichen dargestellt werden. An welchem Bit kann man erkennen, dass es sich um ein Sonderzeichen handelt?

Aufgabe 2: Zeilenumbrüche

Geh noch einmal von der Binärdarstellung des gezeigten Textes aus:

Screenshot mit TextBinärdarstellung zum Text

Mit [Format][Convert to UNIX-Format] kann man auf die Darstellung in einem anderen Betriebssystem umschalten. Die Screenshots zeigen, was sich hierbei ändert.

Screenshot mit TextBinärdarstellung zum Text im Unix-Format

Welche Unterschiede zeigen sich bei der Darstellung von Zeilenumbrüchen? Inwiefern kann das zu Problemen führen?

Aufgabe 3: Sonderzeichen

Der neue Text enthält Sonderzeichen. Schau dir erst einmal an, wie diese in der ANSI-Kodierung dargestellt werden. An welchem Bit kann man erkennen, dass es sich um ein Sonderzeichen handelt?

Screenshot mit TextBinärdarstellung zum Text im Ansi-Format

Mit [Format][Encode in UTF-8] kann man auf eine andere Kodierung umschalten. Gib den Text genau wie vorher ein und schau dir jetzt die Binärdarstellung an.

Screenshot mit TextBinärdarstellung zum Text im utf8-Format

Wie viele Bytes werden hier zur Darstellung der Sonderzeichen benutzt?

Am Anfang der Datei sind drei zusätzliche Bytes eingefügt worden. Es handelt sich hierbei um ein sogenanntes BOM (byte order mark). Recherchiere, was es mit diesem BOM auf sich hat.

X

Fehler melden

X

Suche