Einstieg - Unicode

8 Bit reichen nicht!

Es gibt eine Vielzahl an Symbolen, die weltweit zur Darstellung von Information benutzt werden. Hier siehst du z.B. einige Zeichen, die in der arabischen Schrift benutzt werden:

سلام

Eine Codierung all dieser weltweit benutzten Zeichen mit 8 Bit ist unmöglich, da man mit 8 Bit nur 28 = 256 Zeichen darstellen kann. Es gibt verschiedene Lösungsansätze für dieses Problem.

Eine Möglichkeit besteht darin, unterschiedliche 8-Bit-Codierungstabellen für unterschiedliche Zwecke zu benutzen. Ein 8-Bit-Muster stellt dann - je nach Kontext - unterschiedliche Zeichen dar.

Eine weitere Möglichkeit nutzt längere Bitfolgen zur Zeichendarstellung. Mit einer Verdopplung auf z.B. 16 Bit kann man bereits 216 = 65.536 Zeichen darstellen.

Wir werden im Folgenden eine solche 16-Bit-Darstellung näher betrachten. Als Kontext betrachten wir die Darstellung von Währungssymbolen.

Währungssymbole

Hier siehst du den Wert eines US-Dollars in unterschiedlichen Währungen.

1$:
0.77€
78,10¥
31.18Я
1149.5₩
3.78₪

Kennst du alle hier vorkommenden Währungssymbole? Wenn nicht, dann bearbeite die folgende Aufgabe.

Aufgabe 1

Die hier aufgelisteten 16-Bit-Folgen werden nach im Unicode zur Binärdarstellung des oben gezeigten Textes benutzt.

0000000000110001
0000000000100100
0000000000111010
0000000000001010
0000000000110000
0000000000101110
0000000000110111
0000000000110111
0010000010101100
0000000000001010
0000000000110111
0000000000111000
0000000000101110
0000000000110001
0000000000110000
0000000010100101
0000000000001010
0000000000110011
0000000000110001
0000000000101110
0000000000110001
0000000000111000
0000010000101111
0000000000001010
0000000000110001
0000000000110001
0000000000110100
0000000000111001
0000000000101110
0000000000110101
0010000010101001
0000000000001010
0000000000110011
0000000000101110
0000000000110111
0000000000111000
0010000010101010

(a) Versuche erst einmal, die Bitfolgen zur Darstellung der Währungssymbole zu identifizieren.

(b) Wenn du die Bitfolgen in Dezimal- oder Hexadezimalzahlen umrechnest, dann kannst du die entsprechenden Symbole im Internet recherchieren. Im Fall des Euro-Zeichens reicht z.B. der Suchtext "Unicode 20ac". Jetzt kannst du sicher die oben gestellte Frage nach den vorkommenden Währungen beantworten.

(c) Mit einer Unicode-Tabelle kannst du auch weitere Währungssymbole darstellen, z.B. den thailändischen Baht oder den vietnamesischen Dong. Probiere das einmal aus. Benutze einen Converter, der Unicode in Textsymbole umwandelt.

X

Fehler melden

X

Suche