![]()
Technische Daten zur Codierleistung
Wie gut ist Scode in der Praxis? Dazu wurden in einer sogenannten "Monte-Carlo-Simulation" zufällige deutsche Sätze gebildet. Dann wurden diese Zufallssätze scodiert und die Anzahl der Buchstaben bestimmt, die man noch in einen Funkruf unterbringen konnte. Pro Funkruf kann man maximal 15 Ziffern übertragen: Wenn man davon die ersten beiden für die Absenderkennung verwendet, bleiben noch 13 Ziffern für den eigentlichen Text.
Mit welcher Wahrscheinlichkeit paßt also ein Text gegebener Länge in diese 13 Ziffern?
Satzlänge in Buchstaben |
Wahrscheinlichkeit, daß der Satz in 13 Ziffern paßt (mit Abkürzungen) | Wahrscheinlichkeit, daß der Satz in 13 Ziffern paßt (ohne Abkürzungen) |
| 6 | 100 % | 100 % |
| 7 | 99,9 % | 99,8 % |
| 8 | 99,7 % | 99 % |
| 9 | 98 % | 91 % |
| 10 | 91 % | 66 % |
| 11 | 76 % | 34 % |
| 12 | 55 % | 11 % |
| 13 | 33 % | 2 % |
| 14 | 16 % | 0,3 % |
| 15 | 7 % | 0 % |
| 16 | 2 % | 0 % |
Mit Scode kann man im Schnitt 11,8 (± 1,8) Buchstaben senden (mit Abkürzungsregeln). Ohne Abkürzungen bringt es Scode auf immerhin 10,0 (± 1,2) Buchstaben je 13 Ziffern.
je kleiner die Prozentzahl, desto besser
Sample.....................32 302 Wörter
313 873 Buchstaben zu je 4,91 Bit (log230)
entspr. 1 545 057 Bits =: 100 %
Codierung mit Scode.......330 824 Ziffern zu je 3,32 Bit (log210)
entspr. 1 098 974 Bits = 71 %
Codierung mit LHA/LZH.....146 360 Bytes zu je 8,00 Bit (log2256)
entspr. 1 170 580 Bits = 76 %
also sogar schlechter als Scode
Codierung mit PKZIP/ZIP...135 916 Bytes zu je 8,00 Bit (log2256)
entspr. 1 087 328 Bits = 70 %
also etwas besser als Scode
Zum Vergleich:
Entropie des Samples....1 323 791 Bits = 86 %
damit ist Scode besser als einfache Huffmann-Codierung
Entscheidend für die Qualität eines Codes sind:
Mathematische Kenngrößen von Scode
Scode besteht aus zwei Elementen: der eigentlichen Codiertabelle und
optionalen Empfehlungen, wie man Nachrichten abkürzen kann.
Scode bietet hier einen sehr guten Kompromiss:
Codierverhältnis
Anzahl der Ziffern, in denen 1 Buchstabe durchschnittlich codiert wirdq = 1,06 Standardabweichung von q
in Einheiten von 1/n1/2Sq = 0,55 Durchschnittlicher Randeffekt
Anzahl der Ziffern, die der Code am Ende nicht ausnutztr = 0,5 Codierverhältnis
Anzahl der Ziffern, in denen 1 Buchstabe durchschnittlich codiert wirdq = 1,25 Standardabweichung von q
in Einheiten von 1/n1/2Sq = 0,46 Durchschnittlicher Randeffekt
Anzahl der Ziffern, die der Code am Ende nicht ausnutztr = 0,4 Codierverhältnis
Anzahl der Ziffern, in denen 1 Buchstabe durchschnittlich codiert wirdq = 2,00 Standardabweichung von q
in Einheiten von 1/n1/2Sq = 0,00 Durchschnittlicher Randeffekt
Anzahl der Ziffern, die der Code am Ende nicht ausnutzt
(bei ungeradem z)r = 1,0 Anwendung:
z - r Sq z - r
n = ------- Sn = -------- · -------
q n1/2 q2
Auf die Verhältnisse von Scall (z = 13 + Absendernummer) angewendet heißt dies:
Z = q·N SZ = Sq·N1/2Wir erwarten also z.B. bei 100 scodierten Buchstaben eine Codelänge von 106 Ziffern (± 5,5). Die Codelänge in diesem Beispiel (112 Ziffern) liegt also noch innerhalb einer Standardabweichung vom theoretischen Wert entfernt (bei anderen 100 Buchstaben langen Sätzen erwarten wir in 95% aller Fälle Codelängen von 95 bis 117 Ziffern = Z ± 2·SZ).
![]()