IEEE Standard-Gleitkommazahlendarstellung
Die Darstellung großer Zahlen in Computer-Binärcode erfordert einen Standard, der gewährleistet, dass es bei Berechnungen keine großen Diskrepanzen gibt. Deshalb hat das Institute of Electrical and Electronics Engineers (IEEE) den IEEE Standard for Floating-Point Arithmetic (IEEE 754) entwickelt.
Es gibt drei Bestandteile des IEEE 754:
- Die Basis: 0 stellt eine positive Zahl und 1 ein negative Zahl dar.
- Der Exponent: Mithilfe des Exponenten lassen sich sowohl positive als auch negative Exponenten darstellen. Deshalb muss dem eigentlichen Exponenten ein Bias hinzugefügt werden, mit dem der gespeicherte Exponent abgerufen wird.
- Die Mantisse: Die Mantisse, auch als Signifikant bezeichnet, stellt die Genauigkeitsbit der Zahl dar.
Mithilfe dieser Komponenten stellt IEEE 754 Gleitkommazahlen in zwei unterschiedlichen Formaten dar – mit einfacher und mit doppelter Genauigkeit. Auch wenn es weiterhin verschiedenste Arten zur Darstellung von Gleitkommazahlen gibt, ist IEEE 754 die gängigste, da es allgemein die effizienteste Darstellung numerischer Werte ist.
Was ist ein Gleitkommaformat mit einfacher Genauigkeit?
Ein Gleitkommaformat mit einfacher Genauigkeit verwendet 32 Bit des Computerspeichers und kann ein großes Spektrum an numerischen Werten darstellen. Dieses Format, das oft als FP32 bezeichnet wird, wird am besten für Berechnungen verwendet, für die eine gewisse Annäherung nicht entscheidend ist.
Was ist ein Gleitkommaformat mit doppelter Genauigkeit?
Das Gleitkommaformat mit doppelter Genauigkeit hingegen belegt 64 Bit des Computerspeichers und ist deutlich genauer als das Format mit einfacher Genauigkeit. Dieses Format wird oft als FP64 bezeichnet und wird zur Darstellung von Werten genutzt, die einen größeren Bereich oder eine genauere Berechnung erfordern.
Obwohl die doppelte Genauigkeit mehr Präzision ermöglicht, erfordert sie auch mehr Rechenressourcen, Speicherkapazität und Datenübertragung. Die Kosten für die Nutzung dieses Formats sind nicht bei jeder Berechnung sinnvoll.
Der Unterschied zwischen einfacher und doppelter Genauigkeit
Am einfachsten kann man Computing mit einfacher und doppelter Genauigkeit unterscheiden, wenn man die Bit betrachtet, die von der Gleitkommazahl dargestellt werden. Bei der einfachen Genauigkeit werden 32 Bit zur Darstellung der Gleitkommazahl verwendet. Bei der doppelten Genauigkeit werden 64 Bit zur Darstellung der Gleitkommazahl verwendet.
Betrachten wir als Beispiel die Eulersche Zahl (e). Dies sind die ersten 50 Dezimalstellen von e: 2.7182818284590452353602874713526624977572470936999.
Dies ist die Eulersche Zahl in Binärcode, konvertiert in einfache Genauigkeit:
01000000001011011111100001010100
Dies ist die Eulersche Zahl in Binärcode, konvertiert in doppelte Genauigkeit:
010000000000010110111111 0000101010001011000101000101011101101001
Die erste Zahl stellt die Basis dar. Das nächste Set von Zahlen (acht bei einfacher Genauigkeit und elf bei doppelter Genauigkeit) stellt den Exponenten dar. Das letzte Set von Zahlen (23 bei einfacher Genauigkeit und 52 bei doppelter Genauigkeit) stellt die Mantisse dar.
Vergleichsdiagramm: Einfache Genauigkeit im Vergleich zu doppelter Genauigkeit
|
Einfache Genauigkeit
|
Doppelte Genauigkeit
|
Übersicht
|
Verwendet 32 Bit Speicher zur Darstellung eines numerischen Werts, wobei eines der Bit das Vorzeichen der Mantisse darstellt
|
Verwendet 64 Bit Speicher zur Darstellung eines numerischen Werts, wobei eines der Bit das Vorzeichen der Mantisse darstellt
|
Exponent
|
8 Bit für den Exponenten verwendet
|
11 Bit für den Exponenten verwendet
|
Mantisse
|
Verwendet 23 Bit für die Mantisse (zur Darstellung der Nachkommastelle)
|
Verwendet 52 Bit für die Mantisse (zur Darstellung der Nachkommastelle)
|
Praktische Anwendung
|
Wird oft für Spiele oder Programme verwendet, die eine breitere Darstellung ohne ein hohes Maß an Genauigkeit erfordern
|
Wird oft für wissenschaftliche Berechnungen und komplexe Programme verwendet, die ein hohes Maß an Genauigkeit erfordern
|