Konvertálás
Hogyan lesznek a számítógép billentyűzetén begépelt betűkből, számokból eltárolt jelek?A magyar nyelvben használt betűink, írásjeleink, számjegyeink, s egyéb speciális jeleink száma körülbelül százegynéhány. Tekintetbe véve az egyéb megkívánt jeleket is, csak a magyar nyelvre gondolva használnunk kell egy-egy nyolc bites csoportot egy ilyen betű, írásjel vagy szám tárolására. Létrehoztak tehát egy olyan hozzárendelési szabályt, ami a nyolc bit különböző állapotához rendeli hozzá a különböző karaktereket. Minden egyes bitsorozat egy-egy karaktert jelképez. Természetesen célszerű volt ezt a hozzárendelési szabályt nemzetközileg is elfogadottá és egységessé tenni. Ezért hozták létre az 1960-as években az alap, 128 karaktert kódoló ASCII kódrendszert, majd ezt a nyolcadik bit ellenőrző szerepének elhagyásával 256-ra bővült. A kiterjesztett ASCII kód kiosztása egyedi, összesen 256-féle jelet különböztetett meg, de még így sem lehetett helye benne minden nemzet minden speciális betűjének. Így a kiterjesztett ASCII kód még nem tartalmazta a teljes magyar betűkészletet sem. Kimaradt belőle például az ő és ű betű, mint speciális magyar írásjelek, persze mint kis- és nagybetűs alakban is.
Ezen hiányosság pótlására az 1980-as években több egyedi megoldás is született, mint például a CWI kódrendszer, de a Microsoft sem fejlesztett egységesen: a magyar betűket a 852-es kódtábla tartalmazta a DOS alatt, míg a Windows használók számára már a 1250-es kódlap tette mindezt. A kialakulóban lévő káoszt csak egységes és nemzeti érdekek és elképzelések felett álló szabályozással lehetett megoldani: az unikódnak elnevezett új kódrendszer 16 bites lett, így a több mint 65 ezer jel egységes kódolásának köszönhetően bárki, bármilyen nyelven, egyértelmű kódolással tud szöveget írni.
Persze a régebben létrehozott dokumentumok átkódolása külön gond lett, de ez egy másik történet…
Karakter vizsgálata
Ha létrehoztunk egy szabályt, amely segítségével karaktereket kódolhatunk, ezen bitcsoportok felhasználásával a szavak leírása is megoldható. Mivel a betűk leírásához betűnként kódrendszertől függő számú bit szükséges, célszerű a rendelkezésre álló bitjeinket ilyen jelkód csoportokba szervezni. Ezeket a jelkódcsoportokat nevezték el byte -nak (ejtsd: bájt).
Mivel az alap-ASCII kódtábla és utódjaik nem csak egy nyelvhez tartozó betűket tartalmaznak, ezért célszerűbb rájuk egy átfogóbb fogalmat alkalmazni. Így tehát ezeket a bármilyen nyelvhez tartozó jeleket összefoglaló néven elnevezhetjük karakternek.
Ha egy 25-betűből, 5 szóközből és 2 írásjelből álló mondatot szeretnénk tárolni, akkor mindezt összeadva a mondat 32 karaktert tartalmaz, tehát 32 byte kell a taroláshoz, ami megfelel hagyományos kódolást használva 32-szer 8, azaz, 256 bitnek, de ha unikódot használunk, akkor a tárolandó bitszám éppen a duplája lesz. Egy számítógépben azonban nem csupán egy mondatot kell tárolnunk és feldolgozunk, hanem annál jóval nagyobb mennyiségű adatot. Így a számítógépeknek rendelkezniük kell egy olyan részegységgel, ahol a feldolgozandó adatokat raktározni tudja. Ezt nevezik operatív vagy belső, vagy egyszerűen csak memóriának. A számítógép memóriájának méretét az határozza meg, hogy hány byte-nyi adat tárolására alkalmas.
A karakter lehet egy szám, egy betű, egy írásjel vagy egy vezérlőjel, amely kódrenszertől függően egy vagy két byte-on tárolható.
Mértékegységek
Ellentétben a megszokott szorzóértékkel a számítástechnikában 1 kilobyte (kbyte) nem 1000 byte, hanem 1024 byte, s ugyanígy az 1 megabyte (Mbyte) sem 1000, hanem 1024 kilobyte. Ez természetesen alaposan indokolt, hiszen a számítógép kettes számrendszerében az 1000 nem egy „kerek"' szám, ellentétben az 1024-gyel, ami pontosan a kettő tízedik hatványa, így a kialakítás és használat szempontjából jóval praktikusabb.
A számítástechnikában használják még a gigabájtot (Gbyte) is, amely a megabyte 1024 szerese, illetve esetenként a terabájtot (1 Tbyte=1024 Gbyte).
A hagyományosan használt, tízes számrendszerre épülő prefixek használata mellett éppen ezért lett gond az informatikához jobban illő bináris prefixek használata. A megoldást a mérnökök világszervezete viszonylag gyorsan megalkotta: a decimális és bináris prefixek között egyértelmű különbséget tett. Géphasználóként belegondolva: a mi érdekünkben!
Informatikában használt jelölés átváltás
1 Bájt = 8 bit
1 KBájt (kilo) = 1024 Bájt
1 MBájt (mega) = 1024 KBájt
1 GBájt (giga) = 1024 MBájt
1 TBájt (tera) = 1024 GBájt
1 PBájt (peta) = 1024 TBájt
1 EBájt (exa) = 1024 PBájt
A byte, magyarul byte, rövidítése B, az adattárolás alapegysége.
Kapcsolódó animációk