Bináris ↔ szöveg konverter

Alakíts szöveget binárissá és vissza UTF-8 vagy ASCII kódolással, választható bit-csoportosítással és elválasztóval.

Karakterek: 4 UTF-8 bájt: 4 Kimenet hossza: 35
Gyors hivatkozás: gyakori ASCII karakterek 8 bites binárisban
Karakter Tízes Bináris (8 bit)
A6501000001
Z9001011010
a9701100001
z12201111010
04800110000
95700111001
(szóköz)3200100000
!3300100001
?6300111111
(új sor)1000001010

Gyakori kérdések

Hogyan működik a szöveg-bináris átalakítás?
Minden karakterhez tartozik egy számkód (a kódpont). Az ASCII karakterek kódja 7 biten elfér, és egy vezető nullával kiegészítve 8 bites bájtot alkot. Az A karakter kódja 65, ami binárisan 01000001. A konverter végigolvassa a szöveget, kikeresi minden karakter kódját, és bájtonként kiírja annak bináris alakját.
Mi a különbség az ASCII és az UTF-8 között?
Az ASCII 128 karaktert fed le (angol betűk, számjegyek, írásjelek), és karakterenként egy 7 bites bájtot használ. Az UTF-8 változó hosszúságú kódolás, amely a világ minden írásjelét képes ábrázolni — latin, cirill, kínai, arab, emoji — karakterenként 1-4 bájton. Az ASCII karakterek UTF-8-ban azonosak (1 bájt). A magyar ékezetes betűk (á, é, í, ó, ö, ő, ú, ü, ű) viszont nem férnek bele 7 bitbe — UTF-8-ban 2 bájton ábrázolódnak. Ha magyar szöveget alakítasz, mindig UTF-8-at válassz.
Miért nem dekódolódik a bináris bemenet?
Gyakori okok: (1) a bit-csoportok hossza nem 8 (vagy 7) bit — ellenőrizd, nincs-e felesleges szóköz; (2) a bemenet 0-án és 1-en kívüli karaktert tartalmaz; (3) a bináris hiányos UTF-8 szekvenciát képvisel. A dekóder az első hiba pozícióját jelzi, így könnyen javítható. Ha nincs elválasztó a bemenetben, állítsd a "Bit csoportosítás"-t 8-ra, az "Elválasztó"-t pedig "Nincs"-re.
Hány bitet használjak karakterenként?
A szabványos megoldás a 8 bit / bájt. A tiszta ASCII 7 biten is elfér, de a tárolt adatok és hálózati protokollok mindig 8 bitre egészítenek ki. A 7 bites módot csak régi teletype-protokolloknál vagy iskolai/érettségi feladatoknál érdemes használni. A nem ASCII karakterek (magyar ékezetek, cirill, kínai, emoji) több bájtos UTF-8-at igényelnek, így rájuk a 7 bites csoportosítás nem értelmezhető.
Át tudok alakítani magyar szöveget vagy emojit?
Igen — hagyd a kódolást UTF-8-on. A magyar ő betű két bájt UTF-8-ban: 11000101 10010001. Ugyanígy az á, é, ű és a többi ékezetes betű is 2 bájt. A CJK írásjelek (kínai, japán, koreai) 3 bájtot foglalnak, az emojik általában 4 bájtot. Az ASCII mód minden 0-127 tartományon kívüli karaktert hibával utasít vissza.
A bináris ugyanaz, mint a gépi kód?
Nem. A bináris csupán egy számrendszer — a kettes alapú —, amely két számjegyet, a 0-t és az 1-et használja. A gépi kód a CPU utasításainak bináris ábrázolása, vagyis egy adott processzor saját kódolása. Az itt látható bináris bájtokba kódolt szöveg, nem futtatható utasítás. Mindkettő 0-kból és 1-ekből áll, ezért használjuk köznyelven a "bináris" szót "számítógép-barát" értelemben.
Hogyan alakítsam vissza a binárist szöveggé?
Válts a Bináris → Szöveg fülre, és illeszd be a binárist. A dekóder az elválasztó (alapértelmezetten szóköz) mentén bájtokra bontja a bemenetet, minden csoportot a kettes alapú számból a tízes kódpontjává alakít, majd összerakja az eredményt. UTF-8 esetén a több bájtos szekvenciákat helyesen fűzi össze egyetlen karakterré (pl. magyar ő, ű).
Az átalakítás teljes egészében a böngésződben történik. Semmi nem kerül feltöltésre.

Bináris ↔ szöveg konverter, amely a böngésződben két irányban működik: szöveget bájtokra bont és binárisra kódol, illetve binárist visszadekódol szöveggé. Választhatsz UTF-8 (bármely nyelv, magyar ékezetekkel együtt) és ASCII (7 bit) kódolás között, állíthatod a bit-csoportosítást (8 bit / bájt, 7 bit, vagy nincs csoportosítás) és a kimeneti elválasztót (szóköz, kötőjel, függőleges vonal, semmi). Magyar példa: az ő betű UTF-8-ban két bájt — 11000101 10010001 —, az emojik általában négy bájton ábrázolódnak. Hasznos érettségi informatika feladatoknál, programozás-oktatáshoz, hálózati protokollok tanulmányozásához vagy kódfejtős játékokhoz. A statisztika sávban azonnal látod a karakterek számát, az UTF-8 bájtok számát és a kimenet hosszát. Hibás bemenet esetén a dekóder pontosan megmutatja, hányadik csoport hibás. Minden feldolgozás helyben történik, semmi nem kerül feltöltésre.