KompiuteriaiInformacinės technologijos

Kodavimas teksto informaciją kompiuteryje

Kompiuterių - sudėtingas įrenginys, su kuria jūs galite sukurti, konvertuoti, ir saugoti informaciją. Tačiau kompiuteris neveikia labai suprantamai mums - grafikos, teksto ir skaičių duomenys saugomi kaip dvejetainiai masyvai numeriai. Šiame straipsnyje mes pažvelgti, kaip teksto informacijos kodavimo.

Kas mums yra kompiuterio tekstas - simbolių seka. Kiekvienas simbolis reiškia tam tikrą rinkinį nulių ir. Pagal simboliai reiškė ne tik didžiąsias ir mažąsias raides Lotynų abėcėlė, bet ir skyrybos ženklai, aritmetinės ženklai, specialiais ženklais, specialiais simboliais ir net kosmose.

Dvejetainiai kodavimas tekstinę informaciją

Paspaudus tam tikrą klavišą vidaus kontrolierius siunčia elektrinį signalą, kuris konvertuojamas į dvejetainį kodą. Kodas yra suderinta su tam tikru simboliu, kuris rodomas ekrane. Pateikimo į lotynų abėcėlės skaitmeniniu formatu ASCII kodavimo tarptautinę sistemą buvo sukurta. Jis reikalauja 1 baitas registravimo vieną simbolį tokiu būdu sudaro aštuonių simbolių seka nulių ir. Įrašymo intervalas - nuo 00000000 iki 11111111, ty teksto informaciją, naudojant šią sistemą kodavimas leidžia mums atstovauti 256 simbolių. Daugeliu atvejų tai yra pakankamai.

ASCII yra padalintas į dvi dalis. Pirmieji 127 simbolių (nuo 00000000 iki 01111111) yra tarptautinė ir yra specifiniai simboliai ir anglų abėcėlės raidės. Antroji dalis - pratęsimas (nuo 10000000 iki 11111111) - skirtas atstovauti nacionalinę abėcėlę, rašymas, kurios skiriasi nuo lotynų.

Kodavimas tekstinę informaciją ASCII yra pastatytas ant vis seka, ty kuo didesnis eilės numeris raidžių, tuo didesnė jo ASCII kodu vertės principu. Skaičiai ir Rusijos dalis stalo pastatyti tuo pačiu principu.

Tačiau pasaulyje yra kelių rūšių kodavimo dėl kirilicos raidėmis. Dažniausiai - tai KOI-8 (aštuonių bitų kodavimas, kad buvo naudojamas per 70s į pirmą ruifitsirovannyh Unix operacinės sistemos), ISO 8859-5 (sukurta Tarptautinės standartizacijos biuras), CP 1251 (kodavimo tekstinę naudojama informacija moderni OS "Windows"), taip pat 2 baitų kodavimas Unicode, kuris gali būti naudojamas įdiegti 65.536 simbolių. Toks koduotes dėl to, kad jie buvo sukurtos skirtingu laiku, skirtingų operacinių sistemų ir skirtingų aplinkybes įvairovė. Dėl šios priežasties, dažnai turi sunkumų perkeliant tekstą iš vienos terpės į kitą - iš nesutapimus, koduojančio vartotoją pamatysite paini piktogramų rinkinį. Kaip aš galiu išspręsti šią problemą? Word, pavyzdžiui, kai dokumentas yra atidarytas, pranešimas apie problemas su tekstu ekrane ir siūlo keletą variantų perkodavimas.

Taigi, kodavimas ir tekstinę informaciją į kompiuterio viduriuose apdorojimas - procesas yra sudėtingas ir daug laiko atimantis organizuotas. Visi bet abėcėlės simboliai yra tik tam tikra seka skaitmenys binarinių sistema, viena ląstelė - tai vienas baitas informacijos.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lt.birmiss.com. Theme powered by WordPress.