Unicode va ASCII

ASCII va Unicode ikkita belgilar kodlashidir. Asosan, ular raqamli muhitda yozilishi, saqlanishi, uzatilishi va o'qilishi uchun farqli belgilarni ikkilikda qanday aks ettirish bo'yicha standartlardir. Ularning orasidagi asosiy farq shundaki, ular belgi va har biri uchun ishlatiladigan bitlar sonini kodlashda. ASCII dastlab har bir belgini kodlash uchun etti bitdan foydalangan. Keyinchalik bu asl nusxaning aniq bo'lmagan etishmovchiligini bartaraf etish uchun kengaytirilgan ASCII yordamida sakkiztagacha oshirildi. Undan farqli o'laroq, Unicode o'zgaruvchan bit kodlash dasturidan foydalanadi, unda siz 32, 16 va 8 bitli kodlashni tanlashingiz mumkin. Ko'proq bitlardan foydalanish kattaroq fayllar hisobiga ko'proq belgi ishlatishga imkon beradi, oz sonli cheklangan tanlov sizga imkon beradi, ammo siz juda ko'p joy tejaysiz. Kamroq bitlardan (masalan, UTF-8 yoki ASCII) foydalanish, agar siz katta hujjatni ingliz tilida kodlasangiz yaxshi bo'ladi.

Unicode-ning paydo bo'lishining asosiy sabablaridan biri nostandart kengaytirilgan ASCII dasturlarida yuzaga kelgan. Agar siz Microsoft va boshqa dasturiy ta'minot kompaniyalari tomonidan ishlatiladigan keng tarqalgan sahifani ishlatmasangiz, unda sizning belgilaringiz qutilar ko'rinishida muammolarga duch kelishi mumkin. Unicode bu muammoni deyarli yo'q qiladi, chunki barcha belgilar kodlari standartlashtirilgan.

Unicode-ning yana bir muhim afzalligi shundaki, u maksimal darajada ko'p sonli belgilarni sig'dira oladi. Shu sababli, hozirda Unicode eng ko'p yozilgan tillarni o'z ichiga oladi va hattoki ko'proq imkoniyatlarga ega. Bunga odatiy chapdan o'ngga, ingliz kabi skriptlar va hatto arab kabi o'ngdan chapga yozilgan skriptlar kiradi. Xitoy, yapon va boshqa ko'plab variantlar ham Unicode-da taqdim etilgan. Shunday qilib, yaqin orada Unicode almashtirilmaydi.

Eski ASCII bilan uyg'unlikni saqlab qolish uchun, o'sha paytda keng qo'llanilgan edi, Unicode birinchi sakkiz bit eng mashhur ASCII sahifasiga mos keladigan tarzda ishlab chiqilgan. Shunday qilib, agar siz Unicode bilan ASCII kodlangan faylni ochsangiz, siz hali ham faylda kodlangan to'g'ri belgilarga ega bo'lasiz. Bu Unicode-ning qabul qilinishini osonlashtirdi, chunki ASCII-dan foydalanayotganlar uchun yangi kodlash standartini qabul qilish ta'sirini kamaytirdi.

Xulosa:

1.ASCII 8-bitli kodlashni ishlatadi, Unicode esa o'zgaruvchan bit kodlash usulidan foydalanadi.
2.Unicode standartlashtirilgan, ASCII mavjud emas.
3.Unicode dunyodagi eng yozma tillarni anglatadi, ASCII esa bunday qilmaydi.
4.ASCII unicode ichida uning ekvivalentiga ega.

Adabiyotlar