C'de ASCII - UTF-8 - UNICODE Kavramları



  • ASCII  :Standart ascii ’de türkçe karakter bulunmamaktadir. Çıkış amacı amerikan sisteminin ihtiyaçlarını karşılayacak şekildedir. C'de standart olarak karakterlerin ascii karşılıkları sistemde tutulmaktadır. Mesela A harfi sistemde 65 olarak tutulmaktadır. 7 bit' lik bir sistemdir.


image
  • UTF-8  :(Unicode Transformation Format 8-bit ) ASCII’ye bir bit koyularak 128 olan karakter sayisi 256 olmustur. Geriye çikan 128 karaketr için farkli bölgeler için farkli tablolar kullanılmaya baslanmistir. 8 bit' lik bir sistemdir.

  • UNICODE : Tüm karakterlerini içerir. universal code’un kisaltmasi. 8 bitlik characterler yerine 16 biti kullanir. Bazı özel amaçlı karakterlere control karakterleri denir. Görüntüsü olan control karakterlerine punchiation character denir.

C'de ASCII Kavramı:

C ‘de bir karakteri char olarak belirtebileceğiniz gibi doğrudan sayı formatında hex veya octal olarak da belirtebilirsiniz. Aşağıda \x’ ile başlayanlar hex olarak kabul edilmiş belirtilmeyenler octal olarak ifade edilmiştir.

image


Not: Büyük harflerden küçük harflere geçisi kolaylastirmak için 32 karakter uzaklik olusturulmus ki büyük harf A’nin 5. biti degistirilince küçük harf a olsun istenmistir.



Unicode karşılıkları için