戴欣如Unicode,UTF-8 字元碼,資料型態

維基百科UTF8


UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。

UTF-8的編碼方式

UTF-8是UNICODE的一種變長度的編碼表達方式〈一般UNICODE為雙位元組(指UCS2)〉,以8位元為單元對UCS進行編碼,而UTF-8不使用大尾序和小尾序的形式,每個使用UTF-8儲存的字元,除了第一個位元組外,其餘位元組的頭兩個位元都是以"10"開始,使文字處理器能夠較快地找出每個字元的開始位置。

 








劉任昌101單元

劉任昌102單元


UTF-88-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。它可以用一至四個位元組對Unicode字元集中的所有有效編碼點進行編碼,屬於Unicode標準的一部分


留言

張貼留言

這個網誌中的熱門文章

矩陣轉置TRANSPOSE,間接定址INDIRECT,資料驗證verification名稱管理員 name manager