ぱたへね

はてなダイアリーはrustの色分けができないのでこっちに来た

Exercise 2.19

IrisとJulieの名前を、ASCIIとUnicode(Basic Laten character set)で表現しなさい。

テキストエディタで書いて、各文字コードで保存、バイナリエディタで覗いてみたら簡単にわかります。

ASCII

Iris 49 72 69 73
Julie 4A 75 6C 69 65

UTF-8

Iris 49 72 69 73
Julie 4A 75 6C 69 65

UTF-8はASCII部分は互換性があります。

UTF-16

UTF-8だと流石に問題の意味がなさそうなので、UTF-16でも調べてみました。先頭にFEFFのバイト順序マーク (BOM) が現れ、続いて16bitの文字が並びます。16bit中の下位8bitは、ASCIIと互換性があります。

FEFF 0049 0072 0068 0073
FEFF 004A 0075 006C 0069 0065