ASCII Code, Unicode, encode, decode (2편)
표현 방식 UTF-8은 위 규칙에 따라서 유니코드 문자를 인코딩 합니다. 1바이트 : ASCII코드 문자가 ASCII 코드인 경우에는 ASCII와 동일하게 1바이트로 표현을 합니다. 2바이트 : 아랍, 히브리, 대부분의 유럽계(조지안 문자 제외) UTF-8에서는 U+0080 ~ U+07FF 사이의 아랍, 히브리, 유럽계 문자들을 2바이트로 표현합니다. 여기서 앞의 바이트 앞에 110을 붙이고, 따라오는 바이트의 앞에는 10을 붙이는 규칙을 적용합니다. 3바이트 : 기본 다국어 평면(BMP) ASCII와 아랍, 히브리, 유럽계 문자들을 제외한 BMP 문자들은 모두 3바이트로 표현합니다. 3바이트로 표현하는 규칙을 2바이트와 유사하게 적용됩니다. 첫 바이트 앞에는 1110을 붙이고, 나머지 두 바이트 앞에는..