文字コード

以前、まるぼ〜の日記 - 漢字の文字コードについて書いたけど、もう少し調べたのでメモっとく。

1.符号化方式により扱える文字コード規格(Windows2000, WindowsXP)

CP932(シフトJIS) UNICODE
JIS X 0208:1997 JIS X 0208:1997
NEC 拡張文字 JIS X 0212
IBM 拡張文字  
外字 私用領域

CP932でもUNICODEでも JIS X 0208:1997 の部分は同じ。JIS X 0208:1997 に含まれない漢字は CP932 の場合、IBM拡張文字として追加している。UNICODE補助漢字(JIS X 0212)として追加している。

2.各文字コードで規定された漢字

3.第三水準・第四水準

第三水準・第四水準漢字は Windows XP 以前では、一部は IBM拡張文字(CP932)もしくはJIS X 0212補助漢字(UNICODE)で表示できるものの、全てを網羅できていない。ここに無い漢字を使う場合は外字として登録し、使用する事になる。
なお、Windows Vista では JIS X 0213:2004 に対応することになったので第三水準、第四水準の漢字は全てデフォルトで表示できる。(但し、UNICODEに限る)