文字コード
以前、まるぼ〜の日記 - 漢字の文字コードについて書いたけど、もう少し調べたのでメモっとく。
1.符号化方式により扱える文字コード規格(Windows2000, WindowsXP)
CP932(シフトJIS) | UNICODE | ||
---|---|---|---|
JIS X 0208:1997 | JIS X 0208:1997 | ||
NEC 拡張文字 | JIS X 0212 | ||
IBM 拡張文字 | |||
外字 | 私用領域 |
CP932でもUNICODEでも JIS X 0208:1997 の部分は同じ。JIS X 0208:1997 に含まれない漢字は CP932 の場合、IBM拡張文字として追加している。UNICODE は補助漢字(JIS X 0212)として追加している。
2.各文字コードで規定された漢字
- JIS X 0208:1997
- 第一水準
- 第二水準
- JIS X 0212
3.第三水準・第四水準
第三水準・第四水準漢字は Windows XP 以前では、一部は IBM拡張文字(CP932)もしくはJIS X 0212 の補助漢字(UNICODE)で表示できるものの、全てを網羅できていない。ここに無い漢字を使う場合は外字として登録し、使用する事になる。
なお、Windows Vista では JIS X 0213:2004 に対応することになったので第三水準、第四水準の漢字は全てデフォルトで表示できる。(但し、UNICODEに限る)