◆ JIS X 0208 …
ひらがな・カタカナ・漢字・全角記号・英数字などの文字コード。
1978年に制定された、日本語環境で最も一般的で互換性も安定している文字集合です。英数字・ひらがな・カタカナ・全角記号に加え使用頻度の高い第1水準の漢字(2965字)と、使用頻度はそれほど高くないとされる第2水準の漢字(3388字)が含まれています。この文字集合に含まれる字であれば外部とのやり取りで文字化けする可能性は殆どないでしょう。
現在(Windows10の時代)でさえ最も安定している文字集合です。
尚、JIS X0208は以下のように何度か改定されています。
-
1978年制定− 通称JIS78
-
1983年改定− 通称JIS83(44字の入れ替え+300字の例示字形変更、75字追加)
-
1990年改定− 通称JIS90(2字追加)※Windows
XPからJISX0208:90(JIS90)を標準サポート。
↓
◆ JIS X 0212 … 補助漢字で構成される文字コード。
1990年に制定された補助漢字という使用頻度の低い漢字(5801字)や記号等の非漢字(266字)で構成される文字コードです。JISX0208にはない文字だけで構成されており(厳密には〆のみ重複)、これだけを単独で文字集合として使うことはなくJISX0208とセットで使うことを想定されていました。WindowsXPはJISX0212もサポートしており、MS-IMEの「単漢字辞書」にチェックを入れると変換候補に表示されます。JISX0212という文字集合はUnicodeにも収録されているため、Unicodeをサポートする環境であれば表示することが可能ですが、OSやブラウザ、ソフトによっては文字化けしたり、メールエンコードが意図しないものになる
可能性もあります。
現在(Windows7/10)ではJISX0213にこれらJISX0212の文字が多く重複
(完全包含ではない)している為、単独使用することは少ないでしょう。
↓
◆ JIS X 0213
…JISX0208を包含し更に第3・第4水準の文字を加えた文字集合
→
2004年に改定してJISX2013:2004(通称JIS2004)
2000年に制定されました。JIS X 0212がJIS X
0208にない文字を集めた集合であるのに対し、JIS X 0213はJIS0208を包含し、更に第3水準・第4水準の漢字(これらはJISX0212と重複している文字が多い)や記号を加えた上位集合です。JISX0212と一緒に使うとダブってしまう字が多いため(完全にJISX0213が0212を包含しているのではない)一緒に使うことはありません。JISX0213では、対応する符号化方式としてISO-2022-JP-2004
が定義されています。
2004年に改定され、168字の例示字形(JISが推奨する字の形)の変更、10字の追加が行われました。これが通称JIS2004と呼ばれる現在最新の文字集合です。
Windows10では(Vista以降)このJIS2004を標準でサポートしているため、収録されている文字を標準フォント(MS明朝、MSP明朝、MSゴシック、MSPゴシック、MS
UI Gothic、メイリオ、Meiryo UI、游朝体など)で表現できます。
更にJIS2004改定で例示字形が変わった168字についても
標準フォントで表示できます。例えば「かつしか」はJIS0208(XPなど)では「」で表示されてきましたが、JIS2004では「」で表示されます。(どちらも文字コードは同じで字形が変更されただけです。)
※Windows10ではIVS入力により、古いJIS90の字体も入力できます(詳しくはこちら)
《補足1》
JISX0213で追加された第3・第4水準の漢字はUnicodeにも収録されていますが、Unicodeをサポートしていないシステムでは文字化けする可能性があります。(例:Win7/10でネット上のフォームに入力できてもフォーム送信先で正常に表示されているとは限らない)
このような状況を回避する為、MS-IMEではJISX0208以外の文字に
は「環境依存文字」、Shift_JISでも表現できない文字には「環境依存文字(Unicode)」というコメントを表示し注意を促しています。
(第3,4水準の文字全てがShift_JISで表現できないわけではありません)
※第3・第4水準の文字を入力するにはMS-IMEの単漢字辞書にチェックON、「変換」タブ−「変換文字制限」−「変換文字制限をしない」となっている必要があります。
《補足2》
第3・第4水準が追加されたJISX0213はWindowsVista以降、標準サポートされましたが、実はXPでもこれらの漢字を表現できます。これは第3・第4水準の漢字としてJISで定義される以前にUnicodeとしてCJK統合漢字やその拡張領域に収録されているためです。ですからCJK統合漢字を表現できるフォント(NEW
GulimやSimSun)でUnicodeに対応しているアプリケーション(Word等)であれば表現可能です。(Vista以降は一般的なフォントで
も表示可能になった、例示字形に従って168文字の文字の形が変わった、ということです。)
例えばという文字はUnicodeのCJK統合漢字領域にも収録されています。ですからXPでもWordでNew
Gulimなどのフォントを使って表示することが可能なのです。(XP上のWordに3402と入力して「Alt」+「X」キーを押してみましょう。)
《補足3》
各文字コードに収録されている文字一覧は、MS-IMEのIMEパッド−「文字一覧」で確認することができます。文字カテゴリから確認したい文字コードセットをクリックします。
|