丸数字を入力するとMS-IMEの変換候補に「環境依存文字」と「環境依存文字(Unicode)」の2種類表示されることがあります。
「なぜ2つあるの?違いは?」という質問があったのでご紹介しますね。
← 候補に2つ表示…どちらを使うの?(→結論:Unicodeではない方を使う)
まず、IMEのコメントの違いですが【Shift_JISで表現できるかできないか】です。「環境依存文字」はJISX0208に登録されていないがShift_JISでは表現でき、「環境依存文字(Unicode)」はShift_JISでも表現できない(Unicodeでなら表現できる)というものです。
★環境依存文字の@
Shift-JIS、JISX0213、Unicodeに含まれる(ユニコード2460)文字化けの可能性は少ない
▼IMEパッド表
「環境依存文字」とだけ表示される2460の➀は、
かつて機種依存文字と呼ばれOSの違いなどで敬遠されていましたが、現在はUnicode、JISX0213やShift-JISで表現可能(cp932にあるから)なため、文字化けの可能性は低い(
でもIMEはJISX0208以外は環境依存文字のコメントをつける)
★環境依存文字(Unicode) の@
Shift_JISで表現できません。JISに含まれずUnicodeにしか含まれていない(ユニコード2780)文字化け可能性あり
▼IMEパッド表
IMEパッド表からも分かるように、2780の➀はユニコードにしか含まれていない。よってUTF-8やUTF-16といったエンコード
方式(CES)以外では文字化けの可能性がある。例えばOutlookで日本語JISで送信すると、2460の➀はJISに含まれるため正常表示するが、2780の➀は文字化けする。
(厳密にはiso-2022-jpはJisx0213をサポートしていないが(jisx0213はiso-2022-jp-2004)メーラーはiso-2022-jpや日本語(JIS)表記で2460の丸数字を表示。詳細は各システム側の処理なので割愛)
★
補足1:丸数字の歴史(簡単編)
JIS X 0208では丸数字はサポート外(JIS0208にはない)
↓
PC98でJISx0208の数字じゃ足りないってことで外字としてJIS X 0208に追加
↓
MacはPC98シリーズとは別のコード位置に外字として追加
↓
WindowsでPC98との互換性を保つため同じコード位置で実装→MSコードページ(CP932=Shift-JISの独自実装)とした(★機種依存文字)
↓
JIS X 0213で丸数字1-50まで追加(1-20までのコード位置はPC98やWindows(Shift-JIS)と同じ)符号位置1-13-1、Unicode2460
↓
UnicodeにもJIS X 0213で実装されている丸数字が含まれている(★だから文字化けしない)
↓
Unicodeにユニコード2780の➀が追加(ゴシック体の丸数字)が追加
★
補足2:2780の➀はゴシック体用に用意
ユニコード2780の➀の名称は「DINGBAT CIRCLED SANS-SERIF
DIGIT
ONE」です。名称にフォント名(Sans-serif(サンセリフ))が付いていることから、➀のゴシック体用のように登録されています。一般に字形はフォントで切り替えるので別の文字コード(符号番号)を割り当てることはしません。これは珍しいですね。