文字コードとは、文字に割り当てている番号です。それを日本語用の番号表、ドイツ語用の 番号表などにまとめた表を文字集合といいます。日本語対応の文字集合は、JISX0208、JISX0213、UNICODE等があります。
さて 文字コードの表だけあってもそれを変換する方式がないと字になりません。これが符号化方式(エンコード)です。日本の場合は、iso-2022-jpやUTF-8、UTF-16、Shift_JISなどがあります。 この符号化方式は、符号化できる番号表がそれぞれ違います。例えばISO-2022-JPは文字集合表としてJIS0208しか変換できません。JIS0208に入っていない文字は変換できないので文字化けします。
さて 文字コードの表だけあってもそれを変換する方式がないと字になりません。これが符号化方式(エンコード)です。日本の場合は、iso-2022-jpやUTF-8、UTF-16、Shift_JISなどがあります。
この符号化方式は、符号化できる番号表がそれぞれ違います。例えばISO-2022-JPは文字集合表としてJIS0208しか変換できません。JIS0208に入っていない文字は変換できないので文字化けします。
1963年に、米国規格協会ANSIがAsciiコードという文字集合をつくりました。英数字、記号、制御記号(空白等)を扱えるコードで100種類程度を表現できま す。これを元にどんどん文字集合が増えていきます。
マイクロソフトが各国版のWindows用に割り当てたデフォルトの 内部コードはそれぞれの国で異なります(言語が違うので当たり前)で、その内部コード総称してANSIと呼んだので、日本語版 ならANSI=Shift_JIS(CP932)となっています。つまり各国版のANSIはそれぞれ異なるということです。
ANSIはShift-JISという符号化方式です。ANSIは文字集合(文字の集まり)としてJIS0208集合にのみ対応しています。よって、JIS0208以外の文字を入力してANSIで保存すると文字化けを起こします。 参考:文字集合(CCS)と符号化方式(CES)とは
ANSIはShift-JISという符号化方式です。ANSIは文字集合(文字の集まり)としてJIS0208集合にのみ対応しています。よって、JIS0208以外の文字を入力してANSIで保存すると文字化けを起こします。
参考:文字集合(CCS)と符号化方式(CES)とは