EUCとJIS補助漢字について


ぴょぴょ  2008-04-01 15:36:52  No: 67932

シフトJISコードの0xF0〜0xFCにあたるJIS補助漢字の変換方法を知りたいです。
そもそもJIS補助漢字をJISコードでは表現できないのでしょうか?

やりたいことはEUCコードをシフトJISコード(文字列)に変換したいです。
ただいまの実装状況は
1.0x00〜0x1F,0x7Fの制御コードをそのまま
2.0x20〜0x7EのASCIIコードをそのまま
3.0x8E+0xA1〜0xDFコードを半角カナとして変換
4.第1バイトが0x1A〜0xFE、第2バイトが0x1A〜0xFEをJIS漢字としてシフトJISコードに変換
5.0x8FのJIS補助漢字をシフトJISコード(0xF0-0xFC)に変換
最後の5だけが不明なため実装できずにいます。

EUCのJIS補助漢字がシフトJISコードの0xF0〜0xFCに
どのようにマップされるのかを知りたいです。
いろいろと調べてみましたが対応表が見つかりませんでした。

文字コードに詳しい方
よろしくお願いします。


YuO  2008-04-02 07:13:49  No: 67933

EUCコードがEUC-JP,シフトJISコードがShift_JISだとし,IANAの定義通りに解釈するものとします。

Shift_JIS = JIS X 0201 + JIS X 0208
EUC-JP = US-ASCII + JIS X 0208 + JIS X 0201 (カタカナ) + JIS X 0212
です。EUC-JPとShift_JISの間の変換では,US-ASCIIとJIS X 0201の相違部分である
・\
・~
が正しく変換出来ません。
# US-ASCII = JIS X 0201という読替で妥協することがよくある。

また,Shift_JISに含まれないJIS X 0212 (補助漢字) については,当然変換する方法が存在しないため,JIS X 0212を利用したEUC-JPからShift_JISの変換は不可能になります。


※返信する前に利用規約をご確認ください。

※Google reCAPTCHA認証からCloudflare Turnstile認証へ変更しました。






  このエントリーをはてなブックマークに追加