掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
文字コードを判別するには (ID:3463)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
EUCよりSJISのほうが優先であればそれで問題ありません。 問題なのは、「EUCの2バイトコードで、SJISの2バイトコード(もしくは半角カタカナ2文字)にあたるコードがある」ことです。 もし、JIS,SJIS,EUCを同時に判別するのであれば、whileなどでループさせて、状態を「JIS/SJIS/EUCの可能性あり」とし、 ・ASCIIコードであれば、可能性は保留(変化なし) ・ESCコードがあればSJIS,EUCの可能性はない(JISの可能性のみ) ・SJISコードであれば、JISの可能性はない ・EUCコードであれば、JISの可能性はない ・可能性が1つであれば、その文字コードと断定 と処理すればよいかと思います。 SJISとEUCの処理では、さらに、 ・SJISであり、確実にEUCでなければJIS/EUCの可能性はない(SJISの可能性のみ) ・EUCであり、確実にSJISでなければSJIS/JISの可能性はない(EUCの可能性のみ) とできます。 # 条件はわすれましたが、いくつかのコードがあったと思います
←解決時は質問者本人がここをチェックしてください。
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.