掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
ファイルのエンコードを調べるには? (ID:144814)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
厳密には無理でしょうね。 たとえば、「E0 E8」というデータを持った 2 バイトのファイルが あったとしましょう。 このファイルを、EUC-JP のテキストとして解釈した場合は『琥』の文字を 表しますが、Shift_JIS として解釈すれば『琲』となります。 韓国の CP949 だとすれば、『「剣」の左半分が「炎」な文字』ですし、 Unicode(UTF-16)なら、外字領域にある文字を指します。 同じデータであっても、複数の解釈が可能になってしまうわけです。 また、もし UTF-8 と Shift_JIS に限定したとしても、どちらが正しいのかを 自動判定するのは困難でしょう。一応、BOM 付き UTF-8 であれば、 「これは Shift_JIS ではない」と判定することができるので救いがありますが、 BOM 無しでは、どちらとも取れるデータの組み合わせとなる可能性があります。 http://vsug.jp/tabid/63/forumid/51/postid/2951/scope/posts/Default.aspx
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.