掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
文字コードを判別するには (ID:3462)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
にしのさん、どうもありがとうございます。 > 最初のABCを処理するとき、とりあえず保留するための処理が必要になります。 ということは、例えば、あるテキストファイルが Shift_JIS で あるかどうかを「チェックするだけ」であるなら、 isknj1 and isknj2 が true であるなら、そのテキストファイルは Shift_JIS と 判断しても OK ということなんでしょうか? 上記の 2 バイト文字の 1 バイト目を見つけるには、Bytetype を 使用すれば、判断できると考えているのですが…。 つまり、 「ABCあいう」という文字列あった場合、Bytetype で 2 バイト文字の 1 バイト目("あ"の 1 バイト目)を見つけて(つまり、mbLeadByte が返されたか どうかをチェックして)、にしのさんが示していました >c1 := 2バイト文字の第1バイト; >c2 := 2バイト文字の第2バイト; >isknj1 := ((c1>=$81) and (c1<=$9F))||((c1>=$ED) and (c1<=$FC)); //第1バイトチェック >isknj2 := ((c2>=$40) and (c2<=$FC) and (c2<>$7F)); //第2バイトチェック >で、isknj1 and isknj2のとき、SJISの2バイト文字です。このほかにASCII文字の判別が必要です(要は半角文字の判別です)。 を行い、isknj1 and isknj2 が true であったら、Shift_JIS である。 と考えているのですが、正しいでしょうか? よろしくお願いいたします。とんちんかんな質問でしたら、すいません。
←解決時は質問者本人がここをチェックしてください。
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.