バイト配列の文字コード判定

解決


edotatsu  2012-11-30 20:27:35  No: 147981

VB2010でプログラムを作成しています。
文字コードが分からないバイト配列があるのですが、バイト配列の文字コードを判別するしたいのです。
よろしくお願いします。


YuO  2012-12-01 01:14:45  No: 147982

力業としては,想定されるエンコーディングすべてでデコードしてみて,失敗率を比較するとか。
フォールバック先をU+FFFFあたりにマッピングすれば,ありえない文字へのマッピングですから失敗を数えることが出来るかと。
ref) http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=41006&forum=7

あとは,自分で調べるとか外部ライブラリに頼るなどの方法になります。
ref) http://dobon.net/vb/dotnet/string/detectcode.html


edotatsu  2012-12-03 23:39:41  No: 147983

YuOさん、ありがとうございました。
力業にするか外部ライブラリにするか考えてみたいと思います。
簡単で確実な方法がないことはわかりましたので、本件は解決とさせていただきます。


※返信する前に利用規約をご確認ください。

※Google reCAPTCHA認証からCloudflare Turnstile認証へ変更しました。






  このエントリーをはてなブックマークに追加