バイト配列の文字コード判定

解決


edotatsu  2012-11-30 11:27:35  No: 147981  IP: [192.*.*.*]

VB2010でプログラムを作成しています。
文字コードが分からないバイト配列があるのですが、バイト配列の文字コードを判別するしたいのです。
よろしくお願いします。

編集 削除
YuO  2012-11-30 16:14:45  No: 147982  IP: [192.*.*.*]

力業としては,想定されるエンコーディングすべてでデコードしてみて,失敗率を比較するとか。
フォールバック先をU+FFFFあたりにマッピングすれば,ありえない文字へのマッピングですから失敗を数えることが出来るかと。
ref) http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=41006&forum=7

あとは,自分で調べるとか外部ライブラリに頼るなどの方法になります。
ref) http://dobon.net/vb/dotnet/string/detectcode.html

編集 削除
edotatsu  2012-12-03 14:39:41  No: 147983  IP: [192.*.*.*]

YuOさん、ありがとうございました。
力業にするか外部ライブラリにするか考えてみたいと思います。
簡単で確実な方法がないことはわかりましたので、本件は解決とさせていただきます。

編集 削除