EUCもしくはS-JISの文字コードをS-JISに変換するには?

解決


疾風  2005-12-28 05:47:25  No: 129280

S-JISもしくはEUCのいずれかのコードで作成されたファイル内容を
S-JISに変換しDBに登録したいと思っています。

処理としては、最初にS-JISもしくはEUCのコードをチェックし
EUCならS-JISに変換しDBに登録するといった方法になると思います。

コード変換は、ADODB.Stream等で問題等でできるのは確認していますが
その文字コードが何かを確認するのに簡単に簡単な方法はあるのでしょうか
教えて下さい?

開発環境はVB6.0+NT4.0です。


魔界の仮面弁士  2005-12-28 09:44:19  No: 129281

自動化するのは良いですけど、コードの仕組み上、完全な判定は
できないのですから、どこかで人間の目視チェックは必要ですよ。
(半角カナの多い文章や、ごく短いテキストは、機械的な判別は困難です)

それを踏まえた上で、という事であれば、ADODB.Stream で
Charset に "_autodetect" を指定してみてください。自動判定になります。

コンポーネントに頼らず、自前で判定を行いたい場合は、下記が参考になるかと。
http://www.gprj.net/dev/tips/other/kanji.shtml


疾風  2005-12-28 20:20:24  No: 129282

魔界の仮面弁士様回答ありがとうございます。

とても参考になりました。

人間の目視チェックが、必要なのはわかっていますが
もともと仕様外の対応なのである程度は理解してもらえ
ると思います

※仕様はS-JISで統一となっていますが・・・。
  EUC側が直さないといってこっちで対応すること・・・。


※返信する前に利用規約をご確認ください。

※Google reCAPTCHA認証からCloudflare Turnstile認証へ変更しました。






  このエントリーをはてなブックマークに追加