文字化け修正プログラムを作っています。
何とかまともに動くソフトができたのですが、
使い勝手が悪いので修正しようとしています。
現在は、修正前の文字(文字化け)ファイル、修正後の文字(正常な文字)ファイルと二つのテキストファイルを用意して、処理しています。
この二つのファイルを1つにしたいと思っているのですが、この場合データの区切りは「、」にすればいいのでしょうか?
それとも「タブ」かそのほかのものにすればいいのでしょうか?
文字化けとはどんなものなの?
何で二つのファイルを1つにしたいのかな?
ファイルの中身はどうなってるの?
>文字化けとはどんなものなの?
>ファイルの中身はどうなってるの?
。 ---> [
「 ---> ]
コ ---> ⇔
汢pnbsp;---> 《英》
氓オ ---> 《し
燹父g煌》 ---> 《米》
たとえば、---> の左側が文字化け状態で、右側が正常な状態です。
>何で二つのファイルを1つにしたいのかな?
他の文字化け状態もありそうなので、新しく見つかる都度ファイルに登録しておこうとしています。二つのファイルに分けて登録するより一つのファイルに登録したほうが、(ちょっとだけ)手間がへるかなあ、なんて思ったものですから...
文字コードを対象としてるなら、
どんなセパレーターでも100%安心ということはありません。
私なら、セパレータを使う案は却下しますね。
代案としては各文字列データの前にヘッダーを作ります。
例
元文字.データサイズ.実データ.変換文字.データサイズ.実データ....
初心者で、詳しいことが分からなければ
せーパレータに使う文字コードが元データに含まれていた場合、それを他の文字コードに置き換える(細かいこと言うとちょっと面倒ですが)とうことをすればどんな文字コードでもセパレータとして使うことができます。
あんこさん回答ありがとうございます。
>どんなセパレーターでも100%安心ということはありません。
>私なら、セパレータを使う案は却下しますね。
>代案としては各文字列データの前にヘッダーを作ります。
分りました。こちらの代案の方なら私にもプログラム組めそうです。
後の方は、なんか難しそうです。
なぞなぞさん、あんこさんありがとうございます。<(_ _*)>
分けずに2行で1つの組み合わせにすればええのでは?
1行目:化け文字
2行目:変換後文字
さすがに改行文字を変換したりしないでしょ?
と、解決後に言ってみる。
>分けずに2行で1つの組み合わせにすればええのでは?
ん! なるほど、こんな手もあったんですね。
これなら、今日中にできそうです。
(まあ、自分用なので納期はないんですが)
半人前さんありがとうございます。<(_ _*)>
「解決」になっていますので、よけいなお節介かも知れませんが・・・
これらの文字はもしかして、CGI(perl)やPHP等でのスクリプト処理時の
有名な(?)文字化けじゃ?
なんか見たような文字があったので・・・
違ったらごめんなさい。
>これらの文字はもしかして、CGI(perl)やPHP等でのスクリプト処理時の
>有名な(?)文字化けじゃ?
実は、あるソフトからの出力を加工しています。
書体とかリンクを張ったりとかしているので、
エディタに取り込んだとき文字化けしているようです。
(良くは分りませんが)
もちろん個人的に使うので、著作権には触れないと思いますけど...
(参考までに)
ところで、思っていた以上に短時間でできました。
みなさん、あらためてありがとうございます。
ツイート | ![]() |