掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
文字コード、改行について (ID:3193)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
stringならばShiftJIS。WideStringならばUnicodeです。 基本的に、Windowsのみであれば、ShiftJISだけで済むと思います。 ただ、メールではShiftJISは使えません。JISのみ正しく送れます。SJIS,EUCともに8ビット文字を含むので、メールが正しく送れるかどうかは、中継するサーバに依存します。 ShiftJISは、特にエスケープせずに、通常のASCIIと一緒に表せす。ただし、2バイト文字の2バイト目に、$00〜$7Fの範囲にある文字が含まれるので注意が必要です。 EUCは、2バイト文字の1バイト目も2バイト目も8bit($80〜$FF)なので、判別が簡単です。もちろん、1バイト文字との混合も可能です。ただし、2バイト文字の1バイト目と2バイト目が同じ範囲のため、それのどちらかを判断することはできません。 JISは、全て7ビット文字で表されます。エスケープされた部分は必ずその種類と決定しますが、特定の場所を見るだけでは漢字なのか1バイト英数なのかわかりません。頭から解析する必要があります。 改行コードは、もしかしたらバイト数が少なくなるという理由でCRのみ、またはLFのみを使用している人がいるかもしれません。 通常、文字コードや改行コードを複数扱うのは、(Webサーバを含む)複数のOS間でテキストファイルのやりとりがある場合です。
←解決時は質問者本人がここをチェックしてください。
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.