掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
コードから日本語を抽出 (ID:140977)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
> ソースの一行ごとに対して、正規表現で半角のみ『^[ -~。-゜]*$』か > どうか判断して、半角のみでは無ければ全角文字が含まれているって > ことで、Excelに吐き出すってな感じです。 ではダメだということだそうです。 >>> おはようございます. 今日は 4日(木)です. には,いわゆる半角文字である, ・U+0020 SPACE ・U+0028 LEFT PARENTHESIS ( ・U+0029 RIGHT PARENTHESIS ) ・U+002E FULL STOP . ・U+0034 DIGIT FOUR 4 が含まれているからです。 個人的には,文字定数部分を全部取り出して,日本語かどうかは目視確認したら,とか思うのですが。 # 「日本語」とは何か,定義できていないようですし。
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.