掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
文章から漢字・カタカナ文字を抽出するには? (ID:146506)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
こんにちは。 以下のルールで文章から単語を抽出したいと考えています。 ルール: ・漢字・カタカナが連続している文字を抽出。 ・半角に変換できる数字(漢数字は上記漢字に含める)・記号・ひらがな・句読点は抽出対象外とする。 (漢字以外の全角記号は抽出対象外としたいのですが、難しいようであれば漢字と同じ扱いとします。) 例えば、以下の例文では、 「あまり長文にならないようにしてください。 エラー発生時、再送信すると二重送信になることがあります。 回答が得られたら、お礼書き込み時に[解決]チェックしてください。」 長文 エラー発生時 再送信 二重送信 回答 得 礼書 込 時 解決 チェック が抽出されるようにしたいのです。 そこで質問ですが、 ・ある文字が上記ルールに適合するかどうかを簡単に調べる方法はありますか? ・上記ルールの正規表現(RegEx)パターンを簡単に表すことができるでしょうか? (可能であれば、パターンをお教えください。) 宜しくお願い申し上げます。
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.