掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
語句の類似性の判断 (ID:33515)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
テキストボックスから入力された2つの語句の「類似性」を判定する良いアイデアはないでしょうか。 ここでいう「類似性」とは、 ・ファンとフアン、キックとキツクの例 ・ルーターとルータの例 ・第1と第一の例 ・緑ヶ丘と緑ガ丘と緑ケ丘の例 ・の、ノ、乃、之の例 のような例です。 ・一文字ずつのトークンに分解して、大文字なら小文字へ、全角なら半角へ変換したもの同士を比較し一致するか ・あらかじめ定義した異体字テーブルの要素に含まれるか といった方法しか思いつきません。 何か良い方法がありましたら、ご教授願います。 最終的な用途としては、用語辞典の編集をする際、登録しようとする語句と同一か似た語句がすでに登録されていないかどうかを判別するのに使います。
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.