掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
語句の類似性の判断 (ID:33516)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
研究レベルだと思いますし、私はそういうの詳しくないですが。 私なら、スコア化します。 たとえば 同じ位置、違う文字、違う意味をもつ単語を0pt 同じ位置、違う文字、同じ意味をもつ単語を1pt 同じ位置、同じ文字を3pt 同じ位置、同じ順序を*1.2 「ガーリック」と「ガリーツク」 ガ ガ +3 *1 ー リ +0 *1 ッ ツ +1 *1.2 ク ク +3 ((3+0+1+3)*1*1*1.2)/4=2.1ポイント みたいな感じで、ルールやスコアは目的に合わせて変更させていけばかなりの精度が出そうな気がします。 あー、順序不動文字ポイントなんかもつけるといいかもしれませんね。 この場合4文字一致で1文字近似とか なんか考えているうちに面白くなってきました。 あとで少し調べてみます。
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.