Word,Wxcel,一太郎で作成された文書に対して
vb.netから文字列検索を行いたいのですが、実現方法がわかりません。
ご存知の方がいらっしゃいましたら、ご教授お願いします。
一太郎はちょっと判りませんが、
http://www.adv.co.jp/
辺り参考になりませんでしょうか?
ファリンファリンさんありがとうございます。
早速、確認したいと思います。
現在私も全文検索をやっています。
日本語は英語のように分かち書きがないので
これを何とかする必要があります。
今日は高田馬場でラーメンの早食い競争があります
という文章をもった一太郎文章があるとします。
馬場さんが 自分と同じ名前の人でラーメンに関連した
文章を探すと
全文は 馬場とラーメンを持っているので
ヒットしますが
利口な分かち書き処理をすれば 高田馬場 は 連文で
馬場とは一致しないようになります。
これはもはや自分で処理できるレベルではありませんが
世の中にはこういう処理をしてくれてさらに高速検索
を提供するフリーソフトがあるんですよ。
あなたは、マンマシン系のみ作ればOK
{元来学術研究系ソフトなのでUNIX対応なので)
(1)NAMAZU を検索して全文検索を学習
(2)Perl(CGI)KAKASI{分かち書き}NAMAZU
インストール
(3)一太郎フィルターをサイトで探す
(4)検索対象を{デレクトリーやWeb指定で}
指定して高速インデックスファイル構築
NAMAZU コマンド (NoProgram)
(5)ComandInterPreterで試験
NAMAZU 馬場 ラーメン (インデックスファイルDIR)
これで 黒い画面に探し当てたファウル情報{複数}
表示
(6)上記(4)を1日に1回自動走行するように
Perlでプログラム作成
(7)上記(5)を快適に画面上で実行できるソフトをVBで作成