HTMLソースからリンクのURLを取得するには?


Hiro  2002-10-31 08:06:51  No: 1936

HTMLソースなどから、リンクのURL(A HREF=〜)を取得するにはどうすればいいのですか?


にしの  2002-10-31 08:15:48  No: 1937

文字列を解析して、そこがURLかどうか判別するしかないと思います。
'<'を探し、次がアルファベットだったら、そこの単語の次の単語から、'>'が現れるまで、
文字列=値
となっている部分を取り出し、文字列がHREF,SRC,CLASS,BACKGROUND,...などならば、値をURLと見なすという風にしてみてはどうですか。
Lex,Yaccを使うと、ほとんど解析ルーチンを作らずにすむので楽です。
# Lex,Yaccの使い方を知らないと、覚えるのに大変かもしれませんが
Delphiで使えるLex,Yaccについては、
http://www2.big.or.jp/~osamu/Delphi/
こちらを参照してください。


※返信する前に利用規約をご確認ください。








  このエントリーをはてなブックマークに追加