page 0 - << : 0 : >>
* やっつけspam対策
#掲示板spam対策
- メール欄(当サイトではurl欄に転用だが、nameは'mail'のまま)に「@」があったら、それはspam
- 本文に「''<a''」や「''[url''」があったら、(ry
if ($FORM{'mail'} =~ /@/) {
$is_spam = 1 ;
}
if ( ($FORM{'data'} =~ /<a/) or ($FORM{'data'}=~ /\[url/)) {
$is_spam = 1 ;
}
* HTMLをXHTMLに変換してREXMLで処理
プログラム(抜粋)
#Web #ヤフオク
h = Html2xhtml.new
h.read_array(readlines)
require "rexml/document"
y = REXML::Document.new(h.body.to_s)
y.elements["/html/body"].elements[6, 'table'].elements['tr/td'].elements.each('a') do |a|
p a.attributes['href']
print a.text.strip + "\n"
end
結果"http://auctions.yahoo.co.jp/jp/0-category.html?" オークション "http://list3.auctions.yahoo.co.jp/jp/23336-category.html?" コンピュータ "http://list3.auctions.yahoo.co.jp/jp/2084039759-category.html?" パーソナルコンピュータ楽だ…めっちゃ楽だ…
#Web #ヤフオク
