『 'AFast,EnjoyableHTMLParserforRuby¶' 』
『 >>RubyによるWebScrapingライブラリの情報をまとめるためのWikiです。 』
こんにちは、編集マンの久次です。 なんだかPerlのWeb::Scraperが便利すぎで、やばいです。 これまでWWW::Mec...
これはちょっと使ってみたい。忘れないようにメモ的エントリー。 htmlSQLはPHPで使うライブラリです。これを使えばHTMLの...
『 rubyのHpricot、Mechanizeを使った高レベルscrapingライブラリ。記述がDSLで独特。使いやすいらしいがど... 』
とりあえずこんな感じで。 元ネタはニコニコ動画をWeb::Scraperでスクレイプ - Magical Diary, beta...
HTMLをスクレイピング(scraping)してあれこれとするとき、僕はずっと正規表現に頼っていたのですが、 ページの構造が変化...
ちょうど日本に帰ってきた時期と台湾から gugod が来日するのがかぶっていることで実現した Shibuya.pm Tech T...
福岡ファミリー向け物件特集!: ファミリー物件 [1]を見ていて、これはいいな、RSS登録するか。 と思ったのですが、このRSS...
Web スパイダーはインターネットを検索および移動する手段として主に HTTP を使っています。HTTP はメッセージ指向のプロ...
『 HTMLScreenScrapingToolsWritteninJava 』
perlのWeb::Scraperみたいな記述で、ページの中からデータを取り出すwebscraper.jsという小さなjavas...
いままで使ってきたスクレイピングを使ったサービス(レシピ検索、書籍在庫一括検索)を作ってきましたが、そこで使ったものをまとめて、...
id:miyagawa さんの Web::Scraper で、HTML::TreeBuilder::XPath の代わりに XM...
WebサービスのAPIやRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつ...
『 naoyaさんの言ってる「ruby版と同じ」ってのはscrAPIの事だよね→http://d.hatena.ne.jp/seco... 』
GETでリクエストすると入力フォームを表示し、POSTでリクエストするとクエリー文字列に従ってページを表示するCGIです。 xs...
おかげで正規表現をたくさん書く機会が得られたし、CPANのモジュールともたくさん触れ合うことができたし、さらに自分自身でも構造化...
スクレイピングをやったことがあるひとならばわかると思うけど、スクレイピングはとてもつまらない作業だ。 HTMLの中から抜き出した...