大阪南港ATCで開催された「関西オープンソース2008」の2日目(11月8日)午前中のセッションで、株式会社はてなCTOの伊藤直...
米Googleは5日、ソースコードの検索が行なえる「Google Code Search」を、Googleの実験的サービスを紹介...
テキストデータを n 個の文字の並びである N-gram に分割して検索を行うた め、「検索漏れが生じない」、「辞書の整備が必要...
KOF 2008 での発表資料「はてな流大規模データ処理」を以下にアップロードしました。 http://bloghackers....
ソースコードで配布しています。configure; make; make install して使ってください。ライブラリのみ使い...
文章からキーワードを抜き出すAPIを実験的に公開します! いわゆる特徴語抽出です。 APIとして公開することで実証実験、精度向上...
住所から緯度・経度を検索したいのですが、どういう方法があるのか知りたいです。 いろいろ調べてみると、国土交通省が住所と緯度・経度...
ユカタン、SLをdisる。「常時“「ドラクエII」で船を手に入れた後状態”」「ぼくも当然知っている。新しい可能性を感じさせるね(...
『 「theInternet'sfirstRegularExpressionLibrary」。なんてニッチな。 』
形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、...
『 Diggisatechnologynewswebsitethatemploysnon-hierarchicaleditorial... 』
とある会社にお呼ばれして、先の水曜日に、クローラについて講義(?)をしてきました。その時に使ったパワーポイントのスライドを公開し...
『 左フレームのリストからCSSプロパティを選択すると、右フレームに選択したプロパティの仕様が表示される。便利。CSS2仕様書のデー... 』
『 SEOmoz|GoogleSearchEngineRankingFactorsにて、世界34人のSEOのプロの投票によって決定し... 』
『 内容もいいのですが、たつをさんのエントリーにはエクリチュールがあると今回はじめて思いました。 』
ブログ検索において、RSSは必ずしも記事全文を配信していないので、クローラーが記事のURLにアクセスし記事の本文を取得するケース...
『 Google'stechnologyplayground.Googleのβサービスの一覧。おもちゃ箱みたいなもんです。 』
あまり感心しない用途だとは思われますが、MD5 Hash 値を逆変換したい、と思ってる人に朗報です。Hash 値を Google...
最近,ネットワーク管理者を悩ませているセキュリティトラブルと言えば,まず最初に挙げられるのがspam/ウィルスメールの類でしょう...
エンジニアにとって、これはなかなか素敵なサイトではないだろうか。 あのサイトってどんな技術で作られているのだろう?という疑問に答...