はてなアンテナの更新情報を取ってくる

2004-03-27 初出


はてなアンテナが持っている「どのページがいつ更新されたか」のデータを、自分のプログラムで使うには、 まずデータを使いやすい形式で取ってきて保存する。


わたしは面倒がきらいなので、アンテナページの HTML を解読するような手間のかかることはしたくない。 だから、アンテナデータを取ってくるときは LIRS 形式を使うようにしている。

http://a.hatena.ne.jp/****/source?mode=lirs&k= (**** ははてな ID )

とすると、 CSV 形式に近い LIRS 形式で更新情報を見られる。

はてなアンテナ殺人事件 - LIRS 形式
http://a.hatena.ne.jp/xx-internet/source?mode=lirs&k=

これをローカルに保存して、 EXCEL や OpenOffice Calc で日付と URL とページタイトルあたりを切り出すと、リンク一覧ができあがる。 ページタイトルでソートして a タグに加工してリンク集にするのもおすすめ。


アンテナ情報を別形式で取ってくる方法は http://a.hatena.ne.jp/****/config の下のほうに書いてある。 (ヘルプには書いていないのがミソ)
ほかにも mode に di を指定すると HINA-DI 形式、 hina を指定すると HINA 互換形式でデータを返してくれるらしい。 でも、ひとつの更新情報が複数行になっている HINA-DI 形式や、 HTML タグっぽい記述の HINA 互換形式よりは、 CSV と同じように扱える LIRS 形式のほうがあっさりしていてわたしは好きだな。

はてなアンテナ殺人事件 - HINA-DI 形式
http://a.hatena.ne.jp/xx-internet/source?mode=di&k=

はてなアンテナ殺人事件 - HINA 形式
http://a.hatena.ne.jp/xx-internet/source?mode=hina&k=


ちなみにわたしは LIRS 形式が何なのかまったく知らない。 日曜プログラムの醍醐味はいいかげんに独自拡張なので、何とかなるものですよ。


このテクニックを使って、はてなアンテナのデータを自分のページに埋め込んでいる人もいる。

Beltorchicca : 文系なりのガッツでIT革命に挑戦するコーナー

はてなアンテナの更新情報をページに埋め込む CGI の設置方法を解説している。

M's folder : はてなアンテナ取得CGI

同じようにアンテナ情報を埋め込む CGI 。はてなアンテナ埋め込みは、はてな LIRS 形式 -> CGI -> JavaScript 出力が主流らしい。

徒書 : はてなアンテナのgoをよけてみる

はてなアンテナのリンクから a.hatena.ne.jp/go を取り除く Bookmarklet 。


はてなダイアリーアンテナ LIRS 形式
http://a.hatena.ne.jp/hatenadiary/source?mode=lirs&k=

はてなダイアリーアンテナにはパブリックなはてなダイアリーが全部登録されている。 つまり、これを LIRS 形式で取ってくれば、「パブリックなはてなダイアリー一覧」がお手軽に作れるというわけ。
でも、おおぜいがこれを試すと、はてなの負荷がすごいことになるかもしれない。
なぜなら、このデータは今の時点で 3.3MB くらいあるから。
わたしはなるべくデータをキャッシュして、週に一度くらいしか取りに行かないようにしている。

index