2007年10月30日

Googleニュースで日本語の古い記事を検索するには

今日、Googleニュース日本語版のRSSが前に一度現れたけど、今はない、という話書いたのですが、あのあとなんとはなしに検索してたら、なんと裏技的にできるという記事を発見してしまいました。

Googleニュース日本版のAtom/RSSフィード(daily gimite)

海外のにはRSS機能がついてるので、そのオプションを使って日本語のを取得しちゃおうという方法です。

http://news.google.com/news?hl=ja&ned=us&ie=UTF-8&oe=UTF-8

の後ろに、
◎配信方法
output=atom (Atomで出力)
output=rss (RSSで出力)

◎カテゴリ
topic=h トップニュース
topic=y 社会
topic=w 国際
topic=b 経済
topic=p 政治
topic=s スポーツ
topic=e 文化・芸能
topic=t 科学・技術
topic=po 話題のニュース
q = [検索キーワード] キーワードに関連するニュースRSS (ただしUTF-8で表示する必要あり)

◎並び順
scoring=n (日付順に表示)
scoring=d (重複も表示)

を組み合わせて入れればよいようです。

ちなみに以前私が「競馬」というタイトルでGoogleニュースカスタマイズサイトに入れてると言っていた「馬 レース 競馬」のニュースRSSフィードは、こちら。競馬関係のニュースが拾えます。

いろいろやっていて気づいたのですが、要するにned=us&hl=jaというパラメーターをつけることで、英語版インターフェースを使って日本語のニュースを検索できるんですね。何故か日本語版のGoogleニュースは、検索結果が「過去1ヶ月」までしか無くなってしまったのですが、米国版にはニュースのアーカイブサーチというのがあります。それを使えば古い記事も簡単に検索することができるのです。それにhl=jaのパラメーターを付ければ、日本語の記事でも古いモノが検索できるということです。おーこれは検索プラグインにすると便利かもと思って、作ってみました。

Googleニュース検索プラグイン (Firefoxで確認済)

もう一度検索したりするともうだめだったりするのですが、その場合はもう一度URLに&hl=jaを加えるとよいと思います。アルファベットで検索しちゃうとうまくいかないかなー。Timeline機能とか使うと、時系列にニュースが一覧できて面白いですよ。

日本でも日経とか、朝日とか、読売とか、かなり古いところまでデジタルでデータを持っているんです。読売なんて、明治期のものまでデジタルで検索できるんです。索引と冒頭部分だけでもGoogleに渡すことで、検索エンジンでひっかかりやすくなってNew York Timesのように記事を切り売りできるんじゃないのかなあ、って思うんですけどね。なかなか難しいのでしょうか。

0 件のコメント:

コメントを投稿