物欲購入目録日誌 写真館
スポンサーサイト
--.--.-- (--:--) スポンサー広告
Twitterでつぶやく
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
Rubyで Google PageRank(ページランク)を取得する方法
2012.01.24 (21:03) プログラミングtrackback(0)comment(0)
Twitterでつぶやく
1278493147013949200.png


ネットを調べれば、やりたいことのサンプルコードは転がっていて比較的簡単に入手できるが、

実際には情報が古かったり、情報が分散されていてタスクが難しくなることががあるので簡単なことでも情報をまとめておくことが大事である。

ということを踏まえてGoogleのPageRankをRubyのスクリプトから直接参照できるやり方をご紹介。

まず、以下のページのサンプルコードを拝借してくる。

DZone Snippets
http://snippets.dzone.com/posts/show/3284

googleのPageRankはgoogleツールバーのAPIを用いて取得するのですが、その際にチェックサム値を算出する必要があるこのタスクをこのスクリプトは全部やってくれる。

しかし、このスクリプトを実行するだけでは取得することはできない。なぜならちょっと前にgoogle のツールバーのAPIのURLが変更になっているからです。よって以下のようにURLを修正する。


# このURLが古くなっている
# "http://toolbarqueries.google.com/search?client=navclient-auto&hl=en&ch=#{cn}&ie=UTF-8&oe=UTF-8&features=Rank&q=info:#{URI.escape(@uri, /[^-.!~*'()a-zA-Z\d]/)}"
# このURLが新しいURL
"http://toolbarqueries.google.com/tbr?client=navclient-auto&hl=en&ch=#{cn}&ie=UTF-8&oe=UTF-8&features=Rank&q=info:#{URI.escape(@uri, /[^-.!~*'()a-zA-Z\d]/)}"


このURLが古くなっているという記事は

http://www.suzukikenichi.com/blog/google-pagerank-unavailable-on-3rd-party-tools/

などで参照されている。
このように情報が分散してしまうと途端に情報を統合して理解するこが難しくなってしまう。

ということで、実際に上記のコードで買い換えて実行してみると


$ ./google-pr.rb 'http://tachiphoto.blog61.fc2.com/'
2

と返却されオイラのブログのページランク値が'2'であることがわかる。
当然ながら、リストなどを渡せは複数のページランク値を一度に取得することも可能となります。
prevhome next












トラックバックURL
→http://tachiphoto.blog61.fc2.com/tb.php/1572-edba5705
home
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。