Amazon KDP Kindle 電子書籍 個人作家 ランキング 1.1


http://kdp.url.ph/cakephp/ranking


裏側には何万件もの電子書籍のデータを収集しているというのに、上位300件しか見えないのもどうかと思ったので、
上位9900位までみれるようにしてみた。


あまりにも重くなるので300位ずつに区切った。


9900位というのは、今日の時点で、1万位以降になるともうほとんどランキングがついていないものばかりなので
ランク圏外同士を比較しても順位に根拠がなくなるため設けた閾値


良く把握していないが、月の頭にランキングがリセットされるのであれば、その瞬間には上のほうしかデータを表示しなくなると思う。
ランクが入ってくるにつれ再び再集計されていくので問題はないと思う。


と同時に、著者名検索の機能を追加した。
DBが24時間以内にデータを取得できた著者については、検索で著者内でのランキングが出る。
ただ、見てみるとやはりAmazon APIがコケてる著者が結構いるように思えた。
コケた場合に即リトライすればいいと思う所なのだけど、HOSTINGERがスクリプトの実行時間を30秒タイムアウトにしているため、
リトライを繰り返すとスクリプトそのものがコケる。
今のところは、最大24時間後に再び同じ著者を引いた時に元通りになるのを待つ、みたいな仕組みになっている。
(古いデータは問答無用で削除している。ランキング順位が古いままソートすると、ランキングの精度が狂うのであえて古いデータは残さず消していく仕組み)。


http://kdp.url.ph/cakephp/ranking


実はとにかく膨大なデータがあるので、
ランキング以外のデータマイニング的な活用方法についても、今後検討していきたいと思う。