高森太郎の日記。

高森太郎の日記です。

別人格サイトでのbotや通常のブラウザ以外のアクセス

 別人格サイトでは、ページのほうは各種アクセス解析を行っておりますが、実際にはRSSなどをつかってやっているのでそっちのほうの解析はその手のASPアクセス解析では無理であります。なので、そういう時はレンタルサーバアクセスログを眺めたり。

 で、最近は方針をかえて、もう手軽にばんばん書いちゃおうという方向で日記は更新を続けているせいか、また著名な方からリンクを張っていただいたりしたのもあるだろうけれど……もっというとi_knowへの更新反映対策で各種pingサーバにpingを送っているというのもあるだろうが、非常に多くのRSSクローラやRSSリーダーらしいユーザーエージェントが見て取れる。これがすげえ種類になってきている気が。

 かなり長い間のログを保存しているのだが(なんっつったってあんなに容量使い切れないのでだだ余りしているし、契約してから2年目を迎えているが、まだ利用料6パーセントってあと十年は平気で戦えそう(汗 )前とくらべて確実にそういうのが増えている。
 これって前みたいに杓子定規でユーザーエージェントではじくサイトが減ったというのもあるのだろうかとか思うが、どうもRSSをつかってなんぞごにょごにょやっているサイトが増えているなかなぁとか。IEのエージェントを吐いているのに明らかに人間のアクセスとは違うログもなんかある(数秒の誤差でほぼ同じ時刻に同じIPからアクセスがある)ので、それを入れるとどれぐらいになるのかなぁ、と……。というわけで、ぱっと目に付いた一般的なブラウザを並べてみる。

  1. Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.co
  2. msnbot/1.0 (+http://search.msn.com/msnbot.htm)
  3. Hatena RSS/0.2 (http://r.hatena.ne.jp; 1 subscribers)
  4. Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yaho
  5. PAIPO-Bot 0.1b
  6. Hatena RSS/0.2 (http://r.hatena.ne.jp; 2 subscribers)
  7. GEKKO STATE
  8. Bloglines/2.1 (http://www.bloglines.com; 1 subscriber)
  9. RssBar/1.24
  10. Accelatech RSSCrawler/0.4
  11. Comaneci_bot/2.0 (+http://help.i-know.jp/?crawler)
  12. Googlebot/2.1 (+http://www.google.com/bot.html)
  13. Y!J-BSC/1.0 (http://help.yahoo.co.jp/help/jp/search/indexing/
  14. Mozilla/5.0 (Sage)
  15. Mozilla/4.0 (compatible; Google Desktop)
  16. Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)
  17. Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; InfoP
  18. Hatena Antenna/0.4 (http://a.hatena.ne.jp/help)
  19. Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://sp.ask.com
  20. Mozilla/3.01 (compatible;)
  21. InternetLinkAgent/3.1
  22. blog search engine by BlogFan.ORG (http://www.blogfan.org/)
  23. Captain NAMAAN/0.05 (www.namaan.net)
  24. gooRSSreader2/2.5-build 20051124 (based on glucose)
  25. CE-Crawler-01
  26. 1.0
  27. BlogCrawler by Xango (VERSION 1.00 / http://xango.razil.jp)
  28. BlogRanking/RSS checker (http://blog.with2.net/)
  29. ichiro/2.0 (ichiro@nttr.co.jp)
  30. Bloglines/3.0-rho (http://www.bloglines.com;)
  31. Gigabot/2.0
  32. Hotzonu/2.0
  33. MagpieRSS/0.61 (+http://magpierss.sf.net)
  34. MaplogCrawler (+http://maplog.jp/)
  35. Mozilla/4.0 compatible ZyBorg/1.0 Dead Link Checker (wn.dlc@l
  36. Mozilla/5.0 (compatible; BlogShot Crawler /2.0; http://www.bl
  37. Urchin/6.3.05
  38. blogmap cralwer
  39. lwp-trivial/1.40
  40. wadaino.jp-crawler 0.2 (http://wadaino.jp/)
  41. Mediapartners-Google/2.1
  42. RssClip/1.00
  43. deck::feedscrew
  44. lwp-trivial/1.41
  45. ping.blogger.jp/RSSdiscovery v/0.1

 なんかしらんようなエージェントがたくさん。うーむ。こりゃなんだとかいうのがけっこうありますなぁ。一応ユーザエージェント改造をなさっているっぽい方は除いてありますがちょっと含んでいるかも。

 さらには、最近別人格サイトではGoogle Anlyticsを導入したせいもあでしょうが、ものすごい頻度でGooglebotが来たりするのでありますが……。最近はYahooのボットがすごい勢いで来るようになっている。以前は見向きもされなかったのだが……。さらにmsnがやたらと多いんだよなぁ。うーむ。