AWStats的补充定义:区分百度图片搜索和一些新出现的流量较大蜘蛛

作者:车东 发表于:2008-10-03 13:10 最后更新于:2008-10-03 13:10
版权声明:可以任意转载,转载时请务必以超链接形式标明文章和作者信息及本版权声明

更新后的AWStats最新版本lib目录打包下载,蜘蛛定义部分增加了区分Yahoo!中国,Soso 豆瓣,鲜果等,其他的是几个国外的RSS阅读器;搜索引擎部分区分了百度图片,有道搜索,soso搜索; diff附后:
Index: robots.pm
===================================================================
RCS file: /cvsroot/awstats/awstats/wwwroot/cgi-bin/lib/robots.pm,v
retrieving revision 1.52
diff -r1.52 robots.pm
356a357
> 'yahoo!\sslurp\schina',
476a478
> 'soso',
677a680,688
> 'blogbus',
> 'QBikSpider',
> 'Zwl.Rss.Spider',
> 'BBReaderFeedSpider',
> 'yeti',
> 'doubanbot',
> 'moreoverbot',
> 'xianguo',
> 'blogvibebot',
997a1009
> 'yahoo!\sslurp\schina','<a href="http://misc.yahoo.com.cn/help.html" title="Bot home page [new window]" target="_blank">Yahoo! Slurp China</a>',
1114a1127
> 'soso','<a href="http://help.soso.com/webspider.htm" target="_blank">Soso Spider</a>',
1318a1332,1340
> 'blogbus','<a href="http://www.blogbus.com" title="BlogBus Home [ new window ]" target="_balnk">BlogBus</a>',
> 'QBikSpider','QBikSpider',
> 'Zwl.Rss.Spider','Zwl.Rss.Spider',
> 'BBReaderFeedSpider','BBReaderFeedSpider',
> 'yeti','<a href="http://help.naver.com/robots/" target="_blank">Yeti</a>',
> 'doubanbot','<a href="http://www.douban.com" target="_blank">doubanbot</a>',
> 'moreoverbot','<a href="http://www.moreover.com" target="_blank">Moreoverbot</a>',
> 'xianguo','<a href="http://www.xianguo.com/" target="_blank">XianGuo</a>',
> 'blogvibebot','BlogVibeBot',


Index: search_engines.pm
===================================================================
RCS file: /cvsroot/awstats/awstats/wwwroot/cgi-bin/lib/search_engines.pm,v
retrieving revision 1.45
diff -r1.45 search_engines.pm
287a288
> 'image\.baidu\.com',     # baidu image search
295a297
> '\.youdao\.com',       # powered by NetEase
501a504
> 'image\.baidu\.com','baidu_image',
506a510
> '\.youdao\.com','yodao',
765a770
> 'baidu_image','(wd|word)=',
771c776,777
< 'soso','q=',
---
> 'yodao','q=',
> 'soso','w=',
992a999
> 'baidu_image','<a href="http://image.baidu.com/" target="_blank">Baidu Image</a>',
997a1005
> 'yodao', '<a href="http://www.yodao.com/" target="_blank">YoDao</a>',

Comments

多谢车东,已经用上。

这个解压后直接上传到lib目录就好了吗?

老大有没有研究过awstats的对于页面下载时间的分析?
iis,squid中都可以定义页面下载时间这一段,如果能分析最好了.很实用.

奇怪, 为什么我去下载6.8已经自带了. 可能已经更新了吧

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36