« 2006年06月 | (回到Blog入口) | 2006年08月 »

2006年07月 归档

2006年07月02日

[AWStats]6.6中的蜘蛛和搜索引擎数据库更新

最近sf.net的CVS库的访问有些更新,原先从cvs.sourceforge.net同步的代码现在要改成通过projectname.cvs.sourceforge.net了。所以如果原先有AWStats代码通过cvs进行更新,需要将CVS/Root文件改成awstats.cvs.sourceforge.net,(或者重新导出)。

仍在cvs中的6.6:从robots.pm和search_engines.pm的更新日志中就可以发现去年下半年以来针对各种robots/RSS reader的统计和各种搜索引擎的统计是越来越丰富了(甚至区分了雅虎美国的蜘蛛Slurp雅虎中国的蜘蛛Slurp China),今天的统计输出:
53 个机器人* 文件数 字节 最近参观日期
Yahoo Slurp 8750+183 60.60 M字节 2006年 七月 01日 23:59
Yahoo! Slurp China 7032+120 40.09 M字节 2006年 七月 01日 23:59
而来自referer spam的列表也已经有3132条记录了,部分的统计项目(蜘蛛/搜索引擎)都增加了官方网站的链接,但是明显国外开发人员不是很了解中国目前的情况,在很多统计项目中仍然有些落后于实际的情况:比如将TencentTraveler当成蜘蛛,没有计入来自sogou soso等新的搜索引擎的来源等。根据cvs版本中的配置重新更新后的文件:lib/robots.pmsearch_engines.pm可以直接下载。
效果可以看看这里: 用户名 awstats 密码 awstats
http://www.chedong.com/cgi-bin/awstats/awstats.pl?config=chedong

按此阅读全文 "[AWStats]6.6中的蜘蛛和搜索引擎数据库更新" »

2006年07月04日

地震了(北京刚才),有感觉吗?

我在16层 晃了几下,

爸爸住西边: 24层
Jun: 地震有感觉吗?
Che: 有
Jun: 在楼顶,很明显!
在文安(音)5.1级

太太在中关村:12层
Ada: 我们这边地震了
Che: 有感觉

按此阅读全文 "地震了(北京刚才),有感觉吗?" »

2006年07月05日

FireFox的自动更新 1.5.0.4 => 1.5.0.5

FireFox 1.5用户的升级速度很快,
本月比例:1.5.0.4在6月初发布的一个月后大部分用户已经升级
Firefox 1.5.0.4 否 23075 10 %
Firefox 1.5.0.3 否 1144 0.4 %
Firefox 1.5.0.2 否 422 0.1 %
Firefox 1.5.0.1 否 450 0.1 %

对比一下5月份的比例:大部分用户当时是用1.5.0.3
Firefox 1.5.0.4 否 2487 0.1 %
Firefox 1.5.0.3 否 161038 10.1 %
Firefox 1.5.0.2 否 18101 1.1 %
Firefox 1.5.0.1 否 9762 0.6 %

而作为高危漏洞软件之首的FireFox 1.0用户正在稳步下降:
5月份比例:
Firefox 1.0.8 否 1296 0 %
Firefox 1.0.7 否 9496 0.5 %
Firefox 1.0.6 否 4202 0.2 %

6月份数据:
Firefox 1.0.8 否 1018 0 %
Firefox 1.0.7 否 4343 0.2 %
Firefox 1.0.6 否 5945 0.3 %

按此阅读全文 "FireFox的自动更新 1.5.0.4 => 1.5.0.5" »

2006年07月07日

AWStats中的未知浏览器/SPIDER的发现机制

很久以来,AWStats统计中的浏览器信息一直让我非常不解的是未知浏览器的流量比例一直很高,最近半年以来一直在10-20%左右。
浏览器 离线浏览器(网页抓取) 文件数 百分比
MS Internet Explorer 否 222874 65.3 %
Firefox 否 43591 12.7 %
Netscape 否 25954 7.6 %
Potu (RSS Reader) 否 14209 4.1 %
无法得知 ? 11422 3.3 %
Mozilla 否 5508 1.6 %
GreatNews (RSS Reader) 否 5246 1.5 %
Opera 否 4323 1.2 %
BonEcho (Firefox 2.0 development) 否 1650 0.4 %
FeedDemon (RSS Reader) 否 1435 0.4 %
其他 4710 1.3 %

按理说未知浏览器流量应该<5%的,但是未知浏览器具体是那些,还是需要手工去grep 日志发现。最近才发现原来AWStat中的无法得知都是可以点击的,点击进入后,就能看到流量最大的一些未知浏览器的特征User Agent信息:原来是越来越多的RSS阅读器(在线的和客户端的)和蜘蛛,而有了这个统计:就可以将一些已知特征的浏览器加入到robots.pm和browser.pm中了。

例举如下:大部分都遵循了 [浏览器名称] [版本号] [网站网址] [当前feed的订阅人数] 这样的格式
Feedpath/1.0 (http://feedpath.jp; 2 subscribers)
RBLOG Feedeater 1.0
AttensaOnline/1.0 (http://www.attensa.com; 1 subscribers)
JetBrains Omea Reader 2.1.2 (http://www.jetbrains.com/omea/reader/)
Feedshow/1.0 (http://www.feedshow.com; 1 subscriber)
ReadOnline.Info rss checker. http://readonline.info
NewsAlloy/1.1 (http://www.NewsAlloy.com; 12 subscribers)
Rome Client (http://tinyurl.com/64t5n) Ver: 0.7
Peoplefeeds/1.0 http://peoplefeeds.com/
CFMX Agent
Netvibes (http://www.netvibes.com/; 81 subscribers)
Drupal ( http://drupal.org/)
Microsoft Office Protocol Discovery
showlife 0.7 ( http://showlife.sf.net/)
FEEDBRINGER/0.1 (http://feedbringer.net/; 1 subscribers)
JetBrains Omea Reader 2.1.4 (http://www.jetbrains.com/omea/reader/)
FeedLook Service
HanRSS/1.0 (http://www.hanrss.com; 1 subscriber)
KTX Reader3
Maxthon
kb.Rmail (http://www.r-mail.org; 2 subscribers)
FeedLounge (http://my.feedlounge.com/)
iSiloX/4.25 Windows/32
LiteFeeds/1.0
endo/1.0 (Mac OS X; ppc i386; http://kula.jp/endo)
Drupal ( http://www.drupal.org/)
Strategic Board Bot
xv onsswdvcwxOdO9opmcfybrsn
JetBrains Omea Reader 2.0 Release Candidate 8 (http://www.jetbrains.com/omea/reader/)
rss-bot/1.0 (http://www.plazoo.com)
Netvibes (http://www.netvibes.com/; 30 subscribers)
http://www.searchfull.net/
rss2email/2.54 http://www.aaronsw.com/2002/rss2email/
IP*Works! V5 HTTP/S Component - by /n software - www.nsoftware.com

按此阅读全文 "AWStats中的未知浏览器/SPIDER的发现机制" »

2006年07月19日

慎用DreamHost

桑林DBANotes都说最近他们在dreamhost的空间最近有down机导致的流量损失,我用ssh登录到服务器上:服务器机器是3天前重启的,而且目前系统负载也比较高。
02:58:39 up 3 days, 20:00, 3 users, load average: 1.80, 3.24, 4.15
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT

从日志统计看:15日当前有比较长的down机时间,而且15日以后4天的日志文件也丢了。之前得到的是大辉的折扣: 第一年 25$,把几个亲友朋友的空间都搬过去了,现在看来还是要注意备份一下。
假设一台服务器有500个用户(而且每个用户还可以申请75个子帐号),这是一个多大的数字,几乎都支持客户再对外提供一个虚拟主机服务了。

2006-07-23 今天又一次电力故障,DreamHost和以色列和黎巴嫩一起成为了TechnoRati的热门关键词。

按此阅读全文 "慎用DreamHost" »

2006年07月25日

MT3.31中邮件乱码问题的解决: MailEncoding utf-8

用上MT以后就会上瘾:3.2后的第一个发布版本3.31不仅对个人免费了,而且增加了对tag的支持,很多朋友应该可以升级了。

不过19日安装以后我发现一个问题:留言中的中文都变成了"???"。今天再这里找到了解决方法,就是在mt-config.cgi中增加一行配置:
MailEncoding utf-8
安装MT3.31后的一个小问题(解决办法) (Yang Kang)

但这个设置目前在MT的官方网站上没有相关说明:只是在代码库中有相关的代码,不知道杨康是怎么找到的。

按此阅读全文 "MT3.31中邮件乱码问题的解决: MailEncoding utf-8" »

2006年07月30日

服务器硬盘故障恢复备忘

大概是从上周四晚上开始,托管的服务器就无法访问。周五请机房重启后,仍然无法登录,干脆拔掉网线,过一个不插电的周末。

周六中午,赶到机房,尝试重启几次,发现硬盘已经无法引导了(grub error 17)。联系机器的提供商提供了块新硬盘(才用了半年),在机房现刻安装光盘,重新安装系统……这就是大概的经过了。虽然平时做了完整的apache和mysql的备份,但是恢复还是花了半天的时间。这就是用虚拟主机的好处:虽然DreamHost偶尔有掉链子的时候,可是至少不用跑机房啊……

按此阅读全文 "服务器硬盘故障恢复备忘" »

关于 2006年07月

此页面包含了在2006年07月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2006年06月

后一个存档 2006年08月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36