« 2005年09月 | (回到Blog入口) | 2005年11月 »

2005年10月 归档

2005年10月14日

给在校学生的建议: 去sf.net上找个项目做做

前2天看到:Google与李开复博士: 大学生如何为加盟Google做准备
中间有一条:(2)多实战。通过编程的实战积累经验、内化知识。建议大家争取在大学四年中积累编写十万行代码的经验。

这点我非常有赞同,但对于大部分学生来说没有方向是一个主要问题。去哪里找项目做呢?我推荐:SourceForge.net:那里有大量的开源项目,虽然项目的质量良莠不齐,其中有不少项目是半成品,这里也是很多国外在校学生毕业设计的试验田。先找一两个自己能用的系统:比如BLOG TWIKI。搭建起来使用一下,使用过程中遇到的问题想办法自己从代码层面解决,然后将修正提交给相应项目争取加入到下一个发布版本中。从中应该很快能学到不少东西,包括如何参与多人项目的合作开发等等……

按此阅读全文 "给在校学生的建议: 去sf.net上找个项目做做" »

2005年10月21日

[MT]升级:迟来的MovableType 3.2

感觉最近2年MT没做别的,几乎大部分改进都是围绕anti spam了。Spam问题的确已经是困扰很多movabletype用户的主要问题,比如前2天pronet上一封邮件的标题是这样的:“spam spam spam, I DO NOT like spam”。在旧版的MT中我主要依靠mt-blacklist和SpamLookup这2个插件进行SPAM的处理。mt-blacklist已经积累了4万多次被block的记录。我自己的BLOG仍然以每天几十封spam的速度遭受轰炸,国庆假期回来,SpamLookup中已经积累了几百封pendding的垃圾信待确认。昨天晚上终于下决心将后台blog系统整体升级了一把,其实MT 3.2今8月底就发布了。但是看到了一些升级失败的例子,其中新的垃圾留言识别和管理机制是大部分用户都最看重的功能。

升级成功后的留言管理界面:
mt_3.2.png
新版本的3.2中对于comment spam和trackback spam都增加了一定的改进。

按此阅读全文 "[MT]升级:迟来的MovableType 3.2" »

2005年10月24日

你的blog用户都是通过那些搜索引擎找到你的?

我的网站上的统计
Google 48.7 %
BaiDu 41.6 %
QQ 3.2 %
Yahoo 1.5 %
3721 1.4 %
YiSou 0.8 %
SoGou 0.7 %
NetEase 0.5
MSN 0.3 %

按此阅读全文 "你的blog用户都是通过那些搜索引擎找到你的?" »

2005年10月25日

Sohu Agent

最近从日志里发现了Sohu的Spider的踪迹: 感觉Sohu的蜘蛛命名还是应该更规范一些。


220.181.26.112 - - [24/Oct/2005:12:15:11 +0800] "GET /tech/unicode_java.html HTTP/1.1" 200 12857 "-" "sohu agent"
220.181.26.111 - - [24/Oct/2005:13:00:52 +0800] "GET /tech/resin.html HTTP/1.1" 200 8221 "-" "sohu agent"
220.181.26.111 - - [24/Oct/2005:13:00:52 +0800] "GET /bbcweb/206.htm HTTP/1.1" 200 1870 "-" "sohu agent"

之前写过一篇关于spider跟踪的文章:让搜索引擎Spider告诉你:什么时间,从哪里,用什么身份抓取了你的网站。已经将Sohu agent加入了我的AWStats统计robots.pm中。

按此阅读全文 "Sohu Agent" »

2005年10月26日

[安全漏洞] 跨服务器之间的内容同步不能使用php的include/require函数

前2天读到了? RSS阅读中潜在的安全问题 | 未完成 - Incomplete,讲的是混杂在Rich Text的RSS中的js会在RSS阅读客户端执行从而导致潜在的漏洞问题。正巧我在上个周末的时候也遇到了类似的一个问题:不过更严重的是在RSS聚合的服务器端。
我的首页是用require_once('lilina.html') 的方式包含一个lilina.php生成的静态页面组合生成的,源代码如下。其中也包含了跨服务器PHP脚本执行的安全漏洞。如果我订阅的RSS中有黑客将其中混入 <?php >这样的代码,这样一包含:不就可以直接在我的服务器上直接运行php脚本了吗?这个潜在漏洞的发现还是从MSN的Search blog的一篇FEED中引出的。

按此阅读全文 "[安全漏洞] 跨服务器之间的内容同步不能使用php的include/require函数" »

2005年10月27日

AWStats升级到6.5:补充更新

AWStats是我一直关注一个网站统计工具:虽然对于日访问量千万级的网站统计速度上有些吃力:但是其丰富的统计机制对于一般中小网站还是非常有效的。2005/10/09 AWStats已经升级到6.5了。除了更新程序外:还需要升级的一些定义库,我整理了一些缺省样例配置文件和各种定义的补丁下载包:下载解包后,
1 直接复制到awstats/的执行目录下;
2 将GeoIP.dat文件复制到 /usr/local/share/GeoIP/ 下;
3 修改awstats.chedong.conf 成你需要的配置文件;
相关的Bug 跟踪.希望开发人员积极推进这些定义的提交,下一个版本就能有更适合中国搜索引擎市场的配置文件了.

按此阅读全文 "AWStats升级到6.5:补充更新" »

2005年10月28日

Google Groups做留言簿:更严重的spam问题

将自己的留言簿迁移到groups-beta.google.com后,刚开始发现清静了很多,但不久以后就发现比原来更加严重的comment spam 比MT的留言簿更是有过之而无不及:
gestbook_spam.png

不得不将Google Groups中的很多留言模式设置成了需要批准才能发布,回复的时候也很不方便,自己的回复还需要自己批准一下……

按此阅读全文 "Google Groups做留言簿:更严重的spam问题" »

2005年10月29日

Chinese Blogger Conference: 一宁的volunteer badge


badge volunteer
Originally uploaded by Yining.
看到张一宁有了自己的新域名: yining.org 最早知道一宁是他参与过We the Media的中文翻译项目

按此阅读全文 "Chinese Blogger Conference: 一宁的volunteer badge" »

2005年10月31日

分布式搜索引擎search.minty dowser类聚引擎和larbin蜘蛛

search.minty.org:
Open, Distributed Web Search

Dowser:
Dowser is a research tool for the web. It clusters results from major search engines, associates words that appear in previous searches, and keeps a local cache of all the results you click on in a searchable database. It helps you keep track of what you find on the web.

Larbin:
crawler

按此阅读全文 "分布式搜索引擎search.minty dowser类聚引擎和larbin蜘蛛" »

关于 2005年10月

此页面包含了在2005年10月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2005年09月

后一个存档 2005年11月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36