« 2004年09月 | (回到Blog入口) | 2004年11月 »

2004年10月 归档

2004年10月06日

使用GET方式设计URL的几个好处

XML.com: REST and the Real World

按此阅读全文 "使用GET方式设计URL的几个好处" »

2004年10月07日

从MT2.6升级到MT3.x

mtupgrade - Upgrading Movable Type
终于找到了将Movabletype 2.x升级到movabletype 3.x版本的升级文档:
方法就是下载时,选择 upgrade包,解包后,将相应文件上传到STATIC_DIR和MT程序的安装路径:MT-DIR下。

执行相应的mt-upgrade30.cgi(从2.6升级到3.0)和 mt-upgrade31.cgi (从3.0升级到3.1)。升级后,大部分原来MT2的汉化翻译包都还能用,但是需要注意:2.x缺失了一个模板:Comment Pending Template,如果设置了评论需要批准才可发表,缺了这个模板可能导致MT一些出错信息(但评论不会丢),可以从movabletype.org进行下载这些缺省模板。

plug-ins: Blacklist需要升级到2.x,重新上传。

MT3.x的主要改进:
comments编辑功能:所有评论必须通过授权才能发布,对于防止spam这点还是非常必要的。

按此阅读全文 "从MT2.6升级到MT3.x" »

2004年10月08日

今天试了一下Hello:感觉象看图说话。可惜发消息不支持中文

Hello : Download
是一个面向图片共享的IM,可惜限制了只能SHARE JPEG格式的文件,发消息不支持中文。

按此阅读全文 "今天试了一下Hello:感觉象看图说话。可惜发消息不支持中文" »

2004年10月15日

我的即时贴吧

今天从Zheng那里看到了一个好玩的贴吧,马上涂鸦了一个:在http://www.aypwip.org/webnote/chedong
webnote

按此阅读全文 "我的即时贴吧" »

2004年10月16日

Google Desktop: 个性化的内容搜索开端

2005-01-09
个性搜索的技术与市场
目前网络蜘蛛基本是瞎眼蜘蛛,依据着简单可数的几个规则爬行着,从来就不知道自己要到哪里去,只会毫无目的地抓取芜杂的信息,处理互联网表层信息,很勤恳但毫无个性。而个性化搜索引擎则需要有智慧的网络蜘蛛,有方向、有目的、有计划地抓取信息,同时肩负着寻找、发现、定位、提交符合要求的信息的任务。它不仅能自动自发地自我管理,而且能感知自身所处的环境并作出反应;不仅具备专业的知识,而且具有学习能力;对信息的处理不仅有广度,而且有深度;不仅有预处理也有后处理。

Findory
has just introduced personalized RSS feeds based on keyword searches of their weblog and/or news databases. A Findory personalized feed will suggest new articles and postings based on YOUR reading history.

2004-12-19 个性化搜索==>个性化蜘蛛
最近使用Lilina新闻聚合器,经常修改/更新RSS订阅列表,有时候在想:要是能根据自己的兴趣,自动更新就好了。

今天和CNBlog的讨论中,大家都这样感觉:
个性化的搜索首先不应单纯靠在服务器端实现的,虽然搜索引擎在服务器端的搜索能否进行一些简单的过滤,但是每个人特征太复杂,所以不能指望在服务器端通过几个滚动条来实现更复杂的过滤实现。况且目前很多个性化搜索需要预先输入那么多预制信息。(更何况这些信息有时候也是经常变化的)

个性化搜索最重要的前提是首先知道个人的特征:如何了解一个人的特征呢?当然是从自己以前最常访问的信息中:网站,文档,邮件/即时聊天记录中。这么多特征,很难在每次搜索都提交给服务器端的(即使服务器知道,也很动态根据某一个人的特征进行过滤和排序优化的)。

所以解决个性化搜索的最好办法是给用户自己一个搜索引擎,让它专门定向抓取用户感兴趣的内容。所谓个性化搜索:应该是基于个人的(分布式的)定向数据采集基础上的。

很多搜索引擎目前已经推出了桌面搜索,下一步可能会是个性化的蜘蛛:根据用户的使用习惯进行定向的数据采集,并结合RSS FEED进行个性化数据推送。

实现有点像很多早期的Web浏览加速软件,利用你上网的空闲时间预先缓存你常去网站的网页(其实目前你的IE上MSIEcrawler就正在这样做)。

而个性化蜘蛛会:
1 统计访问频度,得到你经常访问的信息源特征,比如某个:网站;
2 然后自动预测/抓取相关网站的内容,而RSS FEED大大方便了这种机器之间的数据交换;
3 在通知你的新闻订阅夹中:根据你的兴趣向你推送信息,比如:你最近星期一直在寻找的PS2 最近在某店打折;

Google Desktop已经知道了你的web缓存文件夹(IE/Mozilla),知道了你的邮件(gMail),说不定一下个版本就可以随着你的喜好,动态的进行提前抓取和数据推送呢。

总之:Google让我明白了个性化搜索,不是只是个性化的过滤/排序,更重要的是个性化的内容抓取。,但是核心仍然是一个全球网页搜索的通用搜索。个性化搜索必须是在此基础上的个性化。


2004-10-16: Google Desktop搜索的安装/试用:

按此阅读全文 "Google Desktop: 个性化的内容搜索开端" »

关于 2004年10月

此页面包含了在2004年10月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2004年09月

后一个存档 2004年11月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36