« 2004年04月 | (回到Blog入口) | 2004年06月 »

2004年05月 归档

2004年05月04日

Google悄悄跟踪用户点击:有可能根据搜索结果点击率改善排名

GOOGLE的界面中很早就已经加入了基于鼠标事件的用户点击系统,比如这样一个搜索结果的标题链接:
<a href=http://www.geeklog.net/staticpages/index.php/CVS onmousedown="return clk(15,this)" target=nw>Geeklog - Anonymous<font color=CC0033>CVS</font> Access</a>

在这个链接的点击过程中,会触发一个鼠标事件:通过clk函数,会讲当前URL的目标链接地址和这个链接的排位发送到统计服务器上,这个请求是向页面中增加一个图片对象,从而向统计服务器发出一个图片HTTP请求实现的,在向统计服务器发出请求的时候,通过JAVASCRIPT讲一些预先设置好的参数传向统计图片服务器。
比如上面的鼠标点击:
会将当前结果的位置:第15条
当前结果的目标地址:本链接对象
传递给图片服务器,从而产生一个URL请求,而浏览器还会将当前的URL做为referer传递给图片服务器,从而图片服务器上还可以进行但前关键词和搜索条件的统计。

function clk(n,el) {if(document.images){(new Image()).src="/url?sa=T&start="+n+"&url="+escape(el.href);}return
true;}

Google通过用户的点击获得了各种位置URL的点击率统计,从而有可能进行基于用户点击统计反馈的排名调整或者是一种不定期的算法改进质量跟踪。我看到的最早的相关Google的鼠标事件跟踪的讨论从去年(2003)4月份就出现过

按此阅读全文 "Google悄悄跟踪用户点击:有可能根据搜索结果点击率改善排名" »

准备五一最后的司马台-金山岭之旅

在网上翻着搜索结果,这篇父子俩走长城的故事让我很感动二林、盼盼 :: 大头儿子小头爸爸走长城日记::司马台~金山岭~古北口~慕田峪
也从长城小站这个志愿者网站学到了很多,这个网站甚至已经有了WIKI,笔记如下:

按此阅读全文 "准备五一最后的司马台-金山岭之旅" »

2004年05月10日

AWStats 6.0 的中文补丁 后记

AWStats快发布6.1了,我提交的BUG主要有以下几个方面:
AWStats - Bugs
775988 Minor Chinese Search Engine patch
AWStats - Patches
745359 Chinese(Simp) update: 6.0 awstats-cn.txt
713960 Chinese minor search engines (awstats 6.0)

715108 URI unescape and Google UTF-8 convert patch(perl 5.8 needed)
AWStats - Feature Requests
881891 ShowMonthStats: last 12 months vs first month of this year
863298 Counter of spider access on URL-Pages report.
706297 smart IIS timezone solution
748264 Count average on "finished day" (Use LastUpdate)

按此阅读全文 "AWStats 6.0 的中文补丁 后记" »

2004年05月12日

盼望已久的"猴"年"马"月 公历2004年6月18日开始到7月16日结束

不知道是谁人的发明,用“猴年马月”来泛指不知道哪年哪月,或者泛指遥遥无期。其实猴年马月的周期性虽然未必都很整齐,但基本上是有规律的。猴年是12年一个轮回,马月也是12个月一个论回,所以凡是猴年,必有一个月是马月,比如与2004年大体相应的猴年(甲申年),其马月(庚午月)就是农历5月份,就是从公历2004年6月18日开始到7月16日结束,由于这一猴年的农历5月份是小月,只有29天,所以今年的马月比较短。

2004年05月14日

tcsh bash 的个人常用配置文件

在一台新机器上的时候经常忘记一些环境和快捷方式,比如:如何让FREEBSD终端上正确显示中文等。按照tcsh和bash分列如下

按此阅读全文 "tcsh bash 的个人常用配置文件" »

2004年05月16日

SEO效果评价:spider referer 和 keywords

SEO: search engine optimization搜索引擎优化:为了提高来自搜索引擎的流量,SEO已经成为很多商业网站的必修课。但是如何评价网站的SEO效果呢,设计了以下脚本,可以获得以下方面的参考数据:
1 那些网页被搜索引擎的Spider收录: 来自搜索引擎的spider统计;
2 那些网页被搜索搜索到那些网页并被点击: 来自搜索引擎的referer统计;
3 被搜索引擎搜索到的时候使用的那些关键词: 来自搜索引擎的keywords统计;

脚本如下:

按此阅读全文 "SEO效果评价:spider referer 和 keywords" »

2004年05月17日

Google搜索博客??

Google将推出博客搜索? - 有风的季节
Photo Matt blog的Matthew Mullenweg说,“拿我的博客站点来说,工作日志上显示了GoogleBot对这个博客站点及其他站点的atom.xml及index.rdf文件又随机检索请求发生。这些文件通常位于根目录或相关子目录中(类似/blog)。这些站点均运行WorPress(一种网志工具),而且我敢保证这些站点上压根就没有提及或提供有atom.xml或index.rdf的链接。这就意味着GoogleBot在推测这些文件应该在那儿。”

按此阅读全文 "Google搜索博客??" »

2004年05月23日

跟Isaac Mao聊天

Isaac Mao(毛向辉)今天看上去比照片上帅,和他聊了聊,主要是个人兴趣和一些研究方向:blog, ss cnblog等。我把从谈话中想到的记录如下:

按此阅读全文 "跟Isaac Mao聊天" »

2004年05月24日

BlogChina建站全过程笔记

博客中国基本上将我所有的知识点进行一次完整的体现,包括:服务器前后台规划,日志统计分析,面向搜索引擎的优化设计和站内全文检索系统。

按此阅读全文 "BlogChina建站全过程笔记" »

Kreny的学习笔记

NULL.IDA 扫描者IP地址的统计脚本作者:Kreny 还在日本留学,他说日本人的很喜欢写笔记:系统管理员会把所有软件的安装过程完整记录下来,我觉得这种习惯的确值得我们学习

2004年05月26日

铅笔仍然是我最有效率的个人知识管理工具

上周末和IsaacMao聊天的时候,我特地问了一下他的作息时间:每天早上6点起床,到晚上12点左右。其中早上6点到9点半是他给自己留做Surfing和Blogging的时间,然后去公司上班(Make live)。我一直非常关注学习的效率,也能感觉到我认识的很多blogger都是非常善于学习和进行个人知识管理的人,如果每天比别人多1个小时的思考时间,日积月累下来就将是一笔很大的财富……

按此阅读全文 "铅笔仍然是我最有效率的个人知识管理工具" »

2004年05月28日

BirthdayAlarm.com 帮你记住朋友的生日

2004-11-25 我用Yahoo邮箱也注册了:发现BirthdayAlerm也能导入你的YAHOO邮箱地址簿。可能他们制作了主要免费邮件的几乎所有地址簿导入工具,但是很明显,我的YAHOO的地址簿利用率比较低。

通过地址簿的利用率:发现MS很厉害的2点:
1 OutLook中,回复自动将邮件地址加入你的OE地址簿;
2 MSN用户用邮件地址注册,然后将邮件地址自动导入MSN的地址簿;

可惜MSN自己没有很好的利用这个地址簿资源(将来一定会用到)。而且我觉得给离线朋友发邮件自动打开HOTMAIL是一个非常慢非常慢的设计,有时候经常为了复制一个朋友的联系邮件而打开一个IE(而且只能是IE)窗口。

2004-11-19 Birthday alarm的地址簿电子邮件营销

今天忽然收到Birthday Alarm,原来它们新增加了一个服务,你可以输入你HOTMAIL的密码,然后自动取到用户的PASSPORT地址簿。
birthday_alarm.png
你可以批量将Birthday Alarm的邀请发到你的朋友中。

我最近已经多次通过地址簿给朋友发送邀请信了:LinkedIn, PlaxoBirthday Alerm
社交网络服务:很重要的就是基于已有的信任建立起关系。而以前历史数据的批量导入是非常重要的。

以前很多好东东不都是最早你周围人群中“喷嚏者”通过邮件发送过来。他们无意中成为了这些产品的蜜蜂。

和垃圾邮件相比:基于私人地址簿的电子邮件营销以后将是一个很好的途径。如何建立信任和紫牛服务,鼓励用户通过而目前很多邮件/即时通信服务中的朋友链接(邮件地址)将是一个很巧妙的推广途径。网站之间通过URL LINK进行互连,EMAIL就是人与人之间的URL。

按此阅读全文 "BirthdayAlarm.com 帮你记住朋友的生日" »

用Lynx过滤出搜索结果链接

利用lynx -dump的和grep awk组合,导出搜索结果链接列表:
lynx -dump 将结果页面和链接分别导出
grep KEYWORD 过滤出包含KEYWORDS的行
grep -v KEYWORD 过滤出不包含KEYWORDS的行
awk '{print $2}' 打印出第2列

按此阅读全文 "用Lynx过滤出搜索结果链接" »

2004年05月29日

Google官方网站增加对SEO(Search Engine Optimization)的说明

Google官方网站增加对SEO(Search Engine Optimization)的说明:
Google Information for Webmasters
包括一些SEO服务商对网站用户的欺骗和误导说明和受到欺骗后的举报方法等。

按此阅读全文 "Google官方网站增加对SEO(Search Engine Optimization)的说明" »

2004 Infonortics 搜索引擎 年会 文档 归档

风语者整理: Search Engine Meeting Conference

按此阅读全文 "2004 Infonortics 搜索引擎 年会 文档 归档" »

关于 2004年05月

此页面包含了在2004年05月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2004年04月

后一个存档 2004年06月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36