« 2004年12月 | (回到Blog入口) | 2005年02月 »

2005年01月 归档

2005年01月09日

膨胀中的spaces.msn.com服务

Googel: site:spaces.msn.com
spaces.msn.com 上约有 205,000 项符合的查询结果

Baidu: site:spaces.msn.com
找到相关网页约22,900篇

一搜:domain:spaces.msn.com
约 34,290 项

按此阅读全文 "膨胀中的spaces.msn.com服务" »

2005年01月11日

搜索门户正在逐步损害网络的原创动力

我很欣赏Kreny的态度:“请注明本文出处!” : Kreny's Blog

因为在网上找资料的时候,我也经常会想方设法看到转贴的资料:转贴的资料一般都不如原文质量好:因为有心的原文作者经常还会保持文档的更新和相关资料的补充。中文网络环境中转载缺乏对出处的引用声明的确是是一个很大的问题。

而目前搜索引擎基于的超链分析机制从某些方面来说正在逐步损害网络的原创动力,比如:大网站由于自身PR很高和便于搜索引擎的收录:转贴小网站文章的文章后,往往不用链接形式标明文章出处的转贴者反而能获得比原作者更高的搜索结果排位,这在几次的搜索引擎排名竞赛中都得到了证明:其结果就是内容过度向个别门户网站集中,显然这不符合互联网非中心化的本质,正如Google Watch(针对Google的垄断,算法和隐私政策)的观察所指出的:其结果就只能是由于少数“门户”垄断造成的脆弱生态。而搜索引擎的超链分析也导致了无意义的反相链接竞赛,如果靠堆砌关键词和盗用他人成果,谁还来创新呢?

按此阅读全文 "搜索门户正在逐步损害网络的原创动力" »

2005年01月15日

当wiki遇上chongqing, 受到恐吓的CooCooWakka

threat.png coocoowakka居然被wiki spammer恐吓。

建议在模板中设置:
<meta name="robots" content="noindex,nofollow"> 这样SPAMMER就无法从自身网站中得到任何反相链接的加分了。

最近CatHome01发起了一个 spamweblog.com 项目: 专门用于搜索各种SPAM网站的作弊特征并和大家交流anti spam的方法和策略。

按此阅读全文 "当wiki遇上chongqing, 受到恐吓的CooCooWakka" »

2005年01月17日

让搜索引擎Spider告诉你:什么时间,从哪里,用什么身份抓取了你的网站

2005-01-17在我的网站上做了一个试验:在部分动态网页中嵌入了以下PHP代码:
echo date("Y-m-d H:i") . " Crawled by " . $_SERVER["HTTP_USER_AGENT"] . " @". $_SERVER["REMOTE_ADDR"
];

这样,抓取网页的Spider Agent信息和来源地址信息就做为网页内容被搜索引擎索引了。通过搜索结果可以告诉我Spider什么时候,从哪里(IP地址),用什么抓取访问了我的网站。

然后再通过站内搜索命令: site:chedong.com +特征词 就能直接定位到这个spider信息段落,在我的网页上是crawled。今天早上我在Google上查: site:chedong.com crawled 已经能看到效果:
车东 Che, Dong
... Alexa流量统计: Hosted by Powweb.com 2005-01-15 22:00 Crawled by
Googlebot/2.1 (+http://www.google.com/bot.html) @66.249.71.47.
chedong.com/

说明: Googlebot/2.1于2005-01-15 22:00从66.249.71.47这台服务器进行了抓取。

2005-01-20 YST结果出现
MIME::Base64 - phpMan [英译汉]
MIME::Base64 - phpMan Command: man perldoc info search(apropos) ... 2005-01-17 23:02 Crawled by Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com ...
www.chedong.com/phpMan.php/man/MIME::Base64 - 2k - 2005年1月18日

2005-01-20 百度结果出现
车东 Che, Dong
...的某些条款可以放弃 [联系方式|Contact] Yahoo! Messenger: [My Bloginality
is INTJ] Alexa流量统计: 2005-01-18 23:01 Crawled by Baiduspider+(+
http://www.baidu.com/search/spider.htm) @202.108...

2005-01-31 MSN Search发布
SSL_CTX_flush_sessions(3) - phpMan
... 2635 mod_ssl/2.8.22 OpenSSL/0.9.7d PowWeb/1.1 Under GNU General Public License 2005-01-17 19:27 Crawled by msnbot/0.3 (+http://search.msn.com/msnbot.htm) @207.46.98.34

按此阅读全文 "让搜索引擎Spider告诉你:什么时间,从哪里,用什么身份抓取了你的网站" »

2005年01月20日

可读性和更新性: RSS模板的atom化改造

从中我们可以看到:Google的atom输出在可读性和更新排序这2个方面比MT的RSS有一定优势。

在可读性方面:
首先是Google的Blogger服务中:缺省的atom.xml缺省都包含了一个XSLT链接,这样用户使用浏览器点击打开链接看XML的时候,也不至于对看到的XML看的太突兀,样例http://grassland.cnblog.org/blog/index.xml
其次:是atom直接显示带有HTML格式内容,而不是摘要,这样的输出更便于用户阅读。

在更新性方面:
我已经发现了,如果你的RSS文章时间总是比较新的化,那么在按照时间排序的输出结果中就有可能比其他人的文章显示的更靠前。在我的Lilina订阅中:Google的blog的文章已经有2次忽然就从后面跑到前面了,原因就是作者对原文进行了一次小改动后,atom输出中文章发布时间也被更新。相当于同样一篇文章,多了1次曝光的机会。

最近对MT的缺省RSS模板进行了改造:
1 直接显示MTEntrBody,代替MTEntryExcerpt 为了提高RSS内容的可读性,MT新版本中也已经开始这么做了;
2 按文章最后修改时间进行排序;

按此阅读全文 "可读性和更新性: RSS模板的atom化改造" »

2005年01月21日

+1 rel="nofollow" = 互联网为超链戴上的安全套?! ;-)

2005-01-20
昨天打开自己RSS订阅的时候:发现订阅的搜索引擎服务商blog和MT的anti spam blog全部指向了一个主题:nofollow
Google联合Yahoo! MSN和主要Blog服务提供商:推出一个新的搜索引擎收录服务标准,超链的rel="nofollow"属性。
2005-01-19 13:37 Preventing comment spam - Google Blog - Live
2005-01-19 13:19 The Most Tumultuous Show On Earth! - Yahoo! Search blog
2005-01-19 09:08 Massive weblog anti-spam initiative: rel="nofollow" - MT-Blacklist/Comment Spam Clearinghouse
2005-01-19 07:45 A Defense Against Comment Spam - Yahoo! Search blog

nofollow定义和robots.txt中的nofollow类似:原来的:<a href="http://www.exapmle.com">foo</a>如果加入nofollow属性<a href="http://www.exapmle.com" rel="nofollow">foo</a> 搜索引擎的蜘蛛程序将不再跟踪这个URL继续爬取,而对应的链接,在排名计算是也不会计算入目标网站的权重。

这个协议的意义在于:如果以前网站内容的发布者只能通过robots.txt进行页面级的内容收录控制的话,链接的nofollow属性更进一步,达到精确到页面内超链级别的索引收录控制:在一个页面中,哪些链接是页面发布者自主控制的,可以被搜索引擎收录的,哪些链接是发布者无法预期和控制,需要告诉搜索引擎spider不要进行收录。

2005-01-22
从某种程度上说:nofollow属性给超链接戴上了安全套,阻止不安全的spam病毒的传播

2005-01-23
整个互联网真的需要/可能为SPAM带上安全套吗?反对nofollow的12个理由:Twelve Reasons against nofollow
no nofollow
1. nofollow does not prevent comment spam. nofollow并无法防止spam
2. nofollow is semantically incorrect. nofollow语意/语法上不正确(应该是 not follow / not to follow吧?)
3. nofollow harms the connections between web sites. nofollow损害了互联网之间的连接
4. nofollow is not useful for humans, just for search engines using PageRank or similar a technique. 对于用户来说是无意义的,指对搜索引擎的PageRank和类似技术有用;
5. nofollow could be used to shut web sites out. nofollow应该被用于网站关闭后的声明nofollow 将可能被滥用,来封锁某些网站;
6. nofollow discriminates legitimate users as spammers. nofollow歧视合法用户:将他们等同于spammer(难道缺省所有的网站留言者都是spammer?!)
7. nofollow heists commentators' earned attention. nofollow标准的出台反而使得spammer从评论员和解说者中得到了更多的眼球。
8. nofollow will not stop comment spam. nofollow无法阻止评论spam
9. nofollow could be used to further discriminate weblogs. nofollow可被进一步引起对weblogs的歧视;
10. nofollow prevents the Web from being a web. nofollow = 网而不网
11. nofollow eliminates the dissemination of free speech. nofollow削弱了自由言论的传播;
12. nofollow was developed in privacy with only search engines companies taking part in the discussion. nofollow只是由参与讨论的有限的几个搜索引擎公司秘密提出。

按此阅读全文 "+1 rel="nofollow" = 互联网为超链戴上的安全套?! ;-)" »

2005年01月25日

首尔之行

中文: T2K:韩国旅游官方指南

英文mini攻略:GoNOMAD--Mini Guide to Seoul

很多文章都提到了Insadong:仁寺洞位于钟路旁边的仁寺洞被称作“传统文化的街道”,“活的街道民俗博物馆”。一到许多有趣的街边演出的周日,会有许许多多的人们来到这里,从年轻人到老年人,甚至是外国观光客等等。仁寺洞另一个值得一看的就是画家文人艺术。
韩国大半的画廊都密集在这里,随处可见展示会馆,而且大部分可以免费自由参观。在仁寺洞,可以看到别处少见的生活韩服和传统茶馆,大部分位于仁寺洞主街的左右两旁的小巷内。在传统茶馆里,
听着,品尝韩国的传统绿茶、 五味子茶、 等传统饮品。
由于近年掀起的传统茶文化热,许多专营差距的瓷器店、古董店也相继兴起。而美食街上主要是些传统的民俗店。在民俗酒幕里,您可以就着韩国传统的绿豆煎饼尽情品尝香气扑鼻的米酒。

2005-02-01
终于去了仁寺洞(Lei Sei Dong):不只是假古玩哟,在几个小画廊看了看,很多现代的作品设计都很有创意。在对传统的继承和对新技术创新上都值得我们学习。

总体上感觉韩国人除了压力大了一点,其实生活的还是很健康的:饭菜用油炸的很少,花样也不多,大部分地方都是禁止吸烟的,能买到的烟都是很淡的香烟而且阿焦油含量比中国的低一个数量级,酒也是非常淡,最高的一般20度左右,赌场(Walker Hill)基本上是“华客”山庄,韩国人是禁止入内的。

按此阅读全文 "首尔之行" »

2005年01月31日

2005改变你生活的50种方法

2005年到来了,在新的一年里,如果有一种全新的生活方式你可以去尝试的话,你会不会说“我愿意”?如果你想在新的一年里获得健康、财富、幸福和快乐的话,你知道怎么去做吗?

  是的,改变以往的生活方式和习惯,重新定义自己的生活,向健康、财富和幸福发起更高的追求,这是我们每一个人在新的一年将面临的主要任务。那么,究竟怎样才能改变过去的自我,开始一种寻求健康、财富和幸福的新生活呢?

  最新一期《美国新闻与世界报道》的封面文章《改变你生活的50种方式》,给了我们一个详细的答案,或者说是给了我们一个切实可行的计划和缜密的方案。

简化复杂的问题
  再伟大的旅程都要从每一小步开始,在你开始迈步之前,你要知道你将要走向哪里。

  如果你非常忙碌而没有时间去选择的话,那么你很有可能走上错误的道路而自己浑然不知。

按此阅读全文 "2005改变你生活的50种方法" »

关于 2005年01月

此页面包含了在2005年01月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2004年12月

后一个存档 2005年02月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36