搜索引擎战略大会( 2007 厦门 )后记


5月底参加的另外一个大会是搜索引擎战略大会。搜索引擎对于目前网站流量来源的重要性可以从以下数字看出:
搜索引擎不直接给用户解决问题,只是提供一个到达目标的转向: 一般来说:带给其他网站的流量相比搜索引擎的搜索流量是要大于1的(用户搜索一次,一定会点击超过一下)。所以搜索引擎有多少流量,带给目标网站的流量可以乘个1.5。中国每天有多少搜索流量? 3-4亿,带给其他网站的流量是多少? 5-6亿。中国每天有几千万用户产生的几十亿流量,而搜索引擎就掌握了其中的5%左右的入口流量,对于很少给其他网站带去流量的内容网站来说,这几乎是所有来自非本站流量(referer)的90%以上。

以下是厦门大会上的部分问题摘要:
为什么你的网站被冥王星了?

参加大会之前曾经要求过主办方将单元标题将"为什么你的网站被删了"改成"为什么你的网站被冥王星了", 而从实际的反馈来看, 网站更关心的问题是为什么其他网站作弊而没有被“冥王星”?
直接向搜索引擎服务商举报是目前的一个途径, 以下是几个引擎的spam提交地址:
百度: http://utility.baidu.com/antispam/spamreport.html
Google: http://www.google.com/contact/spamreport.html
中国雅虎搜索: http://help.cn.yahoo.com/feedback.html?product=onesearch

如何保护自己的文章(搜索引擎如何保证原创性内容排名靠前):

再推销一下chedong copyright . 这个方法很有效, 为用户正确的标记文章原始出处提供方便, 通过法律途径对于不遵循你声明的版权信息的网站进行反击或者积极推进相关法律的形成和执行,我相信用户还是希望做正确的事情的,如果你为他们提供方便的话

很多人问过我关于搜索引擎排名方面的问题, 我只能告诉他们我了解的2个最基本的事实:

1 不被搜索引擎蜘蛛发现的内容, 肯定是搜索不到的;
2 如果用户找的内容只有你的网站提供, 你肯定排第一(如果被搜索引擎收录);

让网站先将拿到应该属于自己的流量是SEO最基本的工作, 尤其是在方便搜索引擎收录和发现新网页内容效率方面,RSS/SITEMAPS等协议, 都是方便搜索引擎收录非常好的途径. 让搜索引擎的蜘蛛从任何一个页面进入后,都能在尽可能少的跳数内遍历完整个网站。良好引用,良好结构,良好导航(Well referenced and well organized, with easy navigation)是网站发布者一直需要关心的问题. 这方面,Wikipedia是一个很好的范例.

5月份的阿里巴巴侠客行大会上遇到的很多网站开发人员, 他们对内容缺乏这个问题的理解比我更深刻. 互联网还是缺内容: 真正能为用户直接解决实际问题的内容. 如何低成本的获得/并结构化的发布内容是最关键的问题. 要知道SEO其实是可以论斤做的, Google Print项目对很多行业网站都应该有启发: 通过扫描/OCR等技术将线下已有的内容发布到网上, 再通过搜索引擎索引后方便的提供给用户, 如何这些利用内容充分覆盖用户的长尾需求其实也是目前SEO的一个重要方向。

作者:车东 发表于:2007-07-12 12:07 最后更新于:2007-07-12 13:07
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

Comments

我观察过一些大网站的统计报告,从搜索引擎来的流量都非常少,大都是直接输入网址,所以搜索引擎可以说就是为中小网站服务为垃圾网站服务。

“让搜索引擎的蜘蛛从任何一个页面进入后,都能在尽可能少的跳数内遍历完整个网站”,这句话很重要,谢谢。

呃。我有点迷茫。能给解答一下吗?

公司的站内搜索OK了(基于Lucene),但领导让我继续研究研究搜索,但我不知道该继续去研究什么好了。
中文分词?目前使用的模块(JE)还可以,如果自己研发需要不少时间,还有词库问题。
爬虫?我们是站内搜索,虽然头说站外也是个方向,但很不明确,我对没有明确需求的东西实在不感兴趣。
分布式?目前的量还没必要(几百万),差的很远的,而且如果一直站内搜索的话也很难用上。
缓冲?这个很有用,但目前实在没有太好的想法。

目前站内搜索的状况就是正常运行,没什么错误,也不知道该改些什么。很迷茫。(还有个项目相反,能正常运行,但我还有很多想法,但领导说我在那个项目浪费太多时间了,不许我再做了,能运行就行。-_-!)

最近很怪,我对搜索的研究很迷茫,对用户的需求倒是很感兴趣。我一直在思考自己的东西最终能给用户带来什么,如何让用户更加方便的使用。

嗯。。。就是很迷茫,有啥好的建议吗?如果想继续深入的研究搜索方面的内容,我该关注哪些技术比较好呢?

还有一点,我想说的。

我始终认为类似Google Print项目并不是个好的方式。我更相信人多的力量,具体上在于如何组织和引导。

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)