FT中文网的FEED为什么总是旧文翻新?


同样一篇文章:每当有新一篇文章发布后,FTChinese的FEED就会显示有大量更新,除了第一篇外,其他主要是以前的旧文章;
ftchinese_rss.png

我观察了一下同一篇文章的URL:发现主要是由一些服务的跟踪参数变化造成的
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=4&loc=RSS_EMAIL
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=3&loc=RSS_EMAIL
而目前的大部分RSS应用(主要是:RSS阅读器)都是以URL为内容的唯一标示的。但由于跟踪参数的问题:导致所有的链接地址都不稳定(每次更新后)旧文地址会变。

做数据跟踪是必要的: 但是以破坏链接地址的稳定性就有些得不偿失了。

解决这个问题有2个办法:
1 阅读器改用文章内容的签名(MD5)作为文章唯一标示,有内容更新则显示未读;
2 RSS的输出者: 保证地址的稳定性,文章的来源跟踪,尽量通过浏览器名称,Referer 头信息等特征组合跟踪;

作者:车东 发表于:2007-11-29 10:11 最后更新于:2007-11-29 09:11
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

Comments

呵呵。多谢兄台。都有些愧对你的热情帮助了。
目前有一些特殊情况没有办法处理,但我保证一定会在可能的时候尽快弄好的。(因为现在负责数据分析的同事病休了一个多月了。我现在没有办法直接改动这个,不经过他的认可)

非常感谢你!
有机会电话联系!

而且,这个URL的问题,应该不仅仅影响RSS的feed,还影响一些搜索引擎的收录和ranking吧?
我个人的猜测。
所以,我会在马上开始的平台改造中,不再用大量的这样东西来做tracking。

google reader不好用,不如bloglines, 它似乎没这个问题

FT中文网的评论部分太不流畅了,非常糟糕。应该向WSJ中文网的评论代码学习啊。

就是因为翻旧文毛病,我早已经退订这个feed.

我对此持不同观点。从seo的校对来看,就是要尽可能的利用现有资源。从用户的角度来看,不可能所有的用户都读过所有的文章。
那么只要精确的定位受众,即便是老文章、旧文章,通过一定形式的重新组织,一样是很受欢迎的。

那么如其让压箱底的文章“腐臭”。何不把它们翻出来晒晒?

活动目录seo
http://gnaw0725.blogbus.com

按照url区分feed是否重复是不错的办法,但是在GreatNews(离线版的阅读器 我用bloglines同步)下,是按照新闻的一个标识,忘了具体叫什么了,之前在GN的论坛里面提出过,作者说是因为哪个标识变了,所以重复出现,一般的解释是作者发布之后又修改了一些内容

绝对不是 Google Reader 的问题,是这个 RSS 不标准。其实很容易解决这个问题。
RSS的标准,判断一个 item 是否是“新的”,是看 item/guid 这个节点,guid 有一个属性是 isPermaLink,默认为 true,设为 false 时可以灵活设置 guid 的值,比如:

<guid isPermaLink="false">001016151@article</guid>

然后再加一个 item/link 节点,是这个 item 的 URL

<link>http://www.ftchinese.com/sc/story.jsp?id=001016151&pos=RSS_DAILY_NEWS&pa1=0&pa2=1&loc=RSS_EMAIL</link>

其中的值随便怎么换,RSS 阅读器都不会认为是“新文章”的

现在 FTChina 的 RSS 是只有 link 而没有 guid,加一个 guid 就解决了。

您的feed同样有问题

本来以为这个网站不错,可惜自从前几天我在评论中发表对西藏问题看法后,我的看法改变了!原来西方媒体也搞审查,说白了还不如中国的论坛,它的评论不光不能实时看到,而且估计很多人的言论像我一样被屏蔽了。我还要申明我没有使用脏话或者非常过激的语言。

FT中文网现在似乎不提供全部新文章的种子了,所以我聚合了一个 FT中文网 All-in-One 的种子,包括(几乎)所有的新闻和专栏的全文输出,并加 [板块名] 为标题前缀,经 Google Reader 测试没有你说的这个问题。

RSS地址:http://feedproxy.google.com/ft_cn
九点地址:http://9.douban.com/subject/9292812

希望对大家有用。

FT中文网站,经济方面的还常看看,但现在看来,也不是什么好东西,从西藏问题发文来看,也是胡言乱语,而且你发了反搏的评论他也不让你显示出来,看来西方国家的喉舌都一个样,唯恐中国不乱,支持藏独和疆独杀人,就不许中国政府出面制止.

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)

相关文章

关于

此页面包含了发表于2007年11月29日 上午10时03分的 Blog 上的单篇日记。

此 Blog 的前一篇日记是 控制Yahoo!Slurp China蜘蛛的访问频度 Crawl-delay: 1000 的效果

此 Blog 的后一篇日记是 用AWStats统计Mail服务日志(sendmail)并生成报表

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36