网站的外链/内链统计:来自Google的网站管理员工具


Google的网站管理员工具有这样一个功能:查询相应网站的外链/内链数量和明细。从控制台,点击一个已经提交的网站:控制台 > http://www.chedong.com/blog/ > 含外部链接的网页 > 以下是导出的部分 chedong.com/blog的外链数量统计: 可惜不是按外链数量排序的,可以导出成EXCEL,报表如下: 

http://www.chedong.com/blog/ 17471
http://www.chedong.com/blog/index.rdf 2948
http://www.chedong.com/blog/archives/001249.html 1011
http://www.chedong.com/blog/archives/001309.html 441
http://www.chedong.com/blog/archives/001306.html 396
http://www.chedong.com/blog/archives/001246.html 350
http://www.chedong.com/blog/archives/000772.html 308
http://www.chedong.com/blog/archives/001117.html 268
http://www.chedong.com/blog/archives/001282.html 264
http://www.chedong.com/blog/archives/001195.html 241
http://www.chedong.com/blog/archives/001293.html 223
http://www.chedong.com/blog/archives/001261.html 222
http://www.chedong.com/blog/archives/001292.html 219
http://www.chedong.com/blog/archives/000741.html 212
http://www.chedong.com/blog/archives/000828.html 204
http://www.chedong.com/blog/archives/001297.html 197
http://www.chedong.com/blog/archives/001240.html 182
http://www.chedong.com/blog/archives/001244.html 172
http://www.chedong.com/blog/index.xml 165
http://www.chedong.com/blog/archives/001285.html 165
http://www.chedong.com/blog/archives/001294.html 164
http://www.chedong.com/blog/archives/001245.html 154
http://www.chedong.com/blog/archives/001280.html 150
http://www.chedong.com/blog/archives/001284.html 140
http://www.chedong.com/blog/archives/001296.html 139
http://www.chedong.com/blog/archives/001124.html 134
http://www.chedong.com/blog/archives/001203.html 119
http://www.chedong.com/blog/archives/001267.html 118
http://www.chedong.com/blog/atom.xml 115
http://www.chedong.com/blog/archives/000738.html 109
http://www.chedong.com/blog/archives/000825.html 103
http://www.chedong.com/blog/archives/001266.html 101
 

发现了吗?

  • BLOG首页最多,但FEED地址也不少。
  • 大部分文章都是编号12xx以后的了,早期的文章数量链接数量很少。看来Chedong CopyRight的作用还是很大啊。

此外我还下载了详细的外链地址: 并按照域名做了一个汇总统计。 awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |awk -F "/" '{print $3}' |sort|uniq -c|sort -rn|more

大部分居然都来自donews的blogger?具体是那些大侠呢? awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |grep donews|awk -F "/" '{print $4}' |sort|uniq -c|sort -rn|more


作者:车东 发表于:2007-04-21 10:04 最后更新于:2007-04-25 14:04
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

引用通告

以下是前来引用的链接: 网站的外链/内链统计:来自Google的网站管理员工具:

» 基于MovableType的chedong.com/tech 重构 来自 车东[Blog^2]
拖了3年了一直没做的一件事情:将以前tech/目录下的内容进行结构化管理,今天终于完成了。 4年前觉得自己做的这几个网页就是blog,从现在看,缺少了很多特征:可留言反馈,可RSS发布等。所以这次重构的系统选择我提出了以下几个要求: 1 文章按照指定文件名在根目录下导出:保持原有的链接不变(permalink); 2 模板话管理:省却使用sed批量替换的麻烦,内容和表现分离; 3 在线可编辑,而不是使用SFTP/FTP上传; 4 更好的管理文章之间的关联; 5 有反馈机制:留言,这对内容的修正很有好... [阅读更多细节]

Comments

呵呵,我排名第二

awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |awk -F "/" '{print $3}' |sort|uniq -c|sort -rn|more
这是对csv进行排序的语句?Linux平台的命令?
这个功能Google很早就有了,不能排序确实很郁闷啊!

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36