Google的网站管理员工具有这样一个功能:查询相应网站的外链/内链数量和明细。从控制台,点击一个已经提交的网站:控制台 > http://www.chedong.com/blog/ > 含外部链接的网页 > 以下是导出的部分 chedong.com/blog的外链数量统计: 可惜不是按外链数量排序的,可以导出成EXCEL,报表如下:
http://www.chedong.com/blog/ 17471
http://www.chedong.com/blog/index.rdf 2948
http://www.chedong.com/blog/archives/001249.html 1011
http://www.chedong.com/blog/archives/001309.html 441
http://www.chedong.com/blog/archives/001306.html 396
http://www.chedong.com/blog/archives/001246.html 350
http://www.chedong.com/blog/archives/000772.html 308
http://www.chedong.com/blog/archives/001117.html 268
http://www.chedong.com/blog/archives/001282.html 264
http://www.chedong.com/blog/archives/001195.html 241
http://www.chedong.com/blog/archives/001293.html 223
http://www.chedong.com/blog/archives/001261.html 222
http://www.chedong.com/blog/archives/001292.html 219
http://www.chedong.com/blog/archives/000741.html 212
http://www.chedong.com/blog/archives/000828.html 204
http://www.chedong.com/blog/archives/001297.html 197
http://www.chedong.com/blog/archives/001240.html 182
http://www.chedong.com/blog/archives/001244.html 172
http://www.chedong.com/blog/index.xml 165
http://www.chedong.com/blog/archives/001285.html 165
http://www.chedong.com/blog/archives/001294.html 164
http://www.chedong.com/blog/archives/001245.html 154
http://www.chedong.com/blog/archives/001280.html 150
http://www.chedong.com/blog/archives/001284.html 140
http://www.chedong.com/blog/archives/001296.html 139
http://www.chedong.com/blog/archives/001124.html 134
http://www.chedong.com/blog/archives/001203.html 119
http://www.chedong.com/blog/archives/001267.html 118
http://www.chedong.com/blog/atom.xml 115
http://www.chedong.com/blog/archives/000738.html 109
http://www.chedong.com/blog/archives/000825.html 103
http://www.chedong.com/blog/archives/001266.html 101
发现了吗?
- BLOG首页最多,但FEED地址也不少。
- 大部分文章都是编号12xx以后的了,早期的文章数量链接数量很少。看来Chedong CopyRight的作用还是很大啊。
此外我还下载了详细的外链地址: 并按照域名做了一个汇总统计。 awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |awk -F "/" '{print $3}' |sort|uniq -c|sort -rn|more
1211 http://www.ccger.cn
930 http://www.365key.com
906 http://del.icio.us
831 http://blog.csdn.net
813 http://www.phpabc.cn
686 http://cip.uni-trier.de
672 http://blog.dannyzhu.com
531 http://www.yaniu.com
497 http://www.kuaiyigang.com
443 http://dengyi.net
420 http://www.thinkjam.org
383 http://kakaryan.webcan.cn
366 http://www.kusochina.com
347 http://www.openrss.net
330 http://www.chinamyhosting.com
314 http://dormforce.net
311 http://blog.hjenglish.com
306 http://www.june6.cn
304 http://rewin.tianyablog.com
大部分居然都来自donews的blogger?具体是那些大侠呢? awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |grep donews|awk -F "/" '{print $4}' |sort|uniq -c|sort -rn|more
689 http://blog.donews.com/tinyfool/
258 http://blog.donews.com/jdwo/
231 http://blog.donews.com/happyljw/
163 http://blog.donews.com/terrychen/
143 http://blog.donews.com/52se/
140 http://blog.donews.com/itluck/
126 http://blog.donews.com/ouo/
101 http://blog.donews.com/keso/
版权声明:可以转载,转载时请务必以超链接形式标明文章 网站的外链/内链统计:来自Google的网站管理员工具 的原始出处和作者信息及本版权声明。
http://www.chedong.com/blog/archives/001342.html
Comments
呵呵,我排名第二
由: tinyfool 发表于 2007年04月21日 下午12时24分
awk -F , '{print $2}' Links_external_www.chedong.com-blog-_20070420T074913Z.csv |awk -F "/" '{print $3}' |sort|uniq -c|sort -rn|more
这是对csv进行排序的语句?Linux平台的命令?
这个功能Google很早就有了,不能排序确实很郁闷啊!
由: awflasher 发表于 2007年04月25日 下午01时55分