« 2007年02月 | (回到Blog入口) | 2007年04月 »

2007年03月 归档

2007年03月07日

AWStats的千万级日志解决方案:日报表 databasebreak=day + Canlendar.php 日历浏览

你完全不用耐心的看完后面所有的说明,awstats在进行日志统计时,
命令行统计增加: -databasebreak=day
报表输出时增加: &databasebreak=day&day=DD
即可按天进行统计, 解决按月统计,归档数据过大导致统计过慢/失败的问题。

问题:
很多网站在流量从10万级增加到百万级以后就放弃了awstats作为统计,具体表现就是到月底的时候,统计数据会运行1天都运行不完。于是就改为webalizer或者analog了。其实这并非awstats统计效率不高:awstats很多丰富的统计指标:蜘蛛识别 浏览器识别,文件类型统计等,都是比Webalizer丰富的,Webalizer要实现类似的统计力度也会出现性能问题。

原因分析:
性能的瓶颈在哪里呢:awstats统计缺省时按月统计,到月底时候记住的头20多天的历史IP等累计统计指标,会使得DUMP数据文件变得很大(数百M),而awstats运行时,需要的内存量是dump数据文件的3-4倍。当这个monthly积累的数据导致awstats统计脚本载入内存的数据量过大,用到系统文件交换做内存的时候日志统计效率就会降低了(处理速度会低2-3个数量级),于是出现了运行一天都统计不完前一天日志的现象。

解决:
AWStats丰富的统计指标还是很有用的,而一个网站已经达到日千万级的访问请求,按天的详细的数据统计也是必须的了。所以:索性牺牲一下按月的独立IP统计,将日志改成按天统计,如果需要按月的汇总,可以利用awstats的dump数据成为一个中间数据源汇总统计。

其他问题:
1 按天的报表浏览:用Calendar.php做个日历浏览界面;
按天统计后,awstats的输出文件会变成awstatsMMYYYYDD.confname.txt 每天一个统计文件,而报表的输出需要增加 &databasebreak=day&day=DD 来指定某一天的数据。增加了日期后,awstats的报表输出有些不方便,awstats本身没有提供按日的浏览,可以自己做个日历前端,方便awstats的报表浏览。
2 日志数据源:最好是压缩的,因为日志上2G以后,文件系统出问题的可能性大。尽量还是压缩日志后,通过zcat管道给awstats进行统计;

按此阅读全文 "AWStats的千万级日志解决方案:日报表 databasebreak=day + Canlendar.php 日历浏览" »

2007年03月25日

顺产 女孩 3630g

太太辛苦了,经过40个小时的磨难,终于在24日下午14点顺利生下一个女孩。向所有选择自然生产的母亲表示敬意。其实:国外的母亲自然生产比例较高,无痛(麻醉)技术的广泛使用也是重要原因之一。

女儿的名字还没取好(小名:小超,去年演《超人归来》的时候怀上的),有建议请留言(名字要三个字的)。
支付宝的在线捐助正在申请中,有红包的可以先用PayPal捐助或者支付宝直接到帐给

按此阅读全文 "顺产 女孩 3630g" »

2007年03月27日

AdWords编辑器:用户最喜欢的10大功能

AdWords编辑器是Google开发的一个客户端程序:专门用于AdWords大客户的大批关键词管理。

用户最喜欢的十大功能包括:
10. Find duplicate keywords in your account with just two clicks of your mouse.
鼠标2次点击即可找到所有的重复关键词。
9. Copy or cut and paste between ad groups, campaigns, or even across accounts.
分组之间的关键词黏贴/复制。甚至是跨帐号的复制/黏贴。
8. Make bulk changes to destination URLs using the Add/Update Multiple tools or Advanced URL Changes.
批量修改目标地址:高级替换功能;
7. If you need to edit your keywords or ads in a spreadsheet, copy the items to edit from the data view and paste them into a spreadsheet. Make your changes, then paste the contents of the spreadsheet directly into the appropriate Add/Update Multiple tool.
EXCEL表格管理关键词,并批量上传;
6. Undelete and activate previously deleted text ads.
恢复误删关键词/广告;
5. Search your account quickly. Perform simple word searches, or do an Advanced Search to find items that meet the multiple criteria that you specify.
帐号内的关键词检索:分字段检索;
4. Easily find and edit bids, destination URLs, and text for ads, keywords, or sites.
搜索后的快速编辑;
3. Submit multiple exception requests at once.
批量提交豁免申请( SouthGrass: 当用户编辑好的广告格式、文字不符合Google Adwords 的编辑指南时,可以向Google 提出申请要求特殊照顾,即豁免申请);
2. Automatically organize your keywords into ad groups based on common themes.
根据主题自动将关键词分组
1. Save a snapshot of your account for archiving or for sharing. Later, you can import the archive file to restore your prior account settings.
帐号/数据的归档和共享,导入导出;

按此阅读全文 "AdWords编辑器:用户最喜欢的10大功能" »

关于 2007年03月

此页面包含了在2007年03月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2007年02月

后一个存档 2007年04月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36