Source favicon23:39 Beijing, Shanghai and Guangzhou » 王建硕

Look at this newly released Google Trends picture:

screen-bj.sh.gz-trends.png
Image in courtesy of Google Trends

shanghai
beijing
guangzhou

Shanghai is more searched in Beijing. I didn't expect result like this, but it is understandable.

Source favicon23:39 Beijing, Shanghai and Guangzhou » Wangjianshuo's blog
Look at this newly released Google Trends picture: Image in courtesy of Google Trends shanghai beijing guangzhou Shanghai is more searched in Beijing. I didn't expect result like this, but it is understandable....
Source favicon22:30 说说"数字域名" 的新网站吧 » DBA notes
"数字迷信" 由来已久了, 不过最近随着 Web 2.0 风潮的来临, 一些以数字为域名的站点噌噌噌的窜出来, 可能这些淘金者也要图个吉利. 什么 51(我要), 58(我发), 59(我就) 之类的站点不时出现在一些软文上. 啥是所谓的数字域名? 老外的站点域名都是英文的, 而数字域名专用阿拉伯字母, 用排列组合的手法颠来倒去,适当的再拉几个简单的英文单词进来. 这样的域名咱叫他数字域名吧. 互联网刚在中国普及的时候, 什么英文域名阿, 搞的很多初级网民记不住, 网易的 163 被誉为是神来之笔, 记得当时还有媒体记载丁磊如何灵机一动而注册这个域名的. 再到后来, 有个 51Job , 弄了一个中西结合, "我要工作", 虽是一个烂域名, 还好, 在网上找工作的人基本上都知道一点英语. 在我看来,数字域名的滥觞应该从 Hao123 算起. 自打这个网址导航站点高价卖给个百度之后, 一夜之间, 很多个人站长看到了以小博大,钻空子赚钱的可能, 一些乱七八糟的什么 "888", "999" 之类"数字域名"雨后春笋一样冒了出来. 给人的感觉是很多新网站就好像穿了一个花里胡哨的裤头就跑出来了. 前一段时间看到有人讨论 Web 2.0 站点的特点. 是 Web 2.0 不好判断, 但是不是 Web 2.0 我倒可以提供一点参考: 只要你看到那些域名里面全是数字,基本上都是混水摸鱼的. -End....
Source favicon20:02 Rainy Friday Night, 2006 » Wangjianshuo's blog
Friday night, it rains in Shanghai again. Wendy went to off-site in a remote place in Zhejiang. Their bus should left Xujiahui soon. I bet she will be back on Sunday night. Just left my office and go to the Raffles City to look for some food - whenever I look for food, I think I am not too much difference with a dog. Hungry? So start wandering on street and hope to get something interesting to eat. Well. Delicious...
Source favicon19:53 音乐八宝盒8box.cn » 未完成 - Incomplete
Last.fm虽然在国内blog圈中的名气并不算大,可能还不如潘多拉,不过我知道也有不少人在用。我一直很奇怪为什么国内那么多人会想去抄袭douban,却没有人做一个与豆瓣模式接近,但分享的主体不同的Last.fm的中文版。音乐八宝盒可以算是我所见到的第一个借鉴了Last.fm、webjay以及潘多拉的中文音乐社区。 八宝盒通过你推荐、试听、打分、评论音乐的过程,学习你的口味,并依此帮助过滤出你喜欢的音乐。 发现音乐的最好途径是通过你的同好。八宝盒能够根据你的口味,推荐相似的用户给你。 与Last.fm不同的是,Last.fm是通过媒体播放器的插件自动上传你的播放列表,积累用户的使用数据,开展数据挖掘,从而进行音乐推荐;而在八宝盒中则需要用户逐一推荐音乐,这点可能对于初始内容的积累有些不利影响,需要在网站的流程设计中考虑更方便用户的措施。 你推荐了一定数量的音乐后,系统就可以通过数据挖掘和推荐引擎,为你推荐你可能会喜欢的音乐以及找出和你口味相近的用户,与其他的分享社区一样,你也可以将其他用户加为好友,组建小组(在八宝盒中叫饭团(fan团)),听起来除了分享的主体不同外,与豆瓣颇为相似。 在八宝盒中,用户可以创建并分享自己的播放列表,并利用网站提供的播放器欣赏音乐。此外,还借鉴了Pandora的方式,利用音乐导航功能可以从任意一首音乐开始连续播放相关的音乐,只是我觉得目前这个音乐导航基本上还与随机播放没有多大的差别,一方面受数据量不足的影响,另一方面还没有做到个性化。 八宝盒在整体的互动设计以及UI上也还有不少需要改进的地方,因为我这种比较熟悉网络服务的用户都常常会有找不着北的感觉。 八宝盒现在还处于内测阶段,下周即将开放。如果大家有兴趣先睹为快的话,可以点击这个链接进入注册,试用一个这个看起来有点潜力的中文服务。
Source favicon19:33 窦唯,一个遥远的童话 » 一个藏袍
窦唯一下子成了焦点,冲击报社,焚烧汽车,与我印象中的窦唯实在无法对应起来。记得在94年香港红堪体育场的演唱会上,窦唯吹吹笛子,弹弹键盘,唱唱歌,多么洒脱的情景,如今似乎一去不复返。实在想不通为什么他这么牛的人也会落到现在这般境况,成了被娱记玩弄的对象。 高中的时候喜欢喜欢窦唯,喜欢他的才华横溢,后来因为他,也喜欢王菲,喜欢王菲那变化多端的嗓子,这么多年过去,不管娱记们怎么报道,生活怎么改变,我对他们的认识还是停留在那个阶段,那个美好的阶段。直到今日,忽然感觉这些都已不复存在,很痛心。...
Source favicon19:29 用 JavaScript 模拟脚踏石模型 » 桑林志
我爱妞妞看到btsb的脚踏石模型帖子后,用 JavaScript 编了个模拟程序,看这儿。真是酷得没治了。 ...
Source favicon16:13 出多少钱? » laolu

(5月2日的赚钱的效率,埋了个地雷呵,请自行前往浏览重大更新。)

前几帖记录了赚钱花钱,现在继续。不过换一个方向,记录客户出钱的情况,也就是广告主交了多少钱?

先列个新闻,算是铺垫。9日百度发布2006Q1财报,利润同比翻13倍,一改去年Q3的颓势,令华尔街兴奋不已,在其后的两天里,股价从60$涨到过90$。而同样的那两天,Google的股价却从410$跌到了390$一线。下面是正题。

百度

百度的季度营收及广告客户,2005Q1-2006Q1,单位:美元
  2005Q1 2005Q2 2005Q3 2005Q4 2006Q1
*营收($) 5,500,000 8,400,000 11,000,000 14,200,000 16,900,000
*活跃网络营销客户数 31,778 41,248 53,000 63,000 74,000
较上季新增客户数 - 9,470 11,752 10,000 11,000
平均每个客户的开支($) 173 203 207 225 228
客户平均开支的季度增长% - 17% 1% 9% 1%
*的数据来源:见 Baidu | Press Releases | Press Releases 各季财报

补充:
1)百度每个季度新增广告客户数的平均值为:10556个。
2)假如按照上表中季度新增客户的平均值10556推算,那么2004Q4的广告客户数量大约为:31,778-10556=21222个;按照2005年报中营收年度增长171.8%反推,那么2004年全年营收为:39,600,000$/2.718=14,569,536$;因此,2004年每个客户支出广告费大约为686美元。
3)若以2005年百度年报来计算,全年营收39,600,000美元,活跃网络营销客户63,000个,那么2005年每个客户支出广告费629美元,较2004年下降了57美元(-8%)。
4)百度财报中公布的是“活跃网络营销客户(active online marketing customers)”数量,不清楚是否还有“非活跃网络营销客户”?

Google

2003年4月29日,Google公布广告客户超过了100,000个(The number of advertisers partnering with Google recently passed the 100,000 mark),之后似乎就再没有公布类似的数据(如果有谁知道,请告知网址,先谢过!)。2004年10月20日,The Chronicle抛出了一份宣称是Google的内部文档,披露了Google对广告客户数量的预测:2004年280,000个,2005年378,000个,2006年472,500个,2007年567,000个,2008年652,050个。

今年5月8日BusinessWeek上的《The Counterattack On Google》提到:“分析家们相信Google已有超过40万的广告客户,数量是Yahoo的两倍(Analysts believe Google has north of 400,000 ad clients, twice as many as Yahoo.)” 。对照起来,与上面透露的内部预测还算相符。

在上面的内部预测数据中,各年新增客户数量依次为:98,000、94,500、94,500、85,050,新增客户数量逐步减少。

Google的年度营收及广告客户,2003-2006,单位:美元
  2003 2004 2005 2006
营收($) 1,465,930,000 3,189,220,000 6,138,560,000 9,207,840,000**
营收的年增长% 234% 118% 92.5% 50%**
广告客户数 180,000* 280,000 378,000 472,500
较上年新增客户数 - 10,000* 98,000 94,500
平均每个客户的开支($) 8,144 11,390 16,239 19,487
客户平均开支的年增长% - 40% 42% 20%
营收的数据来源:见 Google Finance: Income Statement 各年财报(Annual),
Google/Investor Relations/Financial Data/Income Statement
广告客户的数据来源:见 Google forecasts growth Search engine sees 372,000 new ad accounts in 4 years
*、**的几个数据见下面的补充说明

补充:
1)*数据:2003年Google广告客户数据的估算。因Google各年新增客户数量有逐步减少的情况,所以,估算2004年较2003年可能新增了大约10,000个广告客户。
2)**数据:2006年的营收预测。上表中Google前几年营收增长很快,但增幅有放缓的趋势,因此,假定2006年营收较之2005年增长50%,那么其2006年营收预测为9,207,840,000美元。

小结一下

  1. 2004年Google的营收是百度的218倍,2005年为155倍,双方差距有所缩小;但是,
  2. 2005年较之2004年,在广告客户的平均年支出方面,百度下降了8%(从686美元降至629美元),Google上升了42%(从11,390美元升至16,239美元);因此,
  3. 2005年,百度的广告客户增加约200%,营收只增长171.8%;Google的广告客户增加35%,营收却增长92.5%;可见,
  4. 2005年,百度营收的增长,要全部归功于广告客户的新增(老客户缩减8%的开支,甚至还拖了后腿);而Google营收的增长,则来自老客户广告开支的加大,以及广告客户的新增两个方面。

至于百度和Google的广告客户在支出金额上有25倍多的差异(16,239美元/629美元=25.8),与国情有很大的关系。Google在中国颗粒无收都没有关系,但百度需要面对这样的现实。如果还是仅仅依赖获得新客户,而不在广告的投资回报率上作努力,那么。。。

(我无法保证所有数据来源的真实、可靠,只能对计算错误负责。所以,如果来源的数据有失真,那么以上所有推算和结论也失效。呵呵)

Source favicon16:09 上海交大处理“汉芯”造假事件 » Blog on 27th Floor
上海交大已经在网站上发布了关于此事的调查结论及处理意见,详见上交大网页。里面说明了各号汉芯的实际情况,给了行政处理。

不过我觉得这事实在是个刑事案,诈骗罪,即便要为受害者一方的教育、科技、发改委三方不出面,检察机关也应该主动介入了。
Source favicon16:08 图:Bryce Canyon National Park, Utah » laolu
Source favicon11:52 Nintendo Wii » 一个藏袍
这个男人挺帅的,尤其是这个姿势。 我们要说的其实是他手上拿的那个东西。那是什么?这个问题我不能马上告诉你,马上告诉你印象不深刻。 那个男人手里拿着的就是任天堂的Wii(代号Revolution)的手柄,手柄内置了意法半导体公司生产的运3轴加速度传感器将被搭载运动传感器(Motion sensor)。采用了ST的MEMS(Micro Electro-Mechanical Systems)技术的 Wii 手柄,将会使玩家手臂、手腕以及手的动作真实的反映在游戏中,在通过 Wii 手柄的倾斜测定机能便可以操纵画面中的角色。上面的酷男人正在拿着手柄玩网球,用这款手柄可以玩钓鱼,乒乓球,以及无数其它使用以前手柄无法完成或者完成的不爽的游戏,个人感觉最酷的应用是两个人拿剑互砍,酷的惊人。比起传统的用了一万年的经典手柄,这款手柄给我们的吸引力不是一点两点,给我们带来更加人性化的互动体验,是不是也有点2.0的感觉? 跟带了酷手柄的Wii比起来,XBox360和PS3都黯然失色。这里还有一款Wii的宣传短片,让你更加震撼的了解这款革命性的游戏机。...
Source favicon11:44 Stop, hey, what's that sound? » Official Google Blog




It might be Gmail. Starting today, Gmail chat will play a little ping sound whenever someone sends you a new chat message (just like Google Talk). Now you can work in other windows or even sit back and watch some TV without worrying about missing a message from your friend. Check out the details.
Source favicon10:57 Turck MMCache for PHP - Turck Software St. Petersburg » del.icio.us/chedong
PHP的预编译加速
Source favicon10:26 Trends游戏 » Blog on 27th Floor
以前就有人用搜索引擎玩这个游戏,以搜索结果的多少来比较,这样反映了一定的流行度;而Google Trends这个最新放出来的工具就能反映一个项目真正的流行趋势,也就是上网的人们对它的关注程度了。

搜一个词直接放进去就可以,要搞PK的话就在词中间加个“,” :

Linux, Windows,Win胜
debian,redhat,fedora core,suse,ubuntu,本来是Debian胜,可2006之后,居然是Ubuntu出来了
新浪,搜狐,163,雅虎,百度,QQ,百度高高在上
百度,google,百度赢
Firefox,IE,Firefox胜出
Beijing,shanghai,Shanghai胜,除了北京一地外
北京,上海,还是上海胜出,但地域性表现更强
blog,rss,Blog关注度十分强劲,RSS还不温不火
拿China和几个国家比,总体总是胜出,但在新闻上从2005年低于印度,说明这帮国际媒体还是偏爱印度些。

Source favicon10:15 杭州5月20日 Mashup Camp 捣浆糊 2 » 王建硕

庞小伟发出的杭州Mashup Camp 2通告:


一、名称
Mashup2 in Hangzhou
上届介绍:
Mashup1 文字:http://www.uuzone.com/blog/mao/86848.htm
Mashup1 图片:http://www.flickr.com/photos/tags/mashupcampchina/

二、日期
2006年5月20日 周六 上午10点至下午3点
3点以后你可以继续进行

三、地点
杭州龙井路下毛家埠(都锦生故居旁)隽水阁茶楼
TEL:0571-87968927
就在这里:http://my.edushi.com/note/url.aspx?id=3638

四、主题报告(已确认):
1、Isaac毛向辉:创业2.0和投资2.0(暂定)
2、Rebort冒志鸿:主题确认中
3、王建硕:主题确认中
4、继续邀请中......欢迎推荐

五、自由讨论
曲水流觞+自由成群

六、参捣费
人民币100元以内,AA制

七、征集和其他
1、门户开放,征集主题发言中,愿意发表高见者,请和我或老冒联系都可以。
2、请大家大家讨论会议的形式、内容和流程。
3、E都市提供投影设备和义工。有任何的进展和确定,我会及时发布。
4、请老冒将MASHUP LOGO传给我。
5、请大家在此帖后报名:中文名+公司或网站+联系方式。参加人我会补充至下一版中。

八、目前已经报名参与者
毛向辉-UCIVC
冒志鸿-UUZONE
王建硕-客齐集
陈序尔
Johnney
励文杰
叶子
CELL-opml.cn
SevenYuan
刘平阳-yupoo
Zheng Xiaoyun
MaxPang-E都市
孙海涛-E都市
李治国-口碑网
王肖柏-波普播客
王佩
......

持续增加中,欢迎参加过南京Mashup1的朋友参加。

我对上一期在南京的一些记录:

Mashup Camp China
Mashup Camp China 现场

Source favicon09:11 Gmail chats in more languages » Official Google Blog


We're pleased to now offer Gmail Chat in 17 more languages: UK English, Danish, Dutch, Finnish, French, German, Italian, Polish, Portuguese, Russian, Spanish, Swedish, Turkish, Japanese, Korean and simplified and traditional Chinese.

Here's what some people have had to say about Gmail Chat:

"My sister & I love Gmail because it's so cool! We're 3,000 miles apart, but are SO connected now with Gmail Chat. And we love the rotating smileys!"
"Pretty cool--I just got my 70+ year old aunt to use IM through Gmail."
"I heart Gmail. The new chat option is marvelous. You people bring joy to my life."
Aww, shucks. Well, we heart you--and we hope lots more of you will now enjoy getting in touch instantly this way.
Source favicon08:59 北京打工子弟学校调查 » 变态家族
我比较佩服我这个本科同学, 学了四年工科觉得文科更适合自己, 考研的时候考到了北师学教育学了。  她最近去采访了北京的一个打工子弟学校……

跟之前行知学校黄鹤校长所讲的情况相比,张校长给我介绍的情况似乎有些“骇人听闻”,比如小学班主任的月工资只有700元,非班主任只有660元,教师每个学期的奖金从50元到300元不等……而北京市的很多公办学校里,每个月给几百块钱的班任费都没有人愿意做班主任!

Source favicon08:05 斯坦福的监狱实验 » 变态家族
社会学家其实偶尔也是做做实验的, 像我以前推荐的那个“大萧条的孩子”的作者,就试图用追踪统计的方法来来分析大萧条对不同阶层的未成年人一辈子的影响。 其中心理学家的试验精神也比较强。小时候总是希望能够拥有看穿别人脑子里面在想什么的超能力, 总是喜欢看心理学方面的书, 看了很多很是失望,因为到了后来发现心理学家其实也没有这种超能力。 不过心理学家作的实验有时候还是很有意思的, 尤其是当他们得到了暴力机构,比如美国海军的资助的时候。

在1971年, 斯坦福的一组心理学家, 由Zimbardo领导,接受了希望对海军的监狱里的难题有更好的了解得海军的资助, 开始了一次心理学实验。 基本的想法是在斯坦福礼里面模拟一个监狱,用海军的钱召集一帮人来扮演警察和囚犯。 看起来这个实验虽然有趣, 但是似乎是不致于出什么问题的。召集的警察和囚犯的扮演者都是经过心理测试选出的心理比较稳定的人。 但是计划持续两个礼拜的试验竟然只有一个多礼拜就结束了,因为出现了真实的监狱里常有的情况: 暴动, 绝食抗议, 虐待----都发生在斯坦福心理系的大厅这个假监狱里面。

我对这个能将假监狱在一个礼拜搞成这种状况的Zimbardo比较佩服。 他为了尽量逼真, 给每个犯人一个号码, 不合身的囚服, 拖鞋, 帽子。警察的装备也全是真家伙。 在开始的时候, 犯人都是由真正的警车送到斯坦福的心理系, 模拟的房间都是真正的脏乱差的环境。第二天就开始出现囚徒的反叛, 然后狱警们也开始进入状态, 开始运用体罚等物理手段和让某些囚徒住好监房等精神手段来分化他们。这个时候有犯人由于受不了这个实验, 出现了情绪崩溃, 但是渐渐进入状态的警察竟然认为他是装疯卖傻想逃出监狱, 一点都不予理会。这导致那个囚犯认为从这个监狱出去毫无希望, 于是变得更加疯狂---这最终使他提早结束了实验。  这种情况一天天变得多起来,狱警也渐渐的更有控制欲。 但是有意思的是, 十几个来参观这个实验的人--甚至包括这些被试的亲戚--都认为这里的情况没有什么不对劲。知道一个礼拜以后, Zimbardo的女友来这里看到了这个疯狂的场景, 才说服他提早结束了这个实验。

每个人在里面的时候都被告知可以用他们的报酬的一部分来换取提早出狱的待遇, 相当于现实中的假释, 但是所有的囚徒都拒绝了。

这个实验被批评为不人道, 且不科学--无法精确地控制各个变量对被试的影响。 Z氏得出的结论是人们在某种环境下,每个人的性格什么的其实不再对他的行为起决定性的作用, 环境和他的角色会更有力的影响他们的行为。 导致一帮正常人在一个礼拜之后就会失去理智,一个模拟的监狱竟然变得比真实的由暴徒居住的监狱还要糟糕……

想到了去年九月份的时候美国Katrina过境时候, 新奥尔良的人们在灾难下的反常举动 。 不过还是有不同, 奥尔良的人们是受到了真实的生存的威胁, 而在这个实验中被试都知道是个虚假的环境, 而且最多次持续两个礼拜,但是还是会在一个礼拜的时候就情绪崩溃 。 不过我觉得比囚徒进入状态更有意思的是狱警也及时的进入状态,狠狠地对付这些一样也是想从这个实验中赚点美元的可怜人们。

你觉得你可以撑多久呢? 我觉得我就是疯个八遍肯定也是要撑到最后把美国海军的银子搞到手的!

Read More
08:00 2006/05/12 08:00:00TQ洽谈通搜索力指数排行榜 » TQ洽谈通搜索力指数
 搜索引擎  搜索力指数  排名升降  份额
1. Baidu  247534914     57.33%
2. Google  55856918     12.94%
3. Yahoo  44390698     10.28%
4. Sogou  37474046     8.68%
5. 3721  34746770     8.05%
6. China  7234854     1.68%
7. iAsk  1994810     0.46%
8. Zhongsou  991310     0.23%
9. Tom  836834     0.19%
10. QQ  669494     0.16%
11. 163  77642     0.02%
Source favicon05:39 自己装一套维基百科 » 哈哈的思想发布器


目的

自己装一套 wikipedia (维基百科),能随时查阅需要的信息。不过这是只有文本的wikipedia 。

安装条件

安装过程

  1. 先装wiki的平台软件 mediawiki。
    • 软件是 mediawiki.org 提供的,想办法下载个最新版本。
    • 展开到你的webroot目录下,看一下 INSTALL 文件
    • 为你的php 装上 eaccelerator 。
      • mediawiki 如果有了 php 加速的话将使得响应速度提高3-4倍。mediawiki 可以支持的加速器有 eaccelerator,mmcache 等,不过eaccelerator 是mmcache基础上的一个活跃的分支(有人维护和挺进版本),而且他有支持php5的版本(0.95beta2)。所以,我选择用 eaccelerator。它对php的加速主要是通过把php编译后的可执行代码cache在内存中而实现的,还有就是通过优化源代码来实现。
      • 以下是安装 eaccelerator过程中要注意的:
        1. 看README
        2. make install 之后,注意下反馈的提示,那是你的eaccelerator.so文件装的位置。
        3. 根据 eaccelerator.so 所在目录名,确定 php.ini中 写法:例如 .../no-debug-zts-20050922/eaccelerator.so , zts 表示 zend thread safe, 那么 php.ini 中调用语法就是: zend_extension_ts="/usr/local/lib/php/extensions/no-debug-zts-20050922/eaccelerator.so"如果是 ../no-debug-non-zts-20020429/eaccelerator.so non-zts 就是没有。那么 php.ini 中调用语法就是:zend_extension="/usr/local/lib/php/extensions/no-debug-non-zts- 20020429/eaccelerator.so"。
        4. 命令行 php -v 试一下,一般会有个
          "with eAccelerator v0.9.5-beta2, Copyright (c) 2004-2006 eAccelerator, by eAccelerator。"那就是装上了。webserver 重起一下,phpinfo(); 中将看到更多 eAccelerator 的信息。那就是装成了。
        5. 想关闭 就把 zend_extension_ts= ... 屏蔽掉。
        6. 如果命令行下 php -v 时候,出了这么个东西:cannot restore segment prot after reloc: Permission denied 。那是你的系统的/selinux(secure linux)对share lib的保护在起作用,只要 运行:chcon -t texrel_shlib_t xxxxx.so 注册一下就行了。
    • 接下来在安装wiki的时候,mediawiki会发现 eaccelerator(对支持php5的eaccelerator 0.95bate2,wiki认不出来,不过没关系,效率还是同等的提高了),那么请在配置时把加速模块选择为eaccelerator。
    • 选择语言时,一定要选 "中文(zh)", 而不是 "中文简体(zh_cn)" ,因为wiki数据是简繁体条目混在一起的。选错了,就看不到繁体的条目了。
    • 选择完后,点确认,会生成个文件 webroot/config/LocalSettings.php ,把它move 到 webroot/下就完成了安装。
    • 参考资料:INSTALL 文件
  2. 从 http://download.wikipedia.org 导入你所需要的wiki数据。
    • 中文的wiki百科在 zh_wiki/中
    • 以下说明了其中各组数据的含义:
      The format:
      * pages-articles.xml
         o Contains current version of all article pages, templates, and other pages
         o Excludes discussion pages ('Talk:') and user "home" pages ('User:')
         o Recommended for republishing of content.
      * pages-meta-current.xml
         o Contains current version of all pages, including discussion and user "home" pages.
      * pages-meta-history.xml
         o Contains complete text of every revision of every page (can be very large!)
         o Recommended for research and archive
    • 所以,一般选择 pages-articles.xml 下载就行了。它是bz2文件,用bzip2 -d "文件名" 打开,最后会得到个 ".xml"。
    • 在继续下一步之前,完成以下工作:
      • cp php.ini php-cli.ini ,这样“命令行”执行php代码时,自动使用 php-cli.ini 的配置信息。
      • 把 php-cli.ini 中的
        max_execution_time = 30  ; Maximum execution time of each script, in seconds
        memory_limit = 8M  ; Maximum amount of memory a script may consume (8MB)
      这两行改高一点,不妨设 300/ 80M , 这样保证长时间命令行运行不出事。

    • 用 webroot/maintenance/importDump.php "那个.xml" 导入数据库,一个zh_wiki 一般要导好几个小时。可以: nohup php importDump.php xxx.xml & 挂在无终端后台去run.
    • 之后,运行 webroot/maintenance/refreshLinks.php ,这是为了重建wiki数据之间的相互关联,这个时间更长,所以也挂后台。
3.其他
  1. 修改你的wiki首页,可以选择转向到适当的页面,不过最简单的方法是,copy zh.wikipedia.org的首页内容。
  2. 这样一个文本的wikipedia就好了,不过没有图片。我也看了资料,好像wikipedia.org目前没有提供对图片的dump. 只能凑合用了。
  3. 参考文献:http://meta.wikimedia.org/wiki/Data_dumps

wikipedia的使用

  1. 普通使用,看wikipedia页面上的 “帮助”
    例:
    • 在 web上访问 http://site-url/index.php/MediaWiki:Monobook.css, 然后 "编辑"这个条目,把别的wiki网站的copy过来,你就有了一个新的缺省页面样式(皮肤)了。
    • 要想重订向,就 #REDIRECT [[where to be go]] , eg.#REDIRECT [[Documentation:Administration#Updating_the_software]] 注:#Updating_the_software 是个锚。
  1. 系统调整,要修改 LocalSettings.php
    例:
    • 如何修改主页左上角的标徽图?
      修改 $wgLogo 变量。
    • 如何改变浏览器地址栏中的网站小图标?
      MediaWiki会用网页中输出指向传统/favicon.ico的链接,即网页默认图标。如果想用独特的图标,可修改/includes/Skin.php文件,将'href' => '/favicon.ico'改为'href' =>'/path/to/your/favicon.ico'即可。
    • 如何完全锁定数据库?
      在LocalSettings.php中设置$wgReadOnlyFile指向锁定信息的文件名,并在文件中书写锁定原因,此后试图编辑wiki文本时就会显示这个提示。注意这个操作并不能绝对保证安全;如果需要完全禁止MediaWiki写入数据,需要在数据库上进行设置(例如禁止wiki用户进行UPDATE,INSERT,DELETE操作,或者将MySQL设为只读模式)
参考资源:http://www.allwiki.com/wiki/Mediawiki%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E8%A7%A3%E7%AD%94 http://meta.wikimedia.org/wiki/Documentation:Administration 


性能如何

  1. 这样的一个wiki中文站,如果不允许写入,在只读模式,那一般能撑起一个访问量在 2w pageviews,同时并发<20的网站(机器就是一般的x86 server),还是比较安全的。
  2. 如果太高了,还是要做cache的, 比如用 squid 或 apache 反向代理来cache.
  3. 如果没有比较好的机器,写入状态还是别打开了,因为 mediawiki 这方面切实太慢了,mediawiki的 languages/LanguageZh.php(在测试中,这个.php被认为是慢代码) 中有 preg_match, preg_replace 这种全文匹配的事情,所以不光mysql受不了的问题,cpu也吃不消。

Source favicon05:26 New feature: Gmail Pictures » Googling Google
Gmail's "What's New" page has changed and tells us of a new feature that will be launched shortly -- Gmail Pictures.  The new feature basically lets you see who has emailed you -- almost like an avatar in instant messengers.The new feature won't be available for all users at once, it will be rolled out [...]
Source favicon04:07 make friends and influence people » del.icio.us
We are continuing to build out the your network feature we launched recently. We’ve added a new area called “your fans”, which lets you see users who have added you to their network. We’ve also added a privacy option, so...
Source favicon00:22 Google告诉我的几件事 » 未完成 - Incomplete
正如《搜》这本书中所说的,搜索引擎掌握着社会时尚的风向标,它了解每个人、每个事物的受关注程度。而Google新推出的Google Trends(趋势)服务则可以反映出关键词搜索次数的时间波动趋势。趋势图的概念,在icerocket等blog搜索引擎中早就有过,不过与Google不同的是,它们显示的是搜索结果的时间变化趋势,而Google Trends则显示的是搜索关键字的变化趋势。 Google Trends其实也是一个好玩的玩具,它让我们更方便地进行一些PK大战,比如,它让我知道: 1、最关注Web2.0这个词的是韩国,在香港受到的关注居然高于大陆,如果把中港台三地加在一起的话,估计要排到第一位了。 2、超级女生和梦想中国受到的关注程度,那是不可同日而语,超女在成都与武汉最受欢迎。 3、李宇春的确要比张靓颖和周笔畅受欢迎,不过三大超女的fans分布区域各有不同。 4、人们对播客以及RSS的认识要比博客低得多。 5、Qihoo虽然起步比Chinabbs低,但发展速度远高于大旗。 6、eBay易趣的下滑趋势与淘宝的攀升形成了鲜明的对比,而当当则比卓越略胜一筹。 7、八荣八耻的发展势头要远胜于当年的“先进性教育”。 8、北京大学始终胜过清华大学那么一点点。 9、红楼梦列四大名著之首还是有点道理的。 搜索引擎的确掌握着社会变化的脉搏,你也到Google Trends去看看能够有些什么发现吧。

^==Back Home: www.chedong.com

<== 2006-05-11

==> 2006-05-13