Source favicon22:57 让人轻松跨越手机和互联网的胖葫芦 » 刻录事
胖葫芦 是个手机rss阅读器的名字,它的特别之处在于能够快速识别表示网址的二维码,从而连入互联网实现rss的订阅。如果我没记错的话,这是国内第一款面向普通网民的二维码软件。 这个胖葫芦支持很多型号的手机,多的让我惊讶,因为早前搜罗的很多识别二维码的软件,支持的手机型号屈指可数。可见胖葫芦的团队下了不少的功夫。 Blogger们可以在胖葫芦 上为自己的Blog生成一张二维码图片和对应的胖号,把它放到想放置的任何地方,网上,名片上,T恤上,大街上,随意什么地方都行。装有胖葫芦软件的人们,就可以轻松的用它扫过二维码,自动连上该blog并实现订阅。 我考虑把它放到名片上,不过遗憾的是胖葫芦在二维码中提供的信息太少,现在只让输入URL,很不爽,怎么也得多加一些介绍性的文字吧,这样别人在扫过我的二维码的时候,先看到的是关于刻录事的介绍,或者是我的一段广告词儿,然后才是网址。 说到这儿,想起另外一个问题,如果胖葫芦普及的话,会不会从此以后,到处张贴、喷印的现象会销声匿迹,代之而起的是满世界,包括墙壁、地板,都是二维码?看的人们成天无数黑白色块乱飞。 呵呵,下面是我的葫芦码。不知道他们用的是不是QRcode,或者是自己开发?????? 对了,在绝大多数人都不认识那个二维码的情况下,或许胖葫芦的主人们应该在二维码下作个贴心的小提示,告诉他们可以通过wap到那里去下载软件,然后试用。
Source favicon20:56 Sitemaps Protocol » 刀枪Blue
Google,Yahoo 和 Microsoft 已经同意,使用相同的 Sitemaps protocol 索引全世界的网站。网站管理员/建设者可以从新网站 Sitemaps.org 获得新格式站点索引 xml 的信息。 这当然大大减少了要向搜索引擎提供索引的内容发布者的工作量。已经使用 Google Sitemaps 的用户可以不用改变自己已经提供的文件,这个索引现在已经被 Microsoft 和 Yahoo 支持。 其他业者看来只有完全忽略或者跟进这个标准的份儿,或许会有些 value-add 的应用出现。 这个 Microsoft 是你眼里那个霸道,自负,不愿改变自己,不能接受现实的 Microsoft 吗?送给 Firefox 的蛋糕,与 Novell 令人吃惊的合作,虽然困惑但已经起步的 Live 策略,Online 版本的 Office… 这个 Microsoft 仍然充满趣味,拥有看点。回首一些和它同时代或者基本同时代的家伙,都在哪里?他们仍然这么有意思吗?SGI,Compaq,Corel,DEC,Trident…… TechCrunch。
Source favicon20:54 网络视频, 再接再厉 » blog中文翻译
翻译原文:Internet video - We try harder Nov 9th 2006 | SAN FRANCISCO, From The Economist print edition 如果 YouTube 是网络视频领域的 Hertz,那么 Metacafe 就要做 Avis。 在以色列军队服役的十年中,有七年在战斗机上度过,”它教你学会进取和自信,”视频分享网站 Metacafe 的合伙创始人 Arik Czerniak 说。如果你的新生意正好与最大的搜索引擎 Google 所收购的网络视频巨擎 YouTube 竞争的话,这些(品质)当然有所帮助。(美国(反垄断)审查人员在11月3日认可了这次收购)。虽然 YouTube 专注于建立围绕视频片段的在线社区,Czerniak 先生说,但是它却对解决两个重大问题缺乏兴趣,分别是质量控制和对贡献的激励,这两大问题仍然制约着网络视频媒体(的发展)。所以作为最大的独立视频分享网站,Metcafe 正在朝这两方面努力。 对于视频网站来说,占最大头的由业余人士提交的视频作品都是质量较低的。像 YouTube 这样的网站充斥着盗版和糟到不堪入目的作品。仅有极少的片段脱颖而出并广为流传,而大多数都不为人知或者仅在为数不多的朋友圈内分享。在 YouTube 上被观看的90%的小视频落于那条”长尾”之内,存在于统计意义中,远离”畅销排行榜”。 和 YouTube 一样,Metacafe 通过网内的广告销售赚钱。但是与 YouTube 不同,它在首页上发挥了筛选与推荐”好东西”的作用。首先,它拒绝了盗版(大约占被提交作品的一半)。接着,它用100,000志愿者作影评员–就像免费的在线百科全书维基百科一样,它让志愿者来撰写和评价文本(的可靠性)。作为第三道过滤,Metacafe 依靠其视频排序(VideoRank)的构架设计来对小视频进行分析,这种设计能抓取多线程的数据(比如观看者是否将一个小视频从头看到尾)从而对视频进行排序–就像 Google 著名的 PageRank 构架对网页搜索结果进行排序一样。 当然,Metacafe 的内容好坏完全是主观的。它的志愿者和设计构架所推荐的内容大多属于软色情,而且有很多和 YouTube 同样,存在着侵权问题。但是系统的确提供了粗略地与 YouTube 情况相反的统计信息:约90%被观看的小视频落于统计分布图的”头”部,而不是”尾”部,他们是被展示在首页上的受欢迎的视频。统计观看总量的话,YouTube [...]
Source favicon20:32 Rumsfeld quotes » English - The Real Deal
Rumsfeld remembered for many famous quotes 看样子政界人物都很擅长搞笑。这两段实在是经典: “Reports that say that something hasn’t happened are always interesting to me, because as we know, there are known knowns. There are things we know we know. We also know there are known unknowns. That is to say we know there are some things we do not know. But there [...]
Source favicon19:44 形象化的能力 » 刘润
有一种能力很有意思,最近在关注,但不知道叫它什么好。不能叫做比喻,不能叫做通假。举个例子就清楚了。

最近有一辆宾利轿车很抢眼,叫价888万。很贵,但是到底有多贵?我问了身边的几位同事:888万到底有多贵?

我收到了几个答案:
但是我对这样一个描述最喜欢:


一个农民,从商纣王还没有出生的时候就开始工作,不吃不喝一直干到社会主义初级阶段,可能才能买得起一辆这样的轿车。



另一个例子。Bill Gates很有钱,到底有多少钱?我喜欢这个回答:


假如Bill Gates能活到100岁,并且必须在死前把所有的财富花完,那么从现在起,他必须每天花掉400万美元,全年无休。



这是一种能力,我暂时管它叫“形象化”(Visualize)的能力,它能够把非常抽象的东西给具化,让听者充分了解这些概念意味着什么。这种能力不是与生俱来的,需要练习,需要思考力,需要智慧。

这和另一种“概念化”(Conceptualize)的能力相呼应。“五讲四美三热爱”,“不管白猫黑猫,捉住老鼠就是好猫”是概念化的好例。

有人问:管理学什么?有人答:想清楚,说明白。

某种程度上,“想清楚”是概念化的能力,“说明白”是形象化的能力。
Source favicon17:08 Overpackaged CDs and tinned fiction » Media in China, Chinese media, advertising, and urban life - Danwei
Second Hand Roses (二手玫瑰) new CD has lots of packaging. Also, YA novels in metal boxes.
Source favicon15:21 Huang Jianxiang says goodbye to CCTV » Media in China, Chinese media, advertising, and urban life - Danwei
Goodbye CCTV Today Jiang Heping director of CCTV's sports department confirmed that football commentator Huang Jiangxiang has resigned from CCTV. Jiang said that this was Huang's personal decision and nothing to do with Huang's passionately pro-Italian commentating during the 2006...
Source favicon14:13 Yahoo, Google and Microsoft join forces (really !!) behind Sitemaps » Yahoo! Search blog
The best part about to-do lists is when you get to cross something off, and today we can cross one more from the list of feedback we have collected from webmasters. You have asked us to support a single format...
Source favicon13:23 The jasmine crossing by Peter Micic » Media in China, Chinese media, advertising, and urban life - Danwei
Melodies and tunes that travel across time and space are fascinating. In China, variants of the same tune can be found across the country, but a tune may also appear in a number of different guises within one area...
Source favicon13:06 Search engines united » Official Google Blog




Last year we published the Sitemap 0.84 XML protocol as a free and easy way for webmasters to inform search engines about URLs on their web sites so that search engines can more effectively crawl them. We released it under the Attribution/Share Alike Creative Commons license in the hopes that other search engines would adopt the protocol too. And today, we're excited to announce that Yahoo! and Microsoft are joining us in officially supporting the Sitemap protocol.



As the web becomes more dynamic, Sitemaps will enable better and fresher search results for everyone who uses the web. For site owners, Sitemaps will help improve website visibility in search results. You can read more about this on our Webmaster Central blog.
Source favicon11:52 Hard Hat Show: African Billboards of Beijing - Chinese subtitles » Media in China, Chinese media, advertising, and urban life - Danwei
Here is the Chinese subtitled version of African Billboards of Beijing, hosted on Tudou: You can also see this video in English on Danwei.TV. See Danwei's China and Africa category for more about Sino-African trade and relations....
Source favicon11:06 Microsoft, Google, Yahoo! Unite to Support Sitemaps » Live Search's WebLog

Today, we are excited to announce that Google, Microsoft and Yahoo! are coming together in support of the SiteMaps protocol.  The goal of this effort is to improve search results for customers around the world.  This protocol enables site owners everywhere to tell search engines about the content on their site instead of having to rely  solely on crawl algorithms to find it.

So, why are we excited to work on this?  Because by agreeing on a standard, we can provide site owners with one simple way to share information with every search engine.  You just publish a sitemap, and every engine is instantly able to read and use the data to more effectively index your site.  Since this is a free, widely supported protocol, our hope is that this will foster an even broader community of developers building support for it.

We are 100% behind this protocol - this kind of collaboration will help improve the search experience for all of our customers, and we are working hard to release full support in 2007.  We are starting to alpha test with internal partners such as MSDN and Microsoft Support now.  Like all teams at Microsoft, we like to dogfood our work internally to ensure that it is working properly before it is publicly released.  Watch this space for an update as soon as we’re done.

Interested in the gritty details?  Read more about the Sitemaps protocol at the official website: http://www.sitemaps.org.  If you have any comments, please let us know by leaving a comment.

Ken Moss

General Manager, Live Search

Source favicon10:53 image search result tracer » information aesthetics

imagetracer.jpg
a collage of image search results, traced over time to track their url, appearance, disappearance & rank. these webpages function like a snapshot at a given moment. when you re-perform the operation, another snapshot is layered over the previous capture, creating an archeology of data.

see also like visual search & casual search.

[link: geuzen.org|thnkx Sandra]

Source favicon10:50 Widget校园活动总结――北线 » 雅虎搜索日志

作者:雅虎Widget产品小组

"灵动桌面 创意无限"作为一项新事物的倡导者,我们希望把更开拓的理念和更广阔的创意与更多的人,尤其是在校的同学们进行分享,于是有了这次Yahoo!Widget校园巡讲活动的成形。希望能够通过我们的行动将一款时尚,好玩,炫酷,实用的桌面工具带入大家的学习和生活中,也希望校园这个充满无限创意和活力的团体能够带给我们新鲜的思路,激励我们和大家一起成长。做为活动工作人员的我们为了这个共同的愿望兵分两路,精彩由此延续开来......

北京理工大学――万事开头难,领头第一站
北京理工大学的校园讲座拉开了Yahoo!Widget巡讲的头一站,我们为这天的到来个个摩拳擦掌,派出了最强的阵容参与到这头一场战役当中,北理工的同学也给予了极大的支持和热情。现场是一个能够容纳将近300人的教室,讲座还没有开始,就已经显现出轰轰烈烈的迹象,连后排都站满了对Widget感兴趣的同学。由于是第一场,我们的讲师和主持人都以百分之二百的饱满状态投入到了讲座当中。讲座进展很顺利,北理工同学的提问环节更是此起彼伏,他们就讲座中遇到的问题,一一向讲师发问,意犹未尽的同学在讲座结束后,还专门留在了教室围着讲师追问自己不明白的地方。第一站我们获得了经验也收获了喜悦,为之后的巡讲提供了很好的参考。所有人都对接下的行程拭目以待。

wieget11.jpg  wieget21.jpg
                 讲座现场                                    讲师侃侃而谈

西安交通大学――热情如火,难以抗拒
初到西安,便被西安人的朴实热情所打动。交大讲座的当天,西安下起了大雨,大雨过后天空骤然放晴却又刮起了大风。我们提早来到校园内准备,经过宣传栏的时候,发现有几张Widget海报被大风无情的吹落了,于是大家赶紧七手八脚的把海报捡了起来,捍卫交大校园的整洁我们也有责任。晚上交大的讲座现场急速升温,可以用如火如荼来形容,我们每个人都被交大同学的热情所打动,在讲师与现场同学互动的过程中,有超过80%的人踊跃提问,将所有人的情绪都推向了高潮。在提问环节,同学们更是挖空心思将自己所学与所问完美结合,讲师也是竭尽所能解决同学们的疑问。结束后,大家都感觉,交大同学的热情就象一把火,我们脑门儿都冒汗了!

wieget3.jpg  wieget41.jpg
             同学踊跃回答问题                              捍卫校园整洁

西安电子科技大学――宠辱不惊,知性西电
西安电子科技大学是西安的第二站,同学们早早的就来帮忙我们一起布置,当天的现场是几场讲座中布置的最用心和最有特色的一处。西电参加讲座的大多数都是大四的学生,而且专业也和Widget相当对口,所以对比起其他学校来说,他们听讲格外用心,所问的问题也颇具专业和深度,连我们的讲师也对西电同学的素质竖起了大拇指。在西电我们的美女主持人也相当的敬业和优秀,她同样获得了大家的掌声。讲座结束后,更有很多的同学执着的继续提问,求知欲令人自愧不如!

wieget51.jpg  wieget61.jpg
             巾帼不让须眉                                同学回答讲师提问

哈尔滨工业大学――母校演讲,溢于言表
哈尔滨工业大学是我们这次校园巡讲的最北站,也是所到之处气温最低的一个地方。刚到哈尔滨我们便全副武装,穿起了羽绒服。当晚在讲师的带领下,进入哈尔滨工业大学采风。哈工大是讲师的母校,这使我们对它的历史和地理环境有了更深入的了解。哈工大的讲座是北线人数最多的一场,有超过400名同学加入到了我们当中。也是我们的讲师自我感觉发挥的最好的一场,这一方面来源于之前几次经验的积累,另一方面也因为是自己的母校,致使当天的表现异常兴奋和激动,悄悄的说,那天讲师在讲座过程中的饮水频率明显比平时高了好几倍,而且讲话的频率和所叙述的内容更是有增无减:)

wieget71.jpg  wieget81.jpg
             哈工大讲座现场                             讲师与获奖者合影

北京邮电大学――波澜不惊,渐入佳境
北京邮电大学是这次北线巡讲的最后一站,听说当天晚上是北邮选修课最多的一晚,但我们依然迎来了众多对Widget感兴趣的同学们的关注。北邮的同学给我们留下的第一印象是比较腼腆,大家都是静静的在听讲课,似乎是把所有的问题都积蓄到最后。讲座到了提问环节,同学们的问题就象连发的糖豆儿一样抛了出来,本来我们的规则是一个人只能有一次提问机会,没想到几乎所有站起来的同学,都连续从不同的侧面提出了问题,我们的讲师乐此不疲的回答大家的提问,并对同学们的认真倍感开心。

wieget91.jpg  wieget101.jpg
        主持人采访参与讲座同学               讲座后还有很多同学向讲师发问

更多精彩,敬请期待...

Source favicon10:29 Map Reduce - the Free Lunch is not over? » Xerdoc Together
微软著名的C++大师Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software“,预言OO之后软件开发将要面临的又一次重大变革-并行计算。 摩尔定律统制下的软件开发时代有一个非常有意思的现象:”Andy giveth, and Bill taketh away.”。不管CPU的主频有多快,我们始终有办法来利用它,而我们也陶醉在机器升级带来的程序性能提高中。 我记着我大二的时候曾经做过一个五子棋的程序,当时的算法就是预先设计一些棋型(有优先级),然后扫描棋盘,对形势进行分析,看看当前走哪部对自己最重要。当然下棋还要堵别人,这就需要互换双方的棋型再计算。如果只算一步,很可能被狡猾的对手欺骗,所以为了多想几步,还需要递归和回朔。在当时的机器上,算3步就基本上需要3秒左右的时间了。后来大学毕业收拾东西的时候找到这个程序,试了一下,发现算10步需要的时间也基本上感觉不出来了。 不知道你是否有同样的经历,我们不知不觉的一直在享受着这样的免费午餐。可是,随着摩尔定律的提前终结,免费的午餐终究要还回去。虽然硬件设计师还在努力:Hyper Threading CPU(多出一套寄存器,相当于一个逻辑CPU)使得Pipeline尽可能满负荷,使多个Thread的操作有可能并行,使得多线程程序的性能有5%-15%的提升;增加Cache容量也使得包括Single-Thread和Multi-Thread程序都能受益。也许这些还能帮助你一段时间,但问题是,我们必须做出改变,面对这个即将到来的变革,你准备好了么? Concurrency Programming != Multi-Thread Programming。很多人都会说MultiThreading谁不会,问题是,你是为什么使用/如何使用多线程的?我从前做过一个类似AcdSee一样的图像查看/处理程序,我通常用它来处理我的数码照片。我在里面用了大量的多线程,不过主要目的是在图像处理的时候不要Block住UI,所以将CPU Intensive的计算部分用后台线程进行处理。而并没有把对图像矩阵的运算并行分开。 我觉得Concurrency Programming真正的挑战在于Programming Model的改变,在程序员的脑子里面要对自己的程序怎样并行化有很清楚的认识,更重要的是,如何去实现(包括架构、容错、实时监控等等)这种并行化,如何去调试,如何去测试。 在Google,每天有海量的数据需要在有限的时间内进行处理(其实每个互联网公司都会碰到这样的问题),每个程序员都需要进行分布式的程序开发,这其中包括如何分布、调度、监控以及容错等等。Google的MapReduce正是把分布式的业务逻辑从这些复杂的细节中抽象出来,使得没有或者很少并行开发经验的程序员也能进行并行应用程序的开发。 MapReduce中最重要的两个词就是Map(映射)和Reduce(规约)。初看Map/Reduce这两个词,熟悉Function Language的人一定感觉很熟悉。FP把这样的函数称为”higher order function”(”High order function”被成为Function Programming的利器之一哦),也就是说,这些函数是编写来被与其它函数相结合(或者说被其它函数调用的)。如果说硬要比的化,可以把它想象成C里面的CallBack函数,或者STL里面的Functor。比如你要对一个STL的容器进行查找,需要制定每两个元素相比较的Functor(Comparator),这个Comparator在遍历容器的时候就会被调用。 拿前面说过图像处理程序来举例,其实大多数的图像处理操作都是对图像矩阵进行某种运算。这里的运算通常有两种,一种是映射,一种是规约。拿两种效果来说,”老照片”效果通常是强化照片的G/B值,然后对每个象素加一些随机的偏移,这些操作在二维矩阵上的每一个元素都是独立的,是Map操作。而”雕刻”效果需要提取图像边缘,就需要元素之间的运算了,是一种Reduce操作。再举个简单的例子,一个一维矩阵(数组)[0,1,2,3,4]可以映射为[0,2,3,6,8](乘2),也可以映射为[1,2,3,4,5](加1)。它可以规约为0(元素求积)也可以规约为10(元素求和)。 面对复杂问题,古人教导我们要“分而治之”,英文中对应的词是”Divide and Conquer“。Map/Reduce其实就是Divide/Conquer的过程,通过把问题Divide,使这些Divide后的Map运算高度并行,再将Map后的结果Reduce(根据某一个Key),得到最终的结果。 Googler发现这是问题的核心,其它都是共性问题。因此,他们把MapReduce抽象分离出来。这样,Google的程序员可以只关心应用逻辑,关心根据哪些Key把问题进行分解,哪些操作是Map操作,哪些操作是Reduce操作。其它并行计算中的复杂问题诸如分布、工作调度、容错、机器间通信都交给Map/Reduce Framework去做,很大程度上简化了整个编程模型。 MapReduce的另一个特点是,Map和Reduce的输入和输出都是中间临时文件(MapReduce利用Google文件系统来管理和访问这些文件),而不是不同进程间或者不同机器间的其它通信方式。我觉得,这是Google一贯的风格,化繁为简,返璞归真。 接下来就放下其它,研究一下Map/Reduce操作。(其它比如容错、备份任务也有很经典的经验和实现,论文里面都有详述) Map的定义: Map, written by the user, takes an input pair and produces a set of intermediate key/value pairs. The MapReduce library [...]
Source favicon09:26 大国崛起 » Blog on 27th Floor
刚刚用这四个字Google了一下,居然有63万条结果,真不容易,原来老大们老早就在思考当大国,并且要崛起了。我以前以为他们还一直很低调呢,原来就跟李大嘴一样:我还是衙门他亲侄儿呢。低调。低调。

不过中央台这个片子似乎还是可以的--以我半瓶醋的水准来评价。这个剧据说是根据3年前老大们的一次学习而来,当然也是应景或奉命之作。但不能排除应景之余又勾起某位仁兄深埋心底的某种念想,于是也引发观者一些有关微言大义的思考。

这个记录片已经演到第3集,前面三集分别是葡萄牙西班牙,荷兰和英国,后面还有9集,还要讲法德日俄苏美。至少在荷兰和英国这两集里,编者还是塞进了一些有关思想的内容,比如重商,守信,反抗威权,法制,包括国王也要守法以及宽松的个人环境等等。总之一个国家走上世界舞台的前端,总不只靠运气和狠干,它背后的思想运动也许有更强大持久的作用。

总之要讲大国,这些东西是避不开的,可以看看它最后能讲到哪里去。

中央台2套,晚9:30。
Source favicon08:52 速度比较:GMail/MSN/Yahoo!Mail » 车东[Blog^2]

LiveHTTPHeaders做了一个比较:发现GMailYahoo!MailLiveMail快还是有原因的。

从输入域名,到登录完成进入邮箱的HTTP请求次数(已经保存密码自动登录):
9 gmail.log
19 hotmail.log
34 ymail.log

GMail的请求:9次

GET /mail/
GET /mail/
GET /mail/
GET /mail/im/dropupdown.gif
GET /setgmail
GET /mail/
GET /mail/
GET /mail/
GET /mail/

Live Mail的请求:19次,其中7个广告相关的请求

GET /mail/mail.aspx
GET /mail/Bootstrap_11.08.0100.0011.aspx
GET /mail/loading_11.08.0100.0011.aspx
GET /mail/ApplicationMain_11.08.0100.0011.aspx
GET /c.gif
POST /mail/mail.fpp
GET /mail/stylesheet_11.08.0100.0011.aspx
GET /mail/11.00/theme0/thumbn.gif
GET /mail/11.00/theme7/thumbn.gif
GET /ADSAdClient31.dll
GET /ADSAdClient31.dll
POST /mail/mail.fpp
GET /mail/11.00/theme6/thumbn.gif
GET /ADSAdClient31.dll
GET /mail/11.00/theme4/thumbn.gif
GET /ADSAdClient31.dll
GET /main/adfshow
GET /main/adfshow
GET /msnms/20061025/Hotmail(China)today_Rectangle_300_250_20k.swf

Yahoo!Mail(Beta版):34次

GET /
GET /b
GET /search
GET /yab/cache/cn/w85nP6Cx_z657_m9Yyg9Aw--
POST /ws/mail/v1/soap
POST /rss/Content/V3.0/getUserFeedData
POST /ws/mail/v1/soap
GET /dc/fc
GET /ws/cal/w85nP6Cx_z657_m9Yyg9Aw--/v0.1/event
GET /a
GET /a
GET /b
GET /a
GET /candygram/welcome/
GET /b
GET /a
GET /a
GET /img/loginrec.htm
GET /candygram/welcome/
GET /promo/p2006/tab_cg.html
GET /a
GET /us.yimg.com/a/1-/jscodes/031016/ct_lrec_031016.js
GET /img/loginrec.htm
GET /b
GET /b
GET /a
GET /b
GET /promo/p2006/tab_cg.html
GET /b
GET /b
GET /a/ad/daphne/20060809_74790_3_300x250_lrec_dragdrop_China.swf
GET /serv
GET /serv
GET /mail/

Source favicon07:44 对中医的态度 » Blog on 27th Floor
  1. 中医退出国家医疗体系,取消所有机构,包括管理医疗和教学。
  2. 中医的理论,放到文化史里去,它连哲学都不是。
  3. 加强加快对中草药的研究,有用的抓住,有毒副作用的赶快公布,一些中医研究院所可以转为中草药研究院。
  4. 对一些成药,目前确实没有发现明显毒副作用的,允许使用,并优先进行研究。
  5. 不许再按那些所谓理论用草药拼凑新药,不许用中西医结合的名义搞假中药,那种不可思议的柴胡注射液鱼腥草注射液应该判刑。
  6. 就爱吃草药或是限于条件只能吃草药的,谁也没办法。
Source favicon07:13 追加的画像自动让文字环绕着 » Ikias.com
在MT中,为了使追加的图像能够自动的让文字进行环绕,需要对MT的lib/MT/App/CMS.pm 文件中,下面这样的一段作以下的修改, <a href="$url" ><img alt="$fname" src="$thumb" width="$thumb_width" height="$thumb_height"  hspace="5" vspace="5" align="left" border="0" /></a> 当然,自己特定的代码也可以添加进去,比如title="<$MTEntryTitle$>"等等....
Source favicon06:50 数学之美 系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里 最大熵模型 » Google 黑板报 -- Google 中国的博客网志




我们上次谈到用最大熵模型可以将各种信息综合在一起。我们留下一个问题没有回答,就是如何构造最大熵模型。我们已经所有的最大熵模型都是指数函数的形式,现在只需要确定指数函数的参数就可以了,这个过程称为模型的训练。



最原始的最大熵模型的训练方法是一种称为通用迭代算法 GIS(generalized iterative scaling) 的迭代 算法。GIS 的原理并不复杂,大致可以概括为以下几个步骤:

1. 假定第零次迭代的初始模型为等概率的均匀分布。

2. 用第 N 次迭代的模型来估算每种信息特征在训练数据中的分布,如果超过了实际的,就把相应的模型参数变小;否则,将它们便大。

3. 重复步骤 2 直到收敛。



GIS 最早是由 Darroch 和 Ratcliff 在七十年代提出的。但是,这两人没有能对这种算法的物理含义进行很好地解释。后来是由数学家希萨(Csiszar)解释清楚的,因此,人们在谈到这个算法时,总是同时引用 Darroch 和Ratcliff 以及希萨的两篇论文。GIS 算法每次迭代的时间都很长,需要迭代很多次才能收敛,而且不太稳定,即使在 64 位计算机上都会出现溢出。因此,在实际应用中很少有人真正使用 GIS。大家只是通过它来了解最大熵模型的算法。



八十年代,很有天才的孪生兄弟的达拉皮垂(Della Pietra)在 IBM 对 GIS 算法进行了两方面的改进,提出了改进迭代算法 IIS(improved iterative scaling)。这使得最大熵模型的训练时间缩短了一到两个数量级。这样最大熵模型才有可能变得实用。即使如此,在当时也只有 IBM 有条件是用最大熵模型。



由于最大熵模型在数学上十分完美,对科学家们有很大的诱惑力,因此不少研究者试图把自己的问题用一个类似最大熵的近似模型去套。谁知这一近似,最大熵模型就变得不完美了,结果可想而知,比打补丁的凑合的方法也好不了多少。于是,不少热心人又放弃了这种方法。第一个在实际信息处理应用中验证了最大熵模型的优势的,是宾夕法尼亚大学马库斯的另一个高徒原 IBM 现微软的研究员拉纳帕提(Adwait Ratnarpakhi)。拉纳帕提的聪明之处在于他没有对最大熵模型进行近似,而是找到了几个最适合用最大熵模型、而计算量相对不太大的自然语言处理问题,比如词性标注和句法分析。拉纳帕提成功地将上下文信息、词性(名词、动词和形容词等)、句子成分(主谓宾)通过最大熵模型结合起来,做出了当时世界上最好的词性标识系统和句法分析器。拉纳帕提的论文发表后让人们耳目一新。拉纳帕提的词性标注系统,至今仍然是使用单一方法最好的系统。科学家们从拉纳帕提的成就中,又看到了用最大熵模型解决复杂的文字信息处理的希望。



但是,最大熵模型的计算量仍然是个拦路虎。我在学校时花了很长时间考虑如何简化最大熵模型的计算量。终于有一天,我对我的导师说,我发现一种数学变换,可以将大部分最大熵模型的训练时间在 IIS 的基础上减少两个数量级。我在黑板上推导了一个多小时,他没有找出我的推导中的任何破绽,接着他又回去想了两天,然后告诉我我的算法是对的。从此,我们就建造了一些很大的最大熵模型。这些模型比修修补补的凑合的方法好不少。即使在我找到了快速训练算法以后,为了训练一个包含上下文信息,主题信息和语法信息的文法模型(language model),我并行使用了 20 台当时最快的 SUN 工作站,仍然计算了三个月。由此可见最大熵模型的复杂的一面。最大熵模型快速算法的实现很复杂,到今天为止,世界上能有效实现这些算法的人也不到一百人。有兴趣实现一个最大熵模型的读者可以阅读我的论文



最大熵模型,可以说是集简与繁于一体,形式简单,实现复杂。值得一提的是,在Google的很多产品中,比如机器翻译,都直接或间接地用到了最大熵模型。



讲到这里,读者也许会问,当年最早改进最大熵模型算法的达拉皮垂兄弟这些年难道没有做任何事吗?他们在九十年代初贾里尼克离开 IBM 后,也退出了学术界,而到在金融界大显身手。他们两人和很多 IBM 语音识别的同事一同到了一家当时还不大,但现在是世界上最成功对冲基金(hedge fund)公司----文艺复兴技术公司 (Renaissance Technologies)。我们知道,决定股票涨落的因素可能有几十甚至上百种,而最大熵方法恰恰能找到一个同时满足成千上万种不同条件的模型。达拉皮垂兄弟等科学家在那里,用于最大熵模型和其他一些先进的数学工具对股票预测,获得了巨大的成功。从该基金 1988 年创立至今,它的净回报率高达平均每年 34%。也就是说,如果 1988 年你在该基金投入一块钱,今天你能得到 200 块钱。这个业绩,远远超过股神巴菲特的旗舰公司伯克夏哈撒韦(Berkshire Hathaway)。同期,伯克夏哈撒韦的总回报是 16 倍。



值得一提的是,信息处理的很多数学手段,包括隐含马尔可夫模型、子波变换、贝叶斯网络等等,在华尔街多有直接的应用。由此可见,数学模型的作用。
Source favicon06:24 Google News in Scandinavia » Official Google Blog




After months of hard work, the day is finally here: we've released Google News in Norway and Sweden.



At Google News, we cut to the bone -- er, to the core -- searching to get you the freshest takes. We gather the latest news headlines in your language and present a summary of links to you in one single page, freshly ranked by relevance and popularity. Then you just dash off to the sites to read the news stories that take your fancy.



The two of us worked as summer interns with Google in Trondheim earlier this year, with plenty of help from our Swedish colleague Jonas Yngvesson, who's based in Google's Zurich office. Now after some months of public silence, we can finally tell our friends and you all about our work on Google News Scandinavia. It has kind of become our baby. We've cared for it, looked after it, yelled at it and corrected it, and we've come to love it. We hope you will appreciate it as much as we do.



In addition to taming the news, we've enjoyed free lunches and had a chance to learn from some of the best engineers Trondheim and the rest of the world have to offer. Perhaps best of all, we were trusted to work on release-level code for Norway and Sweden. If like us you want to have a say in the inner workings of the world's biggest search company -- to discuss algorithm problems with the guy who wrote your algorithm textbook at college -- you should know that Google wants interns all over the world. Check out the Google Interns site.



Before we go, we would like to thank all the Googlers who have helped us and encouraged us and cared for us throughout our internship. Bosses, colleagues, recruiters and caterers, thank you! Our summer would not have been the same without your help.
Source favicon05:17 Search Marketing World on 11/15/06 » Search Marketing Standard Blog
Via Screenwerk, Google has expended its mobile ad test programto know include France, Italy, Netherlands, Spain, China, Ireland, India and Australia. Microsoft gets a distribution deal with...
Source favicon04:34 Nov 15 - Second Day of PubCon 2006 Coverage » Search Marketing Standard Blog
Here is the coverage of the second day of PubCon 2006 by Barry and Donna: New Age of Web Advertising Keynote by John Battelle Local and Mobile Local Search What Every Webmaster Should Know: PHP,...
Source favicon02:56 Search Public Events in Google Calendar » Official Google Blog


Today we launched a new feature of Google Calendar: "Search public events." It lets you search over public events added by others using Calendar and also events we've added by working with partners to provide movie listings, concerts, and all sorts of other fun events.

There are many reasons we wanted to build this feature, but mainly because some of us on the team moved to New York last year to work in our office there. Needless to say, we wanted to experience everything that the city had to offer but had trouble finding all the fun and fascination that New York has to offer. After Google Calendar launched in April, we saw a surge in the number of public calendars being shared. We thought if we made public events searchable, we could find interesting events with little effort by encouraging people to share interesting events.

So whether you're interested in broadway, movies, art, music, photography, farmer's markets, Knicks basketball (we love 'em in NY) or even good old dumpster diving, we hope you find this new feature useful. If you don't see your favorite event, add it to a public calendar and share it with the world. And while you're finding new and interesting things to do, please send us feedback on other ways we can improve the service.
Source favicon01:53 Nov 14 - First Day of PubCon 2006 Coverage » Search Marketing Standard Blog
The first day of PubCon 2006 in Vegas appears to be a busy one. SE Roundtable has a great coverage of the first day: WebmasterWorld Pubcon Kickoff Keynote Address - Guy Kawasaki Feeds,...
Source favicon00:06 Prostitution exemptions » Media in China, Chinese media, advertising, and urban life - Danwei
Liaoning province exempts 14 classes of people from re-education for prostitution-related crimes.

^==Back Home: www.chedong.com

<== 2006-11-15

==> 2006-11-17