Source favicon22:29 格志转移到 drupal » 桑林志
© 桑葚,来自桑林志 | 格志转移到 drupal把格志从使用 WordPress 转移到 drupal。欢迎前去测试。 ----------------- 加入 del.icio.us,阅读更多blogosphere, 简讯分类下的文章...
Source favicon20:40 Orz » English - The Real Deal
在网络流行语方面我一向后知后觉,两三个月前才第一次接触到Orz(这里似乎该加个“汗”)。前几天和朋友吃饭时有人问起Orz到底是什么意思,正好这个网站的留言里也第一次出现Orz,我就仔细挖了一下Orz的来源。找到一篇挺有意思的英文介绍,摘录如下(有较多语法和拼写错误,未修正): “Orz” is a popular symbol, a pictograph, a fun stuff, a strong meme, a fashion and even a subculture in Far East Asia since 2004. It’s originally from Japan. It illustrates a guy facing left and kneeling on the ground, the “o” means the head, the “r” means the hands and the body while the [...]
Source favicon19:50 Oracle SES 的实现案例 » DBA's notes

Oracle Secure Enterprise Search 站点上提供了一篇白皮书: Implementing search.oracle.com - A Case Study 比较详细的介绍了 http://search.oracle.com 的实现。Oracle 通过这个站点提供对公司首页内容与 OTN 的搜索。不过既然是安全搜索,为什么不加入 Metalink 内容的搜索呢?

服务器用的两台 Dell PowerEdge 2850(机器可挺破)。每台配置是 2 颗 3G 的超线程 CPU 加上 8G 内存。存储是 RAID 5 方式。共有 4.3T 内部(? 这个机型最大支持 1.8TB SCSI 内部存储,其余就需要接外部存储了啊? )磁盘空间可用。没有说具体的存储设备或是连接方式。划分了 700G 给当前用。其余留作扩展。写了一个简单的脚本定期从 OS 端检查磁盘状态。

操作系统用的红帽子 RHEL 3 Update 2。内核是 2.4.21-37.ELhugemem ,能够充分利用大内存。接下来的设置我有一点疑问。前面说的 700g 空间挂在目录 /u02 下,而 SES 软件安装在 /u01 下。这个目录是单个磁盘分区上的--这似乎是一个单点啊!

Oracle SGA 设置了 2.5G 左右。当前已经索引了 35 万篇文档,数据库大小是 15G,Cache 文件 17G,Log(搜索的Log) 文件 1G。如果 Oracle 不做站外搜索的话,4.3 T 的总空间是绰绰有余。其实我倒是觉得 Oracle 有义务对站外的 Oracle 论坛等相关信息作一下专门的搜索,也算是对广大用户负责的一种手段。

负载均衡设备选用的是 F5(青春偶像 F4 的旁边, 呵呵)。示意图如下:

Oracle SES and F5 负载均衡

最后的监控方法也值得借鉴。

整个搜索站点构建中,软件成本的标准是: $30K/CPU 或者是 $60/命名用户 或是 $30/员工。两台机器上的 SES 需要 License 是 12 万美金。这个报价可不低啊。

-EOF-

Source favicon19:22 2006.8.3晚中断预告 » 豆瓣blog
为准备功能更新,今晚豆瓣将有几次间歇性的服务中断,每次应该不超过20分钟。对可能给大家造成的不便,我们深感歉意。
Source favicon17:09 质量还是数量?我们到底有多少工程师 » blog中文翻译
原文地址:Quality vs. Quantity in Engineering Marvinlee 每年春天,加州大学伯克利分校的电子工程学和计算机科学的主任(chair of electrical engineering and computer science at the University of California at Berkeley)Jitendra Malik都会坐下来同被工程学院录取的学生们谈话,讨论他们是否应该入学就读这个专业。 最近Malik注意到在学生们,尤其是他们的家长,提出的问题中有一个经常出现的主题。“他们都很关心工程师或者计算机科学这个职业在今后的十年内发展前景如何”,Malik说。他们想知道他们是否选择了一个将会被外包出去的职业。为什么能够进入国内顶级工程学项目的学生还要担心找不到一份好工作?如果连考进伯克利工程系(Berkeley engineering)的学生都不愿意入学,是不是关于全国工程学毕业生的数量正在增长的争论并没有讨论到点子上? 只要打开电视看几眼Lou Dobbs在CNN的夜间节目“输出中的美国”——现在已经出书了——就能理解学生们的担心了,他在其中大肆抱怨外包。“把美国的就业机会输出到廉价的国外劳动力市场所威胁到的不仅仅是成千上万的工人和他们的家庭,更威胁到美国的生活方式”,那本书的官方广告如是说。 除此还有无数的政客、新闻稿和各色文章告诉学生们“去年中国的高校有超过60万的工程系学生毕业,印度的学校弄出了35万,而美国只有区区7万”,就像教育部的秘书Margaret Spellings在《新闻周刊》的一则通讯中指出的那样。无论是左派还是右派的政客们——包括Edward Kennedy 和Newt Gingrich——都争相引用那些数字,就像美国国家科学院(National Academies of Science)一份名为《超越密布的阴云》((Rising Above the Gathering Storm))的报告所作的那样,那份报告似乎很想将关于扁平的世界的恐惧传递给白宫。 但是杜克大学(Duke University)两位学者的一项研究表明这些一再援引的数据是误导性的,一些专家说外包压根不会导致美国终结,关于美国工程学岌岌可危的警告不但没有使学生们更自律,反而吓得他们止步不前。 在一份并没有像《阴云》那样引起美国国会重视的报告中,杜克大学的学者们探寻着关于毕业生数量的数据的真实性。杜克大学普拉达工程学院(Duke’s Pratt School of Engineering)的院长(executive in residence),《圈定工程学外包争论》((Framing the Engineering Outsourcing Debate))的作者之一Vivek Wadhwa说中国有60万工程学毕业生的数据是2002年的,当时Cadence Design Systems的CEO Ray Bingham在一次演讲中使用了这个数据。“人们还在引用同样的数据,它们根本就不准确”,Wadhwa说。杜克大学的报告使用了国家教育统计中心(the National Center for Educational Statistics)、国家软件与服务公司协会(the National Association [...]
Source favicon17:05 彭博新闻社(Bloomberg)记者下午过来拜访(三) » 妮妮
Bloomberg通过遍布全球金融机构的终端机(目前可能全世界几十万台),以及电视、电台、广播,向全世界提供金融信息和新闻。甚至面对滚滚迩来的网络大潮,Bloomberg没有淘汰自己的专线系统计划(路透社确大举进军网络),因为它95%的利润来源于此——外表时尚新潮,价格甚巨的彭博终端机,使用它的人们认为这是身份与地位的象征,有人说这是市场贵族的形成过程,英格兰银行、梵蒂冈教廷、世界银行、国际清算银行和美国各大联邦储备银行、美林等都是终端机忠实的用户。 目前中国的Bloomberg终端机大概是2000多个,年费是2万多美元。Bloomberg终端机由Bloomberg提供,在外面是不能买到单机的,很漂亮。 路透终端数量是彭博的3倍,但来自每台终端的收入却只有彭博的1/4。 Bloomberg专用键盘(注意旁边有两个喇叭) 键盘上的指纹识别器 以上图片来自台湾雄瓶...
Source favicon16:17 《读书杂志》第一期 [Flickr] » DBA's notes

dbanotes posted a photo:

《读书杂志》第一期

pic.thebeijingnews.com/culture/0821/2006/08-03/0013@45246...

Source favicon15:16 彭博新闻社(Bloomberg)记者下午过来拜访(二) » 妮妮
彭博新闻社的记者刚才来拜访过,礼节性的带来了一袋子印有他们LOGO的精致礼品和文具(有笔、本子、T恤、钥匙链、鼠标垫)。让我顿生好感!我最喜欢文具啦。该美女记者说,这是公司规定,外出都要带这么一兜子。 老外的礼节真不错,见面就送一堆小礼物,注意是“一堆”而不是“一个”。中国公司的惯例通常是相谈甚欢之后或者下次见面之前才送小礼物的。我们公司也有自己的小礼物,但是通常一般客户不给,只给大客户,可是呢准备的礼物又太微不足道大客户瞧不上,没有一点效果。 我被收买了。 这真是一个值得学习的好规定。能最快的时间让对方就欢喜,放松。特别是我这种超级喜欢文具的人,而且据我所知,很多人都对文具情有独衷。 BTW,彭博社有个著名的“厨房”,全世界的彭博社所在地都有,里面很多很多美食、饮料、水果、点心、巧克力,客户到了以后,随便吃。 美女记者说,通常是一半办公区一般厨房。 我国外的朋友就去过他们纽约的总部,她说为了去,她饿了一天。很丰盛。 我今天跟美女记者说我也要去北京的厨房,她很抱歉的说没有纽约的好,只有点心和饮料啥的。 我说有这些就成。 这些人性化的手段是很值得学习的。 彭博在全球推广这样一个规定(出门带一兜子小礼品)一定是反复研究和谨慎考虑过的,而且在我身上的确也产生了效果。 不过我不知道其他人(对文具不是很感冒的人)是否也会被产生效果呢?精致的小礼品一样大家喜欢。...
Source favicon13:23 彭博社(Bloomberg)记者下午过来拜访(一) » 妮妮
第一次知道彭博社(Bloomberg)是03年前宝弟儿告诉的,他说如果你们研究院哪天能做到像彭博社那样即时为房地产行业客户提供他们需要的所有资讯、数据和分析,你们就牛掰大了,你也再不用天天趴在桌前写报告赚钱了。他说这话的时候是我们研究院青黄不接的时候,咨询业务没上来,只能天天写报告和整理数据。 当时我忘记了Bloomberg这个难记的名字,只是知道有这么一家公司提供财经数据很牛啦。 上周宝弟儿又给我上课来着:彭博社是全世界最大的财经类媒体,是现任纽约市市长Michael R. Bloomberg创建并以他的名字命名的一家金融资讯公司。在20多年的时间内,已经发展成为全球无人可以小视的第一金融资讯帝国。是路透社最大的竞争者之一。 以下是刚才在网络上查到的资料,算是接收拜访前做的功课吧: 彭博资讯(Bloomberg L.P.) 创建于1981年,是一家全球性的信息服务、新闻和传媒公司,总部位于纽约,在世界各地的100多家办事处雇佣了8000名员工。在国际金融界,它的旗舰产品是“彭博专业服务”,即将新闻、数据、分析工具、多媒体报告和“直通式”处理系统整合在单一的平台上,随时向客户提供信息和帮助。 组织结构图查看图片 就财经新闻而言,它在全球有102个新闻机构,1600多名财经记者。彭博社的报道风格更倾向于杂志,不用形容词,只用名词和动词。直接告诉客户事实,即发生了什么?权威人士是怎么认为的?非常客观,不带有丝毫主观性。 彭博社要求记者做到5个F:First word(导语要到位),fast(要快),fact(反映事实),future word (新闻的发展趋势), final word(告诉读者事件的结果)。 First word即第一句话勾画出事件全貌,每一分钟跟近事件的发展,让人们有现场感,知道发生了什么; fast,就是新闻发布要快,抢在竞争对手之前发布; fact,告诉读者每句话都有出处,是谁说的; future word,即把新闻放在一个环境中,试图让投资者和股民看到事态的发展,事态周边的关系,把新闻立体化。这一部分多是专家的,行业的分析等等。 Final word,就是告诉人们新闻的结果是什么,这个结果一定比第二天人们在报纸上看到的要全面、权威。 Bloomberg每天要发4000条消息,在这些消息中,他们结合市场现象和竞争,教给人们如何认识市场。在华尔街投行家和交易商看来,彭博资讯终端不仅是有价值的信息渠道,更能提高使用者的身份和地位。每个客户用彭博资讯的收费标准:每月1600美元。 新浪文章:梦想的诱惑与力量 解读Bloomberg创建者内驱力...
Source favicon13:00 Links for 2006-08-02 [del.icio.us] » DBA's notes
Source favicon11:56 Oracle SES architecture [Flickr] » DBA's notes

dbanotes posted a photo:

Oracle SES architecture

download-west.oracle.com/docs/cd/B28527_01/doc/search.101...

Source favicon08:59 再次清零 » laolu

关于MSN Spaces的更新,keso说:改善用户体验,用不着总是改变URL。他不用MSN Spaces,没切肤之痛。

不到一年的时间里,我的blog拥有了4个不同的网址,感谢微软,还都能用。但首页的PageRank在3次网址改变中,3次被清零。第一次被改网址,过了没多久,PR很快恢复到了4。第二次被改网址,可能引起了Google的警觉,怀疑我PR欺诈了,一直没恢复PR,连个0都没给。我正等着Google继续考察,恢复名誉,昨天网址又被改到live,那可是顶风作案哪。只求不要因为duplicate sites的spam而遭封杀,PR我是不想了。

08:00 2006/08/03 08:00:00TQ洽谈通搜索力指数排行榜 » TQ洽谈通搜索力指数
 搜索引擎  搜索力指数  排名升降  份额
1. Baidu  47293890     65.92%
2. Google  6570646     9.16%
3. Yahoo  6343274     8.84%
4. Sogou  4229182     5.89%
5. 3721  3521554     4.91%
6. QQ  1754790     2.45%
7. Tom  494010     0.69%
8. MSN  421006     0.59%
9. China  408034     0.57%
10. 163  360758     0.50%
11. iAsk  244874     0.34%
Source favicon02:57 It's all about the photos...on a Mac » Official Google Blog




I'm happy to tell you about the release of Picasa Web Albums Uploaders (beta, of course) for Mac OS X. Picasa Web Albums makes it simple to share photos with friends and family, and now we've made it even easier on the Mac. This new download comes with two handy tools for uploading photos: There's a plug-in for uploading your pics within iPhoto. If you don't use iPhoto, or just want to upload the occasional picture, just drag your photos into the provided standalone app and click Upload. Either way, I can't wait for my fellow Mac users to showcase their talents.



Normally I work on search engine infrastructure. I love my work on web search, but as a change of pace I decided to use my 20 percent time to make Picasa Web Albums better for Mac users. Fortunately, I was not alone. The Picasa and Mac development teams embraced the project and provided great assistance. Greg Robbins, a co-conspirator in the famous graphing calculator story, worked to refine the user interface. Later, another one of our Mac engineers, Mike Morton (I’m OK, mentor), took over as project lead, made quick work of creating the iPhoto export plug-in, and became the one responsible for incorporating feedback and finishing up the application and plug-in.



For me this has been a great opportunity to meet and work with new people, explore new technologies, and help create something that I hope the Mac community will find useful. So, please sign up for Picasa Web Albums, download the uploaders, and show the world some beautiful photos.
Source favicon02:15 SES San Jose 2006 » The Ask.com Blog
Search Engine Strategies is touching down in San Jose next week for the annual Bay Area conference. As always, there are some very informative panel discussions occurring throughout the week, many of which will include folks from Ask.com & Bloglines....
Source favicon01:03 Filebrowser 1.3.4 中文化 » Jedi's BLOG | Jedi.org
Filebrowser 是另一套由 Lussumo Software (就是做 Vanilla 那一間)所開發的系統,功能是把某個網頁目錄瞬間變成相簿之類的東西。整個系統也是相當輕巧,安裝起來幾乎沒甚麼需求(雖然功能也不多就是了)。因為某些緣故,所以我花了一點點時間,做了繁簡中文化。 這個系統並沒有甚麼 i18n 的架構,所以所有的訊息都是寫死在程式碼之中的,中文化也就是硬改了。請從上述的目錄取得檔案,覆蓋掉原有的檔案即可;除了主程式及縮圖程式均中文化外,預設的組態檔也一併中文化了,內附的陽春文件也翻譯成中文了。 同樣地,如果有甚麼瑕疵或建議,請回報給我。
Source favicon00:01 翻译开源来学英语 » Blog on 27th Floor
Debian每周新闻上(第1段)提到这个新项目,就是用Wordforge来做Debian的本地化(Localization,l10n),上面还写错了,那个Worldforge似乎是个角色游戏?

除了前面提到的Debian包的介绍的翻译,还有其他一些翻译的方法,最传统的就是翻译那些PO文件,这个有专门的翻译工作,gTranslator一类的,一句一句地翻;还有许多其他工作,可以把其他形式的语言文件转成po格式。

还有就是这个LaunchPad,这是一个基于网络的翻译平台,操作比较简单,并且方便大家合作,但它似乎和Ubuntu联系比较紧密,当然也可以把翻译好的东西提交给其他维护者。

现在Debian这里提议的是看上去是个类似的东西:Pootle - a web portal for translation,面向翻译的web门户。也许Debian以后会把翻译的工作放到这里来进行吧。

说起翻译,Wordforge前言说得好:

WordForge基金会的任务是保护少数(派?民族,或者弱势?)语言。因为多数(强势)语言在技术上的优势,它们在学校里和工作场合中慢慢地取代了这些少数语言。而引发这一变化的一个重要因素就是这些语言不能获取到必要的词汇来描述那些尚未被翻译的技术、现代办公以及计算机软件。

本基金会把这些语言看作是“受到数字化威胁”的语言,并希望能通过在这些国家的工作来达成自己的目标。工作主要是发展技术术语,以及把自由和开源软件翻译到这些国家的语言和实现本地化。

汉语虽然使用人群够多,但在这些方面也是面临险境,在翻译时常常遇到怎么翻都不太准确的字词。所以呢,一定要努力参与。

另一方面,还看到金融时报中文版上一直在讨论英语问题,包括学英语,然后延伸到如何保护我国传统文化的伟大事业。我想我们要在战略上藐视英语,把它当成个小菜,努力阅读,翻译,现在网上这么多活生生的英语,比课本上强不少;再者要努力看盗版DVD,找机会就说,把它当成一个工具掌握了,先跟上世界潮流再说其他。

翻译这个活动,实在是练习阅读的一大法宝,其效果坚持上一个月就很明显了。同时又锻炼了自己的汉语表达和写作,也算是保护传统文化了。

^==Back Home: www.chedong.com

<== 2006-08-02

==> 2006-08-04