« 2005年08月 | (回到Blog入口) | 2005年10月 »

2005年09月 归档

2005年09月07日

《旅行的艺术》

上周见到王建硕的时候感觉他最近挺忙的,嘴角都有些上火。聊天的时候王建硕说他最近只看了一本书:并且向我们推荐: 《旅行的艺术》。当时建硕还记下的便签:要送我一本。

书果然今天收到了:谢谢,一定遵从建硕的建议:从后往前看。


按此阅读全文 "《旅行的艺术》" »

2005年09月08日

王建硕的15个[OR]

研究了一下王建硕的写作风格,发现他经常喜欢进行对比。在Google上查:intitle:"or" site:home.wangjianshuo.com 可以发现他在15篇文章(排除了重复的以后)标题中用到了“OR”。

他自己最满意的2篇分别是:
Enjoy Doing [or] Being Able to Do <=这就是著名的《喜欢有之还是喜欢用之》英文原文
Dislike Doing [or] Starting to Do <=不喜欢还是不喜欢开始

更多还有:

按此阅读全文 "王建硕的15个[OR]" »

2005年09月09日

基于桌面搜索的站内全文检索解决方案

如果索引的文档主要是Word/PDF/静态网页等,在内部的公共文件服务器上使用Google的桌面搜索:
http://in.tra.net:4664/
然后在这台服务器上架设一台反相代理服务器,代理桌面搜索的服务端口,并对外提供服务:就成了自己的站内/intranet全文检索解决方案,
http://in.tra.net:4664/ <==> http://in.tra.net/ <==> internet
可能需要在代理服务器上加入一些设置,将搜索出来的链接地址由本地地址改成发布地址。

类似的:将多台这样的桌面搜索服务器集群起来,还可以形成一个小型的分布式检索解决方案。X-Friend就是这样一款产品,内核也是Lucene(Java)全文引擎

按此阅读全文 "基于桌面搜索的站内全文检索解决方案" »

2005年09月11日

911 四年前的今天你在做什么?

记得有一个记载:清末一个官员第一次在长江中看到英国的“小火轮”后即刻晕了过去,醒来的第一句话就是“这个世界要变天了……”,这我第一次使用Google搜索引擎的时候感觉是类似的。

四年前的9.11也是一个对世界改变很多的日子,而那天对我来说却有特别的意义:那天夜里我是在北京网易的办公室里加班度过的。那天我们完成了基于Lucene的新版网易搜索引擎(指的是用Lucene代替了当时大部分门户使用的GAIS),而刚刚成功切换到新引擎的喜悦很快被Judie通过MSN发给我的消息所打破:“纽约发生恐怖袭击的消息,快去看新浪论坛……”

按此阅读全文 "911 四年前的今天你在做什么?" »

2005年09月15日

通过Google webmasters tools提交SiteMaps:和Googlebot直接对话

昨天Google发布了BlogSearch
正确的提交自己的RSS还是要通过SiteMaps:

今天重新用了一下Google的SiteMaps网站:使用了一下提交网站认领(确认)功能。通过SiteMaps服务,网站管理员可以看到自己网站被Google抓取的情况。

具体的方法如下:Googlebot要求你在网站的FEED目录下创建一个空文件名,比如:
确认网站: http://www.niernier.com/
Google 已经抓取了您的网站 http://www.niernier.com/ ,并将向您展示某些结果。然而,为确保我们不会将您网站的隐私信息透露给他人,我们需要确认您的所有权。

1. 创建一个确认文件

创建名为 GOOGLE1cd1cd73cbe423a2.html 的空文件。该文件使 Google 可以对您进行唯一确认。您可以在任何文本编辑器中创建该文件。该文件应为空,因为我们只是检查其是否与您的 Sitemaps 位于同一位置,而不会阅读其内容。 您可以在 此处阅读有关此文件的详细信息。
2. 上传确认文件

您创建确认文件后,放置在您服务器上的 http://www.niernier.com/。

确认状态: http://www.niernier.com/GOOGLE1cd1cd73cbe423a2.html 已确认 查看网站状态 »

« 返回我的 Sitemaps

在网站上创建这个文件(比如用touch)后:GOOGLE1cd1cd73cbe423a2.html
点击“检查”Googlebot会立刻访问这个文件:记录到的日志如下
66.249.65.141 - - [15/Sep/2005:16:13:27 +0800] "HEAD /GOOGLE1cd1cd73cbe423a2.html HTTP/1.1" 200 0 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Googlebot真是够省的,连内容都不要,只要HTTP HEAD中发现这个文件存在即可。
如果成功:这个网站是你的了!网站被认领的好处在于你可以看到Googlebot的访问日志:从而帮助你的网站进行死链检查。

比如我的网站的“ 统计信息”如下:
网站: http://www.chedong.com/blog/
在我们的常规抓取过程中发现的网址

作为我们常规抓取过程的一部分,我们一直在抓取您的网站。这包括来自您的网页以及其他网站网页的以下链接。 以下我们列出了在此抓取过程中无法访问的网址,以及解释我们为什么无法访问的链接。

网址 错误
http://www.chedong.com/blog/archives/000019.html HTTP 错误
http://www.chedong.com/blog/archives/000020.html HTTP 错误
http://www.chedong.com/blog/archives/000027.html HTTP 错误

按此阅读全文 "通过Google webmasters tools提交SiteMaps:和Googlebot直接对话" »

2005年09月18日

BLOG="Better Listings On Google" ? Google BlogSearch上的 BSP索引收录量比较

Google Blog搜索引擎中的BSP收录量比较:
BlogSpot.com Google收购的Blogger服务对应的发布服务: 9,598,736
MSN也是最大的赢家之一,使用:inurl:spaces.msn.com 搜索:MSN Spaces的索引量:8,691,835。
LiveJournal: 1,992,742
TypePad: 444,189
Yahoo!360: 20,885

按此阅读全文 "BLOG="Better Listings On Google" ? Google BlogSearch上的 BSP索引收录量比较" »

装在U盘里的Windows XP:闪存改变的软件应用

前些天看到的:



把xp装在 U盘里


Originally uploaded by herock.

硬件的发展越来越明显的改变软件产品的设计。绑定专用软件的硬件产品的越来越多了,记得以前需要自己用旧机器安装Linux+NAT服务器做代理服务器让多台机器上网呢:现在一个无线HUB就解决了,配置很方便。

最近感觉更多的是闪存的发展对产品的影响:
QQ2005也出了基于USB的电话软件:在机场买的很火。
而越来越小的iPod产品也正预示着闪存存储在加速代替硬盘的趋势。

按此阅读全文 "装在U盘里的Windows XP:闪存改变的软件应用" »

Google为李开复博士新建的博客网志:kaifuleegoogle.com

还记得Google的斑竹吗?最近Google为李开复博士新建了一个博客网志:kaifuleegoogle.com Google与李开复博士:摘要如下
引言

欢迎光临我们新建的李开复博士的博客网志!正如许多人可能知道的,我们七月聘请了李博士来创建我们在中国的工程研究院。受聘后不久,李博士的前雇主微软公司就起诉李博士和Google公司。

我们想通过一个中文的临时博客网志帮助李博士和Google的中国朋友们了解事件的动态。因为法律问题有时候会非常复杂,可能会使一些人感到困惑。

在这个博客网志我们将会刊登各种各样的内容,让大家能了解事件的进展,包括诉讼摘要、法庭记录、和我们对事件的解读。我们也会经常透过某位我们的律师,与各位分享我们对本案的法律观点。合适的时候,我们也会请李博士写一些内容。

我们盼望这个博客网志能帮助中国的朋友们了解远在加州的复杂法律程序。

-- Google公司

按此阅读全文 "Google为李开复博士新建的博客网志:kaifuleegoogle.com" »

关于 2005年09月

此页面包含了在2005年09月发表于车东[Blog^2]的所有日记,它们从老到新列出。

前一个存档 2005年08月

后一个存档 2005年10月

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36