基于桌面搜索的站内全文检索解决方案


如果索引的文档主要是Word/PDF/静态网页等,在内部的公共文件服务器上使用Google的桌面搜索:
http://in.tra.net:4664/
然后在这台服务器上架设一台反相代理服务器,代理桌面搜索的服务端口,并对外提供服务:就成了自己的站内/intranet全文检索解决方案,
http://in.tra.net:4664/ <==> http://in.tra.net/ <==> internet
可能需要在代理服务器上加入一些设置,将搜索出来的链接地址由本地地址改成发布地址。

类似的:将多台这样的桌面搜索服务器集群起来,还可以形成一个小型的分布式检索解决方案。X-Friend就是这样一款产品,内核也是Lucene(Java)全文引擎

如果发布的内容存储在数据库中的话,就需要一定的开发了。Lucene引擎仍然是首选的解决方案:Blog全文引擎 www.grass.org.cn就是一个样例。其后台代码全部Open Source在sourceforge.net/projects/weblucene/

作者:车东 发表于:2005-09-09 10:09 最后更新于:2007-04-15 19:04
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

Comments

似乎更难以控制的是隐私性问题

这个比较好玩,可编程,可定制:
http://gdapi.sourceforge.net
另外,你分析过GDS的文件吗?

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)

相关文章

关于

此页面包含了发表于2005年09月09日 上午10时36分的 Blog 上的单篇日记。

此 Blog 的前一篇日记是 王建硕的15个[OR]

此 Blog 的后一篇日记是 911 四年前的今天你在做什么?

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36