如果索引的文档主要是Word/PDF/静态网页等,在内部的公共文件服务器上使用Google的桌面搜索:
http://in.tra.net:4664/
然后在这台服务器上架设一台反相代理服务器,代理桌面搜索的服务端口,并对外提供服务:就成了自己的站内/intranet全文检索解决方案,
http://in.tra.net:4664/ <==> http://in.tra.net/ <==> internet
可能需要在代理服务器上加入一些设置,将搜索出来的链接地址由本地地址改成发布地址。
类似的:将多台这样的桌面搜索服务器集群起来,还可以形成一个小型的分布式检索解决方案。X-Friend就是这样一款产品,内核也是Lucene(Java)全文引擎。
如果发布的内容存储在数据库中的话,就需要一定的开发了。Lucene引擎仍然是首选的解决方案:Blog全文引擎 www.grass.org.cn就是一个样例。其后台代码全部Open Source在sourceforge.net/projects/weblucene/
作者:车东 发表于:2005-09-09 10:09 最后更新于:2007-04-15 19:04版权声明:可以转载,转载时请务必以超链接形式标明文章 基于桌面搜索的站内全文检索解决方案 的原始出处和作者信息及本版权声明。
http://www.chedong.com/blog/archives/000983.html
Comments
似乎更难以控制的是隐私性问题
由: Fenng 发表于 2005年09月09日 下午12时58分
这个比较好玩,可编程,可定制:
http://gdapi.sourceforge.net
另外,你分析过GDS的文件吗?
由: Andy 发表于 2005年09月13日 下午04时06分