桌面搜索工具 DocFetcher 试用笔记(补 20110416)

最初发布在 https://code.google.com/p/thinkbasenet/wiki/20110416_DocFetcherTrialRun ;

简介

在 Ubuntu 上一直使用 Beagle Search( http://beagle-project.org/ )来对一些有用的文档进行全文检索, 今天想起这件事, 上网找了一圈, 发现 DocFetcher( http://sourceforge.net/projects/docfetcher/ ) 也是不错的一个桌面搜索工具.

在 sf.net 网站可以下载到的 DocFetcher 最新版本是 1.0.3 (2010-03-18 更新), 提供了 Win32 安装程序、Linux deb 包, 以及一个可用于 Windows 及 Linux 环境的 "portable" 版本, 解压后即可使用, 运行时产生的配置及索引数据都存放在程序目录下, 方便存放到 U 盘等移动设备上使用 :)

主要特色

  • 基于 Java SWT 开发, 跨平台;
  • 支持 txt、html、MS Office、Open Office、PDF等常用的文件格式, 基本上够用了;
  • 界面比较简单, 但是使用很方便, 基本上只要两步:
    1. 添加要索引的目录, 建立索引;
    2. 输出要查询的字符串, 进行查找;
  • 中文支持不错;

需要解决的问题

  • 最主要的缺点(我认为)是不能检索压缩包, 这样对那些压缩打包后的文档就比较难搜索了;
  • 不支持对文件名进行查找;
  • 对 UTF-8 格式的文本文件, 似乎只能认识英文;

中文化

  • 这个版本的 lang 目录下有 fr、de 等几种语言的资源文件(.properties), 但是没有中文语言的资源文件, 不过很容易通过对 Resource.properties文件翻译产生中文语言包.
  • 今天大致翻译了一下, 如果需要有这个中文语言包的话, 可以在这里下载;

后记

  • 20110416
    • Puggle( http://puggle.sourceforge.net/index.html )也是一个简单易用的 Java 桌面搜索工具, 而且支持 zip 和 rar 格式文档的搜索, 以及针对文件名字的查找(不过, 似乎不支持扩展名 :$).
  • 20121203
    • 发现目前 DocFetcher 已经升级到 1.1.5 版本了, 已经支持对 zip、7z、rar 等格式的压缩文件进行索引, 具体情况有待试验:

      Between version 1.0.3 and version 1.1 beta 1, DocFetcher was rewritten from scratch, resulting in a large number of new features and changes. This page gives an overview of the most important ones.

END

Attachments (1)

  • DocFetcher_10.03_lang_Resource_zh_CN.properties.7z (6.4 KB) - added by thinkbase 5 years ago. DocFetcher 1.0.3 的中文资源文件, 复制到 DocFetcher 安装目录的下的 lang 子目录即可起作用; 注意其中的 Resource_zh_CN.properties.txt 是中文源文件, 执行 native2ascii Resource_zh_CN.properties.txt > Resource_zh_CN.properties 可产生实际起作用的资源文件 Resource_zh_CN.properties.

Download all attachments as: .zip

Comments

1. thinkbase -- 2012-12-09 22:19

通过基于 truezip 和 7-zip 的支持, 最新版本的 DocFetcher-1.1.5 已经支持对压缩文件中内容进行索引, truezip 内置对 jar|tar|tar.bz2|tar.gz|tb2|tbz|tgz|zip 多种压缩文件格式的支持, 7-zip 用于支持 .7z.rar 格式的压缩文件;