产品信息
什么是 Docfetcher?
DocFetcher 是一个开源桌面搜索应用程序:它允许您搜索计算机上文件的内容。 — 您可以将其视为本地文件的 Google。该应用程序可以在 Windows、Linux 和 OS X 上运行,并根据 Eclipse 公共许可证提供。
显着特点:
便携式版本:DocFetcher 有一个可在 Windows、Linux 和 OS X 上运行的便携式版本。本页下面将更详细地介绍其用途。
64 位支持:同时支持 32 位和 64 位操作系统。
Unicode 支持:DocFetcher 为所有主要格式提供坚如磐石的 Unicode 支持,包括 Microsoft Office、OpenOffice.org、PDF、HTML、RTF 和纯文本文件。
存档支持:DocFetcher 支持以下存档格式:zip、7z、rar 和整个 tar.* 系列。 zip 存档的文件扩展名可以自定义,允许您根据需要添加更多基于 zip 的存档格式。此外,DocFetcher 可以处理无限嵌套的存档(例如,包含 7z 存档的 zip 存档包含 rar 存档......等等)。
在源代码文件中搜索:可以自定义DocFetcher 识别纯文本文件的文件扩展名,因此您可以使用DocFetcher 在任何类型的源代码和其他基于文本的文件格式中进行搜索。 (这与可自定义的 zip 扩展名结合使用效果非常好,例如用于在 Jar 文件内搜索 Java 源代码。)
Outlook PST 文件:DocFetcher 允许搜索 Outlook 电子邮件,Microsoft Outlook 通常将其存储在 PST 文件中。
HTML 对的检测:默认情况下,DocFetcher 检测 HTML 文件对(例如,名为“foo.html”的文件和名为“foo_files”的文件夹),并将该对视为单个文档。此功能乍一看似乎毫无用处,但事实证明,当您处理 HTML 文件时,这会显着提高搜索结果的质量,因为 HTML 文件夹内的所有“混乱”都会从结果中消失。
基于正则表达式从索引中排除文件:您可以使用正则表达式从索引中排除某些文件。例如,要排除 Microsoft Excel 文件,您可以使用如下正则表达式:.*.xls
Mime 类型检测:您可以使用正则表达式为某些文件打开“mime 类型检测”,这意味着DocFetcher 不仅会通过查看文件名,还会通过查看文件内容来尝试检测其实际文件类型。这对于文件扩展名错误的文件非常有用。
强大的查询语法:除了 OR、AND 和 NOT 等基本结构外,DocFetcher 还支持:通配符、短语搜索、模糊搜索(“查找与...相似的单词”)、邻近搜索(“这两个单词最多相距 10 个单词”)、boosting(“增加包含...的文档的分数”)
如何使用 Docfetcher?
DocFetcher是一款开源桌面搜索应用程序,它允许用户搜索计算机本地文件的内容,提供类似“本地文件版Google”的快速文件内容检索能力。
Docfetcher 的核心功能
文件内搜索
文件内容索引
索引搜索
文件搜索
内容搜索
全文搜索
Docfetcher 的使用场景
- 搜索计算机本地文件的内容。
- 在各种源代码文件和文本文件中进行搜索。
- 查找Outlook PST文件中的电子邮件。
- 处理HTML文件对,提高搜索结果质量。
- 在工作和家庭环境中追踪所需信息。
Docfetcher 的常见问题
DocFetcher做什么的?
我如何使用DocFetcher?
DocFetcher有哪些核心功能?
DocFetcher有哪些应用场景?




















