DocFetcher是一款非常好用的文檔文本檢索軟件,它采用Java語言開發,可以幫助用戶高效搜索電腦上的各種文檔內容,非常適合用來查找代碼或文獻資料。DocFetcher操作很簡單,支持眾多常見的文檔格式,有需要的用戶快來下載吧。

Unicode支持:DocFetcher隨附所有主要格式的堅如磐石的Unicode支持,包括Microsoft Office,OpenOffice.org,PDF,HTML,RTF和純文本文件。
存檔支持:DocFetcher支持以下存檔格式:zip,7z,rar和整個tar。*系列。可以定制zip存檔的文件擴展名,從而允許您根據需要添加更多基于zip的存檔格式。此外,DocFetcher可以處理無限的檔案嵌套(例如,包含7z檔案的zip檔案和rar檔案的zip等等)。
搜索源代碼文件:可以自定義DocFetcher識別純文本文件的文件擴展名,因此您可以使用DocFetcher來搜索任何類型的源代碼和其他基于文本的文件格式。(與可自定義的zip擴展結合使用時,效果很好,例如,在Jar文件中搜索Java源代碼。)
Outlook PST文件:DocFetcher允許搜索Outlook電子郵件,Microsoft Outlook通常將其存儲在PST文件中。
檢測HTML對:默認情況下,DocFetcher檢測HTML文件對(例如,名為“ foo.html”的文件和名為“ foo_files”的文件夾),并將該對視為單個文檔。起初,此功能似乎沒有什么用,但是事實證明,當您處理HTML文件時,這會大大提高搜索結果的質量,因為HTML文件夾中的所有“雜物”都會從結果中消失。
基于正則表達式的文件從索引中排除:您可以使用正則表達式從索引中排除某些文件。例如,要排除Microsoft Excel文件,可以使用如下正則表達式:.*\.xls
MIME類型檢測:您可以使用正則表達式為某些文件打開“ MIME類型檢測”,這意味著DocFetcher不僅會通過查看文件名,還可以通過窺視文件內容來嘗試檢測其實際文件類型。 。這對于文件擴展名錯誤的文件非常有用。
強大的查詢語法:除了OR,AND和NOTDocFetcher之類的基本結構之外,DocFetcher還支持:通配符,詞組搜索,模糊搜索(“找到與...相似的單詞”),鄰近搜索(“這兩個單詞應為最多相距10個字”),增強(“增加包含...的文檔的分數”)
Microsoft Office(doc,xls,ppt)
Microsoft Office 2007和更高版本(docx,xl??sx,pptx,docm,xlsm,pptm)
Microsoft Outlook(PST)
OpenOffice.org(odt,ods,odg,odp,ott,ots,otg,otp)
便攜式文件格式(pdf)
EPUB(epub)
HTML(html,xhtml,...)
TXT和其他純文本格式(可定制)
富文本格式(rtf)
AbiWord(abw,abw.gz,zabw)
Microsoft編譯的HTML幫助(chm)
MP3元數據(mp3)
FLAC元數據(flac)
JPEG Exif元數據(jpg,jpeg)
Microsoft Visio(vsd)
可縮放矢量圖形(SVG)
下面的屏幕快照顯示了主用戶界面。在(1)的文本字段中輸入查詢。搜索結果顯示在結果窗格的(2)中。(3)處的預覽窗格顯示了當前在結果窗格中選擇的文件的純文本預覽。文件中的所有匹配項均以黃色突出顯示。
您可以按最小和/或最大文件大小(4),文件類型(5)和位置(6)過濾結果。(7)處的按鈕分別用于打開手冊,打開首選項和將程序最小化到系統托盤中。

DocFetcher要求您為要搜索的文件夾創建所謂的索引。簡而言之,索引使DocFetcher可以非常快速地(以毫秒為單位)找出哪些文件包含一組特定的單詞,從而大大加快了搜索速度。以下屏幕截圖顯示了DocFetcher的用于創建新索引的對話框:

單擊該對話框右下角的“運行”按鈕,開始編制索引。索引過程可能需要一段時間,具體取決于要建立索引的文件的數量和大小。一個好的經驗法則是每分鐘200個文件。
雖然創建索引需要時間,但每個文件夾只需要執行一次。此外,在文件夾內容更改后更新索引比創建索引要快得多-通常只需要幾秒鐘。