自動化處理大量 Word 檔案之字數統計
大家都知道,Microsoft Word 有個字數統計的功能,而這個功能對眾多青年學子而言非常重要,因為在寫作業或者是報告的時候,字數統計可以讓學生判斷到底還需不需要繼續鬼扯下去……不過今天 DR 並不打算分享鬼扯的奧義,而是要談談最近 DR 所碰到的問題(之一),以及解決的過程。
這個問題簡而言之便是要統計很多個 Word 檔案(*.doc、*.docx)加起來的總字數,如果檔案很少是可以一個個開來看,但如果有很多個檔案,弄到死人事小,耗費精力延誤時程事大,於是 DR 就著手研究怎麼樣才可以一次性的把所有檔案的字數統計抓出來。一開始 DR 嘗試使用 Microsoft 官方所提供的 Dsofile.dll,這個元件可以在不需安裝 Microsoft Office 的情況下讀取、編輯 Office 檔案的屬性資料,所以就參考官方的範例,利用 Dsofile.dll 寫了一支 VB .NET 程式,以下程式碼非常直覺,懂 VB 的人都看得懂: