雖然 OCR (光學字符辨識) 不是甚麼新鮮事物。
不過通常都是需要付一大筆或者要有少許技術力才能使用,
今天我想向各位介紹番一個免費、準確度高、不需複雜設定以及能處理大量資料的 OCR 方案-
就是 Google Drive!
講多無謂,示範一次大家就會知道幾咁容易:
1. 首先用你喜歡的方法 scan 需要辨識的文本先 jpg, pdf 均可 (影印機或多合一印表機的掃描功能、甚麼好一點的智能手機也可以)
我就用 scanner 以黑白色 150dpi 掃描了書本的其中一頁 (後來我發現彩色文本也可以辨識到的)

2. 將這個 jpg 或 pdf 檔案拖到 Google Drive

3. 然後在該檔案上 Right Click > 選擇開啟方式 > Google 文件

4. 稍等一會,整板文字都被辨識了,這麼矇的掃描檔也有 95% 準確度,真是厲害!

5. 最來我用這個方法對一本 20 板的雜誌進行辨識,效果不錯呀!
不過通常都是需要付一大筆或者要有少許技術力才能使用,
今天我想向各位介紹番一個免費、準確度高、不需複雜設定以及能處理大量資料的 OCR 方案-
就是 Google Drive!
講多無謂,示範一次大家就會知道幾咁容易:
1. 首先用你喜歡的方法 scan 需要辨識的文本先 jpg, pdf 均可 (影印機或多合一印表機的掃描功能、甚麼好一點的智能手機也可以)
我就用 scanner 以黑白色 150dpi 掃描了書本的其中一頁 (後來我發現彩色文本也可以辨識到的)

2. 將這個 jpg 或 pdf 檔案拖到 Google Drive

3. 然後在該檔案上 Right Click > 選擇開啟方式 > Google 文件

4. 稍等一會,整板文字都被辨識了,這麼矇的掃描檔也有 95% 準確度,真是厲害!

5. 最來我用這個方法對一本 20 板的雜誌進行辨識,效果不錯呀!