Quantcast
Channel: ocr – Gea-Suan Lin's BLOG
Browsing all 8 articles
Browse latest View live

Image may be NSFW.
Clik here to view.

紐約公共圖書館提供的 Library:將地圖 OCR 成向量資料…

紐約公共圖書館 (NYPL) 丟出個有趣的東西:「Map polygon and feature extractor」,敘述的地方就有這樣的說明: Like OCR for maps 可以把這樣的地圖圖檔: 轉成: 這樣子… 也可以 GeoJSON 輸出 :p 這屬於 Open Data 的工作,紐約公共圖書館本身就是全世界第三大圖書館,美國第二大的圖書館...

View Article



Image may be NSFW.
Clik here to view.

圖片上的文字辨識:Project Naptha

把圖片上的文字辨識直接做成 Google Chrome 的延伸套件,預設就辨識好後讓你可以直接選取:「Project Naptha」。 這是官方提供的範例: 一張含有文字的圖片可以直接 OCR 出來變成文字選擇。 官方網站上有說,這是 client-side javascript: One of the more impressive things about this project is...

View Article

Image may be NSFW.
Clik here to view.

用 Tesseract OCR 解 CAPTCHA

在「python 乌云账号暴力猜解工具」這邊看到 Tesseract OCR 這個 command line 工具,比想像中的簡單很多… Tesseract OCR 最新版是 2012 年出的,所以也不需要另外用 ppa 安裝,在 Ubuntu 下可以直接用 apt-get 安裝到 3.02 版: # apt-get install tesseract-ocr 隨便抓張 CAPTCHA...

View Article

Image may be NSFW.
Clik here to view.

Google Cloud Vision API 開放讓大眾使用

兩個月前 Google 放出來的 Google Cloud Vision API (參考「Google Cloud Vision API」) 開放讓一般人使用了,當初沒決定的價錢也公告出來了。 可以看到分成「Optical Character Recognition (OCR)」、「Image Attributes, Landmark, Facial, Logo, or Explicit...

View Article

Image may be NSFW.
Clik here to view.

把嵌上去的字幕重新轉回文字

雖然這篇用的方法很簡單,但因為太符合本 blog 的副標,所以還是寫下來介紹:「Extracting Chinese Hard Subs from a Video, Part 1」。 作者想要把字幕拉出來,他直接把這張圖丟進 OCR,然後失敗 XDDD: 他決定拉出下半段: 再做 thresholding: 最後再 OCR 取得文字: ′…′二′′′'′ 怎么去逯么远的地方 '/′...

View Article


Image may be NSFW.
Clik here to view.

Python 上的 OCR

這個 OCR 專案是在 Python 包好,讓你很快就可以上手用:「Easy OCR」。 從結果的 screenshot 可以看到輸出的內容很簡單,就是座標與 OCR 出來的內容: 然後支援的語言很多: We are currently supporting following 42 languages. Afrikaans (af), Azerbaijani (az), Bosnian (bs),...

View Article

Image may be NSFW.
Clik here to view.

抓 PDF 裡文字的問題

在 Hacker News Daily 上看到的,在講從 PDF 裡面拉文字出來遇到的各種問題:「What's so hard about PDF text extraction?」。 FilingDB 是一家處理歐洲公司資料的公司,可能是開公司時送件的時候要求用 PDF,或是政府單位輸出的時候用 PDF,所以他們必須從這些 PDF 裡面拉出文字分析,然後就能夠讓程式使用: 會這麼難搞的原因是因為...

View Article

Image may be NSFW.
Clik here to view.

還原被碼掉的 PEM 資訊 (SSH RSA key)

在「Recovering a full PEM Private Key when half of it is redacted」這邊看到的,起因是 _SaxX_ 幫客戶做滲透測試時找到客戶公開在網路上的 SSH key,然後他就碼掉一部分貼出來: This morning, I began another #pentest for a client. After some google-fu...

View Article

Browsing all 8 articles
Browse latest View live




Latest Images