Re: [請益] 如何快速學習一個framework
※ 引述《hidog (.....)》之銘言:
: ※ 引述《Leon (Achilles)》之銘言:
: : 這叫 skew detection..
: : 用橢圓不太對, 應該用兩條 line 去 bound 住一行文字.
: : 我查了一下, 網路上能夠 download 的文章
: : http://cdn.intechopen.com/pdfs/11405/
: : InTech-Preprocessing_techniques_in_character_recognition.pdf
: 專業術語我沒辦法像原po一樣的水平
: 這邊大概講一下我當時的做法
你應該去修課, ( open class 應該有 image processing )
或是把上面那篇好好讀一讀, 學習整個 image pre-processing for OCR.
: 第一步是做二值化,
: threshold的取法是先找中位數,
: 接下來利用低於中位數的值去計算平均值,標準差
: 偶後利用這個平均值標準差產生threshold
: 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法
這樣做會有嚴重的問題.
shot noise, 或是打光不均勻, 你會得到一個很差的 binary image
而且救不回來.
一般的作法是先用 histrogram normalization,
解決亮度不均勻.
再用 filter 幹掉 shot noise.
當然, 所有的作法都是 heuristic, 但是直接 make it into binary
除非你有特殊的要求, 不然問題很多.
: 第二步是直接投影到 x, y軸去,利用histogram去找bound box
: 找出bound box後,就直接resize到22*32
: 這邊大概會有兩個問題, 一個是字體斷掉
: 另一個是會有雜點跟污損,而這邊的做法大概是
: 因為圖片只有 22*32, 所以以上問題直接針對case來做調整
: 副產品是因為 I 的字體寬度小於5pixel,直接解決1, I不分的問題
: 以演算法部分,其實算不上是演算法
: 但是以結果論,在deadline前面趕出一個可以用的版本
: (記得給我兩天還三天吧,辨識錯誤率達到要求)
上面聽起來真是混亂.
我的 comment 是, 你第一步做得不好, 後面應該就..
: 另一個問題,是要在圖片上面找出方形
: █ █
: ▇ ▇
: 要求的做法是使用edge base的做法, 當時要求利用hough line來做
: 而我手上的hough line版本,能抓到的是直線而非線段
: 雖然找出直線後,可以搜尋出方形
: 但是直線延伸處,也會交出方形
: 這時候很難判斷這個方形到底是真的有方形,還是假的方形
: 特別是真的方形上面又疊了一個假的方形.
: 這邊我最後是選擇直接回到原圖比對,勉強可以有結果,
: 但是這樣的做法沒辦法被接受
: 自己希望加入region base的做法,但是直接被打槍 XD
: 用線段的方式則會卡在方形有缺損,這時候找出來的線段很容易斷掉.
: 其他雜項的話,圖片上可能會有其他線條,要能夠避免這些線條被當成方形
: 這個問題我目前正在搜尋,看有沒有比較好的解答
: 實際上這種問題應該已經有很多別人做出來的結果才對
: 也希望能有板友願意給小弟一些方向的參考 <(_ _)>
: 討論方向可能有點偏離soft_job的主軸
: 假如版主認為討論這樣的問題不妥,就請將我的文章刪除吧 :)
用 hough transform 是對的, 因為圖片 (鈔票) 很固定
你可以加入一些條件去限制住 bounding box 的範圍.
我知道的都是一些很 advanced 的作法, computational power 要求都很高.
舉個例子來說吧, 更難的人臉範圍 bounding 在 Iphone 上都做得那麼好了
你的問題, 也絕對有人已經處理過了.
So, keep google..
--
趙客縵胡纓,吾鉤霜雪明。銀鞍照白馬,颯沓如流星。
十步殺一人,千里不留行。是了拂衣去,深藏身與名。
閑過信陵飲,脫劍膝前橫。將炙啖朱亥,持觴勸侯贏。
三杯吐然諾,五嶽倒為輕。眼花耳熱後,意氣素霓生。
就趙揮金錘,邯鄲先震驚。千秋二壯士,烜赫大梁城。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 76.170.77.110
推
07/29 03:29, , 1F
07/29 03:29, 1F
推
07/29 07:09, , 2F
07/29 07:09, 2F
→
07/29 07:12, , 3F
07/29 07:12, 3F
→
07/29 07:14, , 4F
07/29 07:14, 4F
→
07/29 07:15, , 5F
07/29 07:15, 5F
→
07/29 07:26, , 6F
07/29 07:26, 6F
→
07/29 07:26, , 7F
07/29 07:26, 7F
→
07/29 07:27, , 8F
07/29 07:27, 8F
→
07/29 07:29, , 9F
07/29 07:29, 9F
推
07/29 07:33, , 10F
07/29 07:33, 10F
推
07/29 09:11, , 11F
07/29 09:11, 11F
推
07/29 09:14, , 12F
07/29 09:14, 12F
→
07/29 19:36, , 13F
07/29 19:36, 13F
推
07/29 22:42, , 14F
07/29 22:42, 14F
討論串 (同標題文章)
Soft_Job 近期熱門文章
35
114
PTT職涯區 即時熱門文章
194
337