Re: [請益] 如何快速學習一個framework

看板Soft_Job (軟體人)作者 (Achilles)時間12年前 (2013/07/29 02:16), 編輯推噓6(608)
留言14則, 5人參與, 最新討論串14/16 (看更多)
※ 引述《hidog (.....)》之銘言: : ※ 引述《Leon (Achilles)》之銘言: : : 這叫 skew detection.. : : 用橢圓不太對, 應該用兩條 line 去 bound 住一行文字. : : 我查了一下, 網路上能夠 download 的文章 : : http://cdn.intechopen.com/pdfs/11405/ : : InTech-Preprocessing_techniques_in_character_recognition.pdf : 專業術語我沒辦法像原po一樣的水平 : 這邊大概講一下我當時的做法 你應該去修課, ( open class 應該有 image processing ) 或是把上面那篇好好讀一讀, 學習整個 image pre-processing for OCR. : 第一步是做二值化, : threshold的取法是先找中位數, : 接下來利用低於中位數的值去計算平均值,標準差 : 偶後利用這個平均值標準差產生threshold : 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法 這樣做會有嚴重的問題. shot noise, 或是打光不均勻, 你會得到一個很差的 binary image 而且救不回來. 一般的作法是先用 histrogram normalization, 解決亮度不均勻. 再用 filter 幹掉 shot noise. 當然, 所有的作法都是 heuristic, 但是直接 make it into binary 除非你有特殊的要求, 不然問題很多. : 第二步是直接投影到 x, y軸去,利用histogram去找bound box : 找出bound box後,就直接resize到22*32 : 這邊大概會有兩個問題, 一個是字體斷掉 : 另一個是會有雜點跟污損,而這邊的做法大概是 : 因為圖片只有 22*32, 所以以上問題直接針對case來做調整 : 副產品是因為 I 的字體寬度小於5pixel,直接解決1, I不分的問題 : 以演算法部分,其實算不上是演算法 : 但是以結果論,在deadline前面趕出一個可以用的版本 : (記得給我兩天還三天吧,辨識錯誤率達到要求) 上面聽起來真是混亂. 我的 comment 是, 你第一步做得不好, 後面應該就.. : 另一個問題,是要在圖片上面找出方形 : █ █ : ▇ ▇ : 要求的做法是使用edge base的做法, 當時要求利用hough line來做 : 而我手上的hough line版本,能抓到的是直線而非線段 : 雖然找出直線後,可以搜尋出方形 : 但是直線延伸處,也會交出方形 : 這時候很難判斷這個方形到底是真的有方形,還是假的方形 : 特別是真的方形上面又疊了一個假的方形. : 這邊我最後是選擇直接回到原圖比對,勉強可以有結果, : 但是這樣的做法沒辦法被接受 : 自己希望加入region base的做法,但是直接被打槍 XD : 用線段的方式則會卡在方形有缺損,這時候找出來的線段很容易斷掉. : 其他雜項的話,圖片上可能會有其他線條,要能夠避免這些線條被當成方形 : 這個問題我目前正在搜尋,看有沒有比較好的解答 : 實際上這種問題應該已經有很多別人做出來的結果才對 : 也希望能有板友願意給小弟一些方向的參考 <(_ _)> : 討論方向可能有點偏離soft_job的主軸 : 假如版主認為討論這樣的問題不妥,就請將我的文章刪除吧 :) 用 hough transform 是對的, 因為圖片 (鈔票) 很固定 你可以加入一些條件去限制住 bounding box 的範圍. 我知道的都是一些很 advanced 的作法, computational power 要求都很高. 舉個例子來說吧, 更難的人臉範圍 bounding 在 Iphone 上都做得那麼好了 你的問題, 也絕對有人已經處理過了. So, keep google.. -- 趙客縵胡纓,吾鉤霜雪明。銀鞍照白馬,颯沓如流星。 十步殺一人,千里不留行。是了拂衣去,深藏身與名。 閑過信陵飲,脫劍膝前橫。將炙啖朱亥,持觴勸侯贏。 三杯吐然諾,五嶽倒為輕。眼花耳熱後,意氣素霓生。 就趙揮金錘,邯鄲先震驚。千秋二壯士,烜赫大梁城。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 76.170.77.110

07/29 03:29, , 1F
原原PO是我學長,他是數學系轉行的 影像處理可能沒碰過
07/29 03:29, 1F

07/29 07:09, , 2F
說到這個 當時禁止我用filter處理noise問題 XD
07/29 07:09, 2F

07/29 07:12, , 3F
再來就是 第二個問題 對像並不是鈔票
07/29 07:12, 3F

07/29 07:14, , 4F
圖片基本上是隨機 也會出現方形顏色跟底色很接近的case
07/29 07:14, 4F

07/29 07:15, , 5F
至於google 最後一天還被說是不是要拔你網路線才能專心 QQ
07/29 07:15, 5F

07/29 07:26, , 6F
這部分目前還是回到google 以及openCV 因為網路上也有找到
07/29 07:26, 6F

07/29 07:26, , 7F
別人做好的code XD
07/29 07:26, 7F

07/29 07:27, , 8F
所以其實還是回到第一句話 最近打算去大學旁聽 建立觀念
07/29 07:27, 8F

07/29 07:29, , 9F
工作部分則是找part time性質的 充實自己中
07/29 07:29, 9F

07/29 07:33, , 10F
不過還是感謝原po 因為原po蠻專業的!!
07/29 07:33, 10F

07/29 09:11, , 11F
我記得直方圖等化是很前面的章節耶
07/29 09:11, 11F

07/29 09:14, , 12F
我其實沒修過相關課程 (汗)
07/29 09:14, 12F

07/29 19:36, , 13F
去借一本頁數最少的影像處理書翻一下就好
07/29 19:36, 13F

07/29 22:42, , 14F
最後一天還專心啥啊?o.O 這主管是怎樣..
07/29 22:42, 14F
文章代碼(AID): #1HzM0Efg (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1HzM0Efg (Soft_Job)