TW201413602A - 基於行動終端的標誌識別處理方法和系統 - Google Patents
基於行動終端的標誌識別處理方法和系統 Download PDFInfo
- Publication number
- TW201413602A TW201413602A TW101146907A TW101146907A TW201413602A TW 201413602 A TW201413602 A TW 201413602A TW 101146907 A TW101146907 A TW 101146907A TW 101146907 A TW101146907 A TW 101146907A TW 201413602 A TW201413602 A TW 201413602A
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- mark
- black
- special
- detecting
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/184—Extraction of features or characteristics of the image by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本方案涉及一種基於行動終端的標誌識別處理方法和系統。該方法包括:藉由行動終端獲得待處理圖像;在獲得的所述待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記則定位所述標誌;根據定位的所述標誌的位置,分割出標誌所在區域;識別分割出的所述標誌所在區域中的標誌的內容。該系統包括對應上述方法組成部分以及相應方法步驟的功能。本方案預設標記與表示目標物的標誌綁定,基於行動平臺在獲取的圖片或圖像上根據該預設的標記定位該標誌、並分割出標誌區域,再使用圖像處理方法識別出商品代碼或標誌,能夠簡單、快速、準確、有效地獲取標誌,實現在行動終端平臺上的廣告等圖像的標誌識別處理。
Description
本發明專利申請涉及行動終端的字元識別領域,尤其涉及一種基於行動終端的標誌識別處理方法和系統。
光學字元識別(OCR,Optical Character Recognition)技術是指電子設備(例如掃描器或數位相機)檢查紙上列印的字元,藉由檢測暗、亮的模式確定其形狀,然後用字元識別方法將其形狀翻譯成電腦文字的過程,即對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面資訊的過程。也就是藉由掃描和攝像等光學輸入方式獲取紙上的文字圖像資訊。其能利用各種模式識別演算法分析文字形態特徵,判斷出漢字的標準編碼,並按照通用格式儲存在文字檔案中:藉由掃描器輸入後,將文稿形成圖像文件,做圖像處理;接著先對版面劃分(如進行版面分析:版面理解、字切分、歸一化等)以便分開不同部分進行分別按次序處理;再對文字閱讀(如圖形文字“漢字”),逐一辨認,單字識別,再歸一化;對OCR識別後的文字編輯修改。
一個OCR識別系統,其目的是要把影像或圖像做一個轉換,使影像內的圖形繼續保存、有表格則報個內資料及影像內的文字,一律變成電腦文字,使得影像資料儲存量減少、降低儲存空間或者對識別的文字可以再使用、分
析等,同時節省人力輸入和輸入時間。
從影像到結果輸出,通常必須經過影像輸入(影像轉入101、影像前處理103、文字特徵抽取105)、比對識別107、校正和結果輸出109等步驟,參見圖1。
影像轉入101:需要OCR處理的標的物,藉由光學儀器如影像掃描器、傳真機或任何攝影材料,把影像轉入電腦。隨著科技進步,掃描器、攝像頭等輸入裝置製作越來越精致、輕薄短小、品質高,便於置入,高解析度也使得影像更清晰,速度提高促進OCR處理效率提高。
影像前處理103:是OCR系統中,必須解決問題最多的一個模組,從得到一個非黑即白的二值化映射,或灰階、彩色的原始影像,到獨立出一個個文字影像的過程。影像前處理103包含:影像正規化、去除雜訊、影像矯正等影像處理,及圖文分析、文字行與字分離的文件前處理。由於影像處理已經是成熟的技術,但在影像的文件前處理方面,各類方式各有千秋,通常影像要先將圖片、表格、文字區域分離出來,甚至可將文章編排方向、文章提綱及內容主體分開,而文字大小及文字字體也如原始文件一樣判斷出來。
文字特徵抽取105:單以識別率而言,特徵抽取是OCR的核心,用什麽特徵、怎麽抽取直接影響識別的好壞,“特徵”也就是識別的籌碼。文字特徵抽取105,簡易的區分可分為兩類:(1)一類為統計的特徵,如文字區域內的黑/白點數比,當文字區分成好幾個區域時,這一個個
區域黑/白點數比之聯合,成為空間的一個數值向量,在比對時,基本數學理論就足以應對;(2)另一類特徵為結構的特徵,如文字影像細線化後,取得字的芼划端點、交叉點之數量及位置,或以芼划段為特徵,配合特殊的比對方法,進行比對。
當輸入文字計算完特徵之後,不論是用統計或結構的特徵,都要有一比對資料庫或特徵資料庫來進行對比,資料庫的內容應當包含所有欲識別的字集文字,根據與輸入文字一樣的特徵抽取方法所得到的特徵群組。
比對(對比)識別107:基於比對比對資料庫,將輸入文字的特徵與比對資料庫中的特徵,藉由數學方式,進行比對識別。比對識別可充分發揮數學運算理論,其能根據不同的特徵特性,選用不同的數學距離函數。比較有名的比對方法如:歐式空間的比對方法、鬆弛比對法(Relaxation)、動態程式比對法(Dynamic Programming,DP)、類似神經網路的資料庫建立和對比、HMM(Hidden Markov Model)等。並且為了使得識別結果更穩定,也有所謂的專家系統(Experts System)被提出,利用各種特徵比對方法的相異互補性,使得識別出的結果信心度特別高。
購買商品時商品上的條碼肉眼無法識別,只有專用讀取設備能識別。還有一類情形是,人們通常用一個數位或者文字編碼對商品等目標物進行索引並形成目錄、序列、編碼/編號/代號等標誌,如商品有商品代碼(或稱為商品
編碼、商品編號等),由數位、文字、圖像(如商家LOGO)等編碼形成的該商品代碼以代表某個商品。常見的網路或手機廣告中展示的商品圖像,在該商品圖像的周圍/附近、或者在該商品圖像的內部,拍攝或要發送的正銷售的實體商品上都可能會出現商品代碼。目前的技術還不能直接識別這些數位、漢字(文字)、圖像等表示的商品代碼,而隨著網際網路行動技術的發展,對利用手機等行動終端(設備)等行動平臺來獲取和識別商品代碼也提出了需求。通常,對掃描或攝像的這類廣告資訊(如背景複雜的商品圖像),可以利用現有的OCR技術加以識別或獲取。但現有的OCR技術中,已有的影像前處理103過程,一般採用版面分析的方法區分圖像中的圖像部分和文字部分。該方法適用於有一定結構資訊的文字版面。但諸如上述廣告裏出現在商品圖像附近或者在商品圖像內部的商品代碼的這些情況,圖像一般比較複雜,較難使用傳統的版面分析的方法提取出字元區域。
因而,對商品圖片,尤其是在行動平臺上對顯示的廣告商品圖像的商品代碼或標誌(即複雜圖像中目標物的標誌)進行識別或獲取,存在困難。
針對上述現有技術的缺陷,本發明的技術方案要解決的技術問題是提供一種基於行動終端的標誌識別處理方法和系統,預設標記與表示目標物的標誌綁定,基於行動平
臺藉由圖像識別的方法處理攝像機獲取的商品圖片/圖像,先在攝像機獲取的圖片或圖像上根據該預設的標記定位該標誌、並分割出標誌(商品代碼)的區域,再使用圖像處理方法識別出商品代碼或標誌。
本發明的技術方案,能夠實現在一幅複雜背景的圖片中,使用一個標記來定位文字或數位部分,並將其應用到商品等目標物的檢索。
本發明提供的一種基於行動終端的標誌識別處理方法,包括:藉由行動終端獲得待處理圖像;當獲取待處理圖像後,在所述待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記,則定位所述標誌;根據定位的所述標誌的位置,分割出標誌所在區域;識別分割出的所述標誌所在區域中的標誌的內容。
對應本發明的方法的一種基於行動終端的標誌識別處理系統,包括:圖像獲取模組,用於藉由行動終端獲取待處理圖像;特殊標記匹配模組,用於在獲取的待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,以定位所述標誌:當獲取待處理圖像後,在待處理圖像中檢測所述特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記,則定位所述標誌;標誌定位模組,用於根據定位的所述標誌的位置,分割出標誌所在區域;字元識別模組,識別分割出的所述標誌所在區域中的標誌的內容。
本發明的方案中,其利用特殊符號或稱特殊標記,對
數位或文字型目標物的標誌如商品的商品代碼進行標記以定位,再使用圖像處理方法來識別標誌,能夠簡單、快速、準確、有效地獲取標誌,實現在行動終端平臺上的廣告等圖像的標誌識別處理。
下面將結合本發明實施例中的圖式,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本發明具體實施方式以商品作為目標物為例。在獲取的圖像位於商品代碼前加入一個特殊符號來幫助定位,即藉由特殊符號(如特定設計的一種標記、記號)對數位或文字型商品代碼(即標誌)進行標記以便進行定位,藉由圖像識別方法處理攝像機獲取的圖片或圖像。在圖像處理環節,首先經邊緣檢測、直線擬合及模板匹配等方式以獲得商品代碼的位置和尺寸;然後使用光學字元識別出商品代碼。
本發明的該具體實施方式的標誌識別處理系統,如圖2所示,以商品為目標物。由圖像獲取模組201、圖像的特殊標記匹配模組203、標誌定位模組205、圖像的字元識別模組207。
圖像獲取模組201,基於行動設備(終端)或其他行動平臺,用掃描、拍攝/攝像、下載等方式獲得商品的圖像(即準備處理的圖片),如用手機的攝像機獲取諸如商品圖片,或攝取/下載廣告中的諸如商品圖片等即包含目標物圖像的原圖。所述行動終端是利用掃描器、攝像機或網路下載,獲取待處理圖像;獲取的待處理圖像可以是諸如商品圖片即包含目標物圖像的原圖。所述標誌是目標物的標誌如所述商品圖片的附近或內部的商品代碼。商品代碼是數字型或文字型的字元、或圖像型等。
圖像的特殊標記匹配模組203,在獲取的圖片中,匹配特殊標記。特殊標記是與目標物的標誌如商品代碼綁定的,預先設置好的,在商品代碼(標誌)設計的時候先定義好(之後可以一起印刷等)。對原圖直接檢測特殊標記,從而利用特殊標記在複雜背景的圖像(圖片)中定位(檢測)要識別的商品圖像(圖片)上的商品代碼。如圖4所示的編碼示例“1234567”數字型標誌,檢測到該特殊標記則能確定此處有商品代碼。二者有固定的關係,如:只要是標誌,其旁邊、其前或其某個確定的位置處就設計有該特殊標記。
事先設計有帶黑框的特殊標記(圖4、圖5),作為定位商品代碼(目標物的標誌)的特殊標記。該黑框內也會包括字元、文字、圖像(如某商家logo)等。用於定位標誌的特殊標記可以定義為黑框結合內容(如黑框+內部圖片)的形式(內部圖片如各種字元或圖形圖像符號)。
該特殊標記可以根據但不限於商品圖像附近或圖像內的商品代碼(如:數字型代碼、文字型代碼、圖像型代碼(如商家LOGO)等標誌)的字元、文字或圖像的結構和/或特徵(如:長度、寬度、大小、尺寸、方向、位置、色彩、灰度、亮度、等等)來預先設計。例如圖4中的根據需要設置有“t”符號在內的黑框這種圖形符號,“t”字也可以設計以適應外觀的要求。
該特殊標記還可以利用圖像處理演算法中,會對圖像中的像素逐行掃描的原理,設計樣式固定的有規則的像素的兩組黑白比例關係的區域作為的特殊標記圖樣。這樣,經逐行掃描發現存在按黑白比的規則設定的至少一行像素的圖像特徵區域,在待處理圖像中檢測所述特殊標記包括直接檢測符合上述黑白比的圖像特徵區域。
按黑白比的規則設定的至少一行像素的圖像特徵區域,通常,可以設定兩行或兩行以上的像素,黑白比分別為1:1:3:1:1和1:2:1:2:1。比如:(1)相鄰或非相鄰兩行像素,每行像素的連續或非連續像素出現了黑白比,一行為1:1:3:1:1、一行為1:2:1:2:1;相鄰或非相鄰的多行(兩行以上)等,有幾行的連續或非連續的像素出現的黑白比為1:1:3:1:1、另外有幾行連續或非連續的像素出現的黑白比為1:2:1:2:1。也就是說,該黑白比的圖像特徵區域設定:可以是一行、相鄰或非相鄰的兩行、或者,相鄰或非相鄰的多行(兩行以上)等情況;可能有多行符合1:1:3:1:1、然後又有多行符合1:2:1:2:1;另外,黑白比規
則的像素,也不一定是該行像素中的連續像素,只要接連有幾個像素的黑白比例符合這種定義就可以(只要連續像素的黑白比例符合這種定義即可)。比如說,有五個像素黑,五個像素白,然後十五個像素黑,五個像素白,五個像素黑(這個可以隨著標記大小的變化而變化),也是符合1:1:3:1:1的比例的。而圖像特徵區域就可以設計為有該像素黑白比規則的黑框結合內部內容的形式(也隨需要標記的大小變化)。
例如圖5中的示意的黑框+“T”兩組黑白比區域圖樣,是有兩行像素的黑白比固定其圖樣設計規則為,一行有黑白比1:1:3:1:1(即該行像素會有:1個黑像素、1個白像素、3個黑像素、1個白像素、1個黑像素)的像素情況,另一行(圖5所示下方一行)有黑白比1:2:1:2:1(即該行像素出現:1個黑像素、2個白像素、1個黑像素、2個白像素、1個黑像素)的像素情況。在圖像處理時,只要掃描圖像時發現有兩行像素所在區域有這樣兩組黑白比的情況存在,就可以確定此處區域為特殊標記。特殊標記的圖樣根據該比例設計,不限於圖5所示圖樣,只是必須滿足上述兩行像素中的兩組黑白比例規則。
圖4給出了一種檢測(匹配和定位)方式:在匹配特殊標記前,預設黑框及其內部內容(內部內容是根據情況或需求可設計的,如“t”字元)作為特殊標記;先檢測屬於特殊標記的黑框是否存在,如果存
在,然後匹配黑框中的內容,如“t”符,由此確定特殊標記在此。由於標記和標誌綁定,有該特殊標記就有相應的目標物的標誌(商品代碼),因而此處是商品代碼所在區域,由此實現定位目標物的標誌(如該商品代碼)。如果不存在黑框或內容不匹配可以表示原圖上沒有目標物的標誌。
圖5給出了一種檢測(匹配和定位)速度和運算速度更快捷、更準確的特殊標記檢測方式:在匹配特殊標記之前,預設至少一行、兩行或多行像素的兩組黑白比(如上所述數位比例)規則的圖樣,表示按照該規則設計的圖或滿足該規則的區域為特殊標記,後面以兩行像素為例進行說明;在原圖中尋找(圖像處理演算法中逐行掃描像素),發現符合預設的固定樣式規則的兩行像素的兩組黑白比例區域。如直接在圖片中尋找兩行像素的黑白比符合1:1:3:1:1(上行像素黑白比)以及1:2:1:2:1(下行像素黑白比)的圖像特徵區域。從而利用直接在圖像上檢測具有所述數位比例的圖像特徵區域,找到所述圖像特徵區域即實現了特殊標記的匹配,檢測到該特殊標記則能夠定位所述標誌在哪個位置。
圖5的方式無需尋找黑框等圖形圖像,只需要在通常的圖像處理掃描過程中尋找符合規定的像素黑白比例定義的圖樣,就能確定由該比例定義的特殊標記,因而該方式檢測速度能更快、檢測結果更準確,實現起來更簡單,稱
快速定位法。
在該圖像的特殊標記匹配模組203中,基於所述特殊標記,其檢測、匹配和定位的演算法,可以採用邊緣檢測、直線擬合以及模板匹配演算法,以確定目標物的標誌(商品代碼)的位置和尺寸。
標誌定位模組205,能根據定位的標誌位置和尺寸切割(分割)標誌即商品代碼的區域。分出商品代碼區域的圖像,並能傳送給字元識別模組207
圖像的字元識別模組207,接收來自標誌定位模組205的分出區域,對分出的區域進行識別,如識別出商品代碼的數位“1234567”等。這裏可以使用OCR光學字元識別演算法,使用OCR識別分割出的區域中的標誌的內容,包括識別出數字型、文字型字元,或圖像型符號等。
下面將根據圖3,以商品的商品代碼為例,對本發明的標誌識別處理系統的流程,即標誌識別處理方法,進行描述,方法的步驟中,不再對系統的模組功能重復描述。
圖像獲取步驟301,藉由手機等行動設備獲得要處理的圖像/圖片。所述行動終端是利用掃描器、攝像機或網路下載,獲取待處理圖像;獲取的待處理圖像是商品圖片;所述標誌是所述商品圖片的附近或內部的商品編碼。商品編碼是數字型或文字型的字元。具體參見模組201的描述。
在特殊標記設置步驟303,預先構造用於在上述獲取的、具有複雜背景的圖片中使用的特殊標記,綁定商品代
碼。特殊標記可以是圖形符號(如圖4所示黑框和其內部),或者是黑白比規則固定樣式的至少一行、兩行或多行像素的圖像特徵區域(如圖5所示按兩組黑白比規則1:1:3:1:1以及1:2:1:2:1設計的黑框圖區域)。具體參見模組203的描述的標記設計方式(圖4、圖5)。
在特殊的標記檢測和匹配步驟305,藉由對特殊標記進行檢測(定位和匹配),如對圖上的圖形符號邊框檢測(黑框),然後匹配黑框中的“t”字(圖4所述方式);或者直接在圖片上找符合預設比例的圖像特徵區域(如圖5所述方式)。
方式一:當採用圖形符號形式的特殊標記時,特殊標記是帶黑框及其內有字元的圖形符號;檢測黑框並匹配其框內的內容,確定檢測到特殊標記;由於特殊標記與所述待處理圖像的(目標物)標誌如商品代碼綁定,則找到特殊標記就能定位到該商品代碼(標誌)。
方式二,又稱快速定位法:當特殊標記特殊標記採用上述特定的數位比設計時,直接在圖像上檢測(逐行掃描像素時尋找)具有所述數位比的圖像特徵區域,找到所述圖像特徵區域即實現了所述標誌與特殊標記的匹配,並定位所述標誌。
具體參見模組203的兩種檢測(匹配和定位)方式的描述。
上述步驟305基於所述特殊標記的檢測、匹配和定位,是根據邊緣檢測、直線擬合以及模板匹配演算法來確
定標誌的位置和尺寸。
標誌定位步驟307,根據步驟305所定位的標誌(如商品代碼)的位置,切割商品代碼的所在區域。
處理步驟309,實現圖像的字元識別和後續處理。根據步驟307獲得的商品代碼區域的圖像(對分出的區域)進行識別,如識別出商品代碼的數位等。這裏可以使用OCR光學字元識別演算法,使用OCR識別分割出的區域中的標誌的內容包括識別出數字型、文字型字元,或圖像型符號等。
判定全部完成步驟311,判斷獲取的、要識別的圖像已經全部完成,不再識別後面的其他圖像或圖片等,則結束該流程,否則返回開始繼續進行識別。
本發明的系統及其方法藉由特定的標記符號來確定複雜圖像中的特定區域,提供了一種快速簡易有效準確的圖像內容以識別技術。
本說明書中的各個實施例一般採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
本發明可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組或單元。一般地,程式模組或單元可以包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。一般來說,程式模組或單元可以由軟體、硬體或兩者的結合來實現。也可以在分散式計算環境中實踐本發明,在這些分散式計算環
境中,由藉由通信網路而被連接的遠端處理設備來執行任務。在分散式計算環境中,程式模組或單元可以位於包括儲存設備在內的本地和遠端電腦儲存介質中。
最後,還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其主要思想;同時,對於本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
201‧‧‧圖像獲取模組
203‧‧‧特殊標記匹配模組
205‧‧‧標誌定位模組
207‧‧‧字元識別模組
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些圖式獲得其他的圖式。
圖1為OCR系統的處理方塊圖。
圖2為本發明具體實施方式的標誌識別處理系統結構圖。
圖3為本發明具體實施方式的標誌識別處理流程圖。
圖4為本發明具體實施方式的一種利用標記檢測商品數位標誌的直觀圖。
圖5為本發明具體實施方式的另一種利用標記檢測商品數位標誌的直觀圖。
201‧‧‧圖像獲取模組
203‧‧‧特殊標記匹配模組
205‧‧‧標誌定位模組
207‧‧‧字元識別模組
Claims (14)
- 一種基於行動終端的標誌識別處理系統,其特徵在於,包括:圖像獲取模組,用於藉由行動終端獲取待處理圖像;特殊標記匹配模組,用於在獲取的待處理圖像中檢測預設於該標誌的固定位置的特殊標記,以定位該標誌:當獲取待處理圖像後,在該待處理圖像中檢測該特殊標記,若匹配上該特殊標記表明檢測到該特殊標記,則定位該標誌;標誌定位模組,用於根據定位的該標誌的位置,分割出標誌所在區域;字元識別模組,識別分割出的該標誌所在區域中的標誌的內容。
- 如申請專利範圍第1項的系統,其中,該特殊標記定義為黑框結合內部圖片,內部圖片在檢測該特殊標記時用於該匹配;在待處理圖像中檢測該特殊標記包括:先檢測到該黑框,再匹配該內部圖片,如果內部圖片匹配上則表明匹配上該特殊標記。
- 如申請專利範圍第1項的系統,其中,該特殊標記包括:經逐行掃描發現存在按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域;在待處理圖像中檢測該特殊標記包括:直接檢測符合上述黑白比的圖像特徵區域。
- 如申請專利範圍第3項的系統,其中,該按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域還包括:其中,設定兩行或多行像素,出現像素的黑白比規則分別為1:1:3:1:1和1:2:1:2:1;圖像特徵區域設計為黑框結合內部內容。
- 如申請專利範圍第2或3項的系統,其中,該標誌的固定位置包括:在該標誌前或在該標誌後。
- 如申請專利範圍第1項的系統,其中,獲取的待處理圖像是商品圖片;該標誌是該商品圖片的附近或內部的商品代碼;商品代碼包括字元或數位字元,和/或圖像。
- 如申請專利範圍第1項的系統,其中,字元識別模組還包括:使用OCR識別分割出的區域中的標誌的內容。
- 一種基於行動終端的標誌識別處理方法,其特徵在於,包括:藉由行動終端獲得待處理圖像;當獲取待處理圖像後,在該待處理圖像中檢測預設於該標誌的固定位置的特殊標記,若匹配上該特殊標記表明檢測到該特殊標記,則定位該標誌;根據定位的該標誌的位置,分割出標誌所在區域;識別分割出的該標誌所在區域中的標誌的內容。
- 如申請專利範圍第8項的方法,其中, 該特殊標記定義為黑框結合內部圖片,內部圖片在檢測該特殊標記時用於該匹配;在待處理圖像中檢測該特殊標記包括:先檢測到該黑框,再匹配該內部圖片,如果內部圖片匹配上則表明匹配上該特殊標記。
- 如申請專利範圍第8項的方法,其中,該特殊標記包括:經逐行掃描發現存在按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域;在待處理圖像中檢測該特殊標記包括:直接檢測符合上述黑白比的圖像特徵區域。
- 如申請專利範圍第10項的方法,其中,該按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域還包括:其中,設定兩行或多行像素,出現像素的黑白比規則分別為1:1:3:1:1和1:2:1:2:1;圖像特徵區域設計為黑框結合內部內容。
- 如申請專利範圍第9或10項的方法,其中,該標誌的固定位置包括:在該標誌前或在該標誌後。
- 如申請專利範圍第8項的方法,其中,獲取的待處理圖像是商品圖片;該標誌是該商品圖片的附近或內部的商品代碼;商品代碼包括字元或數位字元,和/或圖像。
- 如申請專利範圍第8項的方法,其中,識別步驟還包括:使用OCR識別分割出的區域中的標誌的內容。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210360774.6A CN103679164A (zh) | 2012-09-21 | 2012-09-21 | 一种基于移动终端的标志识别处理方法和*** |
??201210360774.6 | 2012-09-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201413602A true TW201413602A (zh) | 2014-04-01 |
TWI631514B TWI631514B (zh) | 2018-08-01 |
Family
ID=50316654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101146907A TWI631514B (zh) | 2012-09-21 | 2012-12-12 | Method and system for marking recognition based on mobile terminal |
Country Status (5)
Country | Link |
---|---|
US (2) | US8971620B2 (zh) |
JP (2) | JP5972468B2 (zh) |
CN (1) | CN103679164A (zh) |
TW (1) | TWI631514B (zh) |
WO (1) | WO2014046918A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10600208B2 (en) | 2017-12-21 | 2020-03-24 | Industrial Technology Research Institute | Object detecting device, object detecting method and non-transitory computer-readable medium |
TWI703508B (zh) * | 2018-12-19 | 2020-09-01 | 洽吧智能股份有限公司 | 字元影像識別方法與系統 |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9613267B2 (en) * | 2012-05-31 | 2017-04-04 | Xerox Corporation | Method and system of extracting label:value data from a document |
US9087272B2 (en) * | 2013-07-17 | 2015-07-21 | International Business Machines Corporation | Optical match character classification |
US9245192B2 (en) * | 2013-09-20 | 2016-01-26 | Here Global B.V. | Ad collateral detection |
KR102209729B1 (ko) * | 2014-04-04 | 2021-01-29 | 삼성전자주식회사 | 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법 |
GB2526102B (en) | 2014-05-13 | 2020-09-23 | Grass Valley Ltd | Logo detection by edge matching |
CN105303189B (zh) * | 2014-07-29 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种用于检测预定区域中特定标识图像的方法及装置 |
CN105608459B (zh) * | 2014-10-29 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 商品图片的分割方法及其装置 |
WO2016117564A1 (ja) * | 2015-01-21 | 2016-07-28 | 国立大学法人東京農工大学 | プログラム、情報記憶媒体及び認識装置 |
US9892478B2 (en) | 2015-03-06 | 2018-02-13 | Digimarc Corporation | Digital watermarking applications |
US10467284B2 (en) | 2015-08-03 | 2019-11-05 | Google Llc | Establishment anchoring with geolocated imagery |
US9690967B1 (en) | 2015-10-29 | 2017-06-27 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery |
US10262176B1 (en) | 2016-02-23 | 2019-04-16 | Digimarc Corporation | Scanner with control logic for resolving package labeling |
US10198782B1 (en) * | 2016-09-15 | 2019-02-05 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery |
US11042161B2 (en) | 2016-11-16 | 2021-06-22 | Symbol Technologies, Llc | Navigation control method and apparatus in a mobile automation system |
CN108345895A (zh) * | 2017-01-22 | 2018-07-31 | 上海分泽时代软件技术有限公司 | 广告图像识别方法以及广告图像识别*** |
US10591918B2 (en) | 2017-05-01 | 2020-03-17 | Symbol Technologies, Llc | Fixed segmented lattice planning for a mobile automation apparatus |
US10726273B2 (en) | 2017-05-01 | 2020-07-28 | Symbol Technologies, Llc | Method and apparatus for shelf feature and object placement detection from shelf images |
US11978011B2 (en) | 2017-05-01 | 2024-05-07 | Symbol Technologies, Llc | Method and apparatus for object status detection |
US10949798B2 (en) | 2017-05-01 | 2021-03-16 | Symbol Technologies, Llc | Multimodal localization and mapping for a mobile automation apparatus |
US11367092B2 (en) | 2017-05-01 | 2022-06-21 | Symbol Technologies, Llc | Method and apparatus for extracting and processing price text from an image set |
US20180314908A1 (en) * | 2017-05-01 | 2018-11-01 | Symbol Technologies, Llc | Method and apparatus for label detection |
WO2018204342A1 (en) | 2017-05-01 | 2018-11-08 | Symbol Technologies, Llc | Product status detection system |
US10505057B2 (en) | 2017-05-01 | 2019-12-10 | Symbol Technologies, Llc | Device and method for operating cameras and light sources wherein parasitic reflections from a paired light source are not reflected into the paired camera |
US10663590B2 (en) | 2017-05-01 | 2020-05-26 | Symbol Technologies, Llc | Device and method for merging lidar data |
US11449059B2 (en) | 2017-05-01 | 2022-09-20 | Symbol Technologies, Llc | Obstacle detection for a mobile automation apparatus |
US11600084B2 (en) | 2017-05-05 | 2023-03-07 | Symbol Technologies, Llc | Method and apparatus for detecting and interpreting price label text |
US10572763B2 (en) | 2017-09-07 | 2020-02-25 | Symbol Technologies, Llc | Method and apparatus for support surface edge detection |
US10521914B2 (en) | 2017-09-07 | 2019-12-31 | Symbol Technologies, Llc | Multi-sensor object recognition system and method |
US10809078B2 (en) | 2018-04-05 | 2020-10-20 | Symbol Technologies, Llc | Method, system and apparatus for dynamic path generation |
US10740911B2 (en) | 2018-04-05 | 2020-08-11 | Symbol Technologies, Llc | Method, system and apparatus for correcting translucency artifacts in data representing a support structure |
US10832436B2 (en) | 2018-04-05 | 2020-11-10 | Symbol Technologies, Llc | Method, system and apparatus for recovering label positions |
US11327504B2 (en) | 2018-04-05 | 2022-05-10 | Symbol Technologies, Llc | Method, system and apparatus for mobile automation apparatus localization |
US10823572B2 (en) | 2018-04-05 | 2020-11-03 | Symbol Technologies, Llc | Method, system and apparatus for generating navigational data |
US11010920B2 (en) | 2018-10-05 | 2021-05-18 | Zebra Technologies Corporation | Method, system and apparatus for object detection in point clouds |
US11506483B2 (en) | 2018-10-05 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for support structure depth determination |
GB201817808D0 (en) * | 2018-10-31 | 2018-12-19 | Ishida Europe Ltd | Method and apparatus for inspecting a label attached to a food pack |
US11003188B2 (en) | 2018-11-13 | 2021-05-11 | Zebra Technologies Corporation | Method, system and apparatus for obstacle handling in navigational path generation |
US11090811B2 (en) | 2018-11-13 | 2021-08-17 | Zebra Technologies Corporation | Method and apparatus for labeling of support structures |
US11416000B2 (en) | 2018-12-07 | 2022-08-16 | Zebra Technologies Corporation | Method and apparatus for navigational ray tracing |
US11079240B2 (en) | 2018-12-07 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for adaptive particle filter localization |
US11100303B2 (en) | 2018-12-10 | 2021-08-24 | Zebra Technologies Corporation | Method, system and apparatus for auxiliary label detection and association |
US11015938B2 (en) | 2018-12-12 | 2021-05-25 | Zebra Technologies Corporation | Method, system and apparatus for navigational assistance |
US10731970B2 (en) | 2018-12-13 | 2020-08-04 | Zebra Technologies Corporation | Method, system and apparatus for support structure detection |
CA3028708A1 (en) | 2018-12-28 | 2020-06-28 | Zih Corp. | Method, system and apparatus for dynamic loop closure in mapping trajectories |
US11250535B1 (en) | 2019-02-08 | 2022-02-15 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data, and robustness checks |
US10789438B1 (en) | 2019-02-08 | 2020-09-29 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data |
US11662739B2 (en) | 2019-06-03 | 2023-05-30 | Zebra Technologies Corporation | Method, system and apparatus for adaptive ceiling-based localization |
US11080566B2 (en) | 2019-06-03 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for gap detection in support structures with peg regions |
US11200677B2 (en) | 2019-06-03 | 2021-12-14 | Zebra Technologies Corporation | Method, system and apparatus for shelf edge detection |
US11341663B2 (en) | 2019-06-03 | 2022-05-24 | Zebra Technologies Corporation | Method, system and apparatus for detecting support structure obstructions |
US11402846B2 (en) | 2019-06-03 | 2022-08-02 | Zebra Technologies Corporation | Method, system and apparatus for mitigating data capture light leakage |
US11151743B2 (en) | 2019-06-03 | 2021-10-19 | Zebra Technologies Corporation | Method, system and apparatus for end of aisle detection |
US11960286B2 (en) | 2019-06-03 | 2024-04-16 | Zebra Technologies Corporation | Method, system and apparatus for dynamic task sequencing |
WO2021054850A1 (ru) * | 2019-09-17 | 2021-03-25 | Публичное Акционерное Общество "Сбербанк России" | Способ и система интеллектуальной обработки документа |
CN111091532B (zh) * | 2019-10-30 | 2023-07-18 | 中国四维测绘技术有限公司 | 一种基于多层感知机的遥感影像色彩评价方法和*** |
US11507103B2 (en) | 2019-12-04 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for localization-based historical obstacle handling |
US11107238B2 (en) | 2019-12-13 | 2021-08-31 | Zebra Technologies Corporation | Method, system and apparatus for detecting item facings |
CN113033588A (zh) * | 2019-12-24 | 2021-06-25 | 中移雄安信息通信科技有限公司 | 一种图像处理方法及电子设备 |
US11822333B2 (en) | 2020-03-30 | 2023-11-21 | Zebra Technologies Corporation | Method, system and apparatus for data capture illumination control |
US11450024B2 (en) | 2020-07-17 | 2022-09-20 | Zebra Technologies Corporation | Mixed depth object detection |
US11593915B2 (en) | 2020-10-21 | 2023-02-28 | Zebra Technologies Corporation | Parallax-tolerant panoramic image generation |
US11392891B2 (en) | 2020-11-03 | 2022-07-19 | Zebra Technologies Corporation | Item placement detection and optimization in material handling systems |
US11847832B2 (en) | 2020-11-11 | 2023-12-19 | Zebra Technologies Corporation | Object classification for autonomous navigation systems |
CN112926683A (zh) * | 2021-03-29 | 2021-06-08 | 中国建设银行股份有限公司 | 一种对象识别方法和装置 |
US11954882B2 (en) | 2021-06-17 | 2024-04-09 | Zebra Technologies Corporation | Feature-based georegistration for mobile computing devices |
WO2024049421A1 (en) * | 2022-08-31 | 2024-03-07 | Surgibox Inc. | Blockchain systems and methods for verifying the certifications and the authenticity of commercial products |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4776464A (en) * | 1985-06-17 | 1988-10-11 | Bae Automated Systems, Inc. | Automated article handling system and process |
US5081685A (en) * | 1988-11-29 | 1992-01-14 | Westinghouse Electric Corp. | Apparatus and method for reading a license plate |
FR2657982B1 (fr) | 1990-02-02 | 1992-11-27 | Cga Hbs | Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede. |
US5060980A (en) * | 1990-05-30 | 1991-10-29 | Xerox Corporation | Form utilizing encoded indications for form field processing |
JPH06339026A (ja) * | 1993-05-31 | 1994-12-06 | Matsushita Electric Ind Co Ltd | 補正データ生成装置 |
JPH0793473A (ja) * | 1993-09-21 | 1995-04-07 | Hitachi Eng Co Ltd | 文字領域割り出し方法 |
JP3726395B2 (ja) | 1997-01-30 | 2005-12-14 | 株式会社デンソー | 2次元コードおよび2次元コードの読取方法 |
JPH1154407A (ja) * | 1997-08-05 | 1999-02-26 | Nikon Corp | 位置合わせ方法 |
JP4054428B2 (ja) * | 1998-02-05 | 2008-02-27 | キヤノン株式会社 | 画像検索装置及びその方法、コンピュータ可読メモリ |
US6360001B1 (en) * | 2000-05-10 | 2002-03-19 | International Business Machines Corporation | Automatic location of address information on parcels sent by mass mailers |
US7130466B2 (en) * | 2000-12-21 | 2006-10-31 | Cobion Ag | System and method for compiling images from a database and comparing the compiled images with known images |
EP1423833A4 (en) * | 2001-07-18 | 2008-07-02 | Hyunjae Tech Co Ltd | SYSTEM FOR THE AUTOMATIC RECOGNITION OF IDENTIFICATION OF OTHER VEHICLES ON OBSERVATIVES AND METHOD THEREFOR |
CA2375355A1 (en) | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US7328847B1 (en) * | 2003-07-30 | 2008-02-12 | Hewlett-Packard Development Company, L.P. | Barcode data communication methods, barcode embedding methods, and barcode systems |
US20050044758A1 (en) * | 2003-08-29 | 2005-03-03 | Richard Gary P. | More readily identifiable license plate |
JP4391839B2 (ja) * | 2004-01-30 | 2009-12-24 | 富士通株式会社 | 撮影条件設定プログラム、撮影条件設定方法および撮影条件設定装置 |
JP2006331322A (ja) | 2005-05-30 | 2006-12-07 | Fuji Electric Systems Co Ltd | 検索用タグ及びこれを使用した情報検索システム |
US7613328B2 (en) * | 2005-09-09 | 2009-11-03 | Honeywell International Inc. | Label detection |
CA2566260C (en) * | 2005-10-31 | 2013-10-01 | National Research Council Of Canada | Marker and method for detecting said marker |
JP4745830B2 (ja) * | 2006-01-05 | 2011-08-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP4670657B2 (ja) | 2006-01-24 | 2011-04-13 | 富士ゼロックス株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2007304864A (ja) * | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
US8218821B2 (en) * | 2007-01-23 | 2012-07-10 | Pips Technology, Inc. | Video preprocessing of image information for character recognition |
US8285047B2 (en) * | 2007-10-03 | 2012-10-09 | Xerox Corporation | Automated method and system for naming documents from a scanned source based on manually marked text |
JP4711093B2 (ja) * | 2008-08-28 | 2011-06-29 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4821869B2 (ja) | 2009-03-18 | 2011-11-24 | 富士ゼロックス株式会社 | 文字認識装置、画像読取装置、およびプログラム |
WO2010114449A1 (en) * | 2009-03-30 | 2010-10-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Barcode processing |
US8594422B2 (en) | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
US9292565B2 (en) | 2010-06-30 | 2016-03-22 | International Business Machines Corporation | Template-based recognition of food product information |
US8763917B2 (en) * | 2010-09-20 | 2014-07-01 | Lumidigm, Inc. | Machine-readable symbols |
US20120223968A1 (en) | 2010-10-12 | 2012-09-06 | Kazutoshi Kashimoto | Display processing device, display method, and program |
US8528820B2 (en) * | 2011-06-29 | 2013-09-10 | Symbol Technologies, Inc. | Object identification using barcode reader |
US20130279758A1 (en) * | 2012-04-23 | 2013-10-24 | Xerox Corporation | Method and system for robust tilt adjustment and cropping of license plate images |
-
2012
- 2012-09-21 CN CN201210360774.6A patent/CN103679164A/zh active Pending
- 2012-12-12 TW TW101146907A patent/TWI631514B/zh not_active IP Right Cessation
-
2013
- 2013-09-09 US US14/021,564 patent/US8971620B2/en active Active
- 2013-09-10 WO PCT/US2013/059054 patent/WO2014046918A1/en active Application Filing
- 2013-09-10 JP JP2015533106A patent/JP5972468B2/ja not_active Expired - Fee Related
-
2015
- 2015-01-21 US US14/602,021 patent/US9811749B2/en active Active
-
2016
- 2016-07-12 JP JP2016137232A patent/JP2016201126A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10600208B2 (en) | 2017-12-21 | 2020-03-24 | Industrial Technology Research Institute | Object detecting device, object detecting method and non-transitory computer-readable medium |
TWI703508B (zh) * | 2018-12-19 | 2020-09-01 | 洽吧智能股份有限公司 | 字元影像識別方法與系統 |
Also Published As
Publication number | Publication date |
---|---|
CN103679164A (zh) | 2014-03-26 |
WO2014046918A1 (en) | 2014-03-27 |
JP2016201126A (ja) | 2016-12-01 |
JP2015529369A (ja) | 2015-10-05 |
US20140086483A1 (en) | 2014-03-27 |
JP5972468B2 (ja) | 2016-08-17 |
US20150199581A1 (en) | 2015-07-16 |
US8971620B2 (en) | 2015-03-03 |
US9811749B2 (en) | 2017-11-07 |
TWI631514B (zh) | 2018-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI631514B (zh) | Method and system for marking recognition based on mobile terminal | |
CN107016387B (zh) | 一种识别标签的方法及装置 | |
CN107133622B (zh) | 一种单词的分割方法和装置 | |
CN111160352B (zh) | 一种基于图像分割的工件金属表面文字识别方法及*** | |
WO2019169772A1 (zh) | 图片处理方法、电子装置及存储介质 | |
CN109753953B (zh) | 图像中定位文本的方法、装置、电子设备和存储介质 | |
CN104182750A (zh) | 一种在自然场景图像中基于极值连通域的中文检测方法 | |
US20150242684A1 (en) | Method and system for linking printed objects with electronic content | |
CN110807454B (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
CN104881665A (zh) | 一种芯片字符识别与校验方法及装置 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN109389115B (zh) | 文本识别方法、装置、存储介质和计算机设备 | |
CN110533704B (zh) | 油墨标签的识别验伪方法、装置、设备及介质 | |
Salunkhe et al. | Recognition of multilingual text from signage boards | |
CN112749696B (zh) | 一种文本检测方法及装置 | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
Chavre et al. | Scene text extraction using stroke width transform for tourist translator on android platform | |
Lai et al. | Binarization by local k-means clustering for Korean text extraction | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN110084117A (zh) | 基于二值图分段投影的文档表格线检测方法、*** | |
Valiente et al. | A process for text recognition of generic identification documents over cloud computing | |
CN115719489A (zh) | 一种基于图形的电力金具表面铭文识别方法及*** | |
CN109871910B (zh) | 一种手写字符识别方法及装置 | |
CN112861861A (zh) | 识别数码管文本的方法、装置及电子设备 | |
Somyat et al. | Thai Lottery Number Reader App for Blind Lottery Ticket Sellers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |