CN107247724B - 转移概率矩阵更新、信息识别方法及装置、计算机设备 - Google Patents

转移概率矩阵更新、信息识别方法及装置、计算机设备 Download PDF

Info

Publication number
CN107247724B
CN107247724B CN201710288225.5A CN201710288225A CN107247724B CN 107247724 B CN107247724 B CN 107247724B CN 201710288225 A CN201710288225 A CN 201710288225A CN 107247724 B CN107247724 B CN 107247724B
Authority
CN
China
Prior art keywords
information
transition probability
transferred
identified
probability matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710288225.5A
Other languages
English (en)
Other versions
CN107247724A (zh
Inventor
许利宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710288225.5A priority Critical patent/CN107247724B/zh
Publication of CN107247724A publication Critical patent/CN107247724A/zh
Application granted granted Critical
Publication of CN107247724B publication Critical patent/CN107247724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种转移概率矩阵更新方法及装置、信息识别方法及装置、计算机设备,根据获取的转移概率矩阵,确定拟进行概率更新的各第一待转移信息;获取与第一待转移信息对应的各预设常用信息,并将各预设常用信息分别后接至第一待转移信息获得与第一待转移信息对应的各合并后信息;获取对第一待转移信息进行搜索获得的第一搜索量,以及分别对各合并后信息进行搜索获得的各第二搜索量;分别计算各第二搜索量与第一搜索量的比值,获得第一待转移信息分别转移至各预设常用信息的各第二转移概率;将第二转移概率的值最大的前预设数目的第二转移概率更新至转移概率矩阵中,提高转移概率矩阵准确性,根据更新后的转移概率矩阵进行信息识别时,可提高识别准确性。

Description

转移概率矩阵更新、信息识别方法及装置、计算机设备
技术领域
本发明涉及计算机信息处理技术领域,特别涉及一种转移概率矩阵更新方法及装置、信息识别方法及装置、计算机设备。
背景技术
在字符、音频等信息识别领域,在采用不同的方法进行识别时得到的识别结果的准确性并不同,目前,常采用的字符识别方法,是通过扫描包括字符的图像,根据图像中字符的特征进行字符识别,常采用的音频识别方法,是通过音频的声音频率进行识别。
然而,在图像出现模糊导致包含的字符不清晰时,通过上述识别方法很难识别成功,或者说识别出的结果准确性较低。在音频受到杂音干扰时,音频的识别准确较低。在利用信息的转移概率矩阵方式对模糊不清晰的字符或受到干扰的音频进行识别,但是由于存在稀疏性,即信息样本的信息量不能较大范围覆盖日常用到的信息,形成的转移概率矩阵不准确,导致后续根据转移概率矩阵进行识别的结果也不准确。
发明内容
基于此,有必要针对由于信息稀疏导致信息的转移概率矩阵不准确,从而使后续信息识别不准确的问题,提出一种转移概率矩阵更新方法及装置、信息识别方法及装置、计算机设备。
据此,本实施例采用以下技术方案:
一种转移概率矩阵更新方法,包括以下步骤:
获取信息的转移概率矩阵,所述转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率;
根据所述转移概率矩阵,确定拟进行概率更新的各第一待转移信息;
获取与所述第一待转移信息对应的各预设常用信息,并将各所述预设常用信息分别后接至所述第一待转移信息,获得与所述第一待转移信息对应的各合并后信息;
获取通过搜索引擎对所述第一待转移信息进行搜索获得的第一搜索量,以及通过所述搜索引擎分别对各所述合并后信息进行搜索获得的各第二搜索量;
分别计算各所述第二搜索量与所述第一搜索量的比值,获得所述第一待转移信息分别转移至各所述预设常用信息的各第二转移概率;
将所述第二转移概率的值最大的前预设数目的第二转移概率更新至所述转移概率矩阵中,获得更新后的转移概率矩阵。
本发明还提供一种转移概率矩阵更新装置,包括:
初始矩阵获取模块,用于获取信息的转移概率矩阵,所述转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率;
信息获取模块,用于根据所述转移概率矩阵,确定拟进行概率更新的各第一待转移信息;
合并模块,用于获取与所述第一待转移信息对应的各预设常用信息,并将各所述预设常用信息分别后接至所述第一待转移信息,获得与所述第一待转移信息对应的各合并后信息;
搜索结果获取模块,获取通过搜索引擎对所述第一待转移信息进行搜索获得的第一搜索量,以及通过所述搜索引擎分别对各所述合并后信息进行搜索获得的各第二搜索量;
概率计算模块,用于分别计算各所述第二搜索量与所述第一搜索量的比值,获得所述第一待转移信息分别转移至各所述预设常用信息的各第二转移概率;
概率更新模块,用于将所述第二转移概率的值最大的前预设数目的第二转移概率更新至所述转移概率矩阵中,获得更新后的转移概率矩阵。
本发明还提供一种信息识别方法,包括以下步骤:
对待识别对象进行特征分析,获得特征信息;
在根据特征信息确定存在异常部分时,将所述异常部分从所述待识别对象中分离,获得分离后的待识别对象;
对所述分离后的待识别对象进行识别,获得初始识别结果;
获取所述初始识别结果中与前相邻对象对应的第一识别信息,所述前相邻对象为所述待识别对象中、与所述异常部分相邻的前一个子对象;
获取采用上述转移概率矩阵更新方法确定的与所述待识别对象的类型对应的更新后的转移概率矩阵,根据所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息;
将所述初始识别结果与所述第二识别信息进行结合,获得所述待识别对象的信息识别结果。
本发明还提供一种信息识别装置,包括上述转移概率矩阵更新装置,还包括;
初始分析模块,用于对待识别对象进行特征分析,获得特征信息;
分离模块,用于在根据特征信息确定存在异常部分时,将所述异常部分从所述待识别对象中分离,获得分离后的待识别对象;
初始识别模块,用于对所述分离后的待识别对象进行识别,获得初始识别结果;
子对象获取模块,用于获取所述初始识别结果中与前相邻对象对应的第一识别信息,所述前相邻对象为所述待识别对象中、与所述异常部分相邻的前一个子对象;
子识别模块,用于根据所述转移概率矩阵更新装置确定的与所述待识别对象的类型对应的所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息;
识别结果更新模块,用于将所述初始识别结果与所述第二识别信息进行结合,获得所述待识别对象的信息识别结果。
本发明还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项的转移概率矩阵更新方法或信息识别方法。
通过上述转移概率矩阵更新方法及装置、计算机设备,即使在信息样本出现文本稀疏,对应的转移概率矩阵不准确,可通过选取合并后信息对应的第二搜索量与第一待转移信息对应的所述第一搜索量的比值最大的前预设数目的转移概率更新至所述转移概率矩阵中,即将第一待转移信息转移到预设常用字符中对应的合并后信息的搜索量较大的部分字符的转移概率增加到转移概率矩阵,更新转移概率矩阵,提高转移概率矩阵的准确性,后续根据转移概率矩阵进行识别时,提高识别准确性。
上述信息识别方法及装置,首先找到异常部分,然后再对待识别对象分离异常部分后的分离后的待识别对象进行识别获得初始识别结果,然后根据初始识别结果以及转移概率矩阵对异常部分进行识别,即分离后的待识别对象和异常部分是分开识别的,无需对整个存在异常部分的待识别对象进行识别后再进行异常部分的识别,再对待识别对象的整个识别结果进行更新,减少识别时间,提高识别效率。且在本方案中,在待识别对象存在异常时,是通过上述转移概率矩阵更新方法确定的更新后的转移概率矩阵和初始识别结果进行异常部分的识别,更新后的转移概率矩阵的准确性好,这样在进行信息识别时,可根据更加准确的更新后的转移概率矩阵进行识别,提高识别准确性。
附图说明
图1为本发明一个实施例的工作环境示意图;
图2为一个实施例中的服务器的组成结构示意图;
图3为一个实施例的转移概率矩阵更新方法的流程示意图;
图4为一个实施例的信息识别方法的流程示意图;
图5为另一个实施例的信息识别方法中的子流程示意图;
图6为一实施例的转移概率矩阵的界面示意图;
图7为一个实施例的转移概率矩阵更新装置的模块示意图;
图8为一个实施例的信息识别装置的模块示意图;
图9为另一个实施例的信息识别装置的子模块示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1示出了本发明一个实施例中的工作环境示意图,如图1所示,其工作环境涉及终端110、服务器120以及网络130,终端110及服务器120可以通过网络130 进行通信。终端110通过网络130可访问对应的服务器120,以请求相应的信息识别结果,服务器120可将该信息识别结果推送至终端110。终端110的用户查看该信息识别结果。该终端110可以是任何一种能够实现智能输入输出的设备,例如,台式电脑或移动终端,移动终端可以是智能手机、平板电脑、车载电脑、穿戴式智能设备等。该服务器120可以是提供信息识别结果的平台所在的服务器。服务器120可以为一个或多个。本实施例涉及的是服务器120对转移概率矩阵更新的方案以及在进行信息识别获得信息识别结果的方案。
服务器120在一个实施例中的内部结构图如图2所示。该服务器120包括通过***总线连接的处理器、存储介质、网络接口和内存。其中,服务器120的处理器用于提供计算和控制能力,支撑整个服务器的运行。服务器120的存储介质存储有操作***、本地数据库、一种转移概率矩阵更新装置和信息识别装置的计算机应用程序,该转移概率矩阵更新装置的计算机应用程序被处理器执行时实现一种转移概率矩阵更新方法,该信息识别装置的计算机应用程序被处理器执行时实现一种信息识别方法。服务器120的内存为非易失性存储介质中的字符的转移概率矩阵更新装置的运行提供环境,该内存中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种转移概率矩阵更新方法和一种信息识别方法。服务器120的网络接口用于与网络130连接和通信。
如图3所示,一个实施例的转移概率矩阵更新方法,包括步骤S310至步骤 S360:
S310:获取信息的转移概率矩阵。
其中,信息可以是字符或声音频率,即当信息为字符时,转移概率矩阵对应为字符的转移概率频率,待转移信息为待转移字符,转移目标信息为转移目标字符。当信息为声音频率时,转移概率矩阵为声音音频的转移概率,待转移信息为待转移声音频率,转移目标信息为转移目标声音频率。其中,信息的转移概率矩阵可根据信息样本计算得到的转移概率矩阵。
转移概率矩阵中的元素为各转移概率,即转移矩阵包括各转移概率,其中,转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率,为了与后续更新到转移概率矩阵中的第二转移概率进行区分,此处,将转移概率矩阵中的转移概率定义为第一转移概率。可以理解,待转移信息转移至转移目标信息的概率为待转移信息后面接转移目标信息的概率。以字符为例,若待转移字符为“电”,转移目标字符包括“视”和“话”等,对应的转移概率分别为待转移字符“电”转移至转移目标字符“视”的概率(“电”后面接“视”的概率)以及待转移字符“电”转移至转移目标字符“话”的概率(“电”后面接“话”的概率)。另外,以声音频率为例,待转移声音频率为“电”对应的频率,转移目标声音频率包括“视”对应的声音频率和“话”对应的声音频率等,对应的转移概率分别为“电”对应的转移声音频率转移至“视”对应的转移目标声音频率的概率(“电”的声音频率后面接“视”的声音频率的概率)以及“电”对应的转移声音频率转移至“话”对应的转移目标声音频率的概率(“电”的声音频率后面接“话”的声音频率的概率)。
S320:根据转移概率矩阵,确定拟进行概率更新的各第一待转移信息。
由于信息稀疏性即信息量较少,可能会导致转移概率矩阵的稀疏性,这样可能会导致后续信息识别时准确性不高,从而需要对转移概率矩阵进行更新,增加其信息量,从而增加信息的转移概率。如此,首先需要根据转移概率矩阵,确定拟进行概率更新的各第一待转移信息,即需要对第一转移信息对应的转移概率进行更新。例如,以字符为例,转移概率矩阵中有字符“水层”后面接字符“浅”的转移概率,后面没有接其他字符,则字符“水层”后面接的字符可能存在稀疏性,需要增加“水层”到其他字符例如“深”的转移概率,从而,可将该字符“水层”作为拟进行概率更新的各第一待转移信息,增加其到其他字符的转移概率,实现字符“水层”的转移概率更新。
S330:获取与第一待转移信息对应的各预设常用信息,并将各预设常用信息分别后接至第一待转移信息,获得与第一待转移信息对应的各合并后信息。
预设常用信息对应包括预设常用字符或者预设常用声音频率。一般情况下,有些信息的使用频率会较高,一些生僻信息使用频率会较低,则通过预设常用信息作为与第一待转移信息合并的信息依据,从很大程度上可覆盖人们常用的信息。比如,第一待转移信息为字符“电”,预设常用字符中包括“视”、“话”、“流”以及“压”等,则可将这些常用字符分别后接到字符“电”,得到的各合并信息分别为“电视”、“电话”、“电流”以及“电压”等。
S340:获取通过搜索引擎对第一待转移信息进行搜索获得的第一搜索量,以及通过搜索引擎分别对各合并后信息进行搜索获得的各第二搜索量。
得到合并后信息后,可获取通过搜索引擎对第一待转移信息进行搜索获得的第一搜索量,以及通过搜索引擎分别对各合并后信息进行搜索获得的各第二搜索量。在本实施例中,可通过调用搜索引擎,对第一待转移信息以及各合并后信息进行搜索,获得第一搜索量和各第二搜索量,也可以是将第一转移信息以及各合并后信息分别发送给搜索引擎之后,然后再获取搜索引擎返回的搜索结果,以获得第一搜索量和各第二搜索量。
S350:分别计算各第二搜索量与第一搜索量的比值,获得第一待转移信息分别转移至各预设常用信息的各第二转移概率。
S360:将第二转移概率的值最大的前预设数目的第二转移概率更新至转移概率矩阵中,获得更新后的转移概率矩阵。
第一搜索量是一定的,第二搜索量根据合并后信息的不同而不同,第二搜索量越大表示该合并后信息越常用,第二搜索量与第一搜索量的比值越大,第一待转移信息后面接该合并后信息的概率越大,即第一转移信息转移至该预设常用信息的可能性越大。为了提高更新后的转移矩阵中的转移概率为更接近常用的信息的转移概率,分别计算各第二搜索量与第一搜索量的比值,获得第一待转移信息分别转移至各预设常用信息的各第二转移概率,将第二转移概率的值最大的前预设数目的第二转移概率更新至转移概率矩阵中,获得更新后的转移概率矩阵。比如,第一待转移信息为字符“电”,上述合并后信息“电视”的第二搜索量与字符“电”的第一搜索量的比值大于“电话”的第二搜索量与字符“电”的第一搜索量的比值,表示电视更常用,若预设数目为1,则选取的是合并后信息“电视”的第二搜索量与字符“电”的第一搜索量的比值更新至转移概率矩阵。
通过上述字符的转移概率矩阵更新方法,即使在信息样本出现文本稀疏,对应的转移概率矩阵不准确,也可通过选取合并后信息对应的第二搜索量与第一待转移信息对应的第一搜索量的比值最大的前预设数目的转移概率更新至转移概率矩阵中,即将第一待转移信息转移到预设常用字符中对应的合并后信息的搜索量较大的部分字符的转移概率增加到转移概率矩阵,更新转移概率矩阵,提高转移概率矩阵的准确性,后续根据转移概率矩阵进行识别时,提高识别准确性。
在其中一个实施例中,第一待转移信息为关联的转移目标信息的数目小于预设数量的待转移信息。
也就是说,在根据转移概率矩阵确定拟进行概率更新的各第一待转移信息时,是通过检测待转移信息关联的转移目标信息的数量是否小于预设数量,若小于,则表示转移矩阵中该待转移信息后接转移目标信息存在稀疏性即后接转移目标信息较少,此时,即可将该待转移信息确定为拟进行概率更新的第一待转移信息。例如,预设数量为30,待转移信息“水层”后接唯一的转移目标信息为“浅”,即后接转移目标信息的数量为1,小于预设数量30,此时,可将待转移信息“水层”作为拟进行概率更新的第一待转移信息。
如图4所示,一种实施例的信息识别方法,包括步骤S410至S460:
S410:对待识别对象进行特征分析,获得特征信息。
待识别对象可包括待识别字符图像或待识别音频。各待识别对象有其关联的特征信息,特征信息对应可包括图像像素信息以及声纹信息,即待识别字符图像有其关联的图像像素信息,待识别音频有其关联的声纹信息,通过对待识别对象进行特征分析,可获得待识别对象的特征信息。
S420:在根据特征信息确定存在异常部分时,将异常部分从待识别对象中分离,获得分离后的待识别对象。
即根据特征信息对待识别对象进行异常检测,在确定待识别对象存在异常部分时,将异常部分从待识别对象中分离,获得分离后的待识别对象。在对待识别字符图像进行识别时,根据图像像素值进行异常检测,当待识别字符图像中图像像素值连续为1的面积大于预设面积时,认为存在异常,且异常部分即为上述图像像素值连续为1的部分。对待识别音频进行识别时,根据声纹信息进行异常检测,当待识别音频中声纹信息存在不一致时,认为待识别音频存在异常。以待识别字符图像为例,当待识别字符图像中出现阴影部分遮挡了该部分的字符,此时阴影部分的像素值全为1,是异常的,即根据像素值即可检测出待识别字符图像中的异常部分即阴影部分,将该影音部分从待识别字符图像中去除,即可获得分离后的待识别字符图像,该分离后的待识别字符图像是不包括阴影部分的。另外,以对待识别音频进行识别为例,当一个用户在进行说话时出现了其他杂音覆盖了用户的声音,其对应的待识别音频中存在两种不同的声纹信息,杂音一般持续时间较短,则将持续时间较短对应的声纹信息确定为异常部分,将该异常声纹从待识别音频的声纹信息中分离,得到分离后的待识别音频。
S430:对分离后的待识别对象进行识别,获得初始识别结果。
分离后的待识别对象即为无异常的部分,可对其进行识别,对于分离后的待识别字符图像而言,进行识别获得初始字符识别结果,对于分离后的待识别音频而言,进行识别获得初始音频识别结果。
S440:获取初始识别结果中与前相邻对象对应的第一识别信息,前相邻对象为待识别对象中、与异常部分相邻的前一个子对象。
对分离后的待识别对象进行识别,获得初始识别结果,初始识别结果中包括了在待识别对象中,与异常部分有相邻的前一个子对象的识别结果,即第一识别信息,从初始识别结果中获取与前相邻对象对应的第一识别信息即可。例如,待识别对象中、与异常部分相邻的前一个子对象的第一识别信息为字符“电”,即字符“电”后面接的是异常部分。又例如,待识别对象为待识别音频时,初始音频识别结果包括声音频率,待识别对象中、与异常部分相邻的前一个字对象的第一识别信息为“电”对应的声音频率,从初始识别结果中获取与前相邻对象对应的“电”对应的声音频率即可。
S450:获取采用上述转移概率矩阵更新方法确定的与待识别对象的类型对应的更新后的转移概率矩阵,根据更新后的转移概率矩阵以及第一识别信息确定与异常部分对应的第二识别信息。
由于待识别对象的类型可包括待识别字符图像或待识别音频,不同待识别对象对应不同的转移概率矩阵,上述转移概率矩阵更新方法中,是对信息的转移概率矩阵进行更新,其中,信息可以是字符或声音频率,即转移概率矩阵可对应不同的类型的转移概率矩阵(例如,分别对应字符的转移概率频率或声音音频的转移概率),上述转移概率矩阵更新方法可确定的与上述信息的类型对应的更新后的转移概率矩阵,在本实施例中,对待识别对象进行识别时,待识别对象可以是识别字符图像或待识别音频,对应地,上述转移概率矩阵更新方法可更新字符的转移概率矩阵或声音频率的转移概率矩阵,可直接获取采用上述转移概率矩阵更新方法确定的与待识别对象的类型对应的更新后的转移概率矩阵,根据更新后的转移概率矩阵以及第一识别信息,可确定与异常部分对应的第二识别信息,即对异常部分识别完毕得到了第二识别信息。例如,第一识别信息为“电”,在转移概率矩阵中有该字符“电”后面接转移目标字符的概率,从而可根据更新后的转移概率矩阵确定异常部分对应的第二识别信息,即确定异常部分的识别结果,提高识别准确性。另一个实现方式中,也可以采用上述转移概率矩阵更新方法确定更新后的转移概率矩阵,然后根据更新后的转移概率矩阵以及第一识别信息确定与异常部分对应的第二识别信息。
S460:将初始识别结果与第二识别信息进行结合,获得待识别对象的信息识别结果。
由于初始识别结果是对分离后的待识别对象进行识别的结果,没有异常部分的识别结果,即相当于待识别对象识别是缺失的,因此,为了实现完整的识别,将初始识别结果与第二识别信息进行结合,获得待识别对象的信息识别结果。
上述信息识别方法,首先找到异常部分,然后再对待识别对象分离异常部分后的分离后的待识别对象进行识别获得初始识别结果,然后根据初始识别结果以及转移概率矩阵对异常部分进行识别,即分离后的待识别对象和异常部分是分开识别的,无需对整个存在异常部分的待识别对象进行识别后再进行异常部分的识别,再对待识别对象的整个识别结果进行更新,减少识别时间,提高识别效率。且在本方案中,在待识别对象存在异常时,是通过上述转移概率矩阵更新方法确定的更新后的转移概率矩阵和初始识别结果进行异常部分的识别,更新后的转移概率矩阵的准确性好,这样在进行信息识别时,可根据更加准确的更新后的转移概率矩阵进行识别,提高识别准确性。
如图5所示,在其中一个实施例中,根据更新后的转移概率矩阵以及第一识别信息确定与异常部分对应的第二识别信息的步骤包括:
S451:根据更新后的转移概率矩阵确定与第一识别信息对应的各转移目标信息以及各转移目标信息的转移概率。
在第一识别信息确定后,再根据更新后的转移概率矩阵,确定与第一识别信息对应的各转移目标信息以及各转移目标信息的转移概率。例如,第一识别信息为字符“电”后,可确定与其对应转移目标信息包括“视”和“话”等,分别对应的转移概率也可确定,即电转移到视的转移概率可确定,电转移到话的转移概率可确定。
S452:将转移概率的值最大的预定数目的转移概率对应的转移目标信息确定为参考转移目标信息。
然而,不同的转移目标信息对应第一识别信息的转移概率不同,从而,需要将转移概率的值最大的预定数目的转移概率对应的转移目标信息确定为参考转移目标信息,以提高转移矩阵的准确性。
S453:根据各参考转移目标信息确定与第一识别信息对应的实际转移信息,并将实际转移信息确定为第二识别信息。
具体地,从各参考转移目标信息中选择与第一识别信息对应的实际转移信息,并将实际转移信息确定为第二识别信息。可从各参考转移目标信息中选择转移概率最大的转移概率的参考目标信息作为实际转移信息,可以理解,还可根据参考转移目标信息在初始识别结果中出现的次数确定与第一识别信息对应的实际转移信息,并将实际转移信息确定为第二识别信息,具体地,可从各参考转移目标信息中选择在初始识别结果中出现的次数最多的参考转移目标信息作为与第一识别信息对应的实际转移信息。
在其中一个实施例中,将转移概率的值最大的转移概率对应的转移目标信息确定为与第一识别信息对应的实际转移信息。
由于转移概率越大表示该待转移信息转移至转移目标信息的可能性越大,越表示该转移目标信息为该待转移信息常用的后接信息,从而,将转移概率的值最大的转移概率对应的转移目标信息确定为与第一识别信息对应的实际转移信息。
下面以一具体实施例对上述转移概率矩阵更新方法加以具体说明,其中,信息为字符,待识别对象为待识别字符图像,信息的转移概率矩阵为字符的转移概率矩阵。
当扫描待识别字符图像时出现部分模糊(异常部分)的时候,OCR(光学字符识别)对该异常部分是无法识别或无法达到准确识别的。因此需要辅助利用该异常部分的前后文信息对该部分进行估计,才能更好地将该异常部分进行识别。然而,由于字符样本的“文本稀疏性”,会导致对该异常部分计算的转移概率矩阵的时候存在误差,这样导致转移概率矩阵不准确,导致后续识别不准确。
例如,利用通过爬取等方式得到的1300万字(可以是报纸等文字刊物上的文字)作为字符样本,计算字符的转移概率矩阵,转移概率矩阵的结果如图6 所示。
其中,字符“水层”后面是“浅”的转移概率为1,“池园”后面接“经济”的转移概率为1,如此,若“水层”后发生模糊无法识别时,根据转移概率矩阵,后面只能接“浅”,则模糊部分的识别结果只能是“浅”,这样会导致识别准确性不高。“水层”和“池园”后面接的字符的数目均为1个,这表示转移概率矩阵存在稀疏性,一般情况下,“水层”后面不可能只接“浅”,即转移概率不可能为1,需要补充后接的转移目标字符的数目小于预设数据的待转移字符,“水层”和“池园”就是其中的2个,就需要对该转移概率矩阵进行优化。优化的方案是:当OCR***发现该转移概率矩阵出现稀疏性时,将“水层”以及“水层”与预设常用字符合并后的合并后字符,获取通过搜索引擎对“水层”进行搜索获得的第一搜索量,以及通过搜索引擎分别对与“水层”合并后的各合并后信息进行搜索获得的各第二搜索量,分别计算各第二搜索量与第一搜索量的比值,获得第一待转移信息分别转移至各预设常用信息的各第二转移概率;将第二转移概率的值最大的前预设数目的第二转移概率更新至转移概率矩阵中,获得更新后的转移概率矩阵。从而,让OCR***明白“水层”后续接的字符不仅仅是“浅”,还可以有其他字符,例如字符“深”,从而使得OCR识别的准确度大幅度提高。
请参阅图7,基于与上述转移概率矩阵更新方法相同的思想,提供一个实施例的转移概率矩阵更新装置,包括:
初始矩阵获取模块710,用于获取信息的转移概率矩阵,转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率;
信息获取模块720,用于根据转移概率矩阵,确定拟进行概率更新的各第一待转移信息;
合并模块730,用于获取与第一待转移信息对应的各预设常用信息,并将各预设常用信息分别后接至第一待转移信息,获得与第一待转移信息对应的各合并后信息;
搜索结果获取模块740,获取通过搜索引擎对第一待转移信息进行搜索获得的第一搜索量,以及通过搜索引擎分别对各合并后信息进行搜索获得的各第二搜索量;
概率计算模块750,用于分别计算各第二搜索量与第一搜索量的比值,获得第一待转移信息分别转移至各预设常用信息的各第二转移概率;
概率更新模块760,用于将第二转移概率的值最大的前预设数目的第二转移概率更新至转移概率矩阵中,获得更新后的转移概率矩阵。
在其中一个实施例中,第一待转移信息为关联的转移目标信息的数目小于预设数量的待转移信息。
请参阅图8,基于与上述信息识别方法相同的思想,提供一个实施例的信息识别装置,包括:初始分析模块810、分离模块820、初始识别模块830、子对象获取模块840、子识别模块850、识别结果更新模块860以及上述转移概率矩阵更新装置。
初始分析模块810,用于对待识别对象进行特征分析,获得特征信息;
分离模块820,用于在根据特征信息确定存在异常部分时,将异常部分从待识别对象中分离,获得分离后的待识别对象;
初始识别模块830,用于对分离后的待识别对象进行识别,获得初始识别结果;
子对象获取模块840,用于获取初始识别结果中与前相邻对象对应的第一识别信息,前相邻对象为待识别对象中、与异常部分相邻的前一个子对象;
子识别模块850,用于根据所述转移概率矩阵更新装置确定的与所述待识别对象的类型对应的更新后的转移概率矩阵,所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息;
识别结果更新模块860,用于将初始识别结果与第二识别信息进行结合,获得待识别对象的信息识别结果。
参阅图9,在其中一个实施例中,子识别模块850可以包括:
概率获取模块 851,用于根据更新后的转移概率矩阵确定与第一识别信息对应的各转移目标信息以及各转移目标信息的转移概率;
参考信息确定模块852,用于将转移概率的值最大的预定数目的转移概率对应的转移目标信息确定为参考转移目标信息;
子识别结果确定模块853,用于根据各参考转移目标信息确定与第一识别信息对应的实际转移信息,并将实际转移信息确定为第二识别信息。
在其中一个实施例中,子识别结果确定模块853,将转移概率的值最大的转移概率对应的转移目标信息确定为与第一识别信息对应的实际转移信息。
本发明的一个实施例还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述转移概率矩阵更新方法或信息识别方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机***的存储介质中,并被该计算机***中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体 (Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM) 等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种转移概率矩阵更新方法,其特征在于,包括步骤:
获取信息的转移概率矩阵,所述转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率;
根据所述转移概率矩阵,确定拟进行概率更新的各第一待转移信息;
获取与所述第一待转移信息对应的各预设常用信息,并将各所述预设常用信息分别后接至所述第一待转移信息,获得与所述第一待转移信息对应的各合并后信息;
获取通过搜索引擎对所述第一待转移信息进行搜索获得的第一搜索量,以及通过所述搜索引擎分别对各所述合并后信息进行搜索获得的各第二搜索量;
分别计算各所述第二搜索量与所述第一搜索量的比值,获得所述第一待转移信息分别转移至各所述预设常用信息的各第二转移概率;
将所述第二转移概率的值最大的前预设数目的第二转移概率更新至所述转移概率矩阵中,获得更新后的转移概率矩阵。
2.根据权利要求1所述的转移概率矩阵更新方法,其特征在于,所述第一待转移信息为关联的转移目标信息的数目小于预设数量的待转移信息。
3.一种信息识别方法,其特征在于,包括以下步骤:
对待识别对象进行特征分析,获得特征信息;
在根据特征信息确定存在异常部分时,将所述异常部分从所述待识别对象中分离,获得分离后的待识别对象;
对所述分离后的待识别对象进行识别,获得初始识别结果;
获取所述初始识别结果中与前相邻对象对应的第一识别信息,所述前相邻对象为所述待识别对象中、与所述异常部分相邻的前一个子对象;
获取采用上述权利要求1或2所述的转移概率矩阵更新方法确定的与所述待识别对象的类型对应的更新后的转移概率矩阵,根据所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息;
将所述初始识别结果与所述第二识别信息进行结合,获得所述待识别对象的信息识别结果。
4.根据权利要求3所述的信息识别方法,其特征在于,根据所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息的步骤包括:
根据所述更新后的转移概率矩阵确定与所述第一识别信息对应的各转移目标信息以及各转移目标信息的转移概率;
将转移概率的值最大的预定数目的转移概率对应的转移目标信息确定为参考转移目标信息;
根据各所述参考转移目标信息确定与所述第一识别信息对应的实际转移信息,并将所述实际转移信息确定为所述第二识别信息。
5.根据权利要求4所述的信息识别方法,其特征在于,
将转移概率的值最大的转移概率对应的转移目标信息确定为与所述第一识别信息对应的实际转移信息。
6.一种转移概率矩阵更新装置,其特征在于,包括:
初始矩阵获取模块,用于获取信息的转移概率矩阵,所述转移概率矩阵中的第一转移概率为待转移信息转移至转移目标信息的概率;
信息获取模块,用于根据所述转移概率矩阵,确定拟进行概率更新的各第一待转移信息;
合并模块,用于获取与所述第一待转移信息对应的各预设常用信息,并将各所述预设常用信息分别后接至所述第一待转移信息,获得与所述第一待转移信息对应的各合并后信息;
搜索结果获取模块,获取通过搜索引擎对所述第一待转移信息进行搜索获得的第一搜索量,以及通过所述搜索引擎分别对各所述合并后信息进行搜索获得的各第二搜索量;
概率计算模块,用于分别计算各所述第二搜索量与所述第一搜索量的比值,获得所述第一待转移信息分别转移至各所述预设常用信息的各第二转移概率;
概率更新模块,用于将所述第二转移概率的值最大的前预设数目的第二转移概率更新至所述转移概率矩阵中,获得更新后的转移概率矩阵。
7.根据权利要求6所述的转移概率矩阵更新装置,其特征在于,所述第一待转移信息为关联的转移目标信息的数目小于预设数量的待转移信息。
8.一种信息识别装置,其特征在于,包括上述权利要求6或7所述的转移概率矩阵更新装置,还包括;
初始分析模块,用于对待识别对象进行特征分析,获得特征信息;
分离模块,用于在根据特征信息确定存在异常部分时,将所述异常部分从所述待识别对象中分离,获得分离后的待识别对象;
初始识别模块,用于对所述分离后的待识别对象进行识别,获得初始识别结果;
子对象获取模块,用于获取所述初始识别结果中与前相邻对象对应的第一识别信息,所述前相邻对象为所述待识别对象中、与所述异常部分相邻的前一个子对象;
子识别模块,用于根据所述转移概率矩阵更新装置确定的与所述待识别对象的类型对应的更新后的转移概率矩阵,所述更新后的转移概率矩阵以及所述第一识别信息确定与所述异常部分对应的第二识别信息;
识别结果更新模块,用于将所述初始识别结果与所述第二识别信息进行结合,获得所述待识别对象的信息识别结果。
9.根据权利要求8所述的信息识别装置,其特征在于,所述子识别模块包括:
概率获取模块,用于根据所述更新后的转移概率矩阵确定与所述第一识别信息对应的各转移目标信息以及各转移目标信息的转移概率;
参考信息确定模块,用于将转移概率的值最大的预定数目的转移概率对应的转移目标信息确定为参考转移目标信息;
子识别结果确定模块,用于根据各所述参考转移目标信息确定与所述第一识别信息对应的实际转移信息,并将所述实际转移信息确定为所述第二识别信息。
10.根据权利要求8所述的信息识别装置,其特征在于,所述子识别结果确定模块,将转移概率的值最大的转移概率对应的转移目标信息确定为与所述第一识别信息对应的实际转移信息。
11.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任意一项所述的方法。
CN201710288225.5A 2017-04-27 2017-04-27 转移概率矩阵更新、信息识别方法及装置、计算机设备 Active CN107247724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710288225.5A CN107247724B (zh) 2017-04-27 2017-04-27 转移概率矩阵更新、信息识别方法及装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710288225.5A CN107247724B (zh) 2017-04-27 2017-04-27 转移概率矩阵更新、信息识别方法及装置、计算机设备

Publications (2)

Publication Number Publication Date
CN107247724A CN107247724A (zh) 2017-10-13
CN107247724B true CN107247724B (zh) 2018-07-20

Family

ID=60016419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710288225.5A Active CN107247724B (zh) 2017-04-27 2017-04-27 转移概率矩阵更新、信息识别方法及装置、计算机设备

Country Status (1)

Country Link
CN (1) CN107247724B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1173684A (zh) * 1996-05-21 1998-02-18 株式会社日立制作所 用于通过推理识别输入字符串的装置
JP2009252044A (ja) * 2008-04-08 2009-10-29 Canon Inc 文書管理システム、方法及びプログラム
CN101652773A (zh) * 2007-03-30 2010-02-17 微软公司 前瞻文档排名***
CN102982330A (zh) * 2012-11-21 2013-03-20 新浪网技术(中国)有限公司 文字图像中字符识别方法和识别装置
CN106156142A (zh) * 2015-04-13 2016-11-23 深圳市腾讯计算机***有限公司 一种文本聚类的处理方法、服务器及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1173684A (zh) * 1996-05-21 1998-02-18 株式会社日立制作所 用于通过推理识别输入字符串的装置
CN101652773A (zh) * 2007-03-30 2010-02-17 微软公司 前瞻文档排名***
JP2009252044A (ja) * 2008-04-08 2009-10-29 Canon Inc 文書管理システム、方法及びプログラム
CN102982330A (zh) * 2012-11-21 2013-03-20 新浪网技术(中国)有限公司 文字图像中字符识别方法和识别装置
CN106156142A (zh) * 2015-04-13 2016-11-23 深圳市腾讯计算机***有限公司 一种文本聚类的处理方法、服务器及***

Also Published As

Publication number Publication date
CN107247724A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
CN108121816B (zh) 图片分类方法、装置、存储介质及电子设备
US10748007B2 (en) Identifying objects in an image
CN107885430B (zh) 一种音频播放方法、装置、存储介质及电子设备
CN109918987A (zh) 一种视频字幕关键词识别方法及装置
CN111222397B (zh) 一种绘本识别方法、装置及机器人
CN110032510B (zh) 应用的测试方法及装置
CN105159556A (zh) 一种界面操作方法及电子终端
CN109547393B (zh) 恶意号码识别方法、装置、设备和存储介质
US20030012440A1 (en) Form recognition system, form recognition method, program and storage medium
CN111866392A (zh) 拍摄提示方法、装置、存储介质及电子设备
CN113255566B (zh) 表格图像识别方法及装置
CN105069013A (zh) 在搜索界面中提供输入接口的控制方法和装置
CN104994236A (zh) 一种信息处理方法及装置
CN112801235A (zh) 模型训练方法、预测方法、装置、重识别模型及电子设备
CN109325539A (zh) 绝缘子掉串检测方法及装置
CN107247724B (zh) 转移概率矩阵更新、信息识别方法及装置、计算机设备
CN110598027A (zh) 图像处理效果的显示方法、装置、电子设备以及存储介质
KR101483611B1 (ko) 이미지에서 객체를 추출하기 위한 방법 및 단말기
CN105528428A (zh) 一种图像显示方法及终端
CN110929057A (zh) 图像处理方法、装置和***、存储介质及电子装置
CN112528610A (zh) 一种数据标注方法、装置、电子设备及存储介质
CN111966846A (zh) 图像查询方法、装置、电子设备和存储介质
CN113378902B (zh) 一种基于优化视频特征的视频抄袭检测方法
CN104598289A (zh) 一种识别方法及一种电子设备
CN111178349A (zh) 一种图像识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant