CN107818289A - 一种药方识别方法和装置、一种用于药方识别的装置 - Google Patents

一种药方识别方法和装置、一种用于药方识别的装置 Download PDF

Info

Publication number
CN107818289A
CN107818289A CN201610823024.6A CN201610823024A CN107818289A CN 107818289 A CN107818289 A CN 107818289A CN 201610823024 A CN201610823024 A CN 201610823024A CN 107818289 A CN107818289 A CN 107818289A
Authority
CN
China
Prior art keywords
character
medicine
prescription
characters
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610823024.6A
Other languages
English (en)
Inventor
银磊
李明修
卜海亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201610823024.6A priority Critical patent/CN107818289A/zh
Publication of CN107818289A publication Critical patent/CN107818289A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供了一种药方识别方法和装置、一种用于药方识别的装置,其中的方法具体包括:按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。本发明实施例能够提高医药字符识别和药方识别的准确率。

Description

一种药方识别方法和装置、一种用于药方识别的装置
技术领域
本发明涉及医药技术领域,特别是涉及一种药方识别方法和装置、一种用于药方识别的装置。
背景技术
中医是我国的传统医学,千百年来根据人们在治疗疾病时积累的经验,形成了众多的用于治疗相应疾病的基础药方,这些基础药方是中医在治疗疾病时的参考,中医在这些基础药方的基础上,根据患者的实际症状对药量和药物作出相应的调整,以得到适合患者的中医药方。
目前的中医药方大多是通过手写完成的。现有方案可以将手写完成的中医药方转换为图片或者照片,并利用OCR(光学医药字符识别,Optical Character Recognition)技术,将图片或照片上的文字内容,转换为可编辑文本,从而完成中医药方的识别。
但是,由于每个人的手写字体都有各自的特点,特别是草书手写字体不但连笔书写,大部分笔画严重变形,而且有很多笔画会被省去。上述手写字体的特点使得现有方案很难准确地识别中医药方中对应的药物名称,这导致中医药方的识别准确率较低。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的药方识别方法、药方识别装置及用于药方识别的装置,本发明实施例能够提高医药字符识别和药方识别的准确率。
为了解决上述问题,本发明公开了一种药方识别方法,包括:
按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
可选地,当每个字符图像对应多个备选字符时,所述依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果的步骤,包括:
依据所述待识别药方的图像中所包含的每个字符图像对应的备选字符的属性特征,对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符;
依据所述待识别药方的图像中包含的所有字符图像分别对应的目标备选字符,得到所述待识别药方的图像对应的药方识别结果;
其中,所述属性特征包括如下特征中的至少一种:所述备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率。
可选地,所述属性特征包括:所述备选字符对应的医药词汇特性,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
针对每个字符图像对应的多个备选字符,利用预置医药词库来确定每个字符图像对应的目标备选字符。
可选地,所述利用预置医药词库来确定每个字符图像对应的目标备选字符的步骤,包括:
针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则将命中预置医药词库的组合字符串对应的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述利用预置医药词库来确定每个字符图像对应的目标备选字符的步骤,包括:
针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则对所述组合字符串对应的备选字符的识别概率进行加权;
对所有组合字符串判断结束后,选择识别概率最大的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的药物药性,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
依据待识别药方的图像所包含字符图像所对应药物的药性,确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药性差异度,其中,所述字符图像所对应药物为依据相邻字符图像所对应备选字符的组合得到;
依据所述药性差异度,从待筛选字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的与预置药方的药物相似度,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
确定备选字符对应待识别药方与预置药方之间的药物相似度;
在所述相似度大于相似度阈值时,从所述字符图像对应的多个备选字符中选取所述预置药方所具备的目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的药物同现概率,所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药物同现概率;
依据所述药物同现概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
依据所述医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率中的至少一种,对相应备选字符对应的识别概率进行调整;
依据调整后的识别概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述待识别药方的图像包括:多个拍摄角度的待识别药方的图像,所述方法还包括:
依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果。
可选地,所述药方识别结果包括:至少一种药物的名称,所述方法还包括:
依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称。
可选地,所述按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像,包括:
按照分隔符对待识别药方的图像进行切分,获得每种药物所对应的药物字符图像;
以字符为单位,对所述药物字符图像进行切分,获得每个字符对应的单字符图像。
可选地,所述依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果,包括:
针对每个药物字符图像,将其所包含的所有单字符图像的备选字符进行组合,以构成对应的组合字符串;
在所述药物字符图像对应多个组合字符串时,针对每个组合字符串,判断预置医药词库中是否存在包括该组合字符串的医药词汇;
当所述药物字符图像对应的多个组合字符串均命中预置医药词库时,对命中预置医药词库的多个组合字符串进行筛选,以得到对应的目标组合字符串;
将所述药物字符图像对应的目标组合字符串与其他药物字符图像所对应组合字符串进行组合,以得到对应的药方识别结果。
可选地,所述对命中预置医药词库的多个组合字符串进行筛选的步骤,包括:
当药物字符图像对应的多个组合字符串均命中预置医药词库时,依据各组合字符串对应备选药物与其他药物字符图像所对应药物之间的药性差异度,从所述多个组合字符串中选取目标组合字符串;和/或,
当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串备选药物和已定药物对应的待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;和/或,
当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从所述多个组合字符串中选取目标组合字符串。
另一方面,本发明公开了一种药方识别装置,包括:
图像切分模块,用于按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
图像识别模块,用于利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;以及
结果获取模块,用于依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
可选地,当每个字符图像对应多个备选字符时,所述结果获取模块包括:
备选字符筛选子模块,用于依据所述待识别药方的图像中所包含的每个字符图像对应的备选字符的属性特征,对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符;
结果获取子模块,用于依据所述待识别药方的图像中包含的所有字符图像分别对应的目标备选字符,得到所述待识别药方的图像对应的药方识别结果;
其中,所述属性特征包括如下特征中的至少一种:所述备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率。
可选地,所述属性特征具体包括:所述备选字符对应的医药词汇特性,则所述备选字符筛选子模块包括:
确定单元,用于针对每个字符图像对应的多个备选字符,利用预置医药词库来确定每个字符图像对应的目标备选字符。
可选地,所述确定单元包括:
组合子单元,用于针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
第一判断子单元,用于针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则将命中预置医药词库的组合字符串对应的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述确定单元包括:
组合子单元,用于针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
第二判断子单元,用于针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则对所述组合字符串对应的备选字符的识别概率进行加权;
选择子单元,用于对所有组合字符串判断结束后,选择识别概率最大的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的药物药性,则所述备选字符筛选子模块包括:
差异度确定单元,用于依据待识别药方的图像所包含字符图像所对应药物的药性,确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药性差异度,其中,所述字符图像所对应药物为依据相邻字符图像所对应备选字符的组合得到;
第一选取单元,用于依据所述药性差异度,从待筛选字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的与预置药方的药物相似度,则所述备选字符筛选子模块包括:
相似度确定单元,用于确定备选字符对应待识别药方与预置药方之间的药物相似度;
第二选取单元,用于在所述相似度大于相似度阈值时,从所述字符图像对应的多个备选字符中选取所述预置药方所具备的目标备选字符。
可选地,所述属性特征包括:所述备选字符对应的药物同现概率,则所述备选字符筛选子模块包括:
同现概率确定单元,用于确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药物同现概率;
第三选取单元,用于依据所述药物同现概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述备选字符筛选子模块包括:
概率调整单元,用于依据所述医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率中的至少一种,对相应备选字符对应的识别概率进行调整;
第四选取单元,用于依据调整后的识别概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述待识别药方的图像包括:多个拍摄角度的待识别药方的图像,则所述装置还包括:
结果选取模块,用于依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果。
可选地,所述药方识别结果包括:至少一种药物的名称,则所述装置还包括:
转换模块,用于依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称。
可选地,所述图像切分模块包括:
第一切分子模块,用于按照分隔符对待识别药方的图像进行切分,获得每种药物所对应的药物字符图像;
第二切分子模块,用于以字符为单位,对所述药物字符图像进行切分,获得每个字符对应的单字符图像。
可选地,所述结果获取模块包括:
第一组合子模块,用于针对每个药物字符图像,将其所包含的所有单字符图像的备选字符进行组合,以构成对应的组合字符串;
词汇判断子模块,用于在所述药物字符图像对应多个组合字符串时,针对每个组合字符串,判断预置医药词库中是否存在包括所述组合字符串的医药词汇;
组合字符串筛选子模块,用于当所述药物字符图像对应的多个组合字符串均命中预置医药词库时,对命中预置医药词库的多个组合字符串进行筛选,以得到对应的目标组合字符串;
第二组合子模块,用于将所述药物字符图像对应的目标组合字符串与其他药物字符图像所对应组合字符串进行组合,以得到对应的药方识别结果。
可选地,所述组合字符串筛选子模块包括:
第一组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,依据各组合字符串对应备选药物与其他药物字符图像所对应药物之间的药性差异度,从所述多个组合字符串中选取目标组合字符串;和/或,
第二组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串备选药物和已定药物对应的待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;和/或,
第三组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从所述多个组合字符串中选取目标组合字符串。
再一方面,本发明公开了一种用于药方识别的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
本发明实施例包括以下优点:
本发明实施例可以利用专门的医药字符识别库以医药字符为单位进行待识别药方的图像的识别,由于医药领域中所涉及的医药字符有限(以中医药方的识别为例,中医药材的名称是可以枚举的),识别单个字符所对应的字符图像的难度远远低于识别整个待识别药方的图像的难度,并且,还可以针对医药字符的医药字符识别库进行优化,例如可以使用预置字符的大量书写体样本进行训练,因此能够有效提高医药字符识别和药方识别的准确率。
另外,在字符图像对应的备选字符多于一个的情况下,可以依据备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率等属性特征确定备选字符的可能性,并选取可能性最大的备选字符作为目标备选字符,由此可以提高医药字符识别的准确率。
附图说明
图1是本发明的一种药方识别方法实施例一的步骤流程图;
图2是本发明的一种药方识别方法实施例二的步骤流程图;
图3是本发明的一种药方识别方法实施例三的步骤流程图;
图4是本发明的一种药方识别方法实施例四的步骤流程图;
图5是本发明的一种药方识别装置实施例的结构框图;
图6是本发明的一种用于药方识别的装置900的框图;及
图7是本发明的一些实施例中服务器的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
方法实施例一
参照图1,示出了本发明的一种药方识别方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101、按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
步骤102、利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
步骤103、依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
本发明实施例提供了一种药方识别方案,该方案可以利用专门的医药字符识别库以单个医药字符为单位对待识别药方的图像中包含的医药名进行识别,由于医药领域中所涉及的医药字符有限(以中医药方的识别为例,中医药材的名称是可以枚举的),识别单个字符对应的字符图像(以下简称单字符图像)的难度远远低于识别整个待识别药方的图像的难度,并且,还可以针对医药字符的医药字符识别库进行优化,例如可以使用单个医药字符的大量书写体样本进行训练,因此能够有效提高医药字符识别和药方识别的准确率。
本发明实施例提供的药方识别方案可以应用于医药相关网站、医药相关APP(应用程序,Application)等具有药方识别功能的应用程序中,且本发明实施例提供的药方识别方案可应用于客户端与服务器对应的应用环境中,其中,客户端与服务器可以位于有线或无线网络中,通过该有线或无线网络,客户端与服务器进行数据交互。
具体地,客户端可以运行在智能终端上,上述智能终端具体可以包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving PictureExperts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,MovingPicture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
在实际应用中,客户端可以通过预置接口获取用户输入的待识别药方的图像。例如,在接收到针对该预置接口的触发操作时,可以给出上传选项或者拍照选项,其中,用户可以依据该上传选项将预先拍摄的待识别药方的图像上传,或者,用户通过该拍照选项将手写完成的药方转换为待识别药方的图像,并将满意的待识别药方的图像上传。可以理解,本发明实施例对于待识别药方的图像的具体获取方式不加以限制。
另外,本发明实施例的待识别药方具体可以包括:中医药方、西医药方、中西医结合药方等,上述药方中可以包括各种药物对应的字符。其中,所述药物具体可以包括:药材、药品等。其中,药材即可供制药的原材料,可选地上述药材可以包括中药材,即未经加工或未制成成品的中药原料,当然,西药材也在本发明实施例的药材的涵盖范围之内。药品泛指药的成品,具体地,药品是指用于预防、治疗、诊断人的疾病,有目的地调节人的生理机能并规定有适应症或者功能主治、用法和用量的物质,具体包括但不限中药饮片、中成药、化学原料药及其制剂、抗生素、生化药品、放射性药品、血清、疫苗、血液制品和诊断药品等。为方便描述,本发明实施例将药物对应的字符统称为医药字符。
在实际应用中,待识别药方的图像中可能包括大量的字符。步骤101可以单个字符为单位,将待识别药方的图像分割为若干个单字符图像,每个单字符图像中可以包括单字符。上述分割可以按照单字符对药方图像中的字符图像进行划分。其中,在分割过程中,可以按照预设顺序(如从前到后、或者从后到前的顺序)对待识别药方的图像中的字符进行遍历,以识别单字符的边缘,进而依据该边缘得到对应的单字符图像。当然,上述基于边缘的图像分割方式只是作为可选实施例,实际上,基于阈值、区域、图论、或者能量泛函的分割方式均可以实现本发明实施例的分割,本发明实施例对具体的分割方式不加以限制。
本发明实施例中,步骤102所使用的医药字符识别库可以为具备单医药字符对应单字符图像的识别能力的学习模型,其可以接收输入的单字符图像,输出该单字符图像对应的字符。并且,上述医药字符识别库可以依据单个医药字符的图像样本集训练得到,故可以对医药字符识别库进行优化,例如可以使用单医药字符的大量书写体样本进行训练,因此能够有效提高单医药字符识别和药方识别的准确率。
在实际应用中,上述单医药字符可以来源于大数据的预置医药文本。可选地,可以将经典医书、医案、古方、成方等对应文本作为预置医药文本,并构建医药文本数据库。可选地,可以按照单个字符对上述预置医药文本对应的图像进行分割,以得到单个医药字符对应的图像,作为图像样本集。例如,可以拍摄得到成方的图像,并通过分割提取成方的图像中单医药字符的图像。
或者,可以从上述预置医药文本中得到预置医药文本所包括的各药物对应的单字符,也即单医药字符。例如,可以从成方中得到“白”、“芍”、“当”、“归”等医药字符。进一步,可以获取各单医药字符的手写字体或标准字体所对应的图像样本集。由于标准字体的识别难度较小,且考虑到中医药方多采用手写字体,故本发明实施例主要以手写字体的图像样本集及其训练和识别过程为例进行说明,标准字体的图像样本集及其训练和识别过程相互参照即可。在实际应用中,可以通过用户反馈、第三方的手写字体功能或者已有药方中手写字体的复用等方式获取各单医药字符的手写字体所对应的图像样本集,可以理解,本发明实施例对于图像样本集的具体收集方式不加以限制。
在本发明的一种可选实施例中,在图像样本集的训练过程中,可以提取图像样本集的特征,其中,该特征具体可以包括:像素值、边界点位置、水平和垂直方向平均笔画穿越数及轮廓点(也即文字各点的位置)等,在训练过程中可以对该像素值进行降维、二值化、锐化等操作。进一步,在字符图像的识别过程中,可以计算图像样本集的特征与字符图像的特征之间的相似度,将该相似度作为字符图像的识别概率,并将医药字符识别结果及对应的识别概率输出。
在本发明的一种可选实施例中,可以依据PCA(主成分分析,Principal ComponentAnalysis)、神经网络、稀疏表示等训练方法进行图像样本集的训练。其中,PCA方法可以通过线性变换将图像样本集变换为一组各维度线性无关的表示,可用于提取图像样本集的主要特征分量;稀疏表示方法可以避免目标识别问题中特征提取和分类器对分类结果产生的影响,通过大量实验,得出只要所得系数解足够稀疏,基于L1/2范数的分类能够获取更好的识别率,并且减少算法运行时间,并能准确地识别字符图像。可以理解,上述训练方法均作为可选实施例,本发明实施例对于具体的训练方法不加以限制。
在实际应用中,步骤102可以针对每个字符对应的字符图像识别得到该字符图像对应的备选字符。对于每个字符图像而言,其对应的备选字符可以是识别概率最高的一个备选字符,也可以是识别概率较高的多个备选字符,这样,步骤103可以对待识别药方的图像所包含的所有字符图像对应的备选字符进行组合,以得到对应的药方识别结果。假设待识别药方的图像的字符图像为Bj,0≤j≤m-1,每个字符图像对应的备选字符为Bjk,0≤k,则可以对B0k+B1k+B2k+…+Bm-1,k进行组合,以得到对应的药方识别结果。
在本发明的一种可选实施例中,当每个字符图像对应多个备选字符时,步骤103所述的依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果,具体可以包括:
步骤A1、依据所述待识别药方的图像中所包含的每个字符图像对应的备选字符的属性特征,对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符;
步骤A2、依据所述待识别药方的图像中包含的所有字符图像分别对应的目标备选字符,得到所述待识别药方的图像对应的药方识别结果。
其中,所述属性特征具体可以包括如下特征中的至少一种:所述备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率。
上述识别概率可以来源于医药字符识别库;医药词汇特性可用于表征备选字符或者其对应组合字符是否为医药词汇;药物药性可用于表示可用于表示药物的性质、气味和功能,例如中药药性,是指中药所具有的与治疗作用有关的性能,可概括为四气五味、归经、升降浮沉、毒性等;与预置药方的药物相似度可用于表示备选字符对应待识别药方与预置药方之间的相似度;药物同现概率可用于表示多种药物同时出现的概率。
在本发明的一种可选实施例中,在上述属性特征包括:所述备选字符对应的医药词汇特性时,步骤A1中所述的对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符,具体可以包括:针对每个字符图像对应的多个备选字符,利用预置医药词库来确定每个字符图像对应的目标备选字符。
具体的,所述利用预置医药词库来确定每个字符图像对应的目标备选字符可以包括:针对每个字符图像,将该字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;针对每个组合字符串,判断所述预置医药词库中是否存在包括该组合字符串的医药词汇;如果存在,则可以将命中预置医药词库的组合字符串对应的备选字符作为所述字符图像对应的目标备选字符。
或者,所述利用预置医药词库来确定每个字符图像对应的目标备选字符还可以包括:针对每个字符图像,将该字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;针对每个组合字符串,判断所述预置医药词库中是否存在包括该组合字符串的医药词汇,如果存在,则可以对该组合字符串对应的备选字符的识别概率进行加权。可选地,若不存在,则可以对该组合字符串对应的备选字符的识别概率进行降权;最终,对所有组合字符串判断结束后,选择识别概率最大的备选字符作为该字符图像对应的目标备选字符。
其中,该相邻字符图像可以为所述待识别药方的图像中、所述字符图像对应字符的相邻字符对应的字符图像;在该待识别药方的图像中,该相邻字符图像对应的字符可以位于该字符图像对应字符的左方或者右方,甚至在该待识别药方的图像的拍摄角度不正时,该相邻字符图像对应的字符还可以位于该字符图像对应字符的上方或者下方等,可以理解,本发明实施例对于相邻字符图像的具体方位不加以限制。
考虑到药物所对应医药词汇的长度不一(有的为2,有的为3或者其他数值),每个字符图像所对应相邻字符图像的数量可以为1或2等,例如,可以选择位于字符图像的同一个方位或者不同方位的一个或者多个相邻字符图像。本申请实施例中,可以分别将该字符图像对应的多个备选字符与一个相邻字符图像对应的至少一个备选字符,构成多个组合字符串;也可以分别将该字符图像对应的多个备选字符与多个相邻字符图像对应的多个备选字符,构成多个组合字符串。当采用多个相邻字符图像时,该多个相邻字符图像对应的字符可以位于该字符图像对应字符的相同方位,也可以分别位于该字符图像对应字符的不同方位(如分别位于左方和右方);本发明实施例中不做具体限定。
在实际应用中,可以将待筛选的备选字符所属字符图像作为待筛选字符图像。可选地,在相邻字符图像为多个时,还可以从多个相邻字符图像中选择与待筛选字符图像属于同一医药词汇的相邻字符图像。所依据的选择因子可以包括:待筛选字符图像与相邻字符图像之间的距离,其中,距离越小,则说明属于两者属于同一医药词汇的概率越大,进而对应相邻字符图像被选择的几率越大。
需要说明的是,在与待筛选字符图像属于同一医药词汇的相邻字符图像的选择过程中,还可以依据相邻字符图像对应的备选字符,对例如分隔符的相邻字符图像进行过滤。对于“,”、“、”、“:”、“(”、“)”等分隔符对应的字符图像而言,由于步骤102已经利用医药字符识别库识别得到其对应的备选字符(也即文本),故可以依据其备选字符对相邻字符图像进行过滤。可选地,可以预置分隔符对应的过滤规则,如该过滤规则为:过滤“,”、“、”、“:”等符号等。可以理解,本领域技术人员还可以根据实际应用需求,对与医药属性无关的其他字符进行过滤,例如,可以依据相邻字符图像对应的备选字符,对例如数字字符和字母字符的相邻字符图像进行过滤等。
预置医药词库可用于存储已有的医药词汇。在实际应用中,可以通过网络上已有的药材、药方百科数据、中医药词库、中医药文献等途径获取已有的医药词汇,并对所获取的医药词汇进行校验和补充,以将通过校验的医药词汇存储至预置医药词库,可以理解,本发明实施例对于预置医药词库中医药词汇的具体收集方式不加以限制。
在对待识别药方的图像上的每一个字符图像识别出对应的备选字符后,本可选实施例可以依据预置医药词库对某字符图像对应的多个备选字符进行筛选,具体地,可以检测备选字符对应的组合字符串是否在预置医药词库中存在,若存在则可以对备选字符的识别概率进行加权。否则可以对备选字符的识别概率进行降权,最终选择识别概率最大的备选字符作为目标备选字符。
在本发明的一种应用示例中,假设步骤102利用医药字符识别库识别出一个字符图像对应的备选字符包括:“未”和“术”,若位于该字符图像左方的相邻字符图象对应的备选字符为“白”,则可以分别将“未”和“术”分别与“白”构成组合字符串:“白未”和“白术”;进一步,通过查找预置医药词库可以得到,预置医药词库中存在包括“白术”的医药词汇,并不存在包括“白未”的医药词汇,故可以直接选择字符串“白术”对应的备选字符“术”作为目标备选字符;当然,也可以将字符串“白术”对应的备选字符“术”的识别概率加权,将字符串“白未”对应的备选字符“未”的识别概率降权。
在本发明的另一种可选实施例中,在所述属性特征包括:所述备选字符对应的药物药性时,步骤A1所述的对每个字符图像对应的多个备选字符进行筛选的,具体可以包括:依据待识别药方的图像所包含字符图像所对应药物的药性,确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药性差异度,其中,所述字符图像所对应药物为依据相邻字符图像所对应备选字符的组合得到;依据所述药性差异度,从待筛选字符图像对应的多个备选字符中选取目标备选字符。
上述药性差异度也即待识别药方中药物之间的药性差异度,对于某待筛选字符图像而言,可以依据其对应的多个备选字符得到对应的多个备选药物,则可以计算各备选药物与其他字符图像所对应药物之间的药性差异度;进一步,当某药性差异度符合预置的药性接近条件,则可以认为相应备选字符的可能性比较大,反之,则可以认为该备选字符的可能性比较小。
在此提供一种字符图像所对应药物的获取过程,具体地,可以将一个字符图像的备选字符与相邻字符图像对应的备选字符,构成对应的组合字符串,并针对每个组合字符串,判断预置医药词库中是否存在包括该组合字符串的医药词汇;如果存在,则可以将命中预置医药词库的组合字符串作为对应药物的标识。假设待识别药方的图像的字符图像为Bj,0≤j≤m-1,每个字符图像对应的备选字符为Bjk,0≤k,则可以将Bjk与相邻字符对象的备选字符构成组合字符串。例如,可以将B0k与B1k构成组合字符串,或者,将B2k与B3k构成组合字符串等。
在本发明的一种可选实施例中,当一个字符图像的多个备选字符与相邻字符图像对应的备选字符构成对应的多个组合字符串时,若多个组合字符串均命中预置医药词库,则可以依据各组合字符串对应备选药物与其他字符图像所对应药物之间的药性差异度,对该字符图像的多个备选字符进行筛选。
在本发明的一种应用示例中,假设步骤102医药字符识别库识别出某字符图像的备选字符包括:“木”或者“术”,位于该该字符图像左方的相邻字符图像的备选字符为“白”,则可以通过组合得到组合字符串:“白木”、“白术”,假设“白木”、“白术”均命中预置医药词库,则可以得到该字符图像所对应药物可能为“白木”或“白术”;假设通过前述方法得到了待识别药方的图像中其他药物:“柴胡”、“当归”、“白芍”、“茯苓”、“生姜”、“薄荷”、“炙甘草”,则结合药性,“白术”性温属脾胃,有健脾益气的功效,与其他几味药物的药功效接近,而“白木”这味药材属肝肾,主治跌打肿痛与其他几味药差距较远,故可以认为“白术”的可能性更大,因此可以选择“术”,而丢弃“木”。
在本发明的再一种可选实施例中,在所述属性特征包括:所述备选字符对应的待识别药方与预置药方的药物相似度时,所述对每个字符图像对应的多个备选字符进行筛选的步骤A1,具体可以包括:确定备选字符对应待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述字符图像对应的多个备选字符中选取所述预置药方所具备的目标备选字符。
本可选实施例可以应用于待识别药方中大部分药物已定的情形,为了方便描述,可以将待识别药方划分为:已定药物和备选药物,其中,已定药物可以依据识别概率、医药词汇特性等属性特征得到,备选药物可以依据字符图像对应的多个备选字符得到,则上述步骤A1可以对未定药物对应的多个备选字符进行筛选。其中,若依据字符图像对应的多个备选字符与相邻字符图像的备选字符构成的多个组合字符串命中了预置医药词库,则该多个组合字符串与备选药物相应,假设组合字符串的数量为N,则N个组合字符串中至少2个命中了预置医药词库。
在实际应用中,可以将待识别药方中已定药物与预置药方的药物进行匹配,以计算二者的药物相似度。例如,待识别药方包括:已定药物“柴胡”、“当归”、“白芍”、“茯苓”、“生姜”、“薄荷”、“炙甘草”、以及备选药物“白术”和“白木”,经计算可知,该待识别药方与预置药方“逍遥散”的药物相似度高达87%,但是“逍遥散”中并没有“白木”这味药,而有“白术”这味药,于是可以从备选药物“白术”和“白木”选择“白术”。
在本发明的又一种可选实施例中,在所述属性特征包括:所述备选字符对应的药物同现概率时,所述对每个字符图像对应的多个备选字符进行筛选的步骤A1,具体可以包括:确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
药物同现概率可用于表示多种药物同时出现的概率,其数值可以在[0,1]之间。在此提供药物同现概率的统计方式的实现过程示例,上述统计方式可以为机器学习方式等。例如,可以根据两个医药词汇是否经常在同一预置药物文本中出现,来确定该两个医药词汇之间的关系。另外,可以依据多种两个医药词汇之间的关系进行医药词汇之间的关系的挖掘,例如,医药词汇A和医药词汇B经常同时出现,且医药词汇B和医药词汇C经常同时出现,则可以认为医药词汇A和医药词汇C也比较接近,因此可以给予较高的数值。可以理解,本发明实施例对于药物同现概率的具体获取式不加以限制。
在实际应用中,一种备选字符对应备选药物与其他药物之间的药物同现概率越大,可以认为该备选字符对应备选药物的可能性越大,反之,可以认为该备选字符对应备选药物的可能性越小,基于此可以进行目标备选字符的选取。
在本发明的一种可选实施例中,上述对每个字符图像对应的多个备选字符进行筛选的步骤A1,具体可以包括:依据所述医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率中的至少一种,对相应备选字符对应的识别概率进行调整;依据调整后的识别概率,从所述字符图像对应的多个备选字符中选取目标备选字符。例如,在备选字符的医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率较强时,可以对备选字符的可能性进行加权。否则可以对备选字符的可能性进行降权,最终可以选取识别概率最大的备选字符,作为目标备选字符。其中,每种属性特征均可以具有对应的权重,加权对应的权重可以大于1,降权对应的权重可以小于1,可以理解,本发明实施例对于具体的调整过程不加以限制。
在实际应用中,上述步骤A2可以按照在待识别药方中的位置顺序,对目标备选字符进行组合,以得到对应的药方识别结果。进一步,客户端可以向用户展现该药方识别结果。例如,一种药方识别结果的示例可以为:熟地黄(1g)、白芍(1g)、当归(1g)、川穹(1g)。
综上,本发明实施例的药方识别方法,可以利用专门的医药字符识别库以医药字符为单位进行待识别药方的图像的识别,由于医药领域中所涉及的医药字符有限(以中医药方的识别为例,中医药材的名称是可以枚举的),识别每个字符所对应的字符图像的难度远远低于识别整个待识别药方的图像的难度,并且,还可以针对医药字符的医药字符识别库进行优化,例如可以使用单个医药字符的大量书写体样本进行训练,因此能够有效提高医药字符识别和药方识别的准确率。
另外,在上述字符图像对应的备选字符可能不止一个的情况下,可以依据备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率等属性特征确定备选字符的可能性,并选取可能性最大的备选字符作为目标备选字符,由此可以提高医药字符识别的准确率。
方法实施例二
参照图2,示出了本发明的一种药方识别方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201、按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
步骤202、利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
步骤203、依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果;
相对于图1所示方法实施例一,本实施例中待识别药方的图像具体可以包括:多个拍摄角度的待识别药方的图像,所述方法还可以包括:
步骤204、依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果。
在实际应用中,在待识别药方的图像为用户自行拍摄的图像时,待识别药方的图像可能因为角度不正而影响识别结果的准确度。针对上述问题,本发明实施例可以针对多个拍摄角度的待识别药方的图像,获取多个药方识别结果,并依据药方识别结果所包含药物的数量,从多个药方识别结果中选取最优的药方识别结果。通常来说,药方识别结果所包含药物的数量越多则对应的拍摄角度越正,因此可以选取包含药物最多的药方识别结果作为最优的药方识别结果。
在具体实现中,在接收到用户针对该预置接口的触发操作时,客户端在展现拍照选项时,可以通过语音或界面等方式给出相应的多角度提示信息,以使用户拍摄多个拍摄角度的待识别药方的图像并上传。其中,可以在上传多个待识别药方的图像后再执行本发明实施例的药方识别流程,或者,可以在上传一个待识别药方的图像后即执行本发明实施例的药方识别流程,并在一次识别完成后提示用户继续上传下一个待识别药方的图像,然后执行本发明实施例的药方识别流程,可以理解,本发明实施例对于多个拍摄角度的待识别药方的图像的采集和识别顺序不加以限制。
综上,本发明实施例依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果,能够选取拍摄角度最正的图像所对应的药方识别结果,因此能够提高药方识别的准确度。
方法实施例三
参照图3,示出了本发明的一种药方识别方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤301、按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
步骤302、利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
步骤303、依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果;
相对于图1所示方法实施例一或者图2所示方法实施例二,本实施例中所述药方识别结果包括:至少一种药物的名称,所述方法还可以包括:
步骤304、依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称。
具体的,判断所述药方识别结果中是否存在药物的名称为简称,如果存在,则依据药物对应的简称与全称之间的映射关系,将所述简称转换为所述药物的全称。
在实际应用中,例如西医药方的药方中可能存在字迹不清或者医生常用字符或单词缩写代替药品名的问题。针对上述问题,本发明实施例可以依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称,并将药物的全称提供给用户,不仅能够降低药方阅读的难度,而且能够提高药方录入的效率。
例如,药品“阿莫西林”的简称为“Amoxil”,有些医生习惯在药方中采用“Amoxil”,则可以利用“Amoxil”与“阿莫西林”的映射关系获得药方中“Amoxil”对应的全称。
在实际应用中,上述简称可以为药物的简单称呼或者部分字符。具体地,可以针对每一种药物,将其名称作为全称,将其对应的医生常用字符或缩写、或者其中的部分字符作为简称,以得到简称与全称之间的映射关系。这样,即使药方中存在字迹不清的问题,也可以依据字迹清楚的部分字符查找得到对应的全称,或者,即使药方中存在医生常用字符或单词缩写,也可以查找得到对应的全称,因此能够降低药方阅读的难度。
考虑到药方中药物信息的错误问题,在本发明的一种可选实施例中,还可以依据药物对应的错误信息与正确信息之间的映射关系,对所述药方识别结果中药物的名称进行纠错处理。其中,上述错误信息、正确信息可以与药物名称相应,其中,正确信息可以为药物名称,错误信息可以为常见的药物名称的错误用法,例如,“Amoxil”的错误信息可以为“amoxll”,“白及”的错误信息可以为“白芨”,“黄连”的错误信息可以为“黄莲”,“穿心莲”的错误信息可以为“穿心连”等。
需要说明的是,可以将上述药物对应的错误信息与正确信息之间的映射关系、与药物对应的简称与全称之间的映射关系结合使用。例如,可以首先进行简称的纠错,然后将正确的简称转换为全称,首先将“amoxll”纠正为“amoxil”然后将“amoxil”转换为中文“阿莫西林”等。
在本发明的一种可选实施例中,除了提供药物的全称外,还可以向用户提供药物的相关信息。以西药药品为例,其对应的相关信息具体可以包括:商品名、通用名、规格、生产厂家、批次号、批准文号、功能主治、禁忌、不良反应、及保质期等信息。以中药药品为例,其对应的相关信息具体可以包括:名称、产地、规格、保质期、批准文号等。以中医药材为例,其对应的相关信息具体可以包括:形态特征、地理分布、价值、鉴别等信息。
方法实施例四
参照图4,示出了本发明的一种药方识别方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤401、按照分隔符对待识别药方的图像进行切分,获得每种药物所对应的药物字符图像;
在实际应用中,待识别药方中可以包括用于分割药物的分隔符,如“,”、“、”、“:”、“(”、“)”、空格等,可以利用图像识别技术识别得到上述分隔符,并按照分隔符对待识别药方的图像进行切分,以得到以药物为单位的药物字符图像。
步骤402、以字符为单位,对所述药物字符图像进行切分,获得每个字符对应的单字符图像;
步骤403、利用医药字符识别库分别对每个单字符图像进行识别,得到每个单字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
步骤404、针对每个药物字符图像,将其所包含的所有单字符图像的备选字符进行组合,以构成对应的组合字符串;
具体地,可以将每个药物字符图像所包含的相邻单字符图像之间的备选字符进行组合,以构成对应的组合字符串。其中,在某单字符图像对应多个备选字符时,可以得到多个组合字符串。例如,一个药物字符图像包含2个单字符图像,其中,第一个单字符图像对应的备选字符为“白”,第二个单字符图像对应的备选字符包括:“未”和“术”,则可以分别将“未”和“术”分别与“白”构成组合字符串:“白未”和“白术”。
步骤405、在药物字符图像对应多个组合字符串时,针对每个组合字符串,判断预置医药词库中是否存在包括该组合字符串的医药词汇;如果存在,则判断命中预置医药词库的组合字符串的数目是否大于1,若是,则确定药物字符图像对应药物为备选药物,并执行步骤406或者步骤407或者步骤408,否则,确定药物字符图像对应药物为已定药物;
当所述药物字符图像对应的多个组合字符串均命中预置医药词库时,可以通过步骤406、步骤407和步骤408中的至少一种,对命中预置医药词库的多个组合字符串进行筛选,以得到对应的目标组合字符串。
步骤406、当药物字符图像对应的多个组合字符串均命中预置医药词库时,依据各组合字符串对应备选药物与其他药物字符图像所对应药物之间的药性差异度,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;
假设某药物字符图像对应的组合字符串为:“白木”和“白术”,且通过前述方法得到了待识别药方的图像中其他药物:“柴胡”、“当归”、“白芍”、“茯苓”、“生姜”、“薄荷”、“炙甘草”,则结合药性,“白术”性温属脾胃,有健脾益气的功效,与其他几味药物的药功效接近,而“白木”这味药材属肝肾,主治跌打肿痛与其他几味药差距较远,故可以认为“白术”的可能性更大,因此可以选择“白术”,而丢弃“白木”。
需要说明的是,药物字符图像对应的多个组合字符串均命中预置医药词库具体指,药物字符图像对应的组合字符串中有多个命中了预置医药词库,例如,药物字符图像对应P个组合字符串,则该P个组合字符串中的全部或者部分均命中预置医药词库,P为大于1的整数。
步骤407、当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物和已定药物对应的待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;
例如,待识别药方包括:已定药物“柴胡”、“当归”、“白芍”、“茯苓”、“生姜”、“薄荷”、“炙甘草”、以及备选药物“白术”和“白木”,经计算可知,该待识别药方与预置药方“逍遥散”的药物相似度高达87%,但是“逍遥散”中并没有“白木”这味药,而有“白术”这味药,于是可以从备选药物“白术”和“白木”选择“白术”。
步骤408、当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从过个组合字符串中选取目标组合字符串;
需要说明的是,步骤406、步骤407或者步骤408从所述多个组合字符串中选取目标组合字符串的过程中可以使用备选字符的识别概率,并且,步骤406、步骤407和步骤408可以结合使用。
步骤409、对步骤406、步骤407和步骤408中至少一者输出的目标组合字符串与其他药物字符图像所对应组合字符串进行组合,以得到对应的药方识别结果。
在实际应用中,可以按照药物字符图像在待识别药方中的位置顺序,对组合字符串进行组合,以得到对应的药方识别结果。例如,一种药方识别结果的示例可以为:熟地黄(1g)、白芍(1g)、当归(1g)、川穹(1g)。
综上,本发明实施例的药方识别方法,可以利用专门的医药字符识别库以医药字符为单位进行待识别药方的单字符图像的识别,由于医药领域中所涉及的医药字符有限(以中医药方的识别为例,中医药材的名称是可以枚举的),识别每个字符所对应的字符图像的难度远远低于识别整个待识别药方的图像的难度,并且,还可以针对医药字符的医药字符识别库进行优化,例如可以使用单个医药字符的大量书写体样本进行训练,因此能够有效提高医药字符识别和药方识别的准确率。
另外,在得到每个单字符图像对应的备选字符后,还可以依据药物字符图像所包含所有单字符图像的备选字符构成组合字符串,并以药物为单位,对组合字符串进行筛选,因此能够提高组合字符串筛选的合理性,从而能够有效提高药物字符识别和药方识别的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图5,示出了本发明的一种药方识别装置实施例的结构框图,具体可以包括:图像切分模块501、图像识别模块502和结果获取模块503。
图像切分模块501,用于按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
图像识别模块502,用于利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库可以依据医药字符的图像样本集训练得到;以及
结果获取模块503,用于依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
可选地,当每个字符图像对应多个备选字符时,所述结果获取模块503具体可以包括:
备选字符筛选子模块,用于依据所述待识别药方的图像中所包含的每个字符图像对应的备选字符的属性特征,对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符;
结果获取子模块,用于依据所述待识别药方的图像中包含的所有字符图像分别对应的目标备选字符,得到所述待识别药方的图像对应的药方识别结果;
其中,所述属性特征具体可以包括如下特征中的至少一种:所述备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率。
可选地,所述属性特征具体包括:所述备选字符对应的医药词汇特性,则所述备选字符筛选子模块具体可以包括:
确定单元,用于针对每个字符图像对应的多个备选字符,利用预置医药词库来确定每个字符图像对应的目标备选字符。
可选地,所述确定单元具体可以包括:
组合子单元,用于针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
第一判断子单元,用于针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则将命中预置医药词库的组合字符串对应的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述确定单元具体可以包括:
组合子单元,用于针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
第二判断子单元,用于针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则对所述组合字符串对应的备选字符的识别概率进行加权;
选择子单元,用于对所有组合字符串判断结束后,选择识别概率最大的备选字符作为所述字符图像对应的目标备选字符。
可选地,所述属性特征可以包括:所述备选字符对应的药物药性,则所述备选字符筛选子模块具体可以包括:
差异度确定单元,用于依据待识别药方的图像所包含字符图像所对应药物的药性,确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药性差异度,其中,所述字符图像所对应药物为依据相邻字符图像所对应备选字符的组合得到;
第一选取单元,用于依据所述药性差异度,从待筛选字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述属性特征可以包括:所述备选字符对应的与预置药方的药物相似度,则所述备选字符筛选子模块具体可以包括:
相似度确定单元,用于确定备选字符对应待识别药方与预置药方之间的药物相似度;
第二选取单元,用于在所述相似度大于相似度阈值时,从所述字符图像对应的多个备选字符中选取所述预置药方所具备的目标备选字符。
可选地,所述属性特征可以包括:所述备选字符对应的药物同现概率,则所述备选字符筛选子模块可以包括:
同现概率确定单元,用于确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药物同现概率;
第三选取单元,用于依据所述药物同现概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述备选字符筛选子模块可以包括:
概率调整单元,用于依据所述医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率中的至少一种,对相应备选字符对应的识别概率进行调整;
第四选取单元,用于依据调整后的识别概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
可选地,所述待识别药方的图像具体可以包括:多个拍摄角度的待识别药方的图像,则所述装置还可以包括:
结果选取模块,用于依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果。
可选地,所述药方识别结果具体可以包括:至少一种药物的名称,则所述装置还可以包括:
转换模块,用于依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称。
可选地,上述图像切分模块501具体可以包括:
第一切分子模块,用于按照分隔符对待识别药方的图像进行切分,获得每种药物所对应的药物字符图像;
第二切分子模块,用于以字符为单位,对所述药物字符图像进行切分,获得每个字符对应的单字符图像。
可选地,上述结果获取模块503具体可以包括:
第一组合子模块,用于针对每个药物字符图像,将其所包含的所有单字符图像的备选字符进行组合,以构成对应的组合字符串;
词汇判断子模块,用于在所述药物字符图像对应多个组合字符串时,针对每个组合字符串,判断预置医药词库中是否存在包括该组合字符串的医药词汇;
组合字符串筛选子模块,用于当所述药物字符图像对应的多个组合字符串均命中预置医药词库时,对命中预置医药词库的多个组合字符串进行筛选,以得到对应的目标组合字符串;
第二组合子模块,用于将所述药物字符图像对应的目标组合字符串与其他药物字符图像所对应组合字符串进行组合,以得到对应的药方识别结果。
可选地,上述组合字符串筛选子模块具体可以包括:
第一组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,依据各组合字符串对应备选药物与其他药物字符图像所对应药物之间的药性差异度,从所述多个组合字符串中选取目标组合字符串;和/或,
第二组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串备选药物和已定药物对应的待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;和/或,
第三组合字符串筛选单元,用于当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从所述多个组合字符串中选取目标组合字符串。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于药方识别的装置900的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器930来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理***,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器630执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能终端的处理器执行时,使得智能终端能够执行一种药方识别方法,所述方法包括:按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
图7是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作***1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种药方识别方法、一种药方识别装置和一种用于药方识别的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种药方识别方法,其特征在于,包括:
按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
2.根据权利要求1所述的方法,其特征在于,当每个字符图像对应多个备选字符时,所述依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果的步骤,包括:
依据所述待识别药方的图像中所包含的每个字符图像对应的备选字符的属性特征,对每个字符图像对应的多个备选字符进行筛选,以得到每个字符图像对应的目标备选字符;
依据所述待识别药方的图像中包含的所有字符图像分别对应的目标备选字符,得到所述待识别药方的图像对应的药方识别结果;
其中,所述属性特征包括如下特征中的至少一种:所述备选字符对应的识别概率、医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率。
3.根据权利要求2所述的方法,其特征在于,所述属性特征包括:所述备选字符对应的医药词汇特性,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
针对每个字符图像对应的多个备选字符,利用预置医药词库来确定每个字符图像对应的目标备选字符。
4.根据权利要求3所述的方法,其特征在于,所述利用预置医药词库来确定每个字符图像对应的目标备选字符的步骤,包括:
针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则将命中预置医药词库的组合字符串对应的备选字符作为所述字符图像对应的目标备选字符。
5.根据权利要求3所述的方法,其特征在于,所述利用预置医药词库来确定每个字符图像对应的目标备选字符的步骤,包括:
针对每个字符图像,将所述字符图像对应的多个备选字符与相邻字符图像对应的多个备选字符,构成多个组合字符串;
针对每个组合字符串,判断所述预置医药词库中是否存在包括所述组合字符串的医药词汇;如果存在,则对所述组合字符串对应的备选字符的识别概率进行加权;
对所有组合字符串判断结束后,选择识别概率最大的备选字符作为所述字符图像对应的目标备选字符。
6.根据权利要求2所述的方法,其特征在于,所述属性特征包括:所述备选字符对应的药物药性,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
依据待识别药方的图像所包含字符图像对应药物的药性,确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药性差异度,其中,所述字符图像所对应药物为依据相邻字符图像所对应备选字符的组合得到;
依据所述药性差异度,从待筛选字符图像对应的多个备选字符中选取目标备选字符。
7.根据权利要求2所述的方法,其特征在于,所述属性特征包括:所述备选字符对应的与预置药方的药物相似度,则所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
确定备选字符对应待识别药方与预置药方之间的药物相似度;
在所述相似度大于相似度阈值时,从所述字符图像对应的多个备选字符中选取所述预置药方所具备的目标备选字符。
8.根据权利要求2所述的方法,其特征在于,所述属性特征包括:所述备选字符对应的药物同现概率,所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
确定待筛选字符图像的各备选药物与其他字符图像所对应药物之间的药物同现概率;
依据所述药物同现概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
9.根据权利要求2所述的方法,其特征在于,所述对每个字符图像对应的多个备选字符进行筛选的步骤,包括:
依据所述医药词汇特性、药物药性、与预置药方的药物相似度和药物同现概率中的至少一种,对相应备选字符对应的识别概率进行调整;
依据调整后的识别概率,从所述字符图像对应的多个备选字符中选取目标备选字符。
10.根据权利要求1至9中任一所述的方法,其特征在于,所述待识别药方的图像包括:多个拍摄角度的待识别药方的图像,所述方法还包括:
依据药方识别结果所包含药物的数量,从所述多个拍摄角度的待识别药方的图像对应的多个药方识别结果中选取最优的药方识别结果。
11.根据权利要求1至9中任一所述的方法,其特征在于,所述药方识别结果包括:至少一种药物的名称,所述方法还包括:
依据药物对应的简称与全称之间的映射关系,将所述药方识别结果中药物的名称的简称转换为全称。
12.根据权利要求1所述的方法,其特征在于,所述按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像,包括:
按照分隔符对待识别药方的图像进行切分,获得每种药物所对应的药物字符图像;
以字符为单位,对所述药物字符图像进行切分,获得每个字符对应的单字符图像。
13.根据权利要求12所述的方法,其特征在于,所述依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果,包括:
针对每个药物字符图像,将其所包含的所有单字符图像的备选字符进行组合,以构成对应的组合字符串;
在所述药物字符图像对应多个组合字符串时,针对每个组合字符串,判断预置医药词库中是否存在包括所述组合字符串的医药词汇;
当所述药物字符图像对应的多个组合字符串均命中预置医药词库时,对命中预置医药词库的多个组合字符串进行筛选,以得到对应的目标组合字符串;
将所述药物字符图像对应的目标组合字符串与其他药物字符图像所对应组合字符串进行组合,以得到对应的药方识别结果。
14.根据权利要求13所述的方法,其特征在于,所述对命中预置医药词库的多个组合字符串进行筛选的步骤,包括:
当药物字符图像对应的多个组合字符串均命中预置医药词库时,依据各组合字符串对应备选药物与其他药物字符图像所对应药物之间的药性差异度,从所述多个组合字符串中选取目标组合字符串;和/或,
当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串备选药物和已定药物对应的待识别药方与预置药方之间的药物相似度;在所述相似度大于相似度阈值时,从所述多个组合字符串中选取所述预置药方所具备的目标组合字符串;和/或,
当药物字符图像对应的多个组合字符串均命中预置医药词库时,确定各组合字符串对应备选药物与其他字符图像所对应药物之间的药物同现概率;依据所述药物同现概率,从所述多个组合字符串中选取目标组合字符串。
15.一种药方识别装置,其特征在于,包括:
图像切分模块,用于按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
图像识别模块,用于利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;以及
结果获取模块,用于依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
16.一种用于药方识别的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
按照字符对待识别药方的图像进行切分,获得每个字符所对应的字符图像;
利用医药字符识别库分别对每个字符图像进行识别,得到每个字符图像对应的备选字符;所述医药字符识别库依据医药字符的图像样本集训练得到;
依据所述待识别药方的图像所包含的所有字符图像对应的备选字符,得到所述待识别药方的图像对应的药方识别结果。
CN201610823024.6A 2016-09-13 2016-09-13 一种药方识别方法和装置、一种用于药方识别的装置 Pending CN107818289A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610823024.6A CN107818289A (zh) 2016-09-13 2016-09-13 一种药方识别方法和装置、一种用于药方识别的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610823024.6A CN107818289A (zh) 2016-09-13 2016-09-13 一种药方识别方法和装置、一种用于药方识别的装置

Publications (1)

Publication Number Publication Date
CN107818289A true CN107818289A (zh) 2018-03-20

Family

ID=61601148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610823024.6A Pending CN107818289A (zh) 2016-09-13 2016-09-13 一种药方识别方法和装置、一种用于药方识别的装置

Country Status (1)

Country Link
CN (1) CN107818289A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664471A (zh) * 2018-05-07 2018-10-16 平安普惠企业管理有限公司 文字识别纠错方法、装置、设备及计算机可读存储介质
CN109801716A (zh) * 2019-03-13 2019-05-24 天津红康云健康科技有限公司 一种基于图像识别技术的智能拍照开方***
CN110287486A (zh) * 2019-06-17 2019-09-27 迪普佰奥生物科技(上海)有限公司 基于人工智能的生物医药产品识别方法、装置、终端、介质
WO2019232869A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写模型训练方法、文本识别方法、装置、设备及介质
CN111340029A (zh) * 2018-12-19 2020-06-26 富士通株式会社 用于识别收件人地址中的至少部分地址的装置和方法
CN113205047A (zh) * 2021-04-30 2021-08-03 平安科技(深圳)有限公司 药名识别方法、装置、计算机设备和存储介质
CN113517050A (zh) * 2021-04-23 2021-10-19 联仁健康医疗大数据科技股份有限公司 确定药方单的方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314616A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 自适应脱机手写识别方法和装置
CN104933429A (zh) * 2015-06-01 2015-09-23 深圳市诺比邻科技有限公司 图像中信息提取的方法及装置
CN105930844A (zh) * 2016-04-20 2016-09-07 西北工业大学 提高纸质医疗化验单手机扫描识别率的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314616A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 自适应脱机手写识别方法和装置
CN104933429A (zh) * 2015-06-01 2015-09-23 深圳市诺比邻科技有限公司 图像中信息提取的方法及装置
CN105930844A (zh) * 2016-04-20 2016-09-07 西北工业大学 提高纸质医疗化验单手机扫描识别率的方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664471A (zh) * 2018-05-07 2018-10-16 平安普惠企业管理有限公司 文字识别纠错方法、装置、设备及计算机可读存储介质
CN108664471B (zh) * 2018-05-07 2024-01-23 北京第一因科技有限公司 文字识别纠错方法、装置、设备及计算机可读存储介质
WO2019232869A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写模型训练方法、文本识别方法、装置、设备及介质
CN111340029A (zh) * 2018-12-19 2020-06-26 富士通株式会社 用于识别收件人地址中的至少部分地址的装置和方法
CN109801716A (zh) * 2019-03-13 2019-05-24 天津红康云健康科技有限公司 一种基于图像识别技术的智能拍照开方***
CN110287486A (zh) * 2019-06-17 2019-09-27 迪普佰奥生物科技(上海)有限公司 基于人工智能的生物医药产品识别方法、装置、终端、介质
CN113517050A (zh) * 2021-04-23 2021-10-19 联仁健康医疗大数据科技股份有限公司 确定药方单的方法、装置、电子设备及存储介质
CN113205047A (zh) * 2021-04-30 2021-08-03 平安科技(深圳)有限公司 药名识别方法、装置、计算机设备和存储介质
WO2022227218A1 (zh) * 2021-04-30 2022-11-03 平安科技(深圳)有限公司 药名识别方法、装置、计算机设备和存储介质
CN113205047B (zh) * 2021-04-30 2024-05-10 平安科技(深圳)有限公司 药名识别方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN107818289A (zh) 一种药方识别方法和装置、一种用于药方识别的装置
US20190147292A1 (en) Image retrieving apparatus, image retrieving method, and setting screen used therefor
CN108229130B (zh) 一种验证方法及装置
AU2016291660B2 (en) Apparatus and methods for facial recognition and video analytics to identify individuals in contextual video streams
CN107169078A (zh) 中医药知识图谱及其建立方法以及计算机***
US9223297B2 (en) Systems and methods for identifying a user of an electronic device
Kwon et al. First person action recognition via two-stream convnet with long-term fusion pooling
JP5963609B2 (ja) 画像処理装置、画像処理方法
CN108899072B (zh) 中药药方推荐方法、装置、计算机设备和存储介质
CN109740168A (zh) 一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法
Li et al. Unsupervised variational video hashing with 1D-CNN-LSTM networks
CN105654033A (zh) 人脸图像验证方法和装置
Xiao et al. Recognizing sports activities from video frames using deformable convolution and adaptive multiscale features
CN107870677A (zh) 一种输入方法、装置和用于输入的装置
CN104598648B (zh) 一种微博用户交互式性别识别方法及装置
CN110414433A (zh) 图像处理方法、装置、存储介质和计算机设备
CN104199838B (zh) 一种基于标签消歧的用户模型建构方法
CN108153843A (zh) 一种基于云平台的医疗信息个性化推荐方法及***
CN107590146A (zh) 一种药方匹配方法和装置、一种用于药方匹配的装置
Avola et al. Medicinal boxes recognition on a deep transfer learning augmented reality mobile application
CN109635303A (zh) 特定领域意义改变词的识别方法
CN108596241A (zh) 一种基于多维感知数据的用户性别快速分类方法
Quet et al. Technologies without borders? The digitization of society in a postcolonial world
CN106960215A (zh) 一种基于云平台实现医疗图像深度匹配的方法及***
CN113128278A (zh) 一种图像识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180320

RJ01 Rejection of invention patent application after publication