CN113064497A - 语句识别的方法、装置、设备及计算机存储介质 - Google Patents

语句识别的方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN113064497A
CN113064497A CN202110310856.9A CN202110310856A CN113064497A CN 113064497 A CN113064497 A CN 113064497A CN 202110310856 A CN202110310856 A CN 202110310856A CN 113064497 A CN113064497 A CN 113064497A
Authority
CN
China
Prior art keywords
sentence
character
segmentation
input
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110310856.9A
Other languages
English (en)
Inventor
费腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chenxing Software Technology Co ltd
Original Assignee
Shanghai Chenxing Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chenxing Software Technology Co ltd filed Critical Shanghai Chenxing Software Technology Co ltd
Priority to CN202110310856.9A priority Critical patent/CN113064497A/zh
Publication of CN113064497A publication Critical patent/CN113064497A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)

Abstract

本申请实施例提供了一种语句识别的方法、装置、设备及计算机存储介质,通过接收用户在输入法界面内输入第一语句的输入,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,切分模型对语句中各个文字间的任意间距都可以进行切分,保证了语句切分的准确性;通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;通过预设语言模型组合至少一个识别文字,得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。

Description

语句识别的方法、装置、设备及计算机存储介质
技术领域
本申请属于输入法技术领域,尤其涉及一种语句识别的方法、装置、设备及计算机存储介质。
背景技术
随着互联网的普及,越来越广泛的群体接触到移动智能终端。在移动智能终端的使用中,输入法是一个不可或缺的应用程序。输入法的输入方式包括键盘输入、手写输入、语音输入,其中,手写输入方式对于不习惯使用键盘输入方式和语音输入方式的群体来说,极大地提高了他们使用移动智能终端的便捷性。
目前,手写输入方式采用光学字符识别(Optical Character Recognition,OCR)技术对含有手写语句的图像进行分析,获取图像中的文字,OCR技术识别的文字需间距固定、大小一样、字体方正。用户手写的语句情况比较复杂,文字间距不固定、大小不一、字体随意,尤其是,尤其连写或者叠写的情况,OCR技术对用户手写的语句识别不准确,降低用户输入语句的速度,影响用户使用体验。
发明内容
本申请实施例提供一种语句识别的方法、装置、设备及计算机存储介质,能够提高对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
第一方面,本申请实施例提供一种语句识别的方法,方法包括:
接收用户在输入法界面内输入第一语句的输入;
根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹;
通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;
通过预设语言模型组合至少一个识别文字,得到第二语句。
在一种可能的实现方式中,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,包括:
根据第一语句的输入轨迹,通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值;
当概率值大于预设阈值时,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
在一种可能的实现方式中,通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,包括:
通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个文字的切分轨迹的至少一个第一识别文字,其中,每个第一识别文字对应一个目标概率值,该目标概率值表征文字的切分轨迹与识别字库中预设文字为同一文字的概率值;
确定至少一个文字的切分轨迹的至少一个第一识别文字的概率值中最大概率值对应的第一识别文字为至少一个识别文字。
在一种可能的实现方式中,通过预设语言模型组合至少一个识别文字,得到第二语句,包括:
通过预设语言模型组合至少一个识别文字,得到至少一个组合语句;
计算至少一个组合语句中每个组合语句的分数值;
确定至少一个组合语句中分数值最大的组合词句为第二语句。
在一种可能的实现方式中,在根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹之前,方法还包括:
获取训练样本图像,训练样本图像包括含有样本语句的输入图像和含有与样本语句对应的各个文字的输出图像;
根据输入图像和输出图像,训练初始神经网络模型得到预设切分模型。
在一种可能的实现方式中,初始网络模型包括卷积神经网络和二分类神经网络,根据输入图像和输出图像,训练初始神经网络模型得到预设切分模型,包括:
将输入图像输入卷积神经网络,得到输入图像中样本语句的特征矩阵;
根据特征矩阵和输出图像,训练二分类神经网络得到预设切分模型。
第二方面,本申请实施例提供了一种语句识别的装置,装置包括:
接收模块,用于接收用户在输入法界面内输入第一语句的输入;
切分模块,用于根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹;
识别模块,用于通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;
组合模块,用于通过预设语言模型组合至少一个识别文字,得到第二语句。
在一种可能的实现方式中,切分模块,具体用于:
根据第一语句的输入,通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值;
当概率值大于预设阈值时,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
第三方面,本申请实施例提供了一种语句识别设备,设备包括:处理器,以及存储有计算机程序指令的存储器;
处理器读取并执行计算机程序指令,以实现第一方面或第一方面任意一种可能的实现方式中的语句识别的方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或第一方面任意一种可能的实现方式中的语句识别的方法。
本申请实施例提供的语句识别的方法、装置、设备及计算机存储介质,通过接收用户在输入法界面内输入第一语句的输入,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,切分模型对语句中各个文字间的任意间距都可以进行切分,保证了语句切分的准确性;通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,基于待识别文字的切分轨迹的准确性,进一步保证了识别文字的准确性;通过预设语言模型组合至少一个识别文字,得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种语句识别方法的流程示意图;
图2是本申请实施例提供的一种语句识别装置的结构示意图;
图3是本申请实施例提供的一种语句识别设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
用户在智能终端界面采用手写输入方式输入语句时,大多会出现连写的情况。所谓连写,就是用户可以在手写键盘上连续书写多个字,书写结束时,输入法将提供用户相应的词组,能够大大提升用户书写的效率。连写与叠写相似,用户都可以一次性连续手写多个字,差别在于叠写要求书写的两个字之间是有部分重叠,而连写要求书写的两个字之间有空隔。现有的连写方法是基于OCR技术,也就是对图像进行分析,获取图像中的文字,但是应用到连写上有个小问题,OCR技术识别的文字间距固定、文字大小一样、文字比较方正,而用户手写情况比较复杂,对于不符合上面说的条件的情况,识别就不够准确了。
为了解决现有技术问题,本申请实施例提供了一种语句识别的方法、装置、设备及计算机存储介质。
在本申请实施例中,通过接收用户在输入法界面内输入第一语句的输入,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,切分模型对语句中各个文字间的任意间距都可以进行切分,保证了语句切分的准确性;通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,基于待识别文字的切分轨迹的准确性,进一步保证了识别文字的准确性;通过预设语言模型组合至少一个识别文字,得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
下面首先对本申请实施例所提供的语句识别的方法进行介绍。
图1示出了本申请一个实施例提供的语句识别方法的流程示意图。如图1所示,该方法可以包括以下步骤:
S110,接收用户在输入法界面内输入第一语句的输入。
用户在智能终端界面输入第一语句时,先进入输入法界面,用户在输入法界面内手写第一语句,第一语句可以是连写的语句,也可以是叠写的语句。智能终端接收用户在输入法界面内输入的第一语句的输入,确定第一语句的输入轨迹,以识别出用户需要输出的文字供用户选择。其中,输入轨迹为用户依次手写第一语句的笔画的组合。
S120,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
预设切分模型为预先训练的切分模型,切分模型可以根据语句的输入轨迹识别出语句中文字的起始轨迹,并根据文字的起始轨迹切分语句,得到至少一个文字的切分轨迹。
当智能终端接收到用户输入的第一语句的输入轨迹后,启动预先训练的切分模型,切分模型识别出第一语句中文字的起始轨迹,根据第一文字中文字的起始轨迹切分第一语句,得到至少一个文字的切分轨迹。
具体地,根据第一语句的输入轨迹,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,包括:
根据第一语句的输入,通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值。
按照接收输入的顺序将第一语句的每一笔画对应的输入轨迹作为预设切分模型一次输入,切分模型输出第一语句中每一笔画对应的输入轨迹为起始轨迹的概率值。如果第一语句的某一笔画对应的输入轨迹为起始轨迹,则概率值为1,如果第一语句的某一笔画对应的输入轨迹为非起始轨迹,则概率值为0。
当概率值大于预设阈值时,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
当某一笔画对应的输入轨迹的概率值大于预设阈值时,说明该笔画为起始笔画,当某一笔画对应的输入轨迹的概率值小于等于预设阈值时,说明该笔画为非起始笔。预设阈值可以设置为任意小于1的值,此处不做限定。
当确定某一笔画为起始笔画后,在该笔画前进行切分。切分模型按照上述切分规则切分第一语句,得到至少一个文字的切分轨迹。比如说,用户在输入法界面内手写“平安”,智能终端接收到“平安”的输入轨迹,按照接收输入轨迹的顺序将“平安”的每一笔画对应的输入轨迹传入切分模型,切分模型输出第一笔“横”对应的输入轨迹的概率值为1,第六笔“点”对应的输入轨迹的概率值为1,其他笔画对应的输入轨迹的概率值为0。此时,在第一笔“横”前进行切分,在第五笔“竖”后,第六笔“点”前进行切分,进而将“平安”的输入轨迹切分为“平”和“安”两个字的切分轨迹。
S130,通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字。
将通过预设切分模型切分第一语句得到的至少一个文字的切分轨迹作为预设文字识别模型的输入,预设文字识别模型输出文字的切分轨迹对应的识别文字。
具体地,通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,包括:
通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个文字的切分轨迹的至少一个第一识别文字,其中,至少一个第一识别文字中每个第一识别文字对应一个表征文字的切分轨迹与识别字库中预设文字为同一文字的概率值;
将一个文字的切分轨迹输入预设文字识别模型时,预设文字识别模型输出至少一个第一识别文字。第一识别文字是识别字库中与文字的切分轨迹可能对应的文字,第一识别文字的数量为多个,每个第一识别文字对应一个概率值,这个概率值表征文字的切分轨迹与识别字库中预设文字为同一文字的可能性。
确定至少一个文字的切分轨迹的至少一个第一识别文字的概率值中最大概率值对应的第一识别文字为至少一个识别文字。
在得到一个文字的输入轨迹的每个第一识别文字的概率值后,确定最大概率值对应的第一识别文字为识别文字。将第一语句切分的至少一个文字的输入轨迹输入预设文字识别模型,将会得到至少一个识别文字。
尽管用户的手写第一语句的字体各种各样,预设切分模型根据第一语句中文字的起始笔画的输入轨迹进行切分,不受字体形状、字体间距等影响,保证了第一语句切分的准确性,然后将切分后的文字的输入轨迹通过预设文字识别模型进行识别,选取概率值最大的第一识别文字为识别文字,保证了文字识别的准确性。
S140,通过预设语言模型组合至少一个识别文字,得到第二语句。
预设语言模型为预先训练的可以将文字组合成语句的语言模型。在得到至少一个识别文字之后,将至少一个识别文字作为预设语言模型的输入,预设语言模型根据该输入输出现在是输入法候选栏中的第二语句。
具体地,通过预设语言模型组合至少一个识别文字,得到第二语句,包括:
通过预设语言模型组合至少一个识别文字,得到至少一个组合语句。
计算至少一个组合语句中每个组合语句的分数值;
语言模型查询到组合语句中第一个文字的第一概率,在第一个文字确定的情况下第二个文字的第二概率,在第一个文字和第二文字确定的情况下,第三个文字的第三概率,···,依次类推,直至查找最组合语句中最后一个文字的第N概率为止。将第一概率、第二概率、第三概率、···、第N概率相乘得到该组合语句的分数值。
比如说,用户手写输入“恭喜发财”,此时,预设文字识别模型已经对“恭喜发财”中每个文字的切分轨迹识别出最大概率值对应的“恭”“喜”“发”“财”,将“恭”“喜”“发”“财”输入预设语言模型,得到“恭喜发财”、“恭发喜财”、“财喜恭发”等组合语句。此时,在预设语言模型中分别查找第一个字为“恭”、“财”的概率PA1和PA2,继续查找在第一个文字为“恭”第二个文字为“喜”的概率PA121或者“发”的概率PA122,或者第一个文字为“财”第二个文字为“喜”的概率PA22。按照此规则,分别找出“恭喜发财”中“发”的概率PA131和“财”的概率PA141,“恭发喜财”中“喜”的概率PA132和“财”的概率PA142,“财喜恭发”中“恭”的概率PA23和“发”的概率PA24。分别计算各个组合语句的分数值,即,“恭喜发财”的分数值S1=PA1*PA121*PA131*PA141,“恭发喜财”的分数值S2=PA1*PA122*PA132*PA142,“财喜恭发”的分数值S3=PA2*PA22*PA23*PA24。
确定至少一个组合语句中分数值最大的组合词句为第二语句。
组合语句的分数值越大,说明该组合语句为用户输入第一语句的可能性越大,识别结果越准确。比如说,假如上述S1、S2、S3的关系为S1>S2>S3,那么,确定“恭喜发财”为第二语句。
在本申请实施例中,通过接收用户在输入法界面内输入第一语句的输入,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,切分模型对语句中各个文字间的任意间距都可以进行切分,保证了语句切分的准确性;通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,基于待识别文字的切分轨迹的准确性,进一步保证了识别文字的准确性;通过预设语言模型组合至少一个识别文字,得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
在一些实施例中,在根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹之前,方法还包括:
获取训练样本图像,训练样本图像包括含有样本语句的输入图像和含有与样本语句对应的各个文字的输出图像;
根据输入图像和输出图像,训练初始神经网络网络得到预设切分模型。
在对第一语句进行识别之前,对切分模型进行训练。首先,获取训练样本图像,训练样本图像包括含有样本语句的输入图像和含有与样本语句对应的各个文字的输出图像。样本语句为将连续手写的字通过平移处理后组成依次排列的字,两个字之间的间隔在一定范围里做随机,再将所有的字对应的轨迹序列拼接起来,每个字的起始笔画做标记。根据输入图像和输出图像,训练初始神经网络模型得到预设切分模型。
在一些实施例中,初始网络模型包括卷积神经网络和二分类神经网络,根据输入图像和输出图像,训练初始神经网络模型得到预设切分模型,包括:
将输入图像输入卷积神经网络,得到输入图像中样本语句的特征矩阵;
将样本语句中文字的每一笔画对应的轨迹依次传入卷积神经网络,得到一个关于当前轨迹的特征矩阵,特征矩阵包括样本语句中每个文字的起始笔画。
根据特征矩阵和输出图像,训练二分类神经网络得到预设切分模型。
将特征矩阵作为二分类神经网络模型的输入,二分类神经网络模型得到起始笔的概率值为1或者非起始笔的概率值为0,根据概率值对样本语句进行切分,输出含有与样本语句对应的各个文字的输出图像。通过对卷积神经网络和二分类神经网络进行先后两次训练,得到预设切分模型。
图2是本申请实施例提供的一种装置结构示意图。如图2所示,语句识别装置200可以包括接收模块210,切分模块220,识别模块230和组合模块240。
接收模块210,用于接收用户在输入法界面内输入第一语句的输入;
切分模块220,用于根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹;
识别模块230,用于通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;
组合模块240,用于通过预设语言模型组合至少一个识别文字,得到第二语句。
在本申请实施例中,通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
在一些实施例中,切分模块220,具体用于根据第一语句的输入,通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值;
当概率值大于预设阈值时,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
在一些实施例中,识别模块230,具体用于通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个文字的切分轨迹的至少一个第一识别文字,其中,至少一个第一识别文字中每个第一识别文字对应一个表征文字的切分轨迹与识别字库中预设文字为同一文字的概率值;
确定至少一个文字的切分轨迹的至少一个第一识别文字的概率值中最大概率值对应的第一识别文字为至少一个识别文字。
在一些实施例中,组合模块240,具体用于通过预设语言模型组合至少一个识别文字,得到至少一个组合语句;
计算至少一个组合语句中每个组合语句的分数值;
确定至少一个组合语句中分数值最大的组合词句为第二语句。
在一些实施例中,在根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹之前,该装置还包括:
获取模块250,用于获取训练样本图像,训练样本图像包括含有样本语句的输入图像和含有与样本语句对应的各个文字的输出图像;
训练模块260,用于根据输入图像和输出图像,训练初始神经网络模型得到预设切分模型。
在一些实施例中,初始网络模型包括卷积神经网络和二分类神经网络,训练模块260,具体用于
将输入图像输入卷积神经网络,得到输入图像中样本语句的特征矩阵;
根据特征矩阵和输出图像,训练二分类神经网络得到预设切分模型。
图2所示装置中的各个模块具有实现图1中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图3示出了本申请实施例提供的语句识别设备的硬件结构示意图。
在语句识别设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器302可以包括可移除或不可移除(或固定)的介质,或者存储器302是非易失性固态存储器。存储器302可在综合网关容灾设备的内部或外部。
在一个实例中,存储器302可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器302包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请的一方面的方法所描述的操作。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现图1所示实施例中的步骤S110至S140,并达到图1所示实例执行其步骤达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,语句识别设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将语句识别设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(IndustryStandard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该语句识别设备可以基于用户手写输入的语句以及预设模型执行本申请实施例中的语句识别方法,从而实现结合图1描述的语句识别方法。
另外,结合上述实施例中的语句识别方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种语句识别方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RadioFrequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种语句识别的方法,其特征在于,包括:
接收用户在输入法界面内输入第一语句的输入;
根据所述第一语句的输入,通过预设切分模型切分所述第一语句,得到至少一个文字的切分轨迹;
通过预设文字识别模型识别所述至少一个文字的切分轨迹,得到至少一个识别文字;
通过预设语言模型组合所述至少一个识别文字,得到第二语句。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一语句的输入,通过预设切分模型切分所述第一语句,得到至少一个文字的切分轨迹,包括:
根据所述第一语句的输入轨迹,通过所述预设切分模型获取所述第一语句的输入轨迹为起始轨迹的概率值;
当所述概率值大于预设阈值时,通过所述预设切分模型切分所述第一语句,得到所述至少一个文字的切分轨迹。
3.根据权利要求1所述的方法,其特征在于,所述通过预设文字识别模型识别所述至少一个文字的切分轨迹,得到至少一个识别文字,包括:
通过所述预设文字识别模型识别所述至少一个文字的切分轨迹,得到所述至少一个文字的切分轨迹的至少一个第一识别文字,其中,每个所述第一识别文字对应一个目标概率值,所述目标概率值为表征所述文字的切分轨迹与识别字库中预设文字为同一文字的概率值;
确定所述至少一个文字的切分轨迹的至少一个第一识别文字的概率值中最大概率值对应的第一识别文字为所述至少一个识别文字。
4.根据权利要求1所述的方法,其特征在于,通过预设语言模型组合所述至少一个识别文字,得到第二语句,包括:
通过所述预设语言模型组合所述至少一个识别文字,得到至少一个组合语句;
计算所述至少一个组合语句中每个组合语句的分数值;
确定所述至少一个组合语句中分数值最大的组合词句为所述第二语句。
5.根据权利要求1所述的方法,其特征在于,在根据所述第一语句的输入,通过预设切分模型切分所述第一语句,得到至少一个文字的切分轨迹之前,所述方法还包括:
获取训练样本图像,所述训练样本图像包括含有样本语句的输入图像和含有与所述样本语句对应的各个文字的输出图像;
根据所述输入图像和所述输出图像,训练初始神经网络模型得到所述预设切分模型。
6.根据权利要求5所述的方法,其特征在于,所述初始网络模型包括卷积神经网络和二分类神经网络,所述根据所述输入图像和所述输出图像,训练初始神经网络模型得到所述预设切分模型,包括:
将所述输入图像输入所述卷积神经网络,得到所述输入图像中样本语句的特征矩阵;
根据所述特征矩阵和所述输出图像,训练所述二分类神经网络得到所述预设切分模型。
7.一种语句识别的装置,其特征在于,所述装置包括:
接收模块,用于接收用户在输入法界面内输入第一语句的输入;
切分模块,用于根据所述第一语句的输入,通过预设切分模型切分所述第一语句,得到至少一个文字的切分轨迹;
识别模块,用于通过预设文字识别模型识别所述至少一个文字的切分轨迹,得到至少一个识别文字;
组合模块,用于通过预设语言模型组合所述至少一个识别文字,得到第二语句。
8.根据权利要求7所述的装置,其特征在于,所述切分模块,具体用于:
根据所述第一语句的输入,通过所述预设切分模型获取所述第一语句的输入轨迹为起始轨迹的概率值;
当所述概率值大于预设阈值时,通过所述预设切分模型切分所述第一语句,得到所述至少一个文字的切分轨迹。
9.一种语句识别设备,其特征在于,所述语句识别设备包括:处理器,以及存储有计算机程序指令的存储器;
所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-6任意一项所述的语句识别的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的语句识别的方法。
CN202110310856.9A 2021-03-23 2021-03-23 语句识别的方法、装置、设备及计算机存储介质 Pending CN113064497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110310856.9A CN113064497A (zh) 2021-03-23 2021-03-23 语句识别的方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110310856.9A CN113064497A (zh) 2021-03-23 2021-03-23 语句识别的方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113064497A true CN113064497A (zh) 2021-07-02

Family

ID=76563247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110310856.9A Pending CN113064497A (zh) 2021-03-23 2021-03-23 语句识别的方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113064497A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399772A (zh) * 2021-12-20 2022-04-26 北京百度网讯科技有限公司 样本生成、模型训练和轨迹识别方法、装置、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1260524A (zh) * 1999-01-13 2000-07-19 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的***
CN102063620A (zh) * 2010-12-31 2011-05-18 北京捷通华声语音技术有限公司 一种手写识别方法、***及手写识别终端
CN102750552A (zh) * 2012-06-18 2012-10-24 北京捷通华声语音技术有限公司 一种手写识别方法、***及手写识别终端
CN109344830A (zh) * 2018-08-17 2019-02-15 平安科技(深圳)有限公司 语句输出、模型训练方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1260524A (zh) * 1999-01-13 2000-07-19 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的***
CN102063620A (zh) * 2010-12-31 2011-05-18 北京捷通华声语音技术有限公司 一种手写识别方法、***及手写识别终端
CN102750552A (zh) * 2012-06-18 2012-10-24 北京捷通华声语音技术有限公司 一种手写识别方法、***及手写识别终端
CN109344830A (zh) * 2018-08-17 2019-02-15 平安科技(深圳)有限公司 语句输出、模型训练方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399772A (zh) * 2021-12-20 2022-04-26 北京百度网讯科技有限公司 样本生成、模型训练和轨迹识别方法、装置、设备和介质
CN114399772B (zh) * 2021-12-20 2024-02-27 北京百度网讯科技有限公司 样本生成、模型训练和轨迹识别方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN109522558B (zh) 一种基于深度学习的中文错字校正方法
US20080008387A1 (en) Method and apparatus for recognition of handwritten symbols
CN113254654B (zh) 模型训练、文本识别方法、装置、设备和介质
CN108280173B (zh) 一种非结构化文本的关键信息挖掘方法、介质及设备
CN112527992B (zh) 长文本处理方法、相关设备及可读存储介质
CN112580643A (zh) 一种基于深度学习的车牌识别方法、装置及存储介质
CN112883968B (zh) 图像字符识别方法、装置、介质及电子设备
CN111695539A (zh) 一种手写汉字的评价方法、装置及电子设备
CN112215236B (zh) 文本识别方法、装置、电子设备及存储介质
CN113064497A (zh) 语句识别的方法、装置、设备及计算机存储介质
CN112699780A (zh) 对象识别方法、装置、设备及存储介质
CN114639096A (zh) 文本识别方法、装置、电子设备和存储介质
CN112149678A (zh) 特殊语言的文字识别方法、识别模型训练方法和装置
CN111695537A (zh) 一种笔画识别的方法、装置及电子设备
US9251412B2 (en) Segmentation of devanagari-script handwriting for recognition
CN115984876A (zh) 文本识别方法、装置、电子设备、车辆及存储介质
CN114863574A (zh) 手写签名识别方法、装置、设备、介质及程序产品
CN115294581A (zh) 错误字符的识别方法、装置、电子设备及存储介质
CN114298054A (zh) 一种文本识别方法、装置、电子设备及可读存储介质
CN115273103A (zh) 文本识别方法、装置、电子设备及存储介质
CN114117031A (zh) 名单筛查方法、装置、设备及计算机存储介质
CN108021918B (zh) 文字识别方法及装置
CN112633243B (zh) 信息识别方法、装置、设备及计算机存储介质
CN114139541B (zh) 命名实体识别方法、装置、设备及介质
CN116306631A (zh) 文本信息排序方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210702

WD01 Invention patent application deemed withdrawn after publication