CN115116069A - 文本处理方法、装置、电子设备及存储介质 - Google Patents

文本处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115116069A
CN115116069A CN202210800979.5A CN202210800979A CN115116069A CN 115116069 A CN115116069 A CN 115116069A CN 202210800979 A CN202210800979 A CN 202210800979A CN 115116069 A CN115116069 A CN 115116069A
Authority
CN
China
Prior art keywords
text
initial
feature
processing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210800979.5A
Other languages
English (en)
Inventor
岳毅
翁嘉颀
陈林平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Laiyibert Network Technology Co ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Shanghai Laiyibert Network Technology Co ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Laiyibert Network Technology Co ltd, Laiye Technology Beijing Co Ltd filed Critical Shanghai Laiyibert Network Technology Co ltd
Priority to CN202210800979.5A priority Critical patent/CN115116069A/zh
Publication of CN115116069A publication Critical patent/CN115116069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本公开提出一种文本处理方法、装置、电子设备及存储介质,该方法包括:获取初始文本,其中,初始文本是对图像识别得到;确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息;根据文本处理信息处理初始文本,得到目标文本。通过本公开,能够在基于图像识别得到文本之后,基于与文本对应的文本分类特征对所识别的文本进行个性化的优化处理,从而能够有效提升基于图像的文本识别的准确率。本公开还能结合机器人流程自动化RPA和人工智能AI实现智能自动化IA的文本处理,进一步减少文本处理所需消耗的资源成本。

Description

文本处理方法、装置、电子设备及存储介质
技术领域
本公开涉及图像识别技术领域,尤其涉及一种文本处理方法、装置、电子设备及存储介质。
背景技术
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门技术科学。
智能自动化(Intelligent Automation,IA)是一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(Optical Character Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(Machine Learning,ML)、自然语言处理(NaturalLanguage Processing,NLP)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(Computer Vision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据的含义,使用数据来管理和优化业务流程的整个历程。
相关技术中,图像中可能有阴影、污渍、不平整和模糊等问题,基于图像的文本识别的准确率比较低。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开在于提出一种文本处理方法、装置、电子设备及存储介质,能够在基于图像识别得到文本之后,基于与文本对应的文本分类特征对所识别的文本进行个性化的优化处理,从而能够有效提升基于图像的文本识别的准确率。
本公开第一方面实施例提出的文本处理方法,包括:获取初始文本,其中,初始文本是对图像识别得到;确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息;根据文本处理信息处理初始文本,得到目标文本。
在一种实施方式中,确定与初始文本对应的文本分类特征,包括:
如果初始文本包括待处理文字,则采用人工智能AI领域的光学字符识别OCR技术确定待处理文字的初始形态特征,其中,初始形态特征被作为文本分类特征;和/或
如果初始文本包括待处理字符,则采用OCR技术确定待处理字符的初始字符特征,其中,初始字符特征被作为文本分类特征;和/或
采用OCR技术确定初始文本的初始语义特征,其中,初始语义特征被作为文本分类特征。
在一种实施方式中,文本处理信息由初始形态特征描述;
其中,根据文本处理信息处理初始文本,得到目标文本,包括:
调用机器人流程自动化RPA机器人处理文本处理信息,以确定纠错文字的参考形态特征;
确定初始形态特征和参考形态特征之间的相似度信息;
根据相似度信息,确定处理结果值;
根据处理结果值处理初始文本,得到目标文本。
在一种实施方式中,处理结果值包括:信心标识,和与信息标识对应的信心评价值;
其中,根据处理结果值处理初始文本,得到目标文本,包括:
如果信心标识是目标标识,且信心评价值小于或等于设定阈值,则将初始文本中待处理文字调整为纠错文字,以得到目标文本;
如果信心标识不是目标标识,或信心评价值大于设定阈值,则将初始文本作为目标文本。
在一种实施方式中,文本处理信息由初始字符特征描述;
其中,根据文本处理信息处理初始文本,得到目标文本,包括:
调用RPA机器人处理文本处理信息,以确定参考字符特征;
根据参考字符特征对初始文本中待处理字符进行纠正处理,得到目标文本。
在一种实施方式中,文本处理信息由初始语义特征描述;
其中,根据文本处理信息处理初始文本,得到目标文本,包括:
调用RPA机器人处理文本处理信息,以确定纠错对应关系,其中,纠错对应关系包括:多个纠错文本,以及与每个纠错文本对应的纠错标记结果;
从多个纠错文本中确定与初始文本所匹配的纠错文本,其中,所匹配的纠错文本具有所对应的纠错标记结果;
根据对应的纠错标记结果对初始文本的已有标记结果进行纠正处理,得到目标文本。
在一种实施方式中,采用人工智能AI领域的光学字符识别OCR技术确定待处理文字的初始形态特征,包括:
采用OCR技术确定待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征;
将结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征作为初始形态特征。
在一种实施方式中,采用OCR技术确定待处理字符的初始字符特征,包括:
采用OCR技术确定待处理字符的格式特征,并将格式特征作为初始字符特征。
在一种实施方式中,采用OCR技术确定初始文本的初始语义特征,包括:
采用OCR技术确定初始文本的文本语义,和文本语义指示的语义标记结果;
将文本语义和语义标记结果作为初始语义特征。
本公开第二方面实施例提出的文本处理装置,包括:获取模块,用于获取初始文本,其中,初始文本是对图像识别得到;确定模块,用于确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息;处理模块,用于根据文本处理信息处理初始文本,得到目标文本。
在一种实施方式中,确定模块,包括:
第一确定子模块,用于在初始文本包括待处理文字时,采用人工智能AI领域的光学字符识别OCR技术确定待处理文字的初始形态特征,其中,初始形态特征被作为文本分类特征;和/或
第二确定子模块,用于在初始文本包括待处理字符时,采用OCR技术确定待处理字符的初始字符特征,其中,初始字符特征被作为文本分类特征;和/或
第三确定子模块,用于采用OCR技术确定初始文本的初始语义特征,其中,初始语义特征被作为文本分类特征。
在一种实施方式中,文本处理信息由初始形态特征描述;
其中,处理模块,具体用于:
调用机器人流程自动化RPA机器人处理文本处理信息,以确定纠错文字的参考形态特征;
确定初始形态特征和参考形态特征之间的相似度信息;
根据相似度信息,确定处理结果值;
根据处理结果值处理初始文本,得到目标文本。
在一种实施方式中,处理结果值包括:信心标识,和与信息标识对应的信心评价值;
其中,处理模块,具体用于:
如果信心标识是目标标识,且信心评价值小于或等于设定阈值,则将初始文本中待处理文字调整为纠错文字,以得到目标文本;
如果信心标识不是目标标识,或信心评价值大于设定阈值,则将初始文本作为目标文本。
在一种实施方式中,文本处理信息由初始字符特征描述;
其中,处理模块,具体用于:
调用RPA机器人处理文本处理信息,以确定参考字符特征;
根据参考字符特征对初始文本中待处理字符进行纠正处理,得到目标文本。
在一种实施方式中,文本处理信息由初始语义特征描述;
其中,处理模块,具体用于:
调用RPA机器人处理文本处理信息,以确定纠错对应关系,其中,纠错对应关系包括:多个纠错文本,以及与每个纠错文本对应的纠错标记结果;
从多个纠错文本中确定与初始文本所匹配的纠错文本,其中,所匹配的纠错文本具有所对应的纠错标记结果;
根据对应的纠错标记结果对初始文本的已有标记结果进行纠正处理,得到目标文本。
在一种实施方式中,第一确定子模块,具体用于:
采用OCR技术确定待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征;
将结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征作为初始形态特征。
在一种实施方式中,第二确定子模块,具体用于:
采用OCR技术确定待处理字符的格式特征,并将格式特征作为初始字符特征。
在一种实施方式中,第三确定子模块,具体用于:
采用OCR技术确定初始文本的文本语义,和文本语义指示的语义标记结果;
将文本语义和语义标记结果作为初始语义特征。
本公开第三方面实施例提出的电子设备,包括:至少一个处理器和存储器;存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行本公开第一方面实施例提出的文本处理方法。
本公开第四方面实施例提出的计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现本公开第一方面实施例提出的文本处理方法。
上述技术方案中的优点或有益效果至少包括:通过获取初始文本,其中,初始文本是对图像识别得到,并确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息,以及根据文本处理信息处理初始文本,得到目标文本,能够在基于图像识别得到文本之后,基于与文本对应的文本分类特征对所识别的文本进行个性化的优化处理,从而能够有效提升基于图像的文本识别的准确率。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本公开进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本公开的一些实施方式,而不应将其视为是对本公开范围的限制。
图1是本公开一实施例提出的文本处理方法的流程示意图;
图2是本公开另一实施例提出的文本处理方法的流程示意图;
图3是本公开另一实施例提出的文本处理方法的流程示意图;
图4是本公开另一实施例提出的文本处理方法的流程示意图;
图5是本公开一实施例提出的文本处理装置的结构示意图;
图6是本公开另一实施例提出的文本处理装置的结构示意图;
图7示出根据本公开一实施例的电子设备的结构框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。
在本公开的描述中,术语“多个”指两个或两个以上。
在本公开的描述中,术语“机器人流程自动化(Robotic Process Automation,RPA)”,是指通过机器人应用软件在计算机上按照规则自动执行流程任务。
在本公开的描述中,术语“人工智能(Artificial Intelligence,AI)”,是指研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术,以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
在本公开的描述中,术语“智能自动化(Intelligent Automation,IA)”,是指一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(OpticalCharacter Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(MachineLearning,ML)、自然语言处理(Natural Language Processing,NLP)、语音识别(AutomaticSpeech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(ComputerVision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据的含义,使用数据来管理和优化业务流程的整个历程。
在本公开的描述中,术语“初始文本”,是指待对其进行处理的文本,该初始文本可以是从图像中识别得到。
在本公开的描述中,术语“文本分类特征”,是指对初始文本进行特征分类所得到的分类类别特征。
在本公开的描述中,术语“待处理文字”,是指初始文本中所包括的文字,在对初始文本进行相应优化处理时,可以对该文字部分进行全局或者局部的优化处理,则该文字,可以被称为待处理文字。
在本公开的描述中,术语“初始形态特征”,是指待处理文字的形态特征,例如,形式特征、排列组合特征、结构特征等等。
在本公开的描述中,术语“待处理字符”,是指初始文本中所包括的字符(数字、字母、符号等等),在对初始文本进行相应优化处理时,可以对该字符部分进行全局或者局部的优化处理,则该字符,可以被称为待处理字符。
在本公开的描述中,术语“初始字符特征”,是指待处理字符相关的特征,例如含义特征、形态特征、排列特征等等。
在本公开的描述中,术语“初始语义特征”,是指初始文本的语义特征,例如初始文本所表征的语义,或者所引申的语义等等。
在本公开的描述中,术语“文本处理信息”,是指用于对初始文本进行个性化的优化处理的方式方法。
在本公开的描述中,术语“目标文本”,是指对初始文本进行相应处理所得文本。
在本公开的描述中,术语“结构特征”,是指文字的呈现结构方面的特征,例如上中下结构、上下结构、左右结构等等。
在本公开的描述中,术语“笔画特征”,是指文字的笔画维度的特征,例如,笔画的顺序、笔画数量等等。
在本公开的描述中,术语“编码特征”,是指对文字进行相应的编码所得的编码特征,例如,四角编码等。
在本公开的描述中,术语“偏旁部首特征”,是指对文字进行偏旁部首识别所得文字的偏旁部首维度的特征。
在本公开的描述中,术语“纠错文字”,是指用于对待处理文字进行纠错参考的文字。
在本公开的描述中,术语“参考形态特征”,是指纠错文字相关的形态特征。
在本公开的描述中,术语“相似度信息”,是指描述待处理文字的初始形态特征与纠错文字的参考形态特征之间相似度情况的信息。
智能自动化平台能够实现RPA、智能文档处理(Intelligent DocumentProcessing,IDP)、对话式AI(Conversational AI,CoAI)、流程挖掘(Process Mining)等多项能力的无缝集成,具有“业务理解”、“流程创建”、“随处运行”、“集中管控”、“人机协同”这五大类功能,为企业实现业务流程端到端的智能自动化,代替人工的操作,进一步提高业务效率,加速数字化转型。
智能文档处理(IDP)是智能自动化平台的核心能力之一。智能文档处理(Intelligent Document Processing,IDP)是基于光学字符识别(Optical CharacterRecognition,OCR)、计算机视觉(Computer Vision,CV)、自然语言处理(Natural LanguageProcessing,NLP)、知识图谱(Knowledge Graph,KG)等AI技术,对各类文档进行识别、分类、要素提取、校验、比对、纠错等处理,帮助企业实现文档处理工作的智能化和自动化的新一代自动化技术。
参照下面的描述和附图,将清楚本公开的实施例的这些和其他方面。在这些描述和附图中,具体公开了本公开的实施例中的一些特定实施方式,来表示实施本公开的实施例的原理的一些方式,但是应当理解,本公开的实施例的范围不受此限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
以下结合附图描述根据本公开实施例的文本处理方法。
图1是本公开一实施例提出的文本处理方法的流程示意图。
本实施例以文本处理方法被配置为文本处理装置中来举例说明,本实施例中文本处理方法可以被配置在文本处理装置中,文本处理装置可以设置在服务器中,或者也可以设置在电子设备中,本公开实施例对此不作限制。
本实施例以文本处理方法被配置在电子设备中为例。其中,电子设备例如智能手机、平板电脑、个人数字助理、电子书等具有各种操作***的硬件设备。
需要说明的是,本公开实施例的执行主体,在硬件上可以例如为服务器或者电子设备中的中央处理器(Central Processing Unit,CPU),在软件上可以例如为服务器或者电子设备中的相关的后台服务,对此不作限制。
本公开实施例中的文本处理方法,可以是结合RPA和AI实现IA的文本处理方法,当然,也可以采用其他任意可能的技术或者技术的组合实现本公开实施例中的文本处理方法,对此不做限制。
另外,本公开实施例中的“处理”,可以例如是指结合机器人流程自动化RPA和人工智能AI实现智能自动化IA的文本处理的过程,也即是说,该文本处理的过程是一个全流程自动化的文本处理的过程,并且该文本处理的过程还与人工智能AI相结合,实现自动化地进行自然语言处理(Natural Language Processing,NLP)领域中的文本处理。
本公开可以具体应用于人工智能AI的自然语言处理(Natural LanguageProcessing,NLP)领域,自然语言处理(Natural Language Processing,NLP),即计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。
举例而言,本公开实施例中基于该全流程自动化的文本处理过程,可以实现全流程自动化地执行基于机器人流程自动化RPA技术获取初始文本,其中,初始文本是对图像识别得到,基于人工智能AI技术确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息,以及根据文本处理信息处理初始文本,得到目标文本。
如图1所示,该文本处理方法,包括:
S101:获取初始文本,其中,初始文本是对图像识别得到。
在本公开的描述中,术语“初始文本”,是指待对其进行处理的文本,该初始文本可以是从图像中识别得到。
例如,可以基于光学字符识别OCR、智能字符识别ICR、流程挖掘PM、深度学习DL、机器学习ML、自然语言处理NLP等技术对图像进行识别,并将从图像中识别得到的文本作为初始文本。
本公开实施例中,在获取对图像识别得到的初始文本之后,可以触发后续对该初始文本进行个性化的优化处理,从而提升基于图像的文本识别准确率。
S102:确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息。
在本公开的描述中,术语“文本分类特征”,是指对初始文本进行特征分类所得到的分类类别特征。
例如,假设文本是文字形式,则文本分类特征可以是文字类别,假设文本是字符形式,则文本分类特征可以是字符类别,假设文本的语义是城市,则文本分类特征可以是城市简称类别,对此不做限制。
例如,可以对文本的形式进行确认,基于文本实际呈现的形式确认文本分类特征,或者,也可以对文本所表征的语义进行确认,基于文本实际所表征的语义确认文本分类特征,或者,还可以对文本的空间维度特征进行确认,基于文本实际所具有的空间维度特征来确认文本分类特征,对此不做限制。
可选地,一些实施例中,在确定与初始文本对应的文本分类特征时,可以是在初始文本包括待处理文字时,采用人工智能AI领域的光学字符识别OCR技术确定待处理文字的初始形态特征,其中,初始形态特征被作为文本分类特征;和/或在初始文本包括待处理字符时,采用OCR技术确定待处理字符的初始字符特征,其中,初始字符特征被作为文本分类特征;和/或采用OCR技术确定初始文本的初始语义特征,其中,初始语义特征被作为文本分类特征,从而能够快速有效地对初始文本的文本分类特征进行识别,当后续基于所识别文本分类特征确定个性化的优化处理方式时,能够便于对初始文本进行准确地、针对性的优化处理,提升文本处理效果。
在本公开的描述中,术语“待处理文字”,是指初始文本中所包括的文字,在对初始文本进行相应优化处理时,可以对该文字部分进行全局或者局部的优化处理,则该文字,可以被称为待处理文字。
待处理文字,例如初始文本中所直接包含的文字。
在本公开的描述中,术语“初始形态特征”,是指待处理文字的形态特征,例如,形式特征、排列组合特征、结构特征等等。
在本公开的描述中,术语“待处理字符”,是指初始文本中所包括的字符(数字、字母、符号等等),在对初始文本进行相应优化处理时,可以对该字符部分进行全局或者局部的优化处理,则该字符,可以被称为待处理字符。
待处理字符,例如初始文本中的日期。
在本公开的描述中,术语“初始字符特征”,是指待处理字符相关的特征,例如含义特征、形态特征、排列特征等等。
在本公开的描述中,术语“初始语义特征”,是指初始文本的语义特征,例如初始文本所表征的语义,或者所引申的语义等等。
初始语义特征,例如初始文本中的城市简称、城市全称。
上述在获取初始文本之后,可以首先确定初始文本中所包含的内容,而后对该内容进行解析以确定是文字还是字符,并且在初始文本包含文字部分时,可以确定该文字是否是待进行优化处理的文字,如果是,则将该文字作为待处理文字,进而确定其初始形态特征,在初始文本包含字符部分时,可以确定该字符是否是待进行优化处理的字符,如果是,则将该字符作为待处理字符,进而确定其初始字符特征,或者,还可以直接基于初始文本对其所携带直接语义或者引申语义进行分析,以确定初始语义特征。
上述在确定与初始文本对应的文本分类特征之后,可以获取该文本分类特征描述的文本处理信息。
在本公开的描述中,术语“文本处理信息”,是指用于对初始文本进行个性化的优化处理的方式方法。
文本处理信息,例如,对初始文本中文字进行全局或者局部错误纠正的方法,对初始文本中日期进行错误纠正的方法,或者,对初始文本中城市简称进行纠正处理的方法,对此不做限制。
其中,该文本处理信息,可以是预先配置的,或者,也可以是动态设置的,对此不做限制。
例如,可以预先针对各种文本分类特征,配置与其相适配的处理方法,并抽取封装该适配的处理方法的关键字段,作为文本处理信息,或者,还可以建立处理信息生成模型,将文本分类特征输入至该处理信息生成模型中,以得到该处理信息生成模型输出的处理信息作为文本处理信息,对此不做限制。
S103:根据文本处理信息处理初始文本,得到目标文本。
在本公开的描述中,术语“目标文本”,是指对初始文本进行相应处理所得文本。
上述在确定与初始文本对应的文本分类特征,并确定文本分类特征所描述的文本处理信息之后,可以直接基于该文本处理信息处理初始文本,得到目标文本。
举例而言,文本处理信息,例如,对初始文本中文字进行全局或者局部错误纠正的方法,对初始文本中日期进行错误纠正的方法,或者,对初始文本中城市简称进行纠正处理的方法,则可以采用相应的文本处理信息对初始文本进行相适应的处理,得到目标文本。
本公开实施例中,可以将文本处理方法相关的实现处理逻辑封装在一个插件中,并将该插件***可实现机器人流程自动化(Robotic Process Automation,RPA)的平台中,并支持项目开发人员导入和引用该插件,并进行相应的参数化配置,即可连贯地实现基于图像的文本识别。
本实施例中,通过获取初始文本,其中,初始文本是对图像识别得到,并确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息,以及根据文本处理信息处理初始文本,得到目标文本,能够在基于图像识别得到文本之后,基于与文本对应的文本分类特征对所识别的文本进行个性化的优化处理,从而能够有效提升基于图像的文本识别的准确率。
图2是本公开另一实施例提出的文本处理方法的流程示意图。
如图2所示,该文本处理方法,包括:
S201:获取初始文本,其中,初始文本是对图像识别得到。
针对S201的说明可以参见上述实施例,在此不再赘述。
S202:采用人工智能AI领域的光学字符识别OCR技术确定与初始文本对应的初始形态特征,其中,初始形态特征描述文本处理信息。
在本公开的描述中,术语“初始形态特征”,是指待处理文字的形态特征,例如,形式特征、排列组合特征、结构特征等等。
可选地,一些实施例中,在确定待处理文字的初始形态特征时,可以是采用OCR技术确定待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征,将结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征作为初始形态特征,有效扩展初始文本中文字的初始形态特征的表征方式,使得所确定初始形态特征充分体现出初始文本中文字的形态情况,便于对初始文本中待处理文字进行有效地纠错校正。
在本公开的描述中,术语“结构特征”,是指文字的呈现结构方面的特征,例如上中下结构、上下结构、左右结构等等。
在本公开的描述中,术语“笔画特征”,是指文字的笔画维度的特征,例如,笔画的顺序、笔画数量等等。
在本公开的描述中,术语“编码特征”,是指对文字进行相应的编码所得的编码特征,例如,四角编码等。
在本公开的描述中,术语“偏旁部首特征”,是指对文字进行偏旁部首识别所得文字的偏旁部首维度的特征。
S203:调用机器人流程自动化RPA机器人处理文本处理信息,以确定纠错文字的参考形态特征。
在本公开的描述中,术语“纠错文字”,是指用于对待处理文字进行纠错参考的文字。
在本公开的描述中,术语“参考形态特征”,是指纠错文字相关的形态特征。
举例而言,假设文本处理信息例如,对初始文本中文字进行全局或者局部错误纠正的方法,则可以对文本处理信息进行解析,结合待处理文字确定多个候选的纠错文字,而后,分析每一个纠错文字的参考形态特征,以确定基于纠错文字纠正待处理文字的概率情况,所得概率值可以用于确定纠错处理的时机。
S204:确定初始形态特征和参考形态特征之间的相似度信息。
在本公开的描述中,术语“相似度信息”,是指描述待处理文字的初始形态特征与纠错文字的参考形态特征之间相似度情况的信息。
上述在根据文本处理信息,确定纠错文字的参考形态特征之后,可以确定初始形态特征和参考形态特征之间的相似度信息,例如,可以对初始形态特征和参考形态特征之间进行相似度分析,并将分析结果作为相似度信息,该相似度信息可以用于后续确定纠错的时机。
举例而言,获取纠正列表,比如客户代理的汽车品牌有【‘通用牌’,‘丰田牌’,‘林肯牌’】等,其中,‘通用牌’,‘丰田牌’,‘林肯牌’则可以被称为纠错文字,所识别初始文本中的待处理文字,可以是前述多个纠错文字其中之一,也可以是与其中某个纠错文字形态接近的文字,则可以计算待处理文字和上述各个纠错文字的相似度信息,该相似度信息可以包括:基于结构特征确定的相似度信息、和/或基于笔画特征确定的相似度信息、和/或基于编码特征确定的相似度信息、和/或基于偏旁部首特征确定的相似度信息。
举例而言,基于笔画特征确定的相似度信息,可以是笔画数相似度;基于结构特征确定的相似度信息,可以是汉字结构相似度,通过文字的拆解,可以得到文字是文还是字,其中,字可以拆解为上下结构、上中下结构和左右结构等,每个字拆解到最小的颗粒度就是文,文可以拆解为笔画顺序,是字的最小颗粒。基于结构特征确定的相似度信息分为:文和文的相似度、字和字相似度,以及文和字相似度;基于编码特征确定的相似度信息可以是四角编码相似度;基于偏旁部首特征确定的相似度信息可以是偏旁部首相似度。
S205:根据相似度信息,确定处理结果值。
上述在得到各个维度的相似度信息之后,还可以对多个维度的相似度信息进行拟合处理,得到处理结果值。
在本公开的描述中,术语“处理结果值”,是指对一维或者多维的相似度信息进行拟合处理得到的结果值,该处理结果值能够映射出一维或者多维的相似度信息,并且,该处理结果值可以被视为对一维或者多维的相似度信息进行量化处理的结果值,该处理结果值可以被用于作为处理初始文本的参考值。
在根据相似度信息,确定处理结果值时,可以是确定待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征的权重信息,而后基于各个特征的权重信息处理对应的相似度信息,得到处理结果值。
举例而言,通过以上各个维度特征的相似度信息,和各个维度特征对应的权重信息可以计算出一个总相似度(即处理结果值),作为最终是否相似的判定标准。
其中,各个维度特征对应的权重信息分配如下:
结构特征的相似度信息的权重>编码特征的相似度信息的权重>偏旁部首特征的相似度信息权重>笔画特征的相似度信息的权重。
测试后最优范例:
结构特征的相似度信息的权重:10;
编码特征的相似度信息的权重:8;
偏旁部首特征的相似度信息权重:6;
笔画特征的相似度信息的权重:2;
则总权重=(结构特征的相似度信息的权重+编码特征的相似度信息的权重+偏旁部首特征的相似度信息权重+笔画特征的相似度信息的权重);
总分=(汉字结构相似度*结构特征的相似度信息的权重
+四角编码相似度*编码特征的相似度信息的权重
+偏旁部首相似度*偏旁部首特征的相似度信息权重
+笔画数相似度*笔画特征的相似度信息的权重);
总相似度(即处理结果值)=总分/总权重。
S206:根据处理结果值处理初始文本,得到目标文本。
上述确定处理结果值之后,可以基于处理结果值确定对初始文本进行局部纠正或者是全局纠正,而后基于所确定纠正方式纠正初始文本,得到目标文本,对此不做限制。
可选地,一些实施例中,处理结果值包括:信心标识,和与信息标识对应的信心评价值,则根据处理结果值处理初始文本,得到目标文本,可以是在信心标识是目标标识,且信心评价值小于或等于设定阈值时,将初始文本中待处理文字调整为纠错文字,以得到目标文本,在信心标识不是目标标识,或信心评价值大于设定阈值时,将初始文本作为目标文本,实现基于处理结果值对初始文本的有效纠正,有效提升对初始文本中待处理文字的纠正处理效果,有效提升基于图像的文字识别的准确率。
举例而言,可以基于编辑距离,表征初始形态特征和参考形态特征之间的相似度,编辑距离越小,表示初始形态特征和参考形态特征之间的相似度越高。
校正举例如下:
校正数据源(包括多个纠正文字):['林清牌','通用牌','丰田牌','林肯牌'];
OCR识别结果:木木情牌;
纠正结果:('林肯牌',3.5769230769230766,True);
其中,'林肯牌'为纠正文字,3.5769230769230766表示信心评价值(可以由处理结果值计算得到),True表示信息标识,Ture表示目标标识,如果信息标识是目标标识,则代表有信心,如果信息标识不是目标标识(即信息标识是False),则代表无信息。
OCR识别结果:木木情;
纠正结果:('林肯牌',3.5769230769230766,True);
OCR识别结果:木情牌;
纠正结果:('林清牌',2.2897435897435896,True);
OCR识别结果:木+木情牌;
纠正结果:('林清牌',6,False);
OCR识别结果:木Z木情牌;
纠正结果:('林清牌',6,False)。
纠正结果说明:
返回三个值,分别为:纠正后内容、信心评价值和是否有信心;
纠正后内容,通过计算后和校正数据源中最相似的结果;
信心评价值可以由此方式计算,初始文本中的待处理文字和校正数据源中的候选的纠错文字的多个编辑距离中最小的编辑距离+(1-字相似度最大值);
是否有信心,信心评价值在小于或者等于5.0分(设定阈值)的都是有信心(值为:True),信心评价值大于5.0分的都是没有信心(值为:False);
其中,当是否有信心为TRUE时,可以直接使用纠正结果,即采用纠错文字替换初始文本中的待处理文字,为False时,可以根据实际情况来判断是否使用。
本实施例中,通过获取初始文本,其中,初始文本是对图像识别得到,并采用人工智能AI领域的光学字符识别OCR技术确定与初始文本对应的初始形态特征,其中,初始形态特征描述文本处理信息,并调用机器人流程自动化RPA机器人处理文本处理信息,以确定纠错文字的参考形态特征,确定初始形态特征和参考形态特征之间的相似度信息,以及根据相似度信息,确定处理结果值,根据处理结果值处理初始文本,得到目标文本,实现基于初始文本中待处理文字的初始形态特征确定对其进行纠正处理的策略,有效提升对初始文本中待处理文字进行纠正处理的针对性,提升初始文本中文字处理准确率。
图3是本公开另一实施例提出的文本处理方法的流程示意图。
如图3所示,该文本处理方法,包括:
S301:获取初始文本,其中,初始文本是对图像识别得到。
针对S301的说明可以参见上述实施例,在此不再赘述。
S302:采用OCR技术确定与初始文本对应的初始字符特征,其中,初始字符特征描述文本处理信息。
在本公开的描述中,术语“初始字符特征”,是指待处理字符相关的特征,例如含义特征、形态特征、排列特征等等。
可选地,可以对初始文本进行字符解析,得到初始文本中所包括的待处理字符,而后对待处理字符进行含义识别,得到含义特征,或者对字符进行形态识别,得到形态特征,或者在待处理字符形成字符序列时,对字符序列中各个字符的排列组合特征进行分析处理,得到排列特征,则含义特征,和/或形态特征,和/或排列组合特征可以被作为初始字符特征。
可选地,一些实施例中,在采用OCR技术确定待处理字符的初始字符特征时,可以是采用OCR技术确定待处理字符的格式特征,并将格式特征作为初始字符特征,有效分析出初始文本中待处理字符的格式特征,便于对待处理字符的格式特征进行纠错调整,提升待处理字符的格式识别准确率。
在本公开的描述中,术语“格式特征”,是指初始文本中待处理字符的格式相关的特征。
举例而言,如果待处理字符表征日期,则其日期的书写格式特征,即可以被称为格式特征。
S303:调用RPA机器人处理文本处理信息,以确定参考字符特征。
在本公开的描述中,术语“参考字符特征”,是指用于对初始文本中待处理字符进行纠错处理所参考的字符特征。
其中,参考字符特征,可以例如是作为参考的格式特征,该参考字符特征,可以是预先标定的,假如确定待处理字符表征日期,则可以获取日期的标准格式特征作为参考格式特征。
其中,参考字符特征,也可以是基于文本处理信息解析得到的,对此不做限制。
S304:根据参考字符特征对初始文本中待处理字符进行纠正处理,得到目标文本。
上述在调用RPA机器人处理文本处理信息,以确定参考字符特征之后,可以根据参考字符特征对初始文本中待处理字符的初始字符特征进行相应的纠错处理,并将字符纠错处理后的初始文本作为目标文本。
举例而言,假设对初始文本中的日期(以字符形式表征,则表示日期的字符可以例如是待处理字符)进行错误纠正,则可以对日期的格式进行识别,识别初始文本中日期的书写格式作为格式特征,并将该格式特征与参考字符特征(可以例如是参考格式特征)进行比对,以确认所书写格式特征的正确性,而后,基于参考字符特征对所书写格式特征进行纠正,具体例如,可以是年补全,年为4位,如果2位前面补全20;如果3位前面补2;如果长度大于4取后4位;月补全,月为2位,如果1位前面补0;日补全,日为2位,如果1位前面补0;识别错误纠正,如8被识别为B,2被之别为Z,-被识别为+或=。
本实施例中,通过获取初始文本,其中,初始文本是对图像识别得到,采用OCR技术确定与初始文本对应的初始字符特征,其中,初始字符特征描述文本处理信息,并调用RPA机器人处理文本处理信息,以确定参考字符特征,以及根据参考字符特征对初始文本中待处理字符进行纠正处理,得到目标文本,实现基于初始文本中待处理字符的初始字符特征确定对其进行纠正处理的策略,有效提升对初始文本中待处理字符进行纠正处理的针对性,提升初始文本中字符处理准确率。
图4是本公开另一实施例提出的文本处理方法的流程示意图。
如图4所示,该文本处理方法,包括:
S401:获取初始文本,其中,初始文本是对图像识别得到。
针对S401的说明可以参见上述实施例,在此不再赘述。
S402:采用OCR技术确定与初始文本对应的初始语义特征,其中,初始语义特征描述文本处理信息。
在本公开的描述中,术语“初始语义特征”,是指对初始文本进行语义识别所得的语义特征,该初始语义特征能够用于表征初始文本的语义维度的特征。
可选地,一些实施例中,在采用OCR技术确定初始文本的初始语义特征时,可以确定初始文本的文本语义,和文本语义指示的语义标记结果,将文本语义和语义标记结果作为初始语义特征,能够有效提升初始文本的语义表征准确性,基于文本语义和语义标记结果来体现初始语义特征,能够便于对初始语义特征进行有效地纠错处理,有效提升纠错处理效率。
在本公开的描述中,术语“文本语义”,是指直接基于语义识别对初始文本所识别的语义,术语“语义标记结果”,是指基于该文本语义对初始文本进行语义标记,所得标记结果。
举例而言,文本语义例如是江宁区交巡警大队车辆管理所,则语义标记结果例如是湘A906235678,此时,语义标记结果指示的是车辆标识结果,而文本语义可以用于描述该车辆标识结果相对应的发证机关。
本公开实施例中支持对上述语义标记结果和对应的文本语义之间的对应关系进行相应的纠错处理,具体可以参见后续实施例。
S403:调用RPA机器人处理文本处理信息,以确定纠错对应关系,其中,纠错对应关系包括:多个纠错文本,以及与每个纠错文本对应的纠错标记结果。
在本公开的描述中,术语“纠错文本”,是指用于对初始文本中文本语义进行纠错参考的文本,该纠错文本可以是预先基于海量数据分析得出的。
在本公开的描述中,术语“纠错标记结果”,是指基于该纠错文本的语义对纠错文本进行语义标记,所得标记结果,该纠错标记结果可以和上述纠错文本一并对初始文本的文本语义和语义标记结果之间的关系进行纠错调整。
在本公开的描述中,术语“纠错对应关系”,是指用于描述上述纠错文本与纠错标记结果之间关联的对应关系。
纠错对应关系,也可以是预先基于海量数据分析得出,并且支持在实际应用过程中动态调整。
纠错对应关系可以例如:
城市全称和城市简称之间的对应关系。
城市全称和城市简称之间的对应关系的获取方式,可以是获取全国所有省、市、区,并编辑对应关系,列表按照先区后市的顺序排列。例如:
上城区,浙A;拱墅区,浙A;西湖区,浙A;建德市,浙A;………杭州市,浙A;历下区,鲁A;市中区,鲁A;槐荫区,鲁A;………济南市,鲁A;江宁区,苏A;六合区,苏A;溧水区,苏A;高淳区,苏A;………南京市,苏A;………。
S404:从多个纠错文本中确定与初始文本所匹配的纠错文本,其中,所匹配的纠错文本具有所对应的纠错标记结果。
其中,可以确定与初始文本所匹配的纠错文本,而后基于所匹配的纠错文本所对应的纠错标记结果,对初始文本中已有标记结果进行纠错调整处理。
S405:根据对应的纠错标记结果对初始文本的已有标记结果进行纠正处理,得到目标文本。
举例而言,基于图像的光学字符识别OCR识别内容为(已有标记结果):湘A906235678;发证机关(纠错文本):江宁区交巡警大队车辆管理所,判定是否符合机动车车牌规则,第一位省简称,第二位是英文字母,按照这个规则上面OCR识别内容为(已有标记结果)得到,第一位和第二位结果为:“湘A”,而后参考城市全称和城市简称之间的对应关系,得到“江宁区”应是“苏A”,替换初始文本中的已有标记结果中的“湘A”为“苏A”,得到目标文本。
本公开实施例中,能够较大幅度提升基于图像的文本识别的准确率,真实数据验证准确率从69%提升到98%,有效地缩短了基于图像的文本识别的结案时间;由于不需要基于海量图像数据来重复训练文本识别模型以提升模型的准确率,从而能够有效节省模型重复训练成本;还支持在实际应用过程中动态增加和修改纠正列表,提高纠正的准确率。
本实施例中,通过获取初始文本,其中,初始文本是对图像识别得到,采用OCR技术确定与初始文本对应的初始语义特征,其中,初始语义特征描述文本处理信息,并调用RPA机器人处理文本处理信息,以确定纠错对应关系,从多个纠错文本中确定与初始文本所匹配的纠错文本,其中,所匹配的纠错文本具有所对应的纠错标记结果,以及根据对应的纠错标记结果对初始文本的已有标记结果进行纠正处理,得到目标文本,实现基于初始文本对应的初始语义特征确定对其进行纠正处理的策略,有效提升对初始文本的语义特征进行纠正处理的针对性,提升初始文本中语义表征的准确率。
图5是本公开一实施例提出的文本处理装置的结构示意图。
如图5所示,该文本处理装置50,包括:
获取模块501,用于获取初始文本,其中,初始文本是对图像识别得到。
确定模块502,用于确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息。
处理模块503,用于根据文本处理信息处理初始文本,得到目标文本。
可选地,一些实施例中,如图6所示,图6是本公开另一实施例提出的文本处理装置的结构示意图,确定模块502,包括:
第一确定子模块5021,用于在初始文本包括待处理文字时,采用人工智能AI领域的光学字符识别OCR技术确定待处理文字的初始形态特征,其中,初始形态特征被作为文本分类特征;和/或
第二确定子模块5022,用于在初始文本包括待处理字符时,采用OCR技术确定待处理字符的初始字符特征,其中,初始字符特征被作为文本分类特征;和/或
第三确定子模块5023,用于采用OCR技术确定初始文本的初始语义特征,其中,初始语义特征被作为文本分类特征。
可选地,一些实施例中,文本处理信息由初始形态特征描述;
其中,处理模块503,具体用于:
调用机器人流程自动化RPA机器人处理文本处理信息,以确定纠错文字的参考形态特征;
确定初始形态特征和参考形态特征之间的相似度信息;
根据相似度信息,确定处理结果值;
根据处理结果值处理初始文本,得到目标文本。
可选地,一些实施例中,处理结果值包括:信心标识,和与信息标识对应的信心评价值;其中,处理模块503,具体用于:
如果信心标识是目标标识,且信心评价值小于或等于设定阈值,则将初始文本中待处理文字调整为纠错文字,以得到目标文本;
如果信心标识不是目标标识,或信心评价值大于设定阈值,则将初始文本作为目标文本。
可选地,一些实施例中,文本处理信息由初始字符特征描述;
其中,处理模块503,具体用于:
调用RPA机器人处理文本处理信息,以确定参考字符特征;
根据参考字符特征对初始文本中待处理字符进行纠正处理,得到目标文本。
可选地,一些实施例中,文本处理信息由初始语义特征描述;
其中,处理模块503,具体用于:
调用RPA机器人处理文本处理信息,以确定纠错对应关系,其中,纠错对应关系包括:多个纠错文本,以及与每个纠错文本对应的纠错标记结果;
从多个纠错文本中确定与初始文本所匹配的纠错文本,其中,所匹配的纠错文本具有所对应的纠错标记结果;
根据对应的纠错标记结果对初始文本的已有标记结果进行纠正处理,得到目标文本。
可选地,一些实施例中,第一确定子模块5021,具体用于:
采用OCR技术确定待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征;
将结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征作为初始形态特征。
可选地,一些实施例中,第二确定子模块5022,具体用于:
采用OCR技术确定待处理字符的格式特征,并将格式特征作为初始字符特征。
可选地,一些实施例中,第三确定子模块5023,具体用于:
采用OCR技术确定初始文本的文本语义,和文本语义指示的语义标记结果;
将文本语义和语义标记结果作为初始语义特征。
与上述图1至图6实施例提供的文本处理方法相对应,本公开还提供一种文本处理装置,由于本公开实施例提供的文本处理装置与上述图1至图6实施例提供的文本处理方法相对应,因此在文本处理方法的实施方式也适用于本公开实施例提供的文本处理装置,在本公开实施例中不再详细描述。
本公开实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
本实施例中,通过获取初始文本,其中,初始文本是对图像识别得到,并确定与初始文本对应的文本分类特征,其中,文本分类特征描述文本处理信息,以及根据文本处理信息处理初始文本,得到目标文本,能够在基于图像识别得到文本之后,基于与文本对应的文本分类特征对所识别的文本进行个性化的优化处理,从而能够有效提升基于图像的文本识别的准确率。
为了实现上述实施例,本公开还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的文本处理方法。
图7示出根据本公开一实施例的电子设备的结构框图。如图7所示,该电子设备70包括:存储器710和处理器720,存储器710内存储有可在处理器720上运行的计算机程序。处理器720执行该计算机程序时实现上述实施例中的文本处理方法。存储器710和处理器720的数量可以为一个或多个。
该电子设备70还包括:
通信接口730,用于与外界设备进行通信,进行数据交互传输。
如果存储器710、处理器720和通信接口730独立实现,则存储器710、处理器720和通信接口730可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器710、处理器720及通信接口730集成在一块芯片上,则存储器710、处理器720及通信接口730可以通过内部接口完成相互间的通信。
本公开实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本公开实施例中提供的方法。
本公开实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本公开实施例提供的方法。
本公开实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(Advanced RISC Machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic Random Access Memory,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本公开的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本公开的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。
应理解的是,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (15)

1.一种文本处理方法,其特征在于,包括:
获取初始文本,其中,所述初始文本是对图像识别得到;
确定与所述初始文本对应的文本分类特征,其中,所述文本分类特征描述文本处理信息;
根据所述文本处理信息处理所述初始文本,得到目标文本。
2.如权利要求1所述的方法,其特征在于,所述确定与所述初始文本对应的文本分类特征,包括:
如果所述初始文本包括待处理文字,则采用人工智能AI领域的光学字符识别OCR技术确定所述待处理文字的初始形态特征,其中,所述初始形态特征被作为所述文本分类特征;和/或
如果所述初始文本包括待处理字符,则采用所述OCR技术确定所述待处理字符的初始字符特征,其中,所述初始字符特征被作为所述文本分类特征;和/或
采用所述OCR技术确定所述初始文本的初始语义特征,其中,所述初始语义特征被作为所述文本分类特征。
3.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始形态特征描述;
其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:
调用机器人流程自动化RPA机器人处理所述文本处理信息,以确定纠错文字的参考形态特征;
确定所述初始形态特征和所述参考形态特征之间的相似度信息;
根据所述相似度信息,确定处理结果值;
根据所述处理结果值处理所述初始文本,得到所述目标文本。
4.如权利要求3所述的方法,其特征在于,所述处理结果值包括:信心标识,和与所述信息标识对应的信心评价值;
其中,所述根据所述处理结果值处理所述初始文本,得到所述目标文本,包括:
如果所述信心标识是目标标识,且所述信心评价值小于或等于设定阈值,则将所述初始文本中所述待处理文字调整为所述纠错文字,以得到所述目标文本;
如果所述信心标识不是所述目标标识,或所述信心评价值大于所述设定阈值,则将所述初始文本作为所述目标文本。
5.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始字符特征描述;
其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:
调用RPA机器人处理所述文本处理信息,以确定参考字符特征;
根据所述参考字符特征对所述初始文本中所述待处理字符进行纠正处理,得到所述目标文本。
6.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始语义特征描述;
其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:
调用RPA机器人处理所述文本处理信息,以确定纠错对应关系,其中,所述纠错对应关系包括:多个纠错文本,以及与每个所述纠错文本对应的纠错标记结果;
从所述多个纠错文本中确定与所述初始文本所匹配的纠错文本,其中,所述所匹配的纠错文本具有所对应的纠错标记结果;
根据所述对应的纠错标记结果对所述初始文本的已有标记结果进行纠正处理,得到所述目标文本。
7.如权利要求2所述的方法,其特征在于,所述采用人工智能AI领域的光学字符识别OCR技术确定所述待处理文字的初始形态特征,包括:
采用所述OCR技术确定所述待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁部首特征;
将所述结构特征、和/或所述笔画特征、和/或所述编码特征、和/或所述偏旁部首特征作为所述初始形态特征。
8.如权利要求2所述的方法,其特征在于,所述采用所述OCR技术确定所述待处理字符的初始字符特征,包括:
采用所述OCR技术确定所述待处理字符的格式特征,并将所述格式特征作为所述初始字符特征。
9.如权利要求2所述的方法,其特征在于,所述采用所述OCR技术确定所述初始文本的初始语义特征,包括:
采用所述OCR技术确定所述初始文本的文本语义,和所述文本语义指示的语义标记结果;
将所述文本语义和所述语义标记结果作为所述初始语义特征。
10.一种文本处理装置,其特征在于,包括:
获取模块,用于获取初始文本,其中,所述初始文本是对图像识别得到;
确定模块,用于确定与所述初始文本对应的文本分类特征,其中,所述文本分类特征描述文本处理信息;
处理模块,用于根据所述文本处理信息处理所述初始文本,得到目标文本。
11.如权利要求10所述的装置,其特征在于,所述确定模块,包括:
第一确定子模块,用于在所述初始文本包括待处理文字时,采用人工智能AI领域的光学字符识别OCR技术确定所述待处理文字的初始形态特征,其中,所述初始形态特征被作为所述文本分类特征;和/或
第二确定子模块,用于在所述初始文本包括待处理字符时,采用所述OCR技术确定所述待处理字符的初始字符特征,其中,所述初始字符特征被作为所述文本分类特征;和/或
第三确定子模块,用于采用所述OCR技术确定所述初始文本的初始语义特征,其中,所述初始语义特征被作为所述文本分类特征。
12.如权利要求11所述的装置,其特征在于,所述文本处理信息由所述初始形态特征描述;
其中,所述处理模块,具体用于:
调用机器人流程自动化RPA机器人处理所述文本处理信息,以确定纠错文字的参考形态特征;
确定所述初始形态特征和所述参考形态特征之间的相似度信息;
根据所述相似度信息,确定处理结果值;
根据所述处理结果值处理所述初始文本,得到所述目标文本。
13.如权利要求12所述的装置,其特征在于,所述处理结果值包括:信心标识,和与所述信息标识对应的信心评价值;
其中,所述处理模块,具体用于:
如果所述信心标识是目标标识,且所述信心评价值小于或等于设定阈值,则将所述初始文本中所述待处理文字调整为所述纠错文字,以得到所述目标文本;
如果所述信心标识不是所述目标标识,或所述信心评价值大于所述设定阈值,则将所述初始文本作为所述目标文本。
14.一种电子设备,其特征在于,包括:
至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-9任一项所述的文本处理方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-9任一项所述的文本处理方法。
CN202210800979.5A 2022-07-08 2022-07-08 文本处理方法、装置、电子设备及存储介质 Pending CN115116069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210800979.5A CN115116069A (zh) 2022-07-08 2022-07-08 文本处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210800979.5A CN115116069A (zh) 2022-07-08 2022-07-08 文本处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115116069A true CN115116069A (zh) 2022-09-27

Family

ID=83332348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210800979.5A Pending CN115116069A (zh) 2022-07-08 2022-07-08 文本处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115116069A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217876A (zh) * 2023-11-08 2023-12-12 深圳市明心数智科技有限公司 基于ocr技术的订单预处理方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217876A (zh) * 2023-11-08 2023-12-12 深圳市明心数智科技有限公司 基于ocr技术的订单预处理方法、装置、设备及介质
CN117217876B (zh) * 2023-11-08 2024-03-26 深圳市明心数智科技有限公司 基于ocr技术的订单预处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN112016310A (zh) 文本纠错方法、***、设备及可读存储介质
CN111695439A (zh) 图像结构化数据提取方法、电子装置及存储介质
JP2023509405A (ja) 翻訳方法、装置、電子機器及びコンピュータプログラム
CN114596566B (zh) 文本识别方法及相关装置
CN112463986A (zh) 信息存储的方法及装置
CN115034200A (zh) 图纸信息提取方法、装置、电子设备及存储介质
CN111666931B (zh) 基于混合卷积文字图像识别方法、装置、设备及存储介质
CN114925170B (zh) 文本校对模型训练方法及装置、计算设备
CN117083605A (zh) 用于文本-图像-布局变换器模型的迭代训练
CN116152840A (zh) 文件分类方法、装置、设备和计算机存储介质
CN115116069A (zh) 文本处理方法、装置、电子设备及存储介质
CN117709317A (zh) 报表文件的处理方法、装置及电子设备
CN111881900B (zh) 语料生成、翻译模型训练、翻译方法、装置、设备及介质
CN117274969A (zh) 一种***识别方法、装置、设备及介质
CN113434631A (zh) 基于事件的情感分析方法、装置、计算机设备及存储介质
CN109902309B (zh) 翻译方法、装置、设备和存储介质
CN110110050B (zh) 一种新闻事件生成式问答数据集的生成方法
CN114399782B (zh) 文本图像处理方法、装置、设备、存储介质及程序产品
US20230082485A1 (en) Machine learning techniques for denoising input sequences
CN115346095A (zh) 视觉问答方法、装置、设备及存储介质
CN114219438A (zh) 基于rpa及ai的公文文件分发方法、装置、设备及介质
CN114331932A (zh) 目标图像生成方法和装置、计算设备以及计算机存储介质
CN114067343A (zh) 一种数据集的构建方法、模型训练方法和对应装置
CN113407676A (zh) 题目批改方法和***、电子设备和计算机可读介质
CN113283241A (zh) 文本识别方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination