CN112164403A - 一种基于人工智能的自然语言处理*** - Google Patents

一种基于人工智能的自然语言处理*** Download PDF

Info

Publication number
CN112164403A
CN112164403A CN202011030529.XA CN202011030529A CN112164403A CN 112164403 A CN112164403 A CN 112164403A CN 202011030529 A CN202011030529 A CN 202011030529A CN 112164403 A CN112164403 A CN 112164403A
Authority
CN
China
Prior art keywords
unit
pinyin
target
natural language
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011030529.XA
Other languages
English (en)
Inventor
韩岭
蔡进
胥传龙
李明
吴开凯
杨昆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Sixiang Software Co ltd
Original Assignee
Jiangsu Sixiang Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Sixiang Software Co ltd filed Critical Jiangsu Sixiang Software Co ltd
Priority to CN202011030529.XA priority Critical patent/CN112164403A/zh
Publication of CN112164403A publication Critical patent/CN112164403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明属于自然语言处理技术领域,公开了一种基于人工智能的自然语言处理***,包括:语音识别模块,用于采集、识别语音资料,并将所述语音资料转换为拼音字符所组成的目标文本;语音处理模块,用于对所述目标文本进行纠错及修正处理,并以处理后的目标修正方案作为输出结果进行输出;其中,所述语音处理模块包括:分词单元,用于对所述目标文本进行拼音分词,获得拼音序列;文本分析单元,识别所述拼音序列的错误,并分析所述错误的类型;修正单元,根据所述文本分析单元的分析结果给出至少一个修正方案;优选单元,对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出。

Description

一种基于人工智能的自然语言处理***
技术领域
本发明属于自然语言处理技术领域,具体涉及一种基于人工智能的自然语言处理***。
背景技术
自然语言处理(Natural Language Processing,NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言处理基本包括认知、理解、生成等部分。自然语言认知和理解是让电脑把获取的自然语言变成有意义的符号并建立相应的关系,然后再根据使用目的进行处理。近年来自然语言处理成为热门研究方向,其中机器翻译是自然语言处理最早的研究工作。
目前,自然语言处理大多是基于规则的方法,在这种方法中,仅限于一个孤立句子的分析,难以配合上下文之间的关联以及谈话语境,因此存在语言处理局限性较大、准确性较低、智能程度较低的问题。
发明内容
鉴于此,为解决现有技术中的不足,本发明的目的在于提供一种基于人工智能的自然语言处理***。
为实现上述目的,本发明提供如下技术方案:一种基于人工智能的自然语言处理***,包括:
语音识别模块,用于采集、识别语音资料,并将所述语音资料转换为拼音字符所组成的目标文本;
语音处理模块,用于对所述目标文本进行纠错及修正处理,并以处理后的目标修正方案作为输出结果进行输出;
其中,所述语音处理模块包括:
分词单元,用于对所述目标文本进行拼音分词,获得拼音序列;
文本分析单元,识别所述拼音序列的错误,并分析所述错误的类型,且错误类型包括语法错误、语义错误和语用错误;
修正单元,根据所述文本分析单元的分析结果给出至少一个修正方案;
优选单元,对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出。
优选的,所述语音识别模块包括:
语言采集单元,用于在线采集语音资料,并将所述语音资料转换为TXT格式文本进行保存;
预处理单元,根据预设的分词程序对所述格式文本进行分词,并滤除格式文本中已停用的词或词组,获得目标特征集合;
特征提取单元,对所述目标特征集合进行特征提取,获得语音特征序列,并将所述语音特征序列转换为拼音特征序列;
识别单元,将所述拼音特征序列与声学模型进行识别配合与比较,获得目标识别结果,且目标识别结果为拼音字符所组成的目标文本。
优选的,所述预处理单元中所采用的分词程序为中文汉字分词程序。
优选的,所述预处理单元进行分词处理时,相邻词或词组之间通过空格进行分隔。
优选的,在所述特征提取单元中,将所述语音特征序列转换为拼音特征序列包括:
根据汉字的ASCII码将所述语音特征序列转换为拼音特征序列;或
根据汉字的Unicode值将所述语音特征序列转换为拼音特征序列。
优选的,所述的处理***还包括知识库,且所述知识库包括静态库和动态库,所述修正单元结合错误类型以及所述静态库和动态库中存储的应用文本给出至少一个修正方案。
优选的,所述静态库用于储存标准文本和历史识别的语音文本,并可进行自动更新;所述动态库基于当前采集的语音资料自动构建,且从所述静态库中筛选与当前采集的语音资料语境相同的标准文本或语音文本。
优选的,在所述识别单元中,所述声学模型为通过静态库中的标准文本进行预训练后的声学模型;且每更新一次静态库,对应执行一次声学模型的预训练。
优选的,所述优选单元根据每个修正方案所修正的错误数量进行目标修正方案的优选,且所述目标修正方案所修正的错误数量最多。
优选的,所述知识库还包括停用词库,且所述预处理单元依据停用词库滤除已停用的词或词组。
本发明与现有技术相比,具有以下有益效果:
在本发明中,结合语法分析、语义分析和语用分析对传统识别的自然语言进行进一步的纠错处理,由此使得最终输出的结果能更准确的适应于实际的谈话环境,进而有效提高整体处理***对语音识别的准确率。
另外,在整体***中设置包含静态库和动态库的知识库,其中静态库可基于历史识别记录进行自动更新,动态库则基于当前所采集的语音资料自动进行文本信息的筛选,由此进一步提高整体***对特定问题的适应能力和处理效率。
附图说明
图1为本发明所提供的自然语言处理***的结构框图;
图2为本发明所提供的自然语言处理***执行处理时的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,公开了一种基于人工智能的自然语言处理***,具体请参阅图1所示,该处理***包括如下结构:
语音识别模块10,用于采集、识别语音资料,并将语音资料转换为拼音字符所组成的目标文本;
具体的,语音识别模块10包括如下:
语言采集单元11,用于在线采集语音资料,并将语音资料转换为TXT格式文本进行保存;
预处理单元12,根据预设的分词程序对(TXT)格式文本进行分词,并滤除(TXT)格式文本中已停用的词或词组,获得目标特征集合;其中,关于分词程序,采用的是中文汉字分词程序,且在进行进行分词处理时,相邻词或词组之间通过空格进行分隔;
特征提取单元13,对目标特征集合进行特征提取,获得语音特征序列,并将语音特征序列转换为拼音特征序列;具体表现为,将目标特征集合按照其语音波形随时间的变化分成多个离散的片段,并对多个片段依次进行标号,对应的,每一个片段中均包括至少一个词或词组,由此根据标号能形成语音特征序列;
识别单元14,将拼音特征序列与声学模型进行识别配合与比较,获得目标识别结果,且目标识别结果为拼音字符所组成的目标文本。
语音处理模块20,用于对目标文本进行纠错及修正处理,并以处理后的目标修正方案作为输出结果进行输出;
具体的,语音处理模块20包括如下:
分词单元21,用于对目标文本进行拼音分词,获得拼音序列;
文本分析单元22,识别拼音序列的错误,并分析错误的类型,且错误类型包括语法错误、语义错误和语用错误;
修正单元23,根据文本分析单元22的分析结果给出至少一个修正方案;
优选单元24,对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出。
知识库30,包括静态库31、动态库32和停用词库33。其中,静态库31用于储存标准文本和历史识别的语音文本,并可进行自动更新;动态库32基于当前采集的语音资料自动构建,且从静态库31中筛选与当前采集的语音资料语境相同的标准文本或语音文本。
另外:
上述修正单元23修正处理时,结合错误类型以及静态库31和动态库32中存储的应用文本给出至少一个修正方案。
在识别单元14中,声学模型为通过静态库31中的标准文本进行预训练后的声学模型;且每更新一次静态库31,对应执行一次声学模型的预训练。
具体,关于静态库31中所储存的标准文本信息可从书籍、新闻、网页(例如百度百科、***等)等数据源中收集;例如,可以对书籍中的文字进行文字识别,特别是标准性书籍(如词典等),对应均可储存于静态库31中作为标准文本。
综上,关于上述公开的一种基于人工智能的自然语言处理***在其进行语音识别处理时,具体包括如下步骤:
S1.在线采集语音资料,并将语音资料转换为TXT格式文本进行保存;
例如,通过语言采集单元11采集的语音资料为“什么时候会下鱼”,对应的其应用语境设为天气查询;
S2.根据预设的中文汉字分词程序对格式文本进行分词,并滤除格式文本中已停用的词或词组,获得目标特征集合;
具体,将“什么时候会下雨”分词形成“什么”-“时候”-“会”-“下鱼”的词及词组序列;并且根据知识库30中的停用词库33,该序列中不包含已停用的词或词组。
S3.对目标特征集合进行特征提取,获得语音特征序列,并将语音特征序列转换为拼音特征序列;
具体,根据汉字的ASCII码将语音特征序列转换为拼音特征序列;由于汉字在计算机***中以ASCII码表示,只需要利用计算机***中已有的或用户建立的每个拼音与每个ASCII码对应关系,即可实现将句子转换成拼音序列。若句子含有多音字,则可以根据所采集的语音资料读音进行确定。例如“会”包含有“hui”和“kuai”两个读音,则以语音资料的读音为准,以获得对应的语音特征序列:“shenme”-“shihou”-“hui”-“xiayu”。
另外,还可根据汉字的Unicode值将语音特征序列转换为拼音特征序列。
S4.将拼音特征序列与声学模型进行识别配合与比较,获得目标识别结果,且目标识别结果为拼音字符所组成的目标文本;
S5.用于对目标文本进行拼音分词,获得拼音序列;
S6.识别拼音序列的错误,并分析错误的类型;
在“shenme”-“shihou”-“hui”-“xiayu”中,包括:语义错误“xiayu”,如下雨/下鱼/夏禹/下狱等均有各不相同的语义;语法错误,缺少限定;
S7.结合错误类型以及静态库31和动态库32中存储的应用文本给出至少一个修正方案;
关于上述语义错误,给出方案1:“什么时候会下雨”;给出方案2:“什么时候回夏禹”;
针对语法错误,结合上述方案1,根据静态库31和动态库32中存储的应用文本可知,语法缺少时间限定,进而根据天气查询语境所建立的动态库32给出修正方案可为:“这个星期什么时候会下雨”;结合上述方案2,根据静态库31和动态库32中存储的应用文本可知,语法缺少时间限定和目的限定,进而根据天气查询语境所建立的动态库32给出修正方案可为:“什么时候回夏禹”;
S8.对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出;
由上述给出的两个修正方案可知,“这个星期什么时候会下雨”所修正的错误数量最多最多,因此以“这个星期什么时候会下雨”作为输出结果进行输出。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于人工智能的自然语言处理***,其特征在于,包括:
语音识别模块,用于采集、识别语音资料,并将所述语音资料转换为拼音字符所组成的目标文本;
语音处理模块,用于对所述目标文本进行纠错及修正处理,并以处理后的目标修正方案作为输出结果进行输出;
其中,所述语音处理模块包括:
分词单元,用于对所述目标文本进行拼音分词,获得拼音序列;
文本分析单元,识别所述拼音序列的错误,并分析所述错误的类型,且错误类型包括语法错误、语义错误和语用错误;
修正单元,根据所述文本分析单元的分析结果给出至少一个修正方案;
优选单元,对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出。
2.根据权利要求1所述的一种基于人工智能的自然语言处理***,其特征在于,所述语音识别模块包括:
语言采集单元,用于在线采集语音资料,并将所述语音资料转换为TXT格式文本进行保存;
预处理单元,根据预设的分词程序对所述格式文本进行分词,并滤除格式文本中已停用的词或词组,获得目标特征集合;
特征提取单元,对所述目标特征集合进行特征提取,获得语音特征序列,并将所述语音特征序列转换为拼音特征序列;
识别单元,将所述拼音特征序列与声学模型进行识别配合与比较,获得目标识别结果,且目标识别结果为拼音字符所组成的目标文本。
3.根据权利要求2所述的一种基于人工智能的自然语言处理***,其特征在于:所述预处理单元中所采用的分词程序为中文汉字分词程序。
4.根据权利要求3所述的一种基于人工智能的自然语言处理***,其特征在于:所述预处理单元进行分词处理时,相邻词或词组之间通过空格进行分隔。
5.根据权利要求2所述的一种基于人工智能的自然语言处理***,其特征在于,在所述特征提取单元中,将所述语音特征序列转换为拼音特征序列包括:
根据汉字的ASCII码将所述语音特征序列转换为拼音特征序列;或
根据汉字的Unicode值将所述语音特征序列转换为拼音特征序列。
6.根据权利要求2-5中任意一项所述的一种基于人工智能的自然语言处理***,其特征在于:所述的处理***还包括知识库,且所述知识库包括静态库和动态库,所述修正单元结合错误类型以及所述静态库和动态库中存储的应用文本给出至少一个修正方案。
7.根据权利要求6所述的一种基于人工智能的自然语言处理***,其特征在于:所述静态库用于储存标准文本和历史识别的语音文本,并可进行自动更新;所述动态库基于当前采集的语音资料自动构建,且从所述静态库中筛选与当前采集的语音资料语境相同的标准文本或语音文本。
8.根据权利要求7所述的一种基于人工智能的自然语言处理***,其特征在于:在所述识别单元中,所述声学模型为通过静态库中的标准文本进行预训练后的声学模型;
且每更新一次静态库,对应执行一次声学模型的预训练。
9.根据权利要求7所述的一种基于人工智能的自然语言处理***,其特征在于,所述优选单元根据每个修正方案所修正的错误数量进行目标修正方案的优选,且所述目标修正方案所修正的错误数量最多。
10.根据权利要求6所述的一种基于人工智能的自然语言处理***,其特征在于:所述知识库还包括停用词库,且所述预处理单元依据停用词库滤除已停用的词或词组。
CN202011030529.XA 2020-09-27 2020-09-27 一种基于人工智能的自然语言处理*** Pending CN112164403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011030529.XA CN112164403A (zh) 2020-09-27 2020-09-27 一种基于人工智能的自然语言处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011030529.XA CN112164403A (zh) 2020-09-27 2020-09-27 一种基于人工智能的自然语言处理***

Publications (1)

Publication Number Publication Date
CN112164403A true CN112164403A (zh) 2021-01-01

Family

ID=73864227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011030529.XA Pending CN112164403A (zh) 2020-09-27 2020-09-27 一种基于人工智能的自然语言处理***

Country Status (1)

Country Link
CN (1) CN112164403A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662933A (zh) * 2012-03-28 2012-09-12 成都优译信息技术有限公司 分布式智能翻译方法
CN108229137A (zh) * 2017-12-29 2018-06-29 北京长御科技有限公司 一种分配文档权限的方法及装置
WO2018121757A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 文本语音播报方法及***
CN109255113A (zh) * 2018-09-04 2019-01-22 郑州信大壹密科技有限公司 智能校对***
CN109635298A (zh) * 2018-12-11 2019-04-16 平安科技(深圳)有限公司 团体状态识别方法、装置、计算机设备及存储介质
CN110110041A (zh) * 2019-03-15 2019-08-09 平安科技(深圳)有限公司 错词纠正方法、装置、计算机装置及存储介质
CN110717021A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 人工智能面试中获取输入文本和相关装置
CN110909550A (zh) * 2019-11-13 2020-03-24 北京环境特性研究所 文本处理方法、装置、电子设备和可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662933A (zh) * 2012-03-28 2012-09-12 成都优译信息技术有限公司 分布式智能翻译方法
WO2018121757A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 文本语音播报方法及***
CN108229137A (zh) * 2017-12-29 2018-06-29 北京长御科技有限公司 一种分配文档权限的方法及装置
CN109255113A (zh) * 2018-09-04 2019-01-22 郑州信大壹密科技有限公司 智能校对***
CN109635298A (zh) * 2018-12-11 2019-04-16 平安科技(深圳)有限公司 团体状态识别方法、装置、计算机设备及存储介质
CN110110041A (zh) * 2019-03-15 2019-08-09 平安科技(深圳)有限公司 错词纠正方法、装置、计算机装置及存储介质
CN110717021A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 人工智能面试中获取输入文本和相关装置
CN110909550A (zh) * 2019-11-13 2020-03-24 北京环境特性研究所 文本处理方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN107315737B (zh) 一种语义逻辑处理方法及***
CN109255113B (zh) 智能校对***
CN109635288A (zh) 一种基于深度神经网络的简历抽取方法
KR20110038474A (ko) 문장경계 인식 장치 및 방법
CN109949799B (zh) 一种语义解析方法及***
CN110942767B (zh) 一种asr语言模型识别标注与优化方法及其装置
CN110008473B (zh) 一种基于迭代方法的医疗文本命名实体识别标注方法
CN111460175A (zh) 一种基于snomed-ct的医学名词词典构造与拓展方法
CN114927177B (zh) 一种融合中文医疗领域特征的医疗实体识别方法及***
CN112818680A (zh) 语料的处理方法、装置、电子设备及计算机可读存储介质
CN111444704A (zh) 基于深度神经网络的网络安全关键词抽取方法
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
CN113761903A (zh) 一种针对海量高噪音口语化短文本的文本筛选方法
CN109918677B (zh) 一种英文单词语义解析的方法及***
CN113255331A (zh) 文本纠错方法、装置及存储介质
CN112765977A (zh) 一种基于跨语言数据增强的分词方法及装置
CN111933116A (zh) 语音识别模型训练方法、***、移动终端及存储介质
CN106682642A (zh) 多面向语言行为识别方法及***
CN111046663A (zh) 一种中文表单的智能校正方法
Mekki et al. COTA 2.0: An automatic corrector of Tunisian Arabic social media texts
CN112164403A (zh) 一种基于人工智能的自然语言处理***
CN114996387A (zh) 一种基于索引数据的自然语言处理方法和***
CN109446537B (zh) 一种针对机器翻译的译文评估方法及装置
CN113705223A (zh) 以读者为中心的个性化英文文本简化方法
CN112632985A (zh) 语料的处理方法、装置、存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination