CN110457695B - 一种在线文字纠错方法及*** - Google Patents
一种在线文字纠错方法及*** Download PDFInfo
- Publication number
- CN110457695B CN110457695B CN201910696146.7A CN201910696146A CN110457695B CN 110457695 B CN110457695 B CN 110457695B CN 201910696146 A CN201910696146 A CN 201910696146A CN 110457695 B CN110457695 B CN 110457695B
- Authority
- CN
- China
- Prior art keywords
- character
- characters
- character string
- continuous
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种在线文字纠错方法及***,通过先将用户键入的字符识别为语句,根据语句中字符间的内聚性将字符串捆绑为语片,可以识别出语句中是否存在连续两个以上的字符无法捆绑为语片的情况,则出现错别字的可能性较高,由于在用户键入字符的过程中,常常会出现拼音输入选择错误导致的错别字,故本方法通过检索相同拼音的替代字符,对原字符中的错别字进行替换,由于用户键入字符的过程中,也常常会出现单个拼音键入错误导致的错别字,故本方法对各字符拼音中的任意一位进行模糊处理并进行模糊检索,寻找替代字符对错别字进行替换,可以有效地对用户键入的字符进行在线文字纠错。
Description
技术领域
本发明涉及文字处理领域,特别是指一种在线文字纠错方法及***。
背景技术
在用户输入文字的过程中,难免会出现错别字的情况,但用户自身往往难以发现输入错误,这就导致最终完成的文章存在错别字,影响其他人对文章的理解,或是出现影响个人和企业的形象问题;
现有的文字处理软件中,虽然存在疑似错别字提醒功能,但往往只是将用户键入的字符与常用字库进行比对,若用户键入的字符不属于常用字库,则对字符串进行标记,但这种方法既没有考虑到语句本身的结构和汉语的使用习惯,也不能进行自动纠错,其效果有限,因此需要一种在线文字纠错方法及***。
发明内容
有鉴于此,本发明的目的在于提出一种在线文字纠错方法及***,提高文字处理的准确性和效率。
基于上述目的本发明提供的一种在线文字纠错方法,本方法包括:
寻找用户键入的若干字符中的句末类标点符号,将相邻句末类标点符号之间的字符判断为语句;
对语句进行预处理,根据字符间的内聚性将字符串捆绑为语片;
若出现连续两个以上的字符无法捆绑为语片,结合内聚性和各字符的拼音在数据库中进行逐一检索,判断是否能找到相同拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对各字符拼音中的任意一位进行模糊处理,在数据库中进行逐一模糊检索,判断是否能找到相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对该连续字符进行标记。
优选地,出现连续两个以上的字符无法捆绑为语片时,提取该连续字符串的拼音,并在人名库中检索是否存在相同拼音的人名,若检索到相同拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
优选地,在人名库中检索是否存在相同拼音的人名时,若无法检索到相同拼音的人名,则对字符串拼音中的任意一位进行模糊处理,在人名库中进行模糊检索,若检索到相似拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
优选地,本方法还包括:
检索到语句中出现多个人名,且各人名间采用表示并列的字符时,根据姓名排序库中的排序对多个人名的顺序进行重新排序。
优选地,本方法还包括:
对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,若该错别字符串在错别字库中的重复次数超过设定阈值,则自动对该错别字符串进行替换。
一种在线文字纠错***,包括:
数据库模块,存储有反应字词内聚性的常用句式集和常用词汇集;
语句判别模块,根据用户键入的若干字符中的句末类标点符号,对字符中的语句进行判别;
预处理模块,根据语句中字符间的内聚性将字符串捆绑为语片;
检索模块,在数据库中对连续两个以上的无法捆绑为语片的字符进行逐一检索和逐一模糊检索,判断是否能找到相同或相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
修正模块,可使用数据库中替代字符对原字符进行替换;
标记模块,可对字符和字符串进行标记。
优选地,数据库中还包括人名库,检索模块可根据人名库对字符串进行检索和模糊检索,检索相同拼音的人名;
修正模块可根据人名库对字符串进行修正。
优选地,***还包括排序模块,数据库中还包括姓名排序库,排序模块可根据姓名排序库中的排序对多个人名的顺序进行重新排序。
优选地,数据库中还包括错别字库,修正模块对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,检索模块对错别字库进行检索,若该错别字符串在错别字库中的重复次数超过设定阈值,则修正模块自动对该错别字符串进行替换。
从上面所述可以看出,本发明提供的在线文字纠错方法及***,通过先将用户键入的字符识别为语句,根据语句中字符间的内聚性将字符串捆绑为语片,可以识别出语句中是否存在连续两个以上的字符无法捆绑为语片的情况,则出现错别字的可能性较高,由于在用户键入字符的过程中,常常会出现拼音输入选择错误导致的错别字,故本方法通过检索相同拼音的替代字符,对原字符中的错别字进行替换,由于用户键入字符的过程中,也常常会出现单个拼音键入错误导致的错别字,故本方法对各字符拼音中的任意一位进行模糊处理并进行模糊检索,寻找替代字符对错别字进行替换,可以有效地对用户键入的字符进行在线文字纠错。
附图说明
图1为本发明实施例的在线文字纠错方法流程示意图;
图2为本发明实施例的在线文字纠错***模块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
一种在线文字纠错方法,包括以下步骤:
寻找用户键入的若干字符中的句末类标点符号,将相邻句末类标点符号之间的字符判断为语句,上述句末类标点符号,指句号、感叹号、问号等表示语句结束的标点符号。
对语句进行预处理,根据字符间的内聚性将字符串捆绑为语片,上述字符间的内聚性,指符号汉语使用习惯的常用句式和结构,如偏正短语、动补短语、介宾短语等;
若出现连续两个以上的字符无法捆绑为语片,结合内聚性和各字符的拼音在数据库中进行逐一检索,判断是否能找到相同拼音的替代字符,使连续字符能够捆绑为内聚性高的语片,一个语句中出现两个以上的字符无法捆绑为语片,则很有可能存在错别字的情况;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对各字符拼音中的任意一位进行模糊处理,在数据库中进行逐一模糊检索,判断是否能找到相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对该连续字符进行标记,标记方式可采用下划线、标色等方式。
本方法通过先将用户键入的字符识别为语句,根据语句中字符间的内聚性将字符串捆绑为语片,可以识别出语句中是否存在连续两个以上的字符无法捆绑为语片的情况,则出现错别字的可能性较高,由于在用户键入字符的过程中,常常会出现拼音输入选择错误导致的错别字,故本方法通过检索相同拼音的替代字符,对原字符中的错别字进行替换,由于用户键入字符的过程中,也常常会出现单个拼音键入错误导致的错别字,故本方法对各字符拼音中的任意一位进行模糊处理并进行模糊检索,寻找替代字符对错别字进行替换,可以有效地对用户键入的字符进行在线文字纠错。
在本发明的实施例中,本方法进一步包括,出现连续两个以上的字符无法捆绑为语片时,提取该连续字符串的拼音,并在人名库中检索是否存在相同拼音的人名,若检索到相同拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
在输入字符的过程中,常常需要输入人名,而人名显然不属于汉语中的常用词汇,故出现连续字符无法绑定为语片的可能性较高,故本方法中通过在人名库中检索是否存在相同拼音的人名,判断该字符串是否属于人名。
在本发明的实施例中,本方法进一步包括,在人名库中检索是否存在相同拼音的人名时,若无法检索到相同拼音的人名,则对字符串拼音中的任意一位进行模糊处理,在人名库中进行模糊检索,若检索到相似拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
本方法在检索人名库时,同样采用模糊处理和模糊检索的方法,可以对拼音键入错误的人名进行在线修正。
在本发明的实施例中,本方法进一步包括,检索到语句中出现多个人名,且各人名间采用表示并列的字符时,根据姓名排序库中的排序对多个人名的顺序进行重新排序。
对于企业中的姓名键入来说,当出现多个姓名并列表示时,常常需要根据领导级别等顺序对姓名进行排序,则本方法可以自动修正错误的排序,上述表示并列的字符包括“顿号”、“和”“与”等字符。
在本发明的实施例中,本方法进一步包括,对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,若该错别字符串在错别字库中的重复次数超过设定阈值,则自动对该错别字符串进行替换。
由于个人的输入习惯,常常出现重复的错误,本方法通过记录错别字符串的重复次数,当再次键入超过设定阈值的错别字符串时,自动进行修正替换,提高本发明的处理效率,且通过关联用户的输入习惯,提高准确率。
本发明还提供一种在线文字纠错***,包括数据库模块,存储有反应字词内聚性的常用句式集和常用词汇集;
语句判别模块,根据用户键入的若干字符中的句末类标点符号,对字符中的语句进行判别;
预处理模块,根据语句中字符间的内聚性将字符串捆绑为语片;
检索模块,在数据库中对连续两个以上的无法捆绑为语片的字符进行逐一检索和逐一模糊检索,判断是否能找到相同或相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
修正模块,可使用数据库中替代字符对原字符进行替换;
标记模块,可对字符和字符串进行标记。
在本发明的实施例中,数据库中还包括人名库,检索模块可根据人名库对字符串进行检索和模糊检索,检索相同拼音的人名;
修正模块可根据人名库对字符串进行修正。
在本发明的实施例中,***还包括排序模块,数据库中还包括姓名排序库,排序模块可根据姓名排序库中的排序对多个人名的顺序进行重新排序。
在本发明的实施例中,数据库中还包括错别字库,修正模块对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,检索模块对错别字库进行检索,若该错别字符串在错别字库中的重复次数超过设定阈值,则修正模块自动对该错别字符串进行替换。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种在线文字纠错方法,其特征在于,所述方法包括:
寻找用户键入的若干字符中的句末类标点符号,将相邻句末类标点符号之间的字符判断为语句;
对语句进行预处理,根据字符间的内聚性将字符串捆绑为语片;
若出现连续两个以上的字符无法捆绑为语片,结合内聚性和各字符的拼音在数据库中进行逐一检索,判断是否能找到相同拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对各字符拼音中的任意一位进行模糊处理,在数据库中进行逐一模糊检索,判断是否能找到相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
若能够找到,则使用数据库中替代字符对原字符进行替换,若不能找到,则对该连续字符进行标记;
出现连续两个以上的字符无法捆绑为语片时,提取该连续字符串的拼音,并在人名库中检索是否存在相同拼音的人名,若检索到相同拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
2.根据权利要求1所述的在线文字纠错方法,其特征在于,在人名库中检索是否存在相同拼音的人名时,若无法检索到相同拼音的人名,则对字符串拼音中的任意一位进行模糊处理,在人名库中进行模糊检索,若检索到相似拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名。
3.根据权利要求1或2所述的在线文字纠错方法,其特征在于,所述方法还包括:
检索到语句中出现多个人名,且各人名间采用表示并列的字符时,根据姓名排序库中的排序对多个人名的顺序进行重新排序。
4.根据权利要求1所述的在线文字纠错方法,其特征在于,所述方法还包括:
对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,若该错别字符串在错别字库中的重复次数超过设定阈值,则自动对该错别字符串进行替换。
5.一种在线文字纠错***,其特征在于,包括:
数据库模块,存储有反应字词内聚性的常用句式集和常用词汇集;
语句判别模块,根据用户键入的若干字符中的句末类标点符号,对字符中的语句进行判别;
预处理模块,根据语句中字符间的内聚性将字符串捆绑为语片;
检索模块,在数据库中对连续两个以上的无法捆绑为语片的字符进行逐一检索和逐一模糊检索,判断是否能找到相同或相似拼音的替代字符,使连续字符能够捆绑为内聚性高的语片;
修正模块,可使用数据库中替代字符对原字符进行替换,出现连续两个以上的字符无法捆绑为语片时,提取该连续字符串的拼音,并在人名库中检索是否存在相同拼音的人名,若检索到相同拼音的人名,将该人名与连续字符串进行比对,若比对相同则不对该连续字符进行标记,若比对不同则将该连续字符串修正为人名;
标记模块,可对字符和字符串进行标记。
6.根据权利要求5所述的在线文字纠错***,其特征在于,所述数据库中还包括人名库,所述检索模块可根据人名库对字符串进行检索和模糊检索,检索相同拼音的人名;
所述修正模块可根据人名库对字符串进行修正。
7.根据权利要求6所述的在线文字纠错***,其特征在于,所述***还包括排序模块,所述数据库中还包括姓名排序库,所述排序模块可根据姓名排序库中的排序对多个人名的顺序进行重新排序。
8.根据权利要求5所述的在线文字纠错***,其特征在于,所述数据库中还包括错别字库,所述修正模块对原字符进行替换时,将原字符所在的字符串记录到错别字库中,作为错别字符串,若错别字库中已经存在该字符串,则记录重复次数;
当用户键入该错别字符串时,所述检索模块对错别字库进行检索,若该错别字符串在错别字库中的重复次数超过设定阈值,则修正模块自动对该错别字符串进行替换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696146.7A CN110457695B (zh) | 2019-07-30 | 2019-07-30 | 一种在线文字纠错方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696146.7A CN110457695B (zh) | 2019-07-30 | 2019-07-30 | 一种在线文字纠错方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110457695A CN110457695A (zh) | 2019-11-15 |
CN110457695B true CN110457695B (zh) | 2023-05-12 |
Family
ID=68484050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910696146.7A Active CN110457695B (zh) | 2019-07-30 | 2019-07-30 | 一种在线文字纠错方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110457695B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310013A (zh) * | 2020-02-17 | 2020-06-19 | 上海蓝鹇信息科技有限公司 | 一种基于人工智能的自动纠错方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101287228A (zh) * | 2008-05-26 | 2008-10-15 | 北京捷讯畅达科技发展有限公司 | 应用于手机短信查询的拼音纠错技术及装置 |
JP2010102676A (ja) * | 2008-10-23 | 2010-05-06 | Hiroshima Dia System Co Ltd | 複数の単語より構成される検索文字列のあいまい検索方法 |
CN107741928A (zh) * | 2017-10-13 | 2018-02-27 | 四川长虹电器股份有限公司 | 一种基于领域识别的对语音识别后文本纠错的方法 |
CN108121455A (zh) * | 2016-11-29 | 2018-06-05 | 渡鸦科技(北京)有限责任公司 | 识别纠正方法及装置 |
WO2018120889A1 (zh) * | 2016-12-28 | 2018-07-05 | 平安科技(深圳)有限公司 | 输入语句的纠错方法、装置、电子设备及介质 |
CN108717412A (zh) * | 2018-06-12 | 2018-10-30 | 北京览群智数据科技有限责任公司 | 基于中文分词的中文校对纠错方法及*** |
-
2019
- 2019-07-30 CN CN201910696146.7A patent/CN110457695B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101287228A (zh) * | 2008-05-26 | 2008-10-15 | 北京捷讯畅达科技发展有限公司 | 应用于手机短信查询的拼音纠错技术及装置 |
JP2010102676A (ja) * | 2008-10-23 | 2010-05-06 | Hiroshima Dia System Co Ltd | 複数の単語より構成される検索文字列のあいまい検索方法 |
CN108121455A (zh) * | 2016-11-29 | 2018-06-05 | 渡鸦科技(北京)有限责任公司 | 识别纠正方法及装置 |
WO2018120889A1 (zh) * | 2016-12-28 | 2018-07-05 | 平安科技(深圳)有限公司 | 输入语句的纠错方法、装置、电子设备及介质 |
CN107741928A (zh) * | 2017-10-13 | 2018-02-27 | 四川长虹电器股份有限公司 | 一种基于领域识别的对语音识别后文本纠错的方法 |
CN108717412A (zh) * | 2018-06-12 | 2018-10-30 | 北京览群智数据科技有限责任公司 | 基于中文分词的中文校对纠错方法及*** |
Non-Patent Citations (2)
Title |
---|
一种支持混合语言的并行查询纠错方法;颛悦等;《中文信息学报》;20160315(第02期);全文 * |
基于统计和特征相结合的查询纠错方法研究;段建勇等;《现代图书情报技术》;20160225(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110457695A (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107045496B (zh) | 语音识别后文本的纠错方法及纠错装置 | |
Kukich | Techniques for automatically correcting words in text | |
US8594999B2 (en) | Typing candidate generating method for enhancing typing efficiency | |
US7743327B2 (en) | Table of contents extraction with improved robustness | |
US7756871B2 (en) | Article extraction | |
CA2642217C (en) | Method and system for verification of uncertainly recognized words in an ocr system | |
US8190538B2 (en) | Methods and systems for matching records and normalizing names | |
CN109299233B (zh) | 文本数据处理方法、装置、计算机设备及存储介质 | |
Mitton | Ordering the suggestions of a spellchecker without using context | |
KR20070010163A (ko) | 핸드라이팅 인식용 장치 및 방법 | |
CN105760359B (zh) | 问句处理***及其方法 | |
US11520835B2 (en) | Learning system, learning method, and program | |
Mann et al. | Multi-field information extraction and cross-document fusion | |
CN102033866A (zh) | 用于校验化学名称的方法及*** | |
Chaudhuri | Reversed word dictionary and phonetically similar word grouping based spell-checker to Bangla text | |
CN110457695B (zh) | 一种在线文字纠错方法及*** | |
JP2009098952A (ja) | 情報検索システム | |
CN108628826A (zh) | 候选词评估方法、装置、计算机设备和存储介质 | |
CN108694167A (zh) | 候选词评估方法、候选词排序方法及装置 | |
US10409861B2 (en) | Method for fast retrieval of phonetically similar words and search engine system therefor | |
CN111310457B (zh) | 词语搭配不当识别方法、装置、电子设备和存储介质 | |
JP2586372B2 (ja) | 情報検索装置及び情報検索方法 | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
CN108595419A (zh) | 候选词评估方法、候选词排序方法及装置 | |
Bakar et al. | An evaluation of retrieval effectiveness using spelling‐correction and string‐similarity matching methods on Malay texts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230425 Address after: 4th Floor, China Telecom Group Wuhu Cloud Computing Center, No. 2 Guotai Road, Jiujiang District, Wuhu City, Anhui Province, 241000 Applicant after: Anhui Huolan Data Co.,Ltd. Address before: No. 206, D3 District, Fuxing City, No. 32 Binhai Avenue, Longhua District, Haikou City, Hainan Province, 570100 Applicant before: HAINAN HUOLAN DATA Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |