CN102193709B - 一种字符输入方法及装置 - Google Patents

一种字符输入方法及装置 Download PDF

Info

Publication number
CN102193709B
CN102193709B CN201010118883.8A CN201010118883A CN102193709B CN 102193709 B CN102193709 B CN 102193709B CN 201010118883 A CN201010118883 A CN 201010118883A CN 102193709 B CN102193709 B CN 102193709B
Authority
CN
China
Prior art keywords
word
probability
name
name candidate
candidate list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010118883.8A
Other languages
English (en)
Other versions
CN102193709A (zh
Inventor
张会鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shiji Guangsu Information Technology Co Ltd filed Critical Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority to CN201010118883.8A priority Critical patent/CN102193709B/zh
Publication of CN102193709A publication Critical patent/CN102193709A/zh
Application granted granted Critical
Publication of CN102193709B publication Critical patent/CN102193709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种字符输入方法,包括:根据用户输入的字符串,生成姓名候选列表和核心词候选列表;从所述姓名候选列表中选取最大概率的姓名候选词,并对所述选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,并根据所述比较的结果展示所述姓名候选列表。相应地,本发明还公开了一种字符输入装置。本发明利用概率比较来进行姓名模式的切换控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。

Description

一种字符输入方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种字符输入方法及装置。
背景技术
随着计算机技术的迅速发展,计算机的使用也越来越普遍。利用计算机实现字符输入的输入法也越来越深入到人们的生活,同时,用户对于输入法的智能性要求也越来越高。
以中文输入为例,计算机用户要将汉字输入到计算机,需要使用中文输入软件,目前,中文输入软件可分为键盘输入和非键盘输入。所谓键盘输入,是指对汉字进行编码,将编码与键盘上的键相联系,当用户利用键盘向计算机输入相应汉字,计算机对输入的编码进行识别,转换为相应的汉字输出。所谓非键盘输入,包括手写输入、语音输入和OCR(Optical Character Recognition,光学字符识别)输入等不利用键盘来实现汉字输入的输入方式。
随着用户对输入法的智能要求,现有的输入法***也在日益改进,其重要的一个智能特点即是为用户提供姓名模式,有效提高姓名输入的效率。具体地,现有的输入法进行姓名模式提示的方案主要为:接收用户输入的字符串(比如:拼音串),判断该字符串是否包含针对姓名的编码字符串,然后根据词库和针对姓名的编码字符串,自动生成姓名候选项展示给用户。发明人在实施本发明的过程中发现,现有的方案主要存在以下缺陷:
1、无模式切换控制,易造成骚扰。由于现有***中进行姓名字符串判断后,即进行姓名候选项的展示,并不对模式的切换进行控制。这样造成当用户并不想进行姓名的输入时,***却直接进行姓名模式的显示,给用户带来骚扰。
2、降低了用户体验。现有的方案没有确切的方案来确定在何种情况下进行姓名模式,如果输入非姓名时进入姓名模式,则会如1中所述,给用户带来不必要的骚扰;如果输入姓名时却未进入姓名模式,则并未体验姓名模式的便利性。因此,现有的方案降低了用户体验。
发明内容
本发明的目的在于,提供一种字符输入方法及装置,利用概率比较来进行姓名模式的切换控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
为了实现上述目的,本发明实施例提供了一种字符输入方法,包括:
根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
从所述姓名候选列表中选取最大概率的姓名候选词,并对所述选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;
将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,并根据所述比较的结果展示所述姓名候选列表。
相应地,本发明实施例还提供了一种字符输入装置,包括:
生成模块,用于根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
选取模块,用于从所述生成模块生成的姓名候选列表中选取最大概率的姓名候选词;
概率处理模块,用于对所述选取模块所选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;
比较模块,用于将所述概率处理模块处理得到的对比概率与所述生成模块生成的核心词候选列表中的各个核心词的概率一一进行比较;
展示模块,用于根据所述比较模块的比较结果,展示所述生成模块生成的姓名候选列表。
本发明根据用户输入的字符串生成姓名候选列表,并选取姓名候选列表中的最大概率的姓名候选词,对其最大概率进行相应处理后,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,再根据比较的结果才进行提示进入姓名模式,本发明利用概率比较来进行姓名模式的控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
附图说明
图1为本发明的字符输入装置的实施例的结构示意图;
图2为本发明的生成模块的实施例的结构示意图;
图3为本发明的概率处理模块的实施例的结构示意图;
图4为本发明的比较模块的实施例的结构示意图;
图5为本发明的展示模块的实施例的结构示意图;
图6为本发明的字符输入方法的第一实施例的流程示意图;
图7为本发明的字符输入方法的第二实施例的流程示意图;
图8为本发明的字符输入方法的第三实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,为本发明的字符输入装置的实施例的结构示意图;如图1所示,所述字符输入装置包括:生成模块10,选取模块20,概率处理模块30,比较模块40和展示模块50。
所述生成模块10,用于根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
具体实现中,所述姓名候选列表包括多个姓名候选词,各姓名候选词均存在各自的概率。具体地,各姓名候选词的概率根据预设置的姓名角色词表中各角色词(姓名的角色包括:姓氏,名,名首字,名尾字等,角色词包括:作为姓氏的各词,作为名的各词,作为名首字的各词以及作为名尾字的各词等)的概率计算得到,所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,比如:姓氏词表中包括“张”“王”“李”等词(或字),当这些词(或字)作为姓氏时,其概率分别为多大;名的词表和作为名的各词的概率,比如:“王刚”中的“刚”,“刘德华”中的“德华”等词,其作为名时,概率分别为多大;名首字的词表和作为名首字的各词的概率,比如:“刘德华”中的“德”字,其作为名首字的概率为多大;名尾字的词表和作为名尾字的各词的概率,比如:“刘德华”中的“华”,其作为名尾字的概率为多大。
所述核心词候选列表为:从词库中识别出的、与用户输入的字符串的编码相对应的词所组成的列表,所述核心词候选列表中的词为核心词。具体实现中,当用户通过键盘或非键盘正常输入字符时,比如输入拼音串,那么计算机***会根据用户输入的字符串的编码,从***自身或网络等存储空间的词库中识别出与所述编码相对应的词,这些词组成了候选列表显示给用户,供用户选择,其列表中的显示的各个词即为核心词,该显示的列表称为核心词候选列表。
所述选取模块20,用于从所述生成模块10生成的姓名候选列表中选取最大概率的姓名候选词;具体实现中,如前所述,姓名候选列表中的各姓名候选词均存在一定的概率,其概率根据姓名角色表中的各角色词的概率计算得到,具体地,各角色词的概率可以从一个很大的姓名库(比如:从网络上的姓名库)中统计出每个词作为姓名的不同角色的概率,而一个姓名的概率即为组成该姓名的各个角色的概率的乘积,比如:“王”作为姓的概率为0.1,“刚”作为名的概率为0.2,则二者组成姓名的概率为“0.1*0.2=0.02”。所述选取模块20,即用于从生成的姓名候选列表中选取最大概率的姓名候选词。可以理解的是,此处的计算方式仅为举例,其他情况,比如:可组成姓名的各角色词的赋予权重系数,利用权重系数进行计算等情况,这些情况下可进行类似分析,在此不进行赘述。
所述概率处理模块30,用于对所述选取模块20所选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率。由于所述选取模块20所选取的姓名候选词的概率如果不经处理则与根据用户正常输入而得到的核心词的概率不具有可比性,因此,具体实现中,需要对所述姓名候选词的概率进行处理,即需要对姓名候选词的概率进行归一化,其具体处理过程为:利用预设的各种不同长度姓名的基准概率,将姓名候选词的概率与其对应长度的基准概率相乘,其最终得到的概率可以称为“对比概率”,该“对比概率”就可与核心词的概率进行比较了。
所述比较模块40,用于将所述概率处理模块30处理得到的对比概率与所述生成模块生成的核心词候选列表中的各个核心词的概率一一进行比较;
所述展示模块50,用于根据所述比较模块40的比较结果,展示所述生成模块10生成的姓名候选列表。具体实现中,当所述姓名候选词的对比概率大于所有的核心词的概率时,所述展示模块50即展示所述姓名候选列表。
再请参见图1,所述字符输入装置还包括:预设模块60。
所述预设模块60,用于预先设置姓名角色词表,角色词的提取个数,姓名候选列表的长度和基准概率表。
具体实现中,所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,名的词表和作为名的各词的概率,名首字的词表和作为名首字的各词的概率,名尾字的词表和作为名尾字的各词的概率;
所述角色词的提取个数指的是从所述姓名角色表中所提取的角色词的个数,本发明实施例中用M表示,M可根据实际情况进行取值;
所述姓名候选列表的长度为所述姓名候选列表所包括的姓名候选词的个数,本发明实施例中用N表示,N可根据实际情况进行取值;比如:当所述姓名候选列表包括1个姓名候选词,则N=1;当所述姓名候选列表包括2个姓名候选词,则N=2;其他情况类似,在此不进行赘述;
所述基准概率表包括:单字姓名的基准概率、二字姓名的基准概率、三字姓名的基准概率、四字姓名的基准概率以及多字姓名的基准概率;具体地,可从一个大的词料库(比如:网络上的大量文章)中分别统计出单字姓名、二字姓名、三字姓名、四字姓名甚至多字姓名的概率,分别作为不同长度姓名的基准概率。
通过上述实施例的描述,本发明根据用户输入的字符串生成姓名候选列表,并选取姓名候选列表中的最大概率的姓名候选词,对其最大概率进行相应处理后,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,再根据比较的结果才进行提示进入姓名模式,本发明利用概率比较来进行姓名模式的控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
为了更清楚的说明本发明,下面将对字符输入装置的各个模块进行详细介绍。
请参见图2,为本发明的生成模块10的结构示意图,所述生成模块10包括:提取单元101,第一生成单元102,计算单元103和第二生成单元104。
所述提取单元101,用于根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前M个角色词,所述M为预设置的角色词提取个数;如前述,所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,名的词表和作为名的各词的概率,名首字的词表和作为名首字的各词的概率,名尾字的词表和作为名尾字的各词的概率。具体地,所述姓名角色词表可以表的形式存在,如下表:
  词(或字)   角色   概率
  王   姓   0.1
  李   姓   0.3
  德   名首字   0.2
  德华   名   0.23
  刚   名   0.2
  张   姓   0.11
  红   名尾字   0.03
  ……   ……   ……
可以理解的是,上述的姓名角色词表仅为举例,其可以不以表格的形式存在,具体地,在预先设置时,其表中的词可以改变或扩展,其作为的角色可以改变,其概率也可以改变,其他情况下可进行类似的分析,在此不进行赘述。
具体实现中,上述的M值的确定也可以根据实际需要进行设定,比如,可设定M值为3,那么所述提取单元101,用于根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前3个角色词;可设定M值为4,那么所述提取单元101,用于根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前4个角色词。可以理解的是,此处仅为举例其他情况类似分析,在此不进行赘述。
所述第一生成单元102,用于将所述提取单元101提取的M个角色词进行姓名组合,生成多个姓名候选词;如前述,比如:当M值为3时,所述提取单元101提取前3个角色词分别为:王、德、张,三者均可作姓和名两种角色,那么,其可以组合成姓名候选词分别为:王德、王张、德张、张德、张王、德王。可以理解的是,此处仅为举例,其他情况类似分析,在此不进行赘述。
所述计算单元103,用于计算所述第一生成单元102生成的各个姓名候选词的概率;具体实现中,所述计算单元103对各个姓名候选词的计算如前所述,具体为,组成姓名的各个角色词的概率的乘积。
所述第二生成单元104,用于根据所述计算单元103计算得到的概率,对所述姓名候选词进行排序,并选取所述排序后的前N个姓名候选词组成姓名候选列表,所述N为预设置的姓名候选列表的长度。具体实现中,所述排序可按从大到小顺序排列,也可按从小到大顺序排列,优选地,所述排序一般按照从大到小的顺序进行排列,概率大的位于候选列表的前面,概率小的位于候选列表的后面,最后,取前N个姓名候选词组成姓名候选列表;具体地,所述N值的确定也可以根据实际需要进行设定,比如,可设定N值为3,那么所述第二生成单元104根据姓名候选词的排序,选取前3个姓名候选词组成姓名候选列表;再如,可设定N值为4,那么所述第二生成单元104根据姓名候选词的排序,选取前4个姓名候选词组成姓名候选列表。可以理解的是,此处排序方式以及N值的设定仅为举例,其他情况类似分析,在此不进行赘述。
可以理解的是,由于N为预设的姓名候选列表的长度,为了保证N的取值,以利于用户对姓名候选词进行选择,优选地,角色词的提取个数M与姓名候选列表的长度N的取值相同。当然,其他情况,比如:M值可大于N值;再如:M值可小于N值;上述各种情况可进行类似的分析,在此不进行赘述。
通过上述实施例的描述,本发明根据用户输入的字符串生成姓名候选列表,其减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
请参见图3,为本发明的概率处理模块的实施例的结构示意图;所述概率处理模块30包括:基准概率提取单元301和概率处理单元302。
所述基准概率提取单元301,用于根据所述选取模块20选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;
具体实现中,所述选取模块20所选取的姓名候选词的概率与根据用户正常输入而得到的核心词的概率不具有可比性,因此,需要对所述姓名候选词的概率进行处理,即需要对姓名候选词的概率进行归一化。具体地,所述基准概率提取单元301具体处理过程为:根据所选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;比如:当所述姓名候选词为二字姓名时,其长度为二,则从预设置的基准概率表中提取二字姓名的基准概率;再如:当所述姓名候选词为三字姓名时,其长度为三,则从预设置的基准概率表中提取三字姓名的基准概率。
所述概率处理单元302,用于将所述选取模块20选取的姓名候选词的概率与所述基准概率提取单元301提取的基准概率相乘,得到所述姓名候选词的对比概率。该“对比概率”就可与核心词的概率进行比较了。
通过上述实施例的描述,本发明能够减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
请参见图4,为本发明的比较模块的实施例的结构示意图;如图4所示,所述比较模块40包括:判断单元401和结果输出单元402。
所述判断单元401,用于将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,判断所述姓名候选词的对比概率是否大于所有的核心词的概率;
所述结果输出单元402,用于当所述判断单元401判断结果为是时,输出肯定结果,当所述判断单元401判断结果为否时,输出否定结果。
通过上述实施例的描述,本发明将姓名候选词的对比概率,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
请参见图5,为本发明的展示模块的实施例的结构示意图;如图5所示,所述展示模块50包括:添加单元501,提示单元502,接收单元503和展示单元504。
所述添加单元501,用于在所述结果输出单元402输出肯定结果时,将所述姓名候选词添加到所述核心词候选列表中;
所述提示单元502,用于在所述添加单元501添加所述姓名候选词的同时,提示用户确认是否进入姓名模式;具体实现中,可向用户提示“按逗号进入姓名模式”,可以理解的是,此处仅为举例,其他情况下,比如:可以不提示用户直接进入姓名模式,这样即与现有技术兼容,这种情况下可能会给用户带来一定的骚扰,因此,优选是向用户提示;再如:可向用户提示“按*号键进入姓名模式”或按其他键进入姓名模式,在此不进行赘述。
所述接收单元503,用于当用户根据所述提示单元502的提示进行确认时,接收所述用户发送的确认信息;具体实现中,比如:所述提示单元502提示“按逗号键进入姓名模式”,如果用户按下逗号键,所述接收单元503即可接收到逗号按键发出的代表“确认”的编码,即接收到了用户发送的确认信息。
所述展示单元504,用于在所述接收单元503接收到所述用户的确认信息时,向所述用户展示所述姓名候选列表。
通过上述实施例的描述,本发明根据比较的结果才进行提示进入姓名模式,其对姓名模式的切换进行了控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
为了更清楚的说明本发明,下面将对字符输入方法进行详细介绍。
请参见图6,为本发明的字符输入方法的第一实施例的流程示意图;如图6所示,所述方法包括:
S101,根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
具体地,所述S101之前还包括:
预先设置姓名角色词表,姓名候选列表的长度和基准概率表。
S102,从所述姓名候选列表中选取最大概率的姓名候选词,并对所述选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;
S103,将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,并根据所述比较的结果展示所述姓名候选列表。
通过上述实施例的描述,本发明根据用户输入的字符串生成姓名候选列表,并选取姓名候选列表中的最大概率的姓名候选词,对其最大概率进行相应处理后,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,再根据比较的结果才进行提示进入姓名模式,本发明利用概率比较来进行姓名模式的控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
请参见图7,为本发明的字符输入方法的第二实施例的流程示意图;如图7所示,所述方法包括:
S201,预先设置姓名角色词表,姓名候选列表的长度和基准概率表;
具体实现中,所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,名的词表和作为名的各词的概率,名首字的词表和作为名首字的各词的概率,名尾字的词表和作为名尾字的各词的概率;
所述角色词的提取个数指的是从所述姓名角色表中所提取的角色词的个数,本发明实施例中用M表示,M可根据实际情况进行取值;
所述姓名候选列表的长度为所述姓名候选列表所包括的姓名候选词的个数,本发明实施例中用N表示,N可根据实际情况进行取值;比如:当所述姓名候选列表包括1个姓名候选词,则N=1;当所述姓名候选列表包括2个姓名候选词,则N=2;其他情况类似,在此不进行赘述;
所述基准概率表包括:单字姓名的基准概率、二字姓名的基准概率、三字姓名的基准概率、四字姓名的基准概率以及多字姓名的基准概率;具体地,可从一个大的词料库(比如:网络上的大量文章)中分别统计出单字姓名、二字姓名、三字姓名、四字姓名甚至多字姓名的概率,分别作为不同长度姓名的基准概率。
S202,根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前M个角色词,所述M为预设置的角色词提取个数;
如前述,所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,名的词表和作为名的各词的概率,名首字的词表和作为名首字的各词的概率,名尾字的词表和作为名尾字的各词的概率。具体地,所述姓名角色词表可以表的形式存在,如下表:
  词(或字)   角色   概率
  王   姓   0.1
  李   姓   0.3
  德   名首字   0.2
  德华   名   0.23
  刚   名   0.2
  张   姓   0.11
  红   名尾字   0.03
  ……   ……   ……
可以理解的是,上述的姓名角色词表仅为举例,其可以不以表格的形式存在,具体地,在预先设置时,其表中的词可以改变或扩展,其作为的角色可以改变,其概率也可以改变,其他情况下可进行类似的分析,在此不进行赘述。
具体实现中,上述的M值的确定也可以根据实际需要进行设定,比如,可设定M值为3,那么S202即根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前3个角色词;可设定M值为4,那么S202即根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前4个角色词。可以理解的是,此处仅为举例,其他情况类似分析,在此不进行赘述。
S203,将所述M个角色词进行姓名组合,生成多个姓名候选词;
具体实现中,如前述,比如:当M值为3时,S202提取前3个角色词分别为:王、德、张,三者均可作姓和名两种角色,那么,S203可以将三者组合成姓名候选词分别为:王德、王张、德张、张德、张王、德王。可以理解的是,此处仅为举例,其他情况类似分析,在此不进行赘述。
S204,计算所述生成的各个姓名候选词的概率,并根据所述计算得到的概率,对所述姓名候选词进行排序,选取排序后的前N个姓名候选词组成姓名候选列表,所述N为预设置的姓名候选列表的长度;
具体实现中,S204对各个姓名候选词的计算如前所述,具体为,组成姓名的各个角色词的概率的乘积;进一步,所述根据计算得到的概率进行排序可按从大到小顺序排列,也可按从小到大顺序排列,优选地,所述排序一般按照从大到小的顺序进行排列,概率大的位于候选列表的前面,概率小的位于候选列表的后面,最后,取前N个姓名候选词组成姓名候选列表;具体地,所述N值的确定也可以根据实际需要进行设定,比如,可设定N值为3,那么S204根据姓名候选词的排序,选取前3个姓名候选词组成姓名候选列表;再如,可设定N值为4,那么S204根据姓名候选词的排序,选取前4个姓名候选词组成姓名候选列表。可以理解的是,此处仅为举例,其他情况类似分析,在此不进行赘述。
可以理解的是,由于N为预设的姓名候选列表的长度,为了保证N的取值,以利于用户对姓名候选词进行选择,优选角色词的提取个数M与姓名候选列表的长度N的取值相同。当然,其他情况,比如:M值可大于N值;再如:M值可小于N值;上述各种情况可进行类似的分析,在此不进行赘述。
S205,从所述姓名候选列表中选取最大概率的姓名候选词;
S206,根据所述选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;
具体实现中,S205所选取的姓名候选词的概率与根据用户正常输入而得到的核心词的概率不具有可比性,因此,需要对所述姓名候选词的概率进行处理,即需要对姓名候选词的概率进行归一化。具体地,S206具体处理过程为:根据所选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;比如:当所述姓名候选词为二字姓名时,其长度为二,则从预设置的基准概率表中提取二字姓名的基准概率;再如:当所述姓名候选词为三字姓名时,其长度为三,则从预设置的基准概率表中提取三字姓名的基准概率。
S207,将所述选取的姓名候选词的概率与所述提取的基准概率相乘,得到所述姓名候选词的对比概率;
具体实现中,S207将姓名候选词的概率与S206所提取的基准概率相乘,其最终得到的概率可以称为“对比概率”,该“对比概率”就可与核心词的概率进行比较了。
S208,将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较;
S209,判断所述姓名候选词的对比概率是否大于所有的所述核心词的概率;如果判断为是,则转入S210;否则,结束。
S210,将所述姓名候选词添加在所述核心词候选列表中,同时提示用户确认是否进入姓名模式;
具体实现中,可向用户提示“按逗号进入姓名模式”,可以理解的是,此处仅为举例,其他情况下,比如:可以不提示用户直接进入姓名模式,这样即与现有技术兼容,这种情况下可能会给用户带来一定的骚扰,因此,优选是向用户提示;再如:可向用户提示“按*号键进入姓名模式”或按其他键进入姓名模式,在此不进行赘述。
S211,接收用户的确认信息,向所述用户展示所述姓名候选列表。
通过上述实施例的描述,本发明根据用户输入的字符串生成姓名候选列表,并选取姓名候选列表中的最大概率的姓名候选词,对其最大概率进行相应处理后,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,再根据比较的结果才进行提示进入姓名模式,本发明利用概率比较来进行姓名模式的控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
请参见图8,为本发明的字符输入方法的第三实施例的流程示意图;如图8所示,所述方法包括:
S301,用户输入拼音串;
S302,检查输入拼音串的音节数;
S303,判断所述音节数是否大于等于2并且小于等于4,如果判断为是,则转入S304;否则,结束;
S304,判断拼音串中的音节是否全部是全拼,如果判断为是,则转入S305;否则,结束;
S305,生成姓名候选列表;
具体实现中,上述过程只有在拼音串的音节全部是全拼的情况下才会进行后续的姓名候选列表的生成,这样做是为了减少在正常输入过程中提示进入姓名模式带来的骚扰。
S306,选取最大概率的姓名候选词,并将其概率乘以对应姓名长度的基准概率,得到对比概率;
具体实现中,选取最大概率的姓名候选词,相当于在生成的包含N个姓名候选词的姓名候选列表中进行N取1的情况。
S307,将姓名候选词的对比概率与核心词候选列表中的各个核心词的概率一一进行比较;
S308,判断对比概率是否大于所有核心词的概率,如果判断为是,转入S309;否则,结束;
S309,将所述姓名候选词添加在所述核心词候选列表中,同时提示“按逗号进入姓名模式”;
S310,用户按下逗号按键;
S311,进入姓名模式,展示姓名候选列表。
通过上述各个实施例的描述,本发明根据用户输入的字符串生成姓名候选列表,并选取姓名候选列表中的最大概率的姓名候选词,对其最大概率进行相应处理后,与通过识别用户输入的字符串得到的核心词候选列表中的各个核心词的概率一一进行比较,再根据比较的结果才进行提示进入姓名模式,本发明利用概率比较来进行姓名模式的控制,减少输入非姓名的情况下提示进入姓名模式的机率,减小了用户骚扰,提高了用户体验。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (11)

1.一种字符输入方法,其特征在于:
根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
从所述姓名候选列表中选取最大概率的姓名候选词,并对所述选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;
将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,判断所述姓名候选词的对比概率是否大于所有的所述核心词的概率,并根据所述判断的结果进入姓名模式,并展示所述姓名候选列表。
2.如权利要求1所述的方法,其特征在于,所述根据用户输入的字符串,生成姓名候选列表包括:
根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前M个角色词,所述M为预设置的角色词提取个数;
将所述M个角色词进行姓名组合,生成多个姓名候选词;
计算所述生成的各个姓名候选词的概率,并根据所述计算得到的概率,对所述姓名候选词进行排序,选取排序后的前N个姓名候选词组成姓名候选列表,所述N为预设置的姓名候选列表的长度。
3.如权利要求2所述的方法,其特征在于,所述对所述选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率,包括:
根据所述选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;
将所述选取的姓名候选词的概率与所述提取的基准概率相乘,得到所述姓名候选词的对比概率。
4.如权利要求3所述的方法,其特征在于,所述将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,判断所述姓名候选词的对比概率是否大于所有的所述核心词的概率,并根据所述判断的结果展示所述姓名候选列表,如果判断为是,提示用户确认是否进入姓名模式;并在接收用户的确认信息时,向所述用户展示所述姓名候选列表包括:
将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,判断所述姓名候选词的对比概率是否大于所有的所述核心词的概率;
如果判断为是,将所述姓名候选词添加在所述核心词候选列表中,并提示用户确认是否进入姓名模式;并在接收用户的确认信息时,向所述用户展示所述姓名候选列表。
5.如权利要求1至4任一项所述的方法,其特征在于,所述根据用户输入的字符串,生成姓名候选列表和核心词候选列表之前,还包括:
预先设置姓名角色词表,角色词的提取个数,姓名候选列表的长度和基准概率表。
6.如权利要求5所述的方法,其特征在于:
所述姓名角色词表包括:姓氏词表和作为姓氏的各词的概率,名的词表和作为名的各词的概率,名首字的词表和作为名首字的各词的概率,名尾字的词表和作为名尾字的各词的概率;
所述候选列表的长度为所述姓名候选列表所包括的姓名候选词的个数;
所述基准概率表包括:单字姓名的基准概率、二字姓名的基准概率、三字姓名的基准概率、四字姓名的基准概率以及多字姓名的基准概率;
所述核心词候选列表为:从词库中识别出的、与用户输入的字符串的编码相对应的词所组成的列表,所述核心词候选列表中的词为核心词。
7.一种字符输入装置,其特征在于,包括:
生成模块,用于根据用户输入的字符串,生成姓名候选列表和核心词候选列表;
选取模块,用于从所述生成模块生成的姓名候选列表中选取最大概率的姓名候选词;
概率处理模块,用于对所述选取模块所选取的姓名候选词的概率进行处理,得到所述姓名候选词的对比概率;
比较模块,用于将所述概率处理模块处理得到的对比概率与所述生成模块生成的核心词候选列表中的各个核心词的概率一一进行比较;
所述比较模块包括:
判断单元,用于将所述姓名候选词的对比概率与所述核心词候选列表中的各个核心词的概率一一进行比较,判断所述姓名候选词的对比概率是否大于所有的核心词的概率;
结果输出单元,用于当所述判断单元判断结果为是时,输出肯定结果,当所述判断单元判断结果为否时,输出否定结果
展示模块,用于根据所述比较模块的比较结果,进入姓名模式,并展示所述生成模块生成的姓名候选列表。
8.如权利要求7所述的装置,其特征在于,所述生成模块包括:
提取单元,用于根据用户输入的字符串,从预设置的姓名角色词表中提取与所述字符串相对应的前M个角色词,所述M为预设置的角色词提取个数;
第一生成单元,用于将所述提取单元提取的M个角色词进行姓名组合,生成多个姓名候选词;
计算单元,用于计算所述第一生成单元生成的各个姓名候选词的概率;
第二生成单元,用于根据所述计算单元计算得到的概率,对所述姓名候选词进行排序,并选取所述排序后的前N个姓名候选词组成姓名候选列表,所述N为预设置的姓名候选列表的长度。
9.如权利要求8所述的装置,其特征在于,所述概率处理模块包括:
基准概率提取单元,用于根据所述选取模块选取的姓名候选词的长度,从预设置的基准概率表中提取相应长度的基准概率;
概率处理单元,用于将所述选取模块选取的姓名候选词的概率与所述基准概率提取单元提取的基准概率相乘,得到所述姓名候选词的对比概率。
10.如权利要求9所述的装置,其特征在于,所述展示模块包括:
添加单元,用于在所述结果输出单元输出肯定结果时,将所述姓名候选词添加到所述核心词候选列表中;
提示单元,用于在所述添加单元添加所述姓名候选词的同时,提示用户确认是否进入姓名模式;
接收单元,用于当用户根据所述提示单元的提示进行确认时,接收所述用户发送的确认信息;
展示单元,用于在所述接收单元接收到所述用户的确认信息时,向所述用户展示所述姓名候选列表。
11.如权利要求7至10任一项所述的装置,其特征在于,还包括:
预设模块,用于预先设置姓名角色词表,角色词的提取个数,姓名候选列表的长度和基准概率表。
CN201010118883.8A 2010-03-01 2010-03-01 一种字符输入方法及装置 Active CN102193709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010118883.8A CN102193709B (zh) 2010-03-01 2010-03-01 一种字符输入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010118883.8A CN102193709B (zh) 2010-03-01 2010-03-01 一种字符输入方法及装置

Publications (2)

Publication Number Publication Date
CN102193709A CN102193709A (zh) 2011-09-21
CN102193709B true CN102193709B (zh) 2015-05-13

Family

ID=44601864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010118883.8A Active CN102193709B (zh) 2010-03-01 2010-03-01 一种字符输入方法及装置

Country Status (1)

Country Link
CN (1) CN102193709B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123068B (zh) * 2013-04-26 2018-02-23 百度在线网络技术(北京)有限公司 一种用于获取字符序列信息的候选词的方法和装置
CN105988993B (zh) * 2015-03-06 2019-05-07 阿里巴巴集团控股有限公司 检测网站上注册的姓名合理性的方法和装置
CN104932712A (zh) * 2015-06-25 2015-09-23 小米科技有限责任公司 文本输入方法和装置
CN106502971B (zh) * 2016-10-27 2020-04-21 青岛海信移动通信技术股份有限公司 输入信息的处理方法、装置及移动终端
CN108090033A (zh) * 2017-12-27 2018-05-29 北京天融信网络安全技术有限公司 人名检测方法、装置、计算机可读介质及设备
CN112783333A (zh) * 2019-11-06 2021-05-11 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755669A (zh) * 2004-09-29 2006-04-05 松下电器产业株式会社 人名输入处理方法及***
CN101359254A (zh) * 2007-08-03 2009-02-04 北京搜狗科技发展有限公司 一种提高姓名词条输入效率的字符输入方法和***
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法***、方法和装置
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5317460B2 (ja) * 2007-10-30 2013-10-16 京セラ株式会社 携帯端末および文字入力システム
US8478787B2 (en) * 2007-12-06 2013-07-02 Google Inc. Name detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755669A (zh) * 2004-09-29 2006-04-05 松下电器产业株式会社 人名输入处理方法及***
CN101359254A (zh) * 2007-08-03 2009-02-04 北京搜狗科技发展有限公司 一种提高姓名词条输入效率的字符输入方法和***
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法***、方法和装置

Also Published As

Publication number Publication date
CN102193709A (zh) 2011-09-21

Similar Documents

Publication Publication Date Title
CN102193709B (zh) 一种字符输入方法及装置
CN107609121A (zh) 基于LDA和word2vec算法的新闻文本分类方法
CN106708893A (zh) 搜索查询词纠错方法和装置
CN102830924B (zh) 一种调整输入法键盘的方法及装置
EP2765473A1 (en) Input processing method and apparatus
CA2556065A1 (en) Handwriting and voice input with automatic correction
CN101556508A (zh) 一种输入法中候选词的生成方法、装置、***及设备
CN104866274A (zh) 信息处理方法及电子设备
CN103474061A (zh) 基于分类器融合的汉语方言自动辨识方法
KR960011770A (ko) 패턴인식방법 및 장치와 패턴데이타 처리장치
CN102937837A (zh) 基于非完整识别的词语快速输入方法
CN110321434A (zh) 一种基于词义消歧卷积神经网络的文本分类方法
CN105718072A (zh) 一种字符输出方法及移动终端
CN106570170A (zh) 基于深度循环神经网络的文本分类和命名实体识别一体化方法及***
CN105225657A (zh) 多音字标注模板生成方法和装置
CN110738997A (zh) 一种信息修正方法、装置、电子设备及存储介质
CN112148852A (zh) 一种智能客服方法、装置、存储介质及计算机设备
US8248370B2 (en) Handheld electronic device with reduced keyboard and associated method of providing improved disambiguation with reduced degradation of device performance
CN102375655B (zh) 一种字母输入的处理方法及***
CN109902306A (zh) 一种语音识别方法、装置、存储介质及语音设备
CN104699381A (zh) 一种输入方式切换方法、输入法***和电子设备
EP1722293A1 (en) Handheld electronic device with reduced keyboard and associated method of providing improved disambiguation with reduced degradation of device performance
CN1755669A (zh) 人名输入处理方法及***
CN101206525A (zh) 一种乱序输入方法
CN102750272A (zh) 字符手写输入候选项优化方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131105

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20131105

Address after: A Tencent Building in Shenzhen Nanshan District City, Guangdong streets in Guangdong province science and technology 518057 16

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518057 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant