CN111984132B - 一种根据上下文环境进行信息输入的方法及*** - Google Patents

一种根据上下文环境进行信息输入的方法及*** Download PDF

Info

Publication number
CN111984132B
CN111984132B CN202010646972.3A CN202010646972A CN111984132B CN 111984132 B CN111984132 B CN 111984132B CN 202010646972 A CN202010646972 A CN 202010646972A CN 111984132 B CN111984132 B CN 111984132B
Authority
CN
China
Prior art keywords
word
words
input
candidate
information queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010646972.3A
Other languages
English (en)
Other versions
CN111984132A (zh
Inventor
宝音
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Original Assignee
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LANGUAGE AND CULTURE UNIVERSITY filed Critical BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority to CN202010646972.3A priority Critical patent/CN111984132B/zh
Publication of CN111984132A publication Critical patent/CN111984132A/zh
Application granted granted Critical
Publication of CN111984132B publication Critical patent/CN111984132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种根据上下文环境进行信息输入的方法及***,权重方法包括:为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中;确定每个输入词语的输入次数和每个接收词语的接收次数;根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集;将同时存在于输入消息和接收消息中的词语确定为公共词语,并基于每个公共词语的接收次数和输入次数确定多个权重词语;将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,并据此对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。

Description

一种根据上下文环境进行信息输入的方法及***
技术领域
本发明涉及信息技术领域,并且更具体地,涉及一种根据上下文环境进行信息输入的方法及***。
背景技术
目前,随着互联网技术的不断进步以及移动终端性能的不断提升,移动终端所具备的功能越来越多。通常情况下,信息输入功能是移动终端中非常重要的功能。例如,信息输入功能可以用于移动终端内的即时通讯应用、购物应用和文档处理应用等。因为需要被频繁使用,所以信息输入功能也被寄予了更高的期望,如输入的快捷性、准确率、效率等等。
在现有技术中,当用户希望通过移动终端进行信息输入时,通常需要输入一些字符,而移动终端中的信息输入应用会根据这些字符来确定多个词语并将这些词语进行提供或呈现以供用户选择。然而,在现有技术中,通常是基于固定的顺序或用户的输入习惯来确定多个词语的顺序,而无法根据用户正在进行的信息输入的上下文环境确定多个词语的顺序。
发明内容
根据本发明的一个方面,提供一种根据上下文环境进行信息输入的方法,所述方法包括:
为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中;
实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数;
根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集;
对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数;
将同时存在于输入消息和接收消息中的词语确定为公共词语,基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语;
当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
其中应用为即时通讯应用、金融应用或游戏应用。
将与每个应用相关联的输入消息和接收消息分别存储在信息队列中包括:
将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的输入消息存储在信息队列的输出部分中。
实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:
实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中输出消息所包括的所有字符的第二数量。
还包括,为每个应用设置各自的数量阈值。
还包括,为每个应用设置各自的预设范围。
根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语包括:
确定多个输入词语中每个输入词语的输入次数Cp
按照输入次数的降序顺序对多个输入词语进行排序,以获得词语列表;
将词语列表中排序在预定位置之前的输入词语确定为候选的输入词语;
计算每个候选的输入词语与所归属的应用的描述文件的匹配度;
将匹配度大于阈值的候选的输入词语确定为基础词语。
在为多个应用中的每个应用建立信息队列之前还包括,根据类别信息将用于进行信息输入的所有词语划分为多个词语集,其中每个词语集中包括多个词语并且每个词语集具有各自的类别名称。
将与每个标准词语相关联的词语集作为基础词语集包括:将多个词语集中与至少一个标准词语相关联的词语集选择作为基础词语集。
所述基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:
确定每个公共词语的接收次数COy
确定每个公共词语的输入次数CIy
计算每个公共词语的权重系数
Figure BDA0002573427030000031
其中y为自然数并且1≤y≤No,其中No为公共词语的数量。
所述阈值为1、0.9、0.8、0.6或0.5。
当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语包括:
对所接收到的用户输入的字符转换为检索条件;
基于检索条件在多个基础词语集中每个基础词语集中进行检索,以获取经过检索的多个词语;
将经过检索的多个词语作为与所述字符相对应的多个待选词语。
计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:
将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度。
将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:
确定第i个候选词语与第j个权重词语的匹配度Mij
确定第j个权重词语的权重系数Owj
基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj
其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语包括:
基于每个候选词语的优先等级的降序顺序对多个候选词语进行排序以生成候选词语列表;
将候选词语列表分为优先等级呈降序顺序的多个候选词语组;
按照优先等级的降序顺序依次提供所述多个候选词语组;
其中每个候选词语组中的所有候选词语按照随机顺序进行提供;
其中上一个候选词语组中的任意一个候选词语的优先等级大于下一个候选词语组中每个候选词语的优先等级。
根据本发明的另一方面,提供一种根据上下文环境进行信息输入的***,所述***包括:
初始化装置,为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中;
监测装置,实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数;
选择装置,根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集;
统计装置,对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数;
确定装置,将同时存在于输入消息和接收消息中的词语确定为公共词语,基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语;
提供装置,当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
其中应用为即时通讯应用、金融应用或游戏应用。
所述初始化装置将与每个应用相关联的输入消息和接收消息分别存储在信息队列中包括:
所述初始化装置将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的输入消息存储在信息队列的输出部分中。
所述监测装置实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:
监测装置实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中输出消息所包括的所有字符的第二数量。
还包括,为每个应用设置各自的数量阈值。
还包括,为每个应用设置各自的预设范围。
所述选择装置根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语包括:
所述选择装置确定多个输入词语中每个输入词语的输入次数Cp
所述选择装置按照输入次数的降序顺序对多个输入词语进行排序,以获得词语列表;
所述选择装置将词语列表中排序在预定位置之前的输入词语确定为候选的输入词语;
所述选择装置计算每个候选的输入词语与所归属的应用的描述文件的匹配度;
所述选择装置将匹配度大于阈值的候选的输入词语确定为基础词语。
所述初始化装置根据类别信息将用于进行信息输入的所有词语划分为多个词语集,其中每个词语集中包括多个词语并且每个词语集具有各自的类别名称。
所述选择装置将与每个标准词语相关联的词语集作为基础词语集包括:所述选择装置将多个词语集中与至少一个标准词语相关联的词语集选择作为基础词语集。
所述确定装置基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:
所述确定装置确定每个公共词语的接收次数COy
所述确定装置确定每个公共词语的输入次数CIy
所述确定装置计算每个公共词语的权重系数
Figure BDA0002573427030000061
其中y为自然数并且1≤y≤No,其中No为公共词语的数量。
所述阈值为1、0.9、0.8、0.6或0.5。
当接收到用户输入字符时,所述提供装置从多个基础词语集中获取与所述字符相对应的多个待选词语包括:
所述提供装置对所接收到的用户输入的字符转换为检索条件;
所述提供装置基于检索条件在多个基础词语集中每个基础词语集中进行检索,以获取经过检索的多个词语;
所述提供装置将经过检索的多个词语作为与所述字符相对应的多个待选词语。
所述提供装置计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:
所述提供装置将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度。
所述提供装置将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:
所述提供装置确定第i个候选词语与第j个权重词语的匹配度Mij
所述提供装置确定第j个权重词语的权重系数Owj
所述提供装置基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj
其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
所述提供装置基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语包括:
所述提供装置基于每个候选词语的优先等级的降序顺序对多个候选词语进行排序以生成候选词语列表;
所述提供装置将候选词语列表分为优先等级呈降序顺序的多个候选词语组;
所述提供装置按照优先等级的降序顺序依次提供所述多个候选词语组;
其中每个候选词语组中的所有候选词语按照随机顺序进行提供;
其中上一个候选词语组中的任意一个候选词语的优先等级大于下一个候选词语组中每个候选词语的优先等级。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明的根据上下文环境进行信息输入的方法的流程图;
图2为根据本发明的根据上下文环境进行信息输入的示意图;
图3为根据本发明的根据上下文环境进行信息输入的***的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明的根据上下文环境进行信息输入的方法100的流程图。方法100当特定信息队列的输入消息的第一数量大于数量阈值时,确定每个输入词语的输入次数和每个接收词语的接收次数,根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集。方法100将同时存在于输入消息和接收消息中的词语确定为公共词语,并将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语。当接收到用户输入字符时,方法100从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
方法100从步骤101处开始。在步骤101,为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中。其中应用可以是需要进行消息输入和/或消息输出的各种类型的应用。应用可以为即时通讯应用、金融应用、游戏应用、多媒体应用等。将与每个应用相关联的输入消息和接收消息分别存储在信息队列包括:将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的输入消息存储在信息队列的输出部分中,如图2所示。图2为根据本发明的根据上下文环境进行信息输入的示意图。信息队列的输入部分存储了输入消息1、2、3、……、Ini-1、Ini,并且信息队列的输出部分存储了输出消息1、2、3、……、Outj-1、Outj。其中i和j分别是输入消息和输出消息的数量。为此,本发明需要将信息队列区分为输入部分和输出部分,其中输入部分和输出部分可以分别在信息队列的两端。当接收到与应用A相关联的输入消息时,将输入消息存储到应用A的信息队列的输入部分,而当接收到与应用A相关联的输出消息时,将输入消息存储到应用A的信息队列的输出部分。
此外,在为多个应用中的每个应用建立信息队列之前还包括,根据类别信息将用于进行信息输入的所有词语划分为多个词语集,其中每个词语集中包括多个词语并且每个词语集具有各自的类别名称。其中,类别信息例如是体育、音乐、历史等。类别信息还可以是篮球、足球、排球等。根据类别信息将用于进行信息输入的所有词语划分为多个词语集例如是,根据每个词语所归属的类别对所有词语进行分类,以划分为多个词语集。其中至少一个词语同时属于多个词语集。例如,词语“界外”可能同时属于信息集合“篮球”、“足球”和“排球”。
在步骤102,实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数。例如,可以通过为每个输入词语设置计数器来对多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数。
其中输入消息的第一数量可以指输入消息所包括的字符的数量,并且接收消息的第二数量可以指接收消息所包括的字符的数量。为此,实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中输出消息所包括的所有字符的第二数量。本发明可以为每个应用设置各自的数量阈值。例如,为游戏应用设置的数量阈值为500个字符、800个字符、1000个字符或1500个字符等。本发明为每个应用设置各自的预设范围。例如,信息队列的第二数量和第一数量的比值的预设范围为50%、80%、100%、150%、200%等。
在步骤103,根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集。其中根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语包括:确定多个输入词语中每个输入词语的输入次数Cp;按照输入次数的降序顺序对多个输入词语进行排序,以获得词语列表;将词语列表中排序在预定位置之前的输入词语确定为候选的输入词语;计算每个候选的输入词语与所归属的应用的描述文件的匹配度;将匹配度大于匹配阈值的候选的输入词语确定为基础词语。其中Cp为第p个输入词语的输入次数并且p为自然数。其中1≤p≤Nw,并且Nw为输入词语的数量。其中匹配阈值例如是60%、70%、80%等。将词语列表中排序在预定位置之前的输入词语确定为候选的输入词语。例如,当输入词语为200个时,将词语列表中排序在50位(包含50位)、100位(包含100位)或150位(包含150位)之前的输入词语确定为候选的输入词语。计算每个候选的输入词语与所归属的应用的描述文件的匹配度例如是计算每个候选的输入词语与所归属的应用的描述文件的语义匹配度、内容匹配度或关键词匹配度。匹配度最小为0%并且最大为100%。匹配阈值例如是60%、70%、80%等。此外,将与每个标准词语相关联的词语集作为基础词语集包括:将多个词语集中与至少一个标准词语相关联的词语集选择作为基础词语集。特定的词语集可能与多个标准词语相关联。通常,通过确定标准词语与词语集的描述信息、特征信息等的关联度或匹配度来确定标准词语与词语集是否相关联。例如,与特定标准词语的关联度或匹配度大于特定的阈值的词语集为基础词语集。
在步骤104,对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数。例如,可以通过为每个接收词语设置计数器来对多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数。
在步骤105,将同时存在于输入消息和接收消息中的词语确定为公共词语,即同时为输入词语和输出词语的词语,如图2所示。基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语,如图2所示。所述基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:确定每个公共词语的接收次数COy;确定每个公共词语的输入次数CIy;计算每个公共词语的权重系数
Figure BDA0002573427030000111
其中y为自然数并且1≤y≤No,其中No为公共词语的数量。阈值可以为各种合理的数值,例如1、0.9、0.8、0.6或0.5。
在步骤106,当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语包括:对所接收到的用户输入的字符转换为检索条件;基于检索条件在多个基础词语集中每个基础词语集中进行检索,以获取经过检索的多个词语;将经过检索的多个词语作为与所述字符相对应的多个待选词语。
计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度。将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:确定第i个候选词语与第j个权重词语的匹配度Mij;确定第j个权重词语的权重系数Owj;基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj。其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语包括:基于每个候选词语的优先等级的降序顺序对多个候选词语进行排序以生成候选词语列表;将候选词语列表分为优先等级呈降序顺序的多个候选词语组;按照优先等级的降序顺序依次提供所述多个候选词语组;其中每个候选词语组中的所有候选词语按照随机顺序进行提供;其中上一个候选词语组中的任意一个候选词语的优先等级大于下一个候选词语组中每个候选词语的优先等级。图2中示出了按照优先等级的降序顺序对多个候选词语进行排序的一组候选词语组。
图3为根据本发明的根据上下文环境进行信息输入的***300的结构示意图。当特定信息队列的输入消息的第一数量大于数量阈值时,***300确定每个输入词语的输入次数和每个接收词语的接收次数,根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集。***300将同时存在于输入消息和接收消息中的词语确定为公共词语,并将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语。当接收到用户输入字符时,***300从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
***300包括:初始化装置301、监测装置302、选择装置303、统计装置304、确定装置305和提供装置306。初始化装置301为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中。其中应用为即时通讯应用、金融应用或游戏应用。初始化装置301将与每个应用相关联的输入消息和接收消息分别存储在信息队列中包括:初始化装置301将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的输入消息存储在信息队列的输出部分中。初始化装置301根据类别信息将用于进行信息输入的所有词语划分为多个词语集,其中每个词语集中包括多个词语并且每个词语集具有各自的类别名称。
监测装置302实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数。监测装置302实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:监测装置302实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中输出消息所包括的所有字符的第二数量。本发明还包括为每个应用设置各自的数量阈值,以及为每个应用设置各自的预设范围。
选择装置303根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集。选择装置303根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语包括:选择装置303确定多个输入词语中每个输入词语的输入次数Cp;选择装置303按照输入次数的降序顺序对多个输入词语进行排序,以获得词语列表;选择装置303将词语列表中排序在预定位置之前的输入词语确定为候选的输入词语;选择装置303计算每个候选的输入词语与所归属的应用的描述文件的匹配度;选择装置303将匹配度大于阈值的候选的输入词语确定为基础词语。选择装置303将与每个标准词语相关联的词语集作为基础词语集包括:所述选择装置将多个词语集中与至少一个标准词语相关联的词语集选择作为基础词语集。
统计装置304对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数。
确定装置305将同时存在于输入消息和接收消息中的词语确定为公共词语,基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语。确定装置305基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:确定装置305确定每个公共词语的接收次数COy;确定装置305确定每个公共词语的输入次数CIy;确定装置305计算每个公共词语的权重系数
Figure BDA0002573427030000141
其中y为自然数并且1≤y≤No,其中No为公共词语的数量。阈值可以为1、0.9、0.8、0.6或0.5。
提供装置306当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个待选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语。
当接收到用户输入字符时,提供装置306从多个基础词语集中获取与所述字符相对应的多个待选词语包括:提供装置306对所接收到的用户输入的字符转换为检索条件;提供装置306基于检索条件在多个基础词语集中每个基础词语集中进行检索,以获取经过检索的多个词语;提供装置306将经过检索的多个词语作为与所述字符相对应的多个待选词语。
提供装置306计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:提供装置306将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度。
提供装置306将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:提供装置306确定第i个候选词语与第j个权重词语的匹配度Mij;提供装置306确定第j个权重词语的权重系数Owj;提供装置306基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj
其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
提供装置306基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语包括:提供装置306基于每个候选词语的优先等级的降序顺序对多个候选词语进行排序以生成候选词语列表;提供装置306将候选词语列表分为优先等级呈降序顺序的多个候选词语组;提供装置306按照优先等级的降序顺序依次提供所述多个候选词语组;其中每个候选词语组中的所有候选词语按照随机顺序进行提供;其中上一个候选词语组中的任意一个候选词语的优先等级大于下一个候选词语组中每个候选词语的优先等级。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种根据上下文环境进行信息输入的方法,所述方法包括:
为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中;
实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数;
根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集;
对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数;
将同时存在于输入消息和接收消息中的词语确定为公共词语,基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语,
其中基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:
确定每个公共词语的接收次数COy
确定每个公共词语的输入次数CIy
计算每个公共词语的权重系数
Figure FDA0003105825730000011
其中y为自然数并且1≤y≤No,其中No为公共词语的数量;
当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个候选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语;
其中计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:
将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度;
其中,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:
确定第i个候选词语与第j个权重词语的匹配度Mij
确定第j个权重词语的权重系数Owj
基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj
其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
2.根据权利要求1所述的方法,其中应用为即时通讯应用、金融应用或游戏应用。
3.根据权利要求1所述的方法,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中包括:
将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的接收消息存储在信息队列的输出部分中。
4.根据权利要求3所述的方法,实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:
实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中接收消息所包括的所有字符的第二数量。
5.根据权利要求1所述的方法,还包括,为每个应用设置各自的数量阈值。
6.一种根据上下文环境进行信息输入的***,所述***包括:
初始化装置,为多个应用中的每个应用建立信息队列,将与每个应用相关联的输入消息和接收消息分别存储在信息队列中;
监测装置,实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量,当特定信息队列的输入消息的第一数量大于数量阈值时,确定所述特定信息队列的第二数量和第一数量的比值是否在预设范围内,如果在预设范围内,对特定信息队列的输入消息内多个输入词语中的每个输入词语进行次数统计,以确定每个输入词语的输入次数;
选择装置,根据输入次数从多个输入词语中选择至少两个输入词语以作为标准词语,将与每个标准词语相关联的词语集作为基础词语集;
统计装置,对特定信息队列的接收消息内多个接收词语中的每个接收词语进行次数统计,以确定每个接收词语的接收次数;
确定装置,将同时存在于输入消息和接收消息中的词语确定为公共词语,基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数,并且将重要系数大于阈值的公共词语选择作为权重词语,以确定多个权重词语,其中基于每个公共词语的接收次数和输入次数确定每个公共词语的重要系数包括:
确定每个公共词语的接收次数COy
确定每个公共词语的输入次数CIy
计算每个公共词语的权重系数
Figure FDA0003105825730000031
其中y为自然数并且1≤y≤No,其中No为公共词语的数量;
提供装置,当接收到用户输入字符时,从多个基础词语集中获取与所述字符相对应的多个候选词语,计算每个候选词语与多个权重词语中每个权重词语的匹配度,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级,基于每个候选词语的优先等级对多个候选词语进行排序,并按照排序的顺序来提供所述多个候选词语;
其中计算每个候选词语与多个权重词语中每个权重词语的匹配度包括:
将每个候选词语与多个权重词语中每个权重词语进行语义匹配,并且将语义匹配的匹配度作为每个候选词语与多个权重词语中每个权重词语的匹配度;
其中,将每个候选词语与每个权重词语的匹配度进行加权计算以确定每个候选词语的优先等级包括:
确定第i个候选词语与第j个权重词语的匹配度Mij
确定第j个权重词语的权重系数Owj
基于第i个候选词语与第j个权重词语的匹配度Mij,计算第i个候选词语的优先等级Pi=Mi1×Ow1+Mi2×Ow2+…+Mij×Owj
其中i和j为自然数并且1≤i≤N1,1≤j≤N2,N1为候选词语的数量,并且N2为权重词语的数量。
7.根据权利要求6所述的***,其中应用为即时通讯应用、金融应用或游戏应用。
8.根据权利要求6所述的***,所述初始化装置将与每个应用相关联的输入消息和接收消息分别存储在信息队列中包括:
所述初始化装置将与每个应用相关联的输入消息存储在信息队列的输入部分中,并且将与每个应用相关联的接收消息存储在信息队列的输出部分中。
9.根据权利要求8所述的***,所述监测装置实时监测每个信息队列中各自的输入消息的第一数量和接收消息的第二数量包括:
监测装置实时监测信息队列的输入部分中输入消息所包括的所有字符的第一数量;以及实时监测信息队列的输出部分中接收消息所包括的所有字符的第二数量。
10.根据权利要求6所述的***,还包括,为每个应用设置各自的数量阈值。
CN202010646972.3A 2020-07-07 2020-07-07 一种根据上下文环境进行信息输入的方法及*** Active CN111984132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010646972.3A CN111984132B (zh) 2020-07-07 2020-07-07 一种根据上下文环境进行信息输入的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010646972.3A CN111984132B (zh) 2020-07-07 2020-07-07 一种根据上下文环境进行信息输入的方法及***

Publications (2)

Publication Number Publication Date
CN111984132A CN111984132A (zh) 2020-11-24
CN111984132B true CN111984132B (zh) 2021-07-27

Family

ID=73438556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010646972.3A Active CN111984132B (zh) 2020-07-07 2020-07-07 一种根据上下文环境进行信息输入的方法及***

Country Status (1)

Country Link
CN (1) CN111984132B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681229A (zh) * 2007-04-26 2010-03-24 株式会社爱可信 输入候选提供装置、输入候选提供***、输入候选提供方法以及输入候选提供程序
CN102419639A (zh) * 2010-09-28 2012-04-18 英业达股份有限公司 提供扩充字词的输入***及其方法
CN102591472A (zh) * 2011-01-13 2012-07-18 新浪网技术(中国)有限公司 一种汉字输入方法和装置
CN102937976A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种基于输入前缀的下拉提示方法和装置
CN105051734A (zh) * 2013-04-04 2015-11-11 索尼公司 信息处理设备、数据输入辅助方法以及程序
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置
CN108319377A (zh) * 2018-02-07 2018-07-24 北京百度网讯科技有限公司 场景化文字输入的方法及***、终端以及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681229A (zh) * 2007-04-26 2010-03-24 株式会社爱可信 输入候选提供装置、输入候选提供***、输入候选提供方法以及输入候选提供程序
CN102419639A (zh) * 2010-09-28 2012-04-18 英业达股份有限公司 提供扩充字词的输入***及其方法
CN102591472A (zh) * 2011-01-13 2012-07-18 新浪网技术(中国)有限公司 一种汉字输入方法和装置
CN102937976A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种基于输入前缀的下拉提示方法和装置
CN105051734A (zh) * 2013-04-04 2015-11-11 索尼公司 信息处理设备、数据输入辅助方法以及程序
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置
CN108319377A (zh) * 2018-02-07 2018-07-24 北京百度网讯科技有限公司 场景化文字输入的方法及***、终端以及计算机可读存储介质

Also Published As

Publication number Publication date
CN111984132A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN107609101B (zh) 智能交互方法、设备及存储介质
CN109815314B (zh) 一种意图识别方法、识别设备及计算机可读存储介质
CN102722483B (zh) 用于确定输入法的候选项排序的方法、装置和设备
CN107491996B (zh) 一种网页广告投放方法与***
CN112395556B (zh) 异常用户检测模型训练方法、异常用户审核方法及装置
CN103761254A (zh) 多领域服务主题匹配推荐方法
CN110795542A (zh) 对话方法及相关装置、设备
CN105159884B (zh) 行业词典的建立方法和装置及行业识别方法和装置
JP2009098964A (ja) ネットワークサービスシステム、サーバ、方法及びプログラム
CN112632257A (zh) 基于语义匹配的问题处理方法、装置、终端和存储介质
CN106777282B (zh) 相关搜索的排序方法和装置
CN108604248B (zh) 利用基于人工智能的相关性计算的笔记提供方法及装置
CN108509499A (zh) 一种搜索方法及装置,电子设备
US20120158857A1 (en) Message Thread Clustering
US20190199667A1 (en) Message focusing
CN116455861B (zh) 一种基于大数据的计算机网络安全监测***及方法
CN110609958A (zh) 数据推送方法、装置、电子设备及存储介质
CN103955480B (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN111984132B (zh) 一种根据上下文环境进行信息输入的方法及***
CN106095941B (zh) 基于大数据知识库的解决方案推荐方法和***
US20120158855A1 (en) Data Clustering
US9679046B2 (en) Identification and quantification of predatory behavior across communications systems
CN110275970A (zh) 图像检索的方法、装置、服务器及存储介质
CN104360759B (zh) 候选字排序方法、装置和文字输入方法、设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant