CN111984131B - 一种基于动态权重进行信息输入的方法及*** - Google Patents

一种基于动态权重进行信息输入的方法及*** Download PDF

Info

Publication number
CN111984131B
CN111984131B CN202010646321.4A CN202010646321A CN111984131B CN 111984131 B CN111984131 B CN 111984131B CN 202010646321 A CN202010646321 A CN 202010646321A CN 111984131 B CN111984131 B CN 111984131B
Authority
CN
China
Prior art keywords
weight
information set
word
words
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010646321.4A
Other languages
English (en)
Other versions
CN111984131A (zh
Inventor
宝音
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Original Assignee
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LANGUAGE AND CULTURE UNIVERSITY filed Critical BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority to CN202010646321.4A priority Critical patent/CN111984131B/zh
Publication of CN111984131A publication Critical patent/CN111984131A/zh
Application granted granted Critical
Publication of CN111984131B publication Critical patent/CN111984131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于动态权重进行信息输入的方法和***,权重方法包括:将同时存在于第一历和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。

Description

一种基于动态权重进行信息输入的方法及***
技术领域
本发明涉及信息技术领域,并且更具体地,涉及一种基于动态权重进行信息输入的方法及***。
背景技术
目前,随着互联网技术的不断进步以及移动终端性能的不断提升,移动终端所具备的功能越来越多。通常情况下,信息输入功能是移动终端中非常重要的功能。例如,信息输入功能可以用于移动终端内的即时通讯应用、购物应用和文档处理应用等。因为需要被频繁使用,所以信息输入功能也被寄予了更高的期望,如输入的快捷性、准确率、效率等等。
在现有技术中,当用户希望通过移动终端进行信息输入时,通常需要输入一些字符,而移动终端中的信息输入应用会根据这些字符来确定多个词语并将这些词语进行提供或呈现以供用户选择。然而,在现有技术中,通常是基于固定的顺序或用户的输入习惯来确定多个词语的顺序。这种方式无法满足用户需求,这是因为这种方法无法根据动态信息来实时修改多个词语的顺序。
发明内容
根据本发明的一个方面,提供一种基于动态权重进行信息输入的方法,所述方法包括:
获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;
确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;
获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;
将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;
根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;
当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
在获取第一时间区间内的第一历史输入信息集之前还包括:
根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。
其中至少一个词语同时属于多个信息集合;
所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;
根据预先设置的输入规则为每个信息集合确定基础权重包括:
根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。
所述第一时间区间包括时间上连续的第一预定数量的自然日。
确定每个词语所归属的信息集合包括:确定每个词语所归属的至少一个信息集合。
确定每个信息集合所涉及的所有词语的第一输入次数的总和包括:
确定每个信息集合所涉及的所有词语;
统计所有词语中每个词语的第一输入次数;
将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。
根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括:
获取每个信息集合所涉及的所有词语的第一输入次数的总和CAi,其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量;
第i个信息集合的第一权重调整因子wmi为:
Figure BDA0002573160050000031
基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括:
获取每个信息集合的第一权重调整因子wmi
获取每个信息集合的基础权重wbi
确定每个信息集合的初始权重wti=wbi×(1+wmi)。
所述第二时间区间包括时间上连续的第二预定数量的自然日,
其中,所述第二预定数量小于所述第一预定数量,
或者第二预定数量的自然日是所述第一预定数量的自然日的子集。
所述基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括:
确定每个目标词语的第一输入次数CFy
确定每个目标词语的第二输入次数CSy
每个目标词语的权重系数
Figure BDA0002573160050000041
其中y为自然数并且1≤y≤Nw,其中Nw为目标词语的数量。
所述阈值为1、0.9、0.8、0.6或0.5。
所述根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括:
获取每个权重词语的第二输入次数CSj,确定每个权重词语的动态系数为:
Figure BDA0002573160050000042
其中j为自然数并且1≤j≤Nm,其中Nm为权重词语的数量。
其中根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:
确定每个权重词语所归属的信息集合,并将具有至少一个权重词语的信息集合确定为权重信息集合;
确定每个权重信息集合所包括的至少一个权重词语;
根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。
其中根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:
确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数Fpq,其中Fpq为第p个权重信息集合中第q个权重词语的动态系数;
获取每个权重信息集合的初始权重wtp
确定每个权重信息集合的动态权重Fwp=wtp×(1+Fp1/1+Fp2/2+Fp3/3+…+Fpq/q),
其中p和q为自然数并且1≤p≤Nk,1≤q≤kp,Nk为权重信息集合的数量,并且kp为第p个权重信息集合的权重词语的数量。
其中利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括:
将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重;
基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括:
确定每个待选词语与所述字符的内容关联度Crv
基于每个待选词语的词语权重Wv和与所述字符的内容关联度Crv确定每个待选词语与所述字符的经过修改的内容关联度CLrv=Crv×(1+Wv);
其中,v为自然数并且1≤v≤No,No为待选词语的数量。
根据本发明的另一方面,提供一种基于动态权重进行信息输入的***,所述***包括:
获取装置,获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;
确定装置,确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;
修改装置,根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;
提供装置,当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
还包括初始化装置,用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。
其中至少一个词语同时属于多个信息集合;
所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;
初始化装置根据预先设置的输入规则为每个信息集合确定基础权重包括:
初始化装置根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。
所述第一时间区间包括时间上连续的第一预定数量的自然日。
所述确定装置确定每个词语所归属的信息集合包括:确定装置确定每个词语所归属的至少一个信息集合。
所述确定装置确定每个信息集合所涉及的所有词语的第一输入次数的总和包括:
确定装置确定每个信息集合所涉及的所有词语;
确定装置统计所有词语中每个词语的第一输入次数;
确定装置将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。
所述确定装置根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括:
确定装置获取每个信息集合所涉及的所有词语的第一输入次数的总和CAi,其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量;
第i个信息集合的第一权重调整因子wmi为:
Figure BDA0002573160050000071
确定装置基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括:
确定装置获取每个信息集合的第一权重调整因子wmi
确定装置获取每个信息集合的基础权重wbi
确定装置确定每个信息集合的初始权重wti=wbi×(1+wmi)。
所述第二时间区间包括时间上连续的第二预定数量的自然日,
其中,所述第二预定数量小于所述第一预定数量,
或者第二预定数量的自然日是所述第一预定数量的自然日的子集。
所述确定装置基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括:
确定装置确定每个目标词语的第一输入次数CFy
确定装置确定每个目标词语的第二输入次数CSy
确定装置确定每个目标词语的权重系数
Figure BDA0002573160050000072
其中y为自然数并且1≤y≤Nw,其中Nw为目标词语的数量。
所述阈值为1、0.9、0.8、0.6或0.5。
所述修改装置根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括:
修改装置获取每个权重词语的第二输入次数CSj,确定每个权重词语的动态系数为:
Figure BDA0002573160050000081
其中j为自然数并且1≤j≤Nm,其中Nm为权重词语的数量。
其中修改装置根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:
修改装置确定每个权重词语所归属的信息集合,并将具有至少一个权重词语的信息集合确定为权重信息集合;
修改装置确定每个权重信息集合所包括的至少一个权重词语;
修改装置根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。
其中修改装置根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:
修改装置确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数Fpq,其中Fpq为第p个权重信息集合中第q个权重词语的动态系数;
修改装置获取每个权重信息集合的初始权重wtp
修改装置确定每个权重信息集合的动态权重Fwp=wtp×(1+Fp1/1+Fp2/2+Fp3/3+…+Fpq/q),
其中p和q为自然数并且1≤p≤Nk,1≤q≤kp,Nk为权重信息集合的数量,并且kp为第p个权重信息集合的权重词语的数量。
其中修改装置利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括:
修改装置将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重;
其中提供装置基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括:
确定每个待选词语与所述字符的内容关联度Crv
基于每个待选词语的词语权重Wv和与所述字符的内容关联度Crv确定每个待选词语与所述字符的经过修改的内容关联度CLrv=Crv×(1+Wv);
其中,v为自然数并且1≤v≤No,No为待选词语的数量。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明的基于动态权重进行信息输入的方法的流程图;
图2为根据本发明的提供多个待选词语的示意图;
图3为根据本发明的基于动态权重进行信息输入的***的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明的基于动态权重进行信息输入的方法100的流程图。方法100根据第一时间区间内的第一历史输入信息集和第二时间区间内的第二历史输入信息集,确定每个词语的第一输入次数和第二输入次数,同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数并以此确定多个权重词语。方法100根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重,并且当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
方法100从步骤101处开始。在步骤101,获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数。第一时间区间可以包括时间上连续的第一预定数量的自然日。第一时间区间还可以是时间上不连续的第一预定数量的自然日。此外,第一时间区间可以是一段连续的时间区段。图2为根据本发明的提供多个待选词语的示意图。如图2所示,第一时间区间为一段连续的时间区段。
此外,在获取第一时间区间内的第一历史输入信息集之前还包括:根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称。其中,类别信息例如是体育、音乐、历史等。类别信息还可以是篮球、足球、排球等。根据类别信息将用于进行信息输入的信息库划分为多个信息集合例如是,根据每个词语所归属的类别对信息库中的所有词语进行分类,以划分为多个信息集合。其中至少一个词语同时属于多个信息集合。例如,词语“界外”可能同时属于信息集合“篮球”、“足球”和“排球”。
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。其中预先设置的输入规则可以是由服务器设置的或是由用户设备设置的。所述输入规则包括每个信息集合的默认权重和动态权重。例如,由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重。默认权重可以是例如在足球运动非常流行的国家,例如,巴西,信息集合“足球”的默认权重大于信息集合“篮球”的默认权重。动态权重是由用户设备或使用用户设备的用户来设置的。例如,用户是篮球评论员,并且因此将信息集合“篮球”的动态权重设置为大于信息集合“足球”的动态权重。
根据预先设置的输入规则为每个信息集合确定基础权重包括:根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。其中所有信息集合的默认权重的格式为百分比,并且所有信息集合的默认权重的和为100%。动态权重例如可以是针对特定信息集合的增加比例。例如,信息集合A、B和C的默认权重分别为1/3、1/3和1/3。动态权重为信息集合A增加100%,即1/3+1/3=2/3。通过动态权重对信息集合A进行处理后,信息集合A、B和C的默认权重变为2/3、1/3和1/3。将变更后的默认权重进行处理,使得信息集合A、B和C的基础权重wb变为1/2、1/4和1/4,即由2/3、1/3和1/3的比例来获得的。
在步骤102,确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重。确定每个词语所归属的信息集合包括:确定每个词语所归属的至少一个信息集合。
确定每个信息集合所涉及的所有词语的第一输入次数的总和包括:确定每个信息集合所涉及的所有词语;统计所有词语中每个词语的第一输入次数;将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。
根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括:获取每个信息集合所涉及的所有词语的第一输入次数的总和CAi,其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量。CAi为第i个信息集合所涉及的所有词语的第一输入次数的总和。
根据下面的公式计算第i个信息集合的第一权重调整因子wmi
Figure BDA0002573160050000121
其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量。
基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括:获取每个信息集合的第一权重调整因子wmi;获取每个信息集合的基础权重wbi;确定每个信息集合的初始权重wti=wbi×(1+wmi)。应当了解的是,可以针对每个信息集合的初始权重wti确定新的比例,并根据新的比例确定初始权重wti的值。即,在通过上面公式确定初始权重后,对初始权重进行处理以使得所有信息集合的初始权重的和为100%。可替换地,可以不对初始权重进行处理以使得所有信息集合的初始权重的和为100%,即直接使用初始权重的计算值。
在步骤103,获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数。所述第二时间区间包括时间上连续的第二预定数量的自然日。其中,所述第二预定数量小于所述第一预定数量。或者第二预定数量的自然日是所述第一预定数量的自然日的子集。如图2所示,第二时间区间为一段连续的时间区段并且,第二时间区间是第一时间区间的子集。
在步骤104,将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语。
基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括:确定每个目标词语的第一输入次数CFy;确定每个目标词语的第二输入次数CSy;根据第一输入次数和第二输入次数计算每个目标词语的权重系数
Figure BDA0002573160050000131
其中y为自然数并且1≤y≤Nw,其中Nw为目标词语的数量。举例来说,阈值可以为1、0.9、0.8、0.6或0.5。
在步骤105,根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重。
根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括:获取每个权重词语的第二输入次数CSj,确定每个权重词语的动态系数为:
Figure BDA0002573160050000132
其中j为自然数并且1≤j≤Nm,其中Nm为权重词语的数量。
其中根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:确定每个权重词语所归属的信息集合,并将具有至少一个权重词语的信息集合确定为权重信息集合;确定每个权重信息集合所包括的至少一个权重词语;根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。
其中根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数Fpq,其中Fpq为第p个权重信息集合中第q个权重词语的动态系数;获取每个权重信息集合的初始权重wtp;确定每个权重信息集合的动态权重Fwp=wtp×(1+Fp1/1+Fp2/2+Fp3/3+…+Fpq/q),
其中p和q为自然数并且1≤p≤Nk,1≤q≤kp,Nk为权重信息集合的数量,并且kp为第p个权重信息集合的权重词语的数量。
其中利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括:将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重。
在步骤106,当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括:确定每个待选词语与所述字符的内容关联度Crv;基于每个待选词语的词语权重Wv和与所述字符的内容关联度Crv确定每个待选词语与所述字符的经过修改的内容关联度CLrv=Crv×(1+Wv);其中,v为自然数并且1≤v≤No,No为待选词语的数量。其中Crv是第v个待选词语与所述字符的内容关联度。Wv是第v个待选词语的词语权重。CLrv是第v个待选词语与所述字符的经过修改的内容关联度。
本发明基于每个待选词语的内容关联度的降序顺序对多个待选词语进行排序并将待选词语按内容关联度分为呈降序顺序的多个待选词语组。例如,多个待选词语组中分别包括多个待选词语A1-A9、B1-B9、C1-C9等。本发明按照内容关联度的降序顺序依次提供所述多个待选词语组,如图2所示。当根据本发明的上述方式确定每个待选词语的经过修改的内容关联度时,例如,待选词语B3的经过修改的内容关联度小于待选词语A2并且大于待选词语A4。为此,将待选词语B3排在待选词语A2和待选词语A4之间。而待选词语A3的经过修改的内容关联度小于待选词语A9并且大于待选词语B1。为此,将待选词语A3排在待选词语A9和待选词语B1之间。
图3为根据本发明的基于动态权重进行信息输入的***300的结构示意图。***300包括:获取装置301、确定装置302、修改装置303、提供装置304和初始化装置305。
获取装置301获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数。第一时间区间包括时间上连续的第一预定数量的自然日。第二时间区间包括时间上连续的第二预定数量的自然日,其中,所述第二预定数量小于所述第一预定数量,或者第二预定数量的自然日是所述第一预定数量的自然日的子集。
确定装置302确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语。
确定装置302确定每个词语所归属的信息集合包括:确定装置确定每个词语所归属的至少一个信息集合。确定装置302确定每个信息集合所涉及的所有词语的第一输入次数的总和包括:确定装置302确定每个信息集合所涉及的所有词语;确定装置302统计所有词语中每个词语的第一输入次数;确定装置302将每个词语的第一输入次数的算术和作为每个信息集合所涉及的所有词语的第一输入次数的总和。
确定装置302根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子包括:确定装置302获取每个信息集合所涉及的所有词语的第一输入次数的总和CAi,其中i为自然数并且1≤i≤Nc,其中Nc为信息集合的数量;
第i个信息集合的第一权重调整因子wmi为:
Figure BDA0002573160050000151
确定装置302基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重包括:确定装置302获取每个信息集合的第一权重调整因子wmi;确定装置302获取每个信息集合的基础权重wbi;确定装置302确定每个信息集合的初始权重wti=wbi×(1+wmi)。
确定装置302基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数包括:确定装置302确定每个目标词语的第一输入次数CFy;确定装置302确定每个目标词语的第二输入次数CSy;确定装置302确定每个目标词语的权重系数
Figure BDA0002573160050000161
其中y为自然数并且1≤y≤Nw,其中Nw为目标词语的数量。阈值为1、0.9、0.8、0.6或0.5。
修改装置303根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重。
修改装置303根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:修改装置303确定每个权重词语所归属的信息集合,并将具有至少一个权重词语的信息集合确定为权重信息集合;修改装置303确定每个权重信息集合所包括的至少一个权重词语;修改装置303根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重。
修改装置303根据每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重包括:修改装置303确定每个权重信息集合所包括的至少一个权重词语中每个权重词语的动态系数Fpq,其中Fpq为第p个权重信息集合中第q个权重词语的动态系数;修改装置303获取每个权重信息集合的初始权重wtp
修改装置303确定每个权重信息集合的动态权重Fwp=wtp×(1+Fp1/1+Fp2/2+Fp3/3+…+Fpq/q),
其中p和q为自然数并且1≤p≤Nk,1≤q≤kp,Nk为权重信息集合的数量,并且kp为第p个权重信息集合的权重词语的数量。
其中修改装置303利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重包括:修改装置303将每个信息集合的每个词语设置词语权重设置为等于各自权重信息集合的动态权重。
修改装置303根据每个权重词语的第二输入次数确定每个权重词语的动态系数包括:修改装置303获取每个权重词语的第二输入次数CSj,确定每个权重词语的动态系数为:
Figure BDA0002573160050000171
其中j为自然数并且1≤j≤Nm,其中Nm为权重词语的数量。
当接收到用户输入字符时,提供装置304获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。其中提供装置304基于与所述字符的内容关联度和词语权重对多个待选词语进行排序包括:提供装置304确定每个待选词语与所述字符的内容关联度Crv;提供装置304基于每个待选词语的词语权重Wr和与所述字符的内容关联度Crv确定每个待选词语与所述字符的经过修改的内容关联度CLrv=Crv×(1+Wr)。
初始化装置305用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。其中至少一个词语同时属于多个信息集合。所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重。初始化装置305根据预先设置的输入规则为每个信息集合确定基础权重包括:初始化装置305根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种基于动态权重进行信息输入的方法,所述方法包括:
获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;
确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;
获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;
将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;
根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;
当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
2.根据权利要求1所述的方法,在获取第一时间区间内的第一历史输入信息集之前还包括:
根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。
3.根据权利要求2所述的方法,其中至少一个词语同时属于多个信息集合;
所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;
根据预先设置的输入规则为每个信息集合确定基础权重包括:
根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。
4.根据权利要求1所述的方法,所述第一时间区间包括时间上连续的第一预定数量的自然日。
5.根据权利要求1所述的方法,确定每个词语所归属的信息集合包括:确定每个词语所归属的至少一个信息集合。
6.一种基于动态权重进行信息输入的***,所述***包括:
获取装置,获取第一时间区间内的第一历史输入信息集,并对第一历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第一输入次数;获取第二时间区间内的第二历史输入信息集,并对第二历史输入信息集内多个词语中的每个词语进行次数统计,以确定每个词语的第二输入次数;
确定装置,确定每个词语所归属的信息集合,从而确定每个信息集合所涉及的所有词语的第一输入次数的总和,根据每个信息集合所涉及的所有词语的第一输入次数的总和为每个信息集合确定第一权重调整因子,基于每个信息集合的第一权重调整因子和基础权重确定每个信息集合的初始权重;将同时存在于第一历史输入信息集和第二历史输入信息集的词语确定为目标词语,基于每个目标词语的第二输入次数和第一输入次数确定每个目标词语的权重系数,并且将权重系数大于阈值的目标词语选择作为权重词语,以确定多个权重词语;
修改装置,根据每个权重词语的第二输入次数确定每个权重词语的动态系数,根据每个权重词语的动态系数和所归属的信息集合对每个信息集合的初始权重进行修改以生成每个信息集合的动态权重;利用每个信息集合的动态权重对每个信息集合的每个词语设置词语权重;
提供装置,当接收到用户输入字符时,获取与所述字符相对应的多个待选词语,基于与所述字符的内容关联度和词语权重对多个待选词语进行排序,并按照排序的顺序来提供所述多个待选词语。
7.根据权利要求6所述的***,还包括初始化装置,用于根据类别信息将用于进行信息输入的信息库划分为多个信息集合,其中每个信息集合中包括多个词语并且每个信息集合具有各自的类别名称;
获取预先设置的输入规则,根据预先设置的输入规则为每个信息集合确定基础权重。
8.根据权利要求7所述的***,其中至少一个词语同时属于多个信息集合;
所述输入规则包括每个信息集合的默认权重和动态权重,其中由内容服务器为每个信息集合设置默认权重,并且由用户设备为每个信息集合设置动态权重;
初始化装置根据预先设置的输入规则为每个信息集合确定基础权重包括:
初始化装置根据每个信息集合的默认权重和动态权重确定每个信息集合的基础权重wb。
9.根据权利要求6所述的***,所述第一时间区间包括时间上连续的第一预定数量的自然日。
10.根据权利要求6所述的***,所述确定装置确定每个词语所归属的信息集合包括:确定装置确定每个词语所归属的至少一个信息集合。
CN202010646321.4A 2020-07-07 2020-07-07 一种基于动态权重进行信息输入的方法及*** Active CN111984131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010646321.4A CN111984131B (zh) 2020-07-07 2020-07-07 一种基于动态权重进行信息输入的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010646321.4A CN111984131B (zh) 2020-07-07 2020-07-07 一种基于动态权重进行信息输入的方法及***

Publications (2)

Publication Number Publication Date
CN111984131A CN111984131A (zh) 2020-11-24
CN111984131B true CN111984131B (zh) 2021-05-14

Family

ID=73439004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010646321.4A Active CN111984131B (zh) 2020-07-07 2020-07-07 一种基于动态权重进行信息输入的方法及***

Country Status (1)

Country Link
CN (1) CN111984131B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN101398834A (zh) * 2007-09-29 2009-04-01 北京搜狗科技发展有限公司 一种针对输入信息的处理方法和装置及一种输入法***
CN102419639A (zh) * 2010-09-28 2012-04-18 英业达股份有限公司 提供扩充字词的输入***及其方法
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103869999A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 对输入法所产生的候选项进行排序的方法及装置
CN103870001A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种生成输入法候选项的方法及电子装置
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN103869998A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
EP2837994A2 (en) * 2013-08-16 2015-02-18 BlackBerry Limited Methods and devices for providing predicted words for textual input
CN104375663A (zh) * 2014-11-11 2015-02-25 广东欧珀移动通信有限公司 一种联想输入方法及装置
CN108227950A (zh) * 2016-12-21 2018-06-29 北京搜狗科技发展有限公司 一种输入方法和装置
CN109254991A (zh) * 2018-10-23 2019-01-22 北京语言大学 一种语言学习方法及装置
CN109521888A (zh) * 2017-09-19 2019-03-26 北京搜狗科技发展有限公司 一种输入方法、装置和介质
CN109871434A (zh) * 2019-02-25 2019-06-11 内蒙古工业大学 一种基于动态增量式的概率图模型的舆情演化跟踪方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN101398834A (zh) * 2007-09-29 2009-04-01 北京搜狗科技发展有限公司 一种针对输入信息的处理方法和装置及一种输入法***
CN102419639A (zh) * 2010-09-28 2012-04-18 英业达股份有限公司 提供扩充字词的输入***及其方法
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN103870001A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种生成输入法候选项的方法及电子装置
CN103869999A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 对输入法所产生的候选项进行排序的方法及装置
CN103869998A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
EP2837994A2 (en) * 2013-08-16 2015-02-18 BlackBerry Limited Methods and devices for providing predicted words for textual input
CN104375663A (zh) * 2014-11-11 2015-02-25 广东欧珀移动通信有限公司 一种联想输入方法及装置
CN108227950A (zh) * 2016-12-21 2018-06-29 北京搜狗科技发展有限公司 一种输入方法和装置
CN109521888A (zh) * 2017-09-19 2019-03-26 北京搜狗科技发展有限公司 一种输入方法、装置和介质
CN109254991A (zh) * 2018-10-23 2019-01-22 北京语言大学 一种语言学习方法及装置
CN109871434A (zh) * 2019-02-25 2019-06-11 内蒙古工业大学 一种基于动态增量式的概率图模型的舆情演化跟踪方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于动态自适应语言模型的手机中文输入***的研究与实现;孙晓;《中国优秀硕士学位论文全文数据库-信息科技辑》;20120615;I138-2266 *
基于汉语拼音的英文辅助写作技术的研究;陆瑞雪;《中国优秀硕士学位论文全文数据库-信息科技辑》;20170315;I138-5983 *
基于递归神经网络的英文手写输入法的设计与实现;王瑞刚;《中国优秀硕士学位论文全文数据库-信息科技辑》;20170215;I138-4693 *

Also Published As

Publication number Publication date
CN111984131A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN103870505B (zh) 一种查询词推荐方法和查询词推荐***
CN108228911A (zh) 一种相似视频的计算方法及装置
CN107016569A (zh) 一种网络产品的目标用户账号获取方法及装置
CN110222233A (zh) 视频推荐方法、装置、服务器及存储介质
WO2020029401A1 (zh) 商品推荐方法、装置、计算机设备及计算机可读存储介质
CN112231555A (zh) 基于用户画像标签的召回方法、装置、设备及存储介质
CN106777282B (zh) 相关搜索的排序方法和装置
WO2019107396A1 (ja) データ分析装置及びデータ分析プログラム
CN105740480B (zh) 机票推荐方法及***
CN106407364A (zh) 一种基于人工智能的信息推荐方法和装置
CN108153918A (zh) 基于自适应正交交叉的多目标优化算法的个性化电影推荐方法
CN111915409A (zh) 基于物品的物品推荐方法、装置、设备及存储介质
CN111984131B (zh) 一种基于动态权重进行信息输入的方法及***
CN114780606B (zh) 一种大数据挖掘方法及***
CN108804676B (zh) 一种帖子排序方法、装置、设备及计算机可读存储介质
CN113779421A (zh) 关联推荐方法、装置、设备及计算机可读存储介质
CN109857856B (zh) 一种文本的检索排序确定方法及***
CN111259232A (zh) 一种基于个性化召回的推荐***优化方法
CN111984132B (zh) 一种根据上下文环境进行信息输入的方法及***
CN106649302A (zh) 一种搜索排序方法以及装置
CN108549729A (zh) 基于覆盖约简的个性化用户协同过滤推荐方法
CN115982634A (zh) 应用程序分类方法、装置、电子设备及计算机程序产品
CN108257035A (zh) 用户相似度计算方法、装置、服务器及可读存储介质
CN114401211A (zh) 一种工业无线网络设备接入IPv6网络的测试***及测试方法
CN110399430A (zh) 用户特征确定方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant