CN113741783A

CN113741783A - 按键识别方法、装置和用于识别按键的装置

Info

Publication number: CN113741783A
Application number: CN202110874455.6A
Authority: CN
Inventors: 余天照; 崔欣
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-12-03

Abstract

本申请实施例公开了按键识别方法、装置和用于识别按键的装置。该方法的实施例包括：获取目标用户输入过程中的实时落点坐标和上文输入字符；基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定输入界面中目标用户点击的目标按键。该实施方式提高了按键识别的准确性。

Description

按键识别方法、装置和用于识别按键的装置

技术领域

本申请实施例涉及计算机技术领域，具体涉及按键识别方法、装置和用于识别按键的装置。

背景技术

随着计算机技术的发展，越来越多的电子设备(包括虚拟现实(Virtual Reality，VR)设备以及实体电子设备)及其所运行的客户端应用中配置有虚拟键盘，电子设备可通过识别用户在虚拟键盘中所触摸的按键，来接收用户输入的信息。

现有技术中，通常通过确定落点坐标位置所属的按键区域，来确定用户点击的按键，进而对该按键进行响应。然而，在用户误触、落点偏移等情况下，这种方式的按键识别结果通常与用户意图不匹配，导致按键识别的准确性较低。

发明内容

本申请实施例提出了按键识别方法、装置和用于识别按键的装置，以解决现有技术中按键识别的准确性较低的技术问题。

第一方面，本申请实施例提供了一种按键识别方法，该方法包括：获取目标用户输入过程中的实时落点坐标和上文输入字符；基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述历史落点坐标分布通过如下步骤预先统计得到：获取多个用户的历史输入数据，所述多个用户中包括所述目标用户，所述历史输入数据中包括输入界面各按键的历史落点坐标；对所述历史落点坐标进行统计，得到所述各按键的历史落点坐标分布。

在一些实施例中，所述历史落点坐标分布通过如下步骤预先统计得到：获取所述目标用户的历史输入数据，所述历史输入数据包括输入界面中各按键的历史落点坐标；对所述历史落点坐标进行统计，得到所述各按键的历史落点坐标分布。

在一些实施例中，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述输入界面中各按键的第一点击概率；基于所得到的第一点击概率，对所述各按键的历史落点坐标分布的参数进行调整，以更新所述各按键的历史落点坐标分布；基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键，包括：获取更新后的各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述各按键的第二点击概率；将所述输入界面中第二点击概率最大的按键，确定所述目标用户点击的目标按键。

在一些实施例中，每个按键的历史落点坐标分布为高斯分布；每个按键的历史落点坐标分布包括历史落点横坐标分布和历史落点纵坐标分布；所调整的参数包括以下至少一项：历史落点横坐标分布的标准差、历史落点纵坐标分布的标准差。

在一些实施例中，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率；将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述各按键的第二点击概率；基于所述第一点击概率和所述第二点击概率，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率，包括：获取输入界面中各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述目标用户对所述各按键的第一点击概率。

在一些实施例中，在确定所述输入界面中所述目标用户点击的目标按键之后，所述方法还包括：基于所述实时落点坐标，更新所述目标按键的历史落点坐标分布。

第二方面，本申请实施例提供了一种按键识别装置，该装置包括：获取单元，被配置成获取目标用户输入过程中的实时落点坐标和上文输入字符；确定单元，被配置成基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述确定单元，进一步被配置成：将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述输入界面中各按键的第一点击概率；基于所得到的第一点击概率，对所述各按键的历史落点坐标分布的参数进行调整，以更新所述各按键的历史落点坐标分布；基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述确定单元，进一步被配置成：获取更新后的各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述各按键的第二点击概率；将所述输入界面中第二点击概率最大的按键，确定所述目标用户点击的目标按键。

在一些实施例中，所述确定单元，进一步被配置成：基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率；将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述各按键的第二点击概率；基于所述第一点击概率和所述第二点击概率，确定所述输入界面中所述目标用户点击的目标按键。

在一些实施例中，所述确定单元，进一步被配置成：获取输入界面中各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述目标用户对所述各按键的第一点击概率。

在一些实施例中，所述装置还包括：更新单元，被配置成基于所述实时落点坐标，更新所述目标按键的历史落点坐标分布。

第三方面，本申请实施例提供了一种用于识别按键的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行上述第一方面中任一实施例的方法的指令。

第四方面，本申请实施例提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上述第一方面中任一实施例所描述的方法。

本申请实施例提供的按键识别方法、装置和用于识别按键的装置，通过获取目标用户输入过程中的实时落点坐标和上文输入字符，而后基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定输入界面中目标用户点击的目标按键。由于在按键识别过程中不仅考虑了实时落点坐标，还考虑了上文输入字符，用户当前的输入意图与上文输入字符存在关联性，因此即使在用户误触、落点偏移等情况下，仍能够确定出用户意图点击的按键，提高了按键识别的准确性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是根据本申请的按键识别方法的一个实施例的流程图；

图2是根据本申请的按键识别方法的又一个实施例的流程图；

图3是根据本申请的按键识别装置的一个实施例的结构示意图；

图4是根据本申请的用于识别按键的装置的结构示意图；

图5是根据本申请的一些实施例中服务器的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1，其示出了根据本申请的按键识别方法的一个实施例的流程100。上述按键识别方法可运行于各种电子设备，上述电子设备包括但不限于：服务器、智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3，Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4，Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、虚拟现实设备等等。

本申请实施例中所提到的输入法应用可以指输入法客户端，其能够支持多种输入法。其中，输入法可以是一种为了将各种符号输入到如计算机、手机等电子设备而采用的编码方法，用户可以使用输入法应用便利地将需要的字符或者字符串输入电子设备。需要注意的是，在本申请实施例中输入法除了支持常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法、语音输入法、手写输入法等)以外，还可以支持其他语种的输入法(比如英文输入法、日文平假名输入法、韩文输入法等)，在此不对输入法以及输入法的语言种类做任何限定。

本实施例中的按键识别方法，可以包括以下步骤：

步骤101，获取目标用户输入过程中的实时落点坐标和上文输入字符。

在本实施例中，按键识别方法的执行主体(如上述电子设备)中可以安装有输入法应用、即时通讯应用等各种客户端应用。所安装的一个或多个客户端应用中可具有输入界面，输入界面中可呈现有多个按键。以输入法应用为例，输入界面可以是输入法的键盘面板，键盘面板中可呈现有多个编码按键(如“a”、“b”、“c”等拼音键)和功能按键(如删除、确认等按键)。用户可以通过触摸界面中的按键，进行内容输入，从而实现与上述执行主体的人机交互。

在本实施例中，上述执行主体可以实时检测目标用户输入过程中的按键行为。例如，当通过压力传感器检测到用户在输入界面对应的屏幕区域中执行了触摸操作，即可认为用户执行了按键行为。每次按键行为发生后，上述执行主体可以获取对应的落点坐标和上文输入字符。

其中，落点坐标为用户的按键行为发生位置的坐标，即用户点击或触摸的位置的坐标。落点坐标可包括预设坐标系中的横坐标和纵坐标。该预设坐标系可以基于显示屏幕或者输入界面预先建立，且该预设坐标系可以是直角坐标系等常用坐标系。实时落点坐标即为目标用户实时输入过程中的落点坐标。上文输入字符即为在执行当前按键行为之前所执行的按键行为对应的字符。上文输入字符可以是一个或多个字符，此处不作限定。例如，用户意图输入字符“i”，在点击键盘按键“i”之前，已先后上屏了输入了字符“s”和字符“h”，则可以将“sh”作为上文输入字符。

步骤102，基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定输入界面中目标用户点击的目标按键。

在本实施例中，上述执行主体中可以预先存储输入界面中各按键的历史落点坐标分布。各按键的历史落点分布可以根据用户的历史输入数据预先统计得到。例如，各按键的历史落点坐标分布可以为高斯分布。高斯分布的参数可包括期望值(可记为μ)和标准差(可记为σ)。需要说明的是，还可以采用其他类型的分布作为历史落点坐标分布，此处不作具体限定。

在一些示例中，每个按键的历史落点坐标分布可具有两个，分别为历史落点坐标中的横坐标的分布(可称为历史落点横坐标分布)和历史落点坐标中的纵坐标的分布(可称为历史落点纵坐标分布)。以高斯分布为例，历史落点横坐标分布的高斯参数可包括期望(可记为μ_x)和标准差(可记为σ_x)，历史落点纵坐标分布的高斯参数可包括期望(可记为μ_y)和标准差(可记为σ_y)。

在一些示例中，各按键的历史落点坐标分布可以以概率密度函数的形式体现。由于每个按键可对应有历史落点横坐标分布和历史落点纵坐标分布，因而每个按键可对应有两个概率密度函数，分别为横轴概率密度函数和纵轴概率密度函数。其中，对于横轴概率密度函数，其自变量可以是横坐标值，因变量可以是该横坐标值与按键匹配的概率，也即落点在该横坐标处时目标用户对该按键的点击概率。同理，对于纵轴概率密度函数，其自变量可以是纵坐标值，因变量可以是该纵坐标值与该按键匹配的概率，也即落点在该纵坐标处时目标用户对该按键的点击概率。

在一些场景中，历史落点坐标分布可通过对多个用户的历史落点坐标统计得到。上述多个用户中可包括目标用户。上述执行主体首先可以获取上述多个用户的历史输入数据，历史输入数据中可包括输入界面各按键的历史落点坐标。之后，可对历史落点坐标进行统计，得到各按键的历史落点坐标分布。由此，各按键的历史落点坐标分布可适用于上述多个用户。

在另一些场景中，历史落点坐标分布可通过对目标用户的历史落点坐标统计得到，从而能够更具针对性。上述执行主体首先可以获取目标用户的历史输入数据，历史输入数据可包括输入界面中各按键的历史落点坐标。而后，可对历史落点坐标进行统计，得到各按键的历史落点坐标分布。

在本实施例中，上述执行主体中还可以存储预先训练的语言模型(LanguageModel，LM)。语言模型是根据语言客观事实而进行的语言抽象数学建模，是一种对应关系。这里，训练后的语言模型可基于用户的上文输入字符预测出用户的下一输入字符。实践中，语言模型可通过机器学习方法(如有监督学习方法)预先训练得到。训练语言模型所使用的数据集可以从用户(可以是目标用户，也可以是包含目标用户的多个用户)的历史输入数据中获取。上述历史输入数据可以是采用同一键盘布局(如均为26键键盘、或者均为9键键盘)的历史输入数据，或者采用共同以键盘布局以及同一输入语言(如均为26键的拼音键盘)的历史输入数据。语言模型可采用各种模型结果，如包括编码器(encoder)和解码器(decoder)的端到端模型结构、BERT(Bidirectional Encoder Representations fromTransformer，基于转换器的双向编码器表示)模型结构等，此处不作限定。

在本实施例中，基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，上述执行主体可采用多种方式确定输入界面中目标用户点击的目标按键。作为示例，可以首先基于实时落点坐标和输入界面中各按键的历史落点坐标分布，确定各按键的用户点击概率。而后基于上文输入字符和预先训练的语言模型，预测用户点击的按键(可称为预测按键)。语言模型可计算得到各按键的用户点击概率，可按照大小顺序选取一个或多个按键作为预测按键。最后按照预设规则调整预测按键的用户点击概率，从而选取用户点击概率最大的按键，作为目标按键。作为又一示例，还可以首先基于实时落点坐标，选取输入界面中与实时落点坐标的距离小于某阈值的候选按键，之后采用相同或相似方式从候选按键中选取目标按键，由此可减少计算的数据量。

在本实施例的一些可选的实现方式中，上述执行主体可以按照如下步骤识别目标按键：

第一步，将上文输入字符输入至预先训练的语言模型，得到目标用户对输入界面中各按键的第一点击概率。

作为示例，上文输入字符为“t”，输入界面中包括26个按键，分别为“a”、“b”、…、“z”。则语言模型可以分别计算出“a”、“b”、…、“z”这26个字符作为“t”下一个字符的概率，也即用户对“a”、“b”、…、“z”的第一点击概率。

第二步，基于所得到的第一点击概率，对各按键的历史落点坐标分布的参数进行调整，以更新各按键的历史落点坐标分布。

以历史落点坐标分布为高斯分布为例，可通过更新各按键的历史落点坐标分布的标准差(即σ)，来更新各按键的历史落点坐标分布。

在一些示例中，由于每个按键的历史落点坐标分布包括历史落点横坐标分布和历史落点纵坐标分布，因此可分别对历史落点横坐标分布和历史落点纵坐标分布的参数进行调整。例如，所调整的参数可以包括以下至少一项：历史落点横坐标分布的标准差(即σ_x)、历史落点纵坐标分布的标准差(即σ_y)。

实践中，上述执行主体可以采用多种方式对历史落点坐标分布的参数进行调整。作为示例，可以将概率大于某一阈值的按键对应的σ_x和/或σ_y扩大(如扩大到指定倍数)，将概率小于该阈值的按键对应的σ_x和/或σ_y缩小(如缩小到指定倍数)。作为又一示例，可以直接将所确定出的每一按键的点击概率与该按键对应的σ_x和/或σ_y分别相乘，以更新各按键对应的σ_x和/或σ_y参数。

第三步，基于实时落点坐标和更新后的各按键的历史落点坐标分布，确定输入界面中目标用户点击的目标按键。

此处，可首先获取更新后的各按键的历史落点坐标分布的概率密度函数。而后，将实时落点坐标输入至各概率密度函数，得到各按键的第二点击概率。最后，可按照第二点击概率由大到小的次序对各按键进行排列，将排列为首的按键(即第二点击概率最大的按键)作为目标用户点击的目标按键。

在一些示例中，每个按键可具有横轴概率密度函数和纵轴概率密度函数。在计算各按键的第二点击概率时，对于每个按键，上述执行主体可将实时落点坐标中的横坐标(可称为当前横坐标)输入至该按键对应的横轴概率密度函数，得到当前横坐标与该按键匹配的概率，也即落点在当前横坐标时目标用户对该按键的点击概率。同理，上述执行主体可将实时落点坐标中的纵坐标(可称为当前纵坐标)输入至该按键的纵轴概率密度函数，得到当前纵坐标与该按键匹配的概率，也即落点在当前纵坐标时目标用户对该按键的点击概率。上述执行主体可以将所得到的两个概率进行结合(如相加相乘等)，得到目标用户对该按键的第二点击概率。在对各个按键执行上述操作后，即可得到目标用户对各个按键的第二点击概率。

第一步，基于实时落点坐标和输入界面中各按键的历史落点坐标分布，确定目标用户对各按键的第一点击概率。此步骤可参见上述可选的实现方式中的第三步，这里不再赘述。

第二步，基于上文输入字符和预先训练的语言模型，确定目标用户对各按键的第二点击概率。此步骤可参见上述可选的实现方式中的第一步，这里不再赘述。

第三步，基于第一点击概率和第二点击概率，确定输入界面中目标用户点击的目标按键。

此处，上述执行主体可以首先基于第一点击概率和第二点击概率，确定各按键的综合点击概率。例如，可以将每一个按键的第一点击概率与第二点击概率相乘，得到该按键的综合点击概率。之后，上述执行主体可以基于各按键的综合点击概率，确定输入界面中目标用户点击的目标按键。例如，可以按照综合点击概率由大到小的次序对各按键进行排列，将排列为首的按键作为目标用户点击的目标按键。

在本实施例的一些可选的实现方式中，在确定输入界面中目标用户点击的目标按键之后，上述执行主体还可以基于实时落点坐标，更新目标按键的历史落点坐标分布，从而可使历史落点坐标分布基于用户实时输入情况进行实时动态地更新，提高了按键识别的准确性。

本申请的上述实施例提供的方法，通过获取目标用户输入过程中的实时落点坐标和上文输入字符，而后基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定输入界面中目标用户点击的目标按键。由于在按键识别过程中不仅考虑了实时落点坐标，还考虑了上文输入字符，用户当前的输入意图与上文输入字符存在关联性，因此即使在用户误触、落点偏移等情况下，仍能够确定出用户意图点击的按键，提高了按键识别的准确性。

进一步参考图2，其示出了按键识别方法的又一个实施例的流程200。该按键识别方法的流程200，包括以下步骤：

步骤201，获取目标用户输入过程中的实时落点坐标和上文输入字符。

本实施例中的步骤201可参见图1对应实施例的步骤101，此处不再赘述。

步骤202，将上文输入字符输入至预先训练的语言模型，得到目标用户对输入界面中各按键的第一点击概率。

在本实施例中，按键识别方法的执行主体(如上述电子设备)可以存储预先训练的语言模型。语言模型可基于用户的上文输入字符预测出用户的下一输入字符。语言模型可通过机器学习方法(如有监督学习方法)预先训练得到。训练语言模型所使用的数据集可以从用户(可以是目标用户，也可以是包含目标用户的多个用户)的历史输入数据中获取。上述历史输入数据可以是采用同一键盘布局(如均为26键键盘、或者均为9键键盘)的历史输入数据，或者采用共同以键盘布局以及同一输入语言(如均为26键的拼音键盘)的历史输入数据。语言模型可采用各种模型结果，如包括编码器和解码器的端到端模型结构、BERT模型结构等，此处不作限定。

在本实施例中，上述执行主体可以将上文输入字符输入至预先训练的语言模型，得到语言模型输出的各按键的第一点击概率。作为示例，上文输入字符为“t”，输入界面中包括26个按键，分别为“a”、“b”、…、“z”。则语言模型可以分别计算出“a”、“b”、…、“z”这26个字符作为“t”下一个字符的概率，也即用户对“a”、“b”、…、“z”的第一点击概率。

步骤203，基于所得到的第一点击概率，对各按键的历史落点坐标分布的参数进行调整，以更新各按键的历史落点坐标分布。

在本实施例中，上述执行主体可以基于所得到的第一点击概率，对各按键的历史落点坐标分布的参数进行调整，以更新各按键的历史落点坐标分布。以历史落点坐标分布为高斯分布为例，可通过更新各按键的历史落点坐标分布的标准差(即σ)，来更新各按键的历史落点坐标分布。

在一些示例中，每个按键的历史落点坐标分布可具有两个，分别为历史落点坐标中的横坐标的分布(可称为历史落点横坐标分布)和历史落点坐标中的纵坐标的分布(可称为历史落点纵坐标分布)。以高斯分布为例，历史落点横坐标分布的高斯参数可包括期望(可记为μ_x)和标准差(可记为σ_x)，历史落点纵坐标分布的高斯参数可包括期望(可记为μ_y)和标准差(可记为σ_y)。此时，可通过对历史落点横坐标分布的标准差(即σ_x)和/或历史落点纵坐标分布的标准差(即σ_y)进行调整，来更新各按键的历史落点坐标分布。

实践中，上述执行主体可以采用多种方式对历史落点坐标分布的参数进行调整。作为示例，可以将第一点击概率大于某一阈值的按键对应的σ_x和/或σ_y扩大(如扩大到指定倍数)，将第一点击概率小于该阈值的按键对应的σ_x和/或σ_y缩小(如缩小到指定倍数)。作为又一示例，可以直接将所确定出的每一按键的第一点击概率与该按键对应的σ_x和/或σ_y分别相乘，以更新各按键对应的σ_x和/或σ_y参数。

步骤204，基于实时落点坐标和更新后的各按键的历史落点坐标分布，确定输入界面中目标用户点击的目标按键。

在本实施例中，各按键的历史落点坐标分布可以以概率密度函数的形式体现。上述执行主体可以首先获取更新后的各按键的历史落点坐标分布的概率密度函数。而后，将实时落点坐标输入至各概率密度函数，得到各按键的第二点击概率。最后，可按照第二点击概率由大到小的次序对各按键进行排列，将排列为首的按键(即第二点击概率最大的按键)作为目标用户点击的目标按键。

在一些示例中，由于每个按键可对应有历史落点横坐标分布和历史落点纵坐标分布，因此，每个按键可对应有两个概率密度函数，分别为横轴概率密度函数和纵轴概率密度函数。其中，对于横轴概率密度函数，其自变量可以是横坐标值，因变量可以是该横坐标值与按键匹配的概率，也即落点在该横坐标处时目标用户对该按键的点击概率。同理，对于纵轴概率密度函数，其自变量可以是纵坐标值，因变量可以是该纵坐标值与该按键匹配的概率，也即落点在该纵坐标处时目标用户对该按键的点击概率。

在计算各按键的第二点击概率时，对于每个按键，上述执行主体可将实时落点坐标中的横坐标(可称为当前横坐标)输入至该按键对应的横轴概率密度函数，得到当前横坐标与该按键匹配的概率，也即落点在当前横坐标时目标用户对该按键的点击概率。同理，上述执行主体可将实时落点坐标中的纵坐标(可称为当前纵坐标)输入至该按键的纵轴概率密度函数，得到当前纵坐标与该按键匹配的概率，也即落点在当前纵坐标时目标用户对该按键的点击概率。上述执行主体可以将所得到的两个概率进行结合(如相加相乘等)，得到目标用户对该按键的第二点击概率。在对各个按键执行上述操作后，即可得到目标用户对各个按键的第二点击概率。

本申请的上述实施例提供的方法，通过上文输入字符和预先训练的语言模型确定目标用户对输入界面中各按键的点击概率，之后基于各按键的点击概率更新各按键的历史落点坐标分布，从而基于更新后的历史落点坐标分布确定实时落点坐标对应的目标按键。由于用户当前的输入意图与上文输入字符存在关联性，因而在按键识别过程中结合上文输入字符和历史落点坐标分布确定目标按键，可在用户误触、落点偏移等情况下，仍能够确定出用户意图点击的按键，提高了按键识别的准确性。

进一步参考图3，作为对上述各图所示方法的实现，本申请提供了按键识别装置的一个实施例，该装置实施例与图1所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例上述的按键识别装置300包括：获取单元301，被配置成获取目标用户输入过程中的实时落点坐标和上文输入字符；确定单元302，被配置成基于上述实时落点坐标、上述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定上述输入界面中上述目标用户点击的目标按键。

在本实施例的一些可选的实现方式中，上述历史落点坐标分布通过如下步骤预先统计得到：获取多个用户的历史输入数据，上述多个用户中包括上述目标用户，上述历史输入数据中包括输入界面各按键的历史落点坐标；对上述历史落点坐标进行统计，得到上述各按键的历史落点坐标分布。

在本实施例的一些可选的实现方式中，上述历史落点坐标分布通过如下步骤预先统计得到：获取上述目标用户的历史输入数据，上述历史输入数据包括输入界面中各按键的历史落点坐标；对上述历史落点坐标进行统计，得到上述各按键的历史落点坐标分布。

在本实施例的一些可选的实现方式中，上述确定单元，进一步被配置成：将上述上文输入字符输入至预先训练的语言模型，得到上述目标用户对上述输入界面中各按键的第一点击概率；基于所得到的第一点击概率，对上述各按键的历史落点坐标分布的参数进行调整，以更新上述各按键的历史落点坐标分布；基于上述实时落点坐标和更新后的各按键的历史落点坐标分布，确定上述输入界面中上述目标用户点击的目标按键。

在本实施例的一些可选的实现方式中，上述确定单元，进一步被配置成：获取更新后的各按键的历史落点坐标分布的概率密度函数；将上述实时落点坐标输入至各概率密度函数，得到上述各按键的第二点击概率；将上述输入界面中第二点击概率最大的按键，确定上述目标用户点击的目标按键。

在本实施例的一些可选的实现方式中，每个按键的历史落点坐标分布为高斯分布；每个按键的历史落点坐标分布包括历史落点横坐标分布和历史落点纵坐标分布；所调整的参数包括以下至少一项：历史落点横坐标分布的标准差、历史落点纵坐标分布的标准差。

在本实施例的一些可选的实现方式中，上述确定单元，进一步被配置成：基于上述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定上述目标用户对上述各按键的第一点击概率；将上述上文输入字符输入至预先训练的语言模型，得到上述目标用户对上述各按键的第二点击概率；基于上述第一点击概率和上述第二点击概率，确定上述输入界面中上述目标用户点击的目标按键。

在本实施例的一些可选的实现方式中，上述确定单元，进一步被配置成：获取输入界面中各按键的历史落点坐标分布的概率密度函数；将上述实时落点坐标输入至各概率密度函数，得到上述目标用户对上述各按键的第一点击概率。

在本实施例的一些可选的实现方式中，上述装置还包括：更新单元，被配置成基于上述实时落点坐标，更新上述目标按键的历史落点坐标分布。

本申请的上述实施例提供的装置，通过获取目标用户输入过程中的实时落点坐标和上文输入字符，而后基于实时落点坐标、上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定输入界面中目标用户点击的目标按键。由于在按键识别过程中不仅考虑了实时落点坐标，还考虑了上文输入字符，用户当前的输入意图与上文输入字符存在关联性，因此即使在用户误触、落点偏移等情况下，仍能够确定出用户意图点击的按键，提高了按键识别的准确性。

图4是根据一示例性实施例示出的用于识别按键的装置400的框图，该装置400可以为智能终端或者服务器。例如，装置400可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电源组件406，多媒体组件408，音频组件410，输入/输出(I/O)的接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理***，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。

多媒体组件408包括在上述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到设备400的打开/关闭状态，组件的相对定位，例如上述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，上述通信组件416还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图5是本申请的一些实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processingunits，CPU)522(例如，一个或一个以上处理器)和存储器532，一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器522可以设置为与存储介质530通信，在服务器500上执行存储介质530中的一系列指令操作。

服务器500还可以包括一个或一个以上电源526，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口558，一个或一个以上键盘556，和/或，一个或一个以上操作***541，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

一种非临时性计算机可读存储介质，当上述存储介质中的指令由装置(智能终端或者服务器)的处理器执行时，使得装置能够执行按键识别方法，上述方法包括：获取目标用户输入过程中的实时落点坐标和上文输入字符；基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键。

可选的，所述历史落点坐标分布通过如下步骤预先统计得到：获取多个用户的历史输入数据，所述多个用户中包括所述目标用户，所述历史输入数据中包括输入界面各按键的历史落点坐标；对所述历史落点坐标进行统计，得到所述各按键的历史落点坐标分布。

可选的，所述历史落点坐标分布通过如下步骤预先统计得到：获取所述目标用户的历史输入数据，所述历史输入数据包括输入界面中各按键的历史落点坐标；对所述历史落点坐标进行统计，得到所述各按键的历史落点坐标分布。

可选的，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述输入界面中各按键的第一点击概率；基于所得到的第一点击概率，对所述各按键的历史落点坐标分布的参数进行调整，以更新所述各按键的历史落点坐标分布；基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键。

可选的，所述基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键，包括：获取更新后的各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述各按键的第二点击概率；将所述输入界面中第二点击概率最大的按键，确定所述目标用户点击的目标按键。

可选的，每个按键的历史落点坐标分布为高斯分布；每个按键的历史落点坐标分布包括历史落点横坐标分布和历史落点纵坐标分布；所调整的参数包括以下至少一项：历史落点横坐标分布的标准差、历史落点纵坐标分布的标准差。

可选的，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率；将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述各按键的第二点击概率；基于所述第一点击概率和所述第二点击概率，确定所述输入界面中所述目标用户点击的目标按键。

可选的，所述基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率，包括：获取输入界面中各按键的历史落点坐标分布的概率密度函数；将所述实时落点坐标输入至各概率密度函数，得到所述目标用户对所述各按键的第一点击概率。

可选的，所述装置经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：基于所述实时落点坐标，更新所述目标按键的历史落点坐标分布。

本领域技术人员在考虑说明书及实践这里公开的申请后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上上述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

以上对本申请所提供的按键识别方法、装置和用于识别按键的装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种按键识别方法，其特征在于，所述方法包括：

获取目标用户输入过程中的实时落点坐标和上文输入字符；

基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键。

2.根据权利要求1所述的方法，其特征在于，所述历史落点坐标分布通过如下步骤预先统计得到：

获取多个用户的历史输入数据，所述多个用户中包括所述目标用户，所述历史输入数据中包括输入界面各按键的历史落点坐标；

对所述历史落点坐标进行统计，得到所述各按键的历史落点坐标分布。

3.根据权利要求1所述的方法，其特征在于，所述历史落点坐标分布通过如下步骤预先统计得到：

获取所述目标用户的历史输入数据，所述历史输入数据包括输入界面中各按键的历史落点坐标；

4.根据权利要求1所述的方法，其特征在于，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：

将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述输入界面中各按键的第一点击概率；

基于所得到的第一点击概率，对所述各按键的历史落点坐标分布的参数进行调整，以更新所述各按键的历史落点坐标分布；

基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键。

5.根据权利要求4所述的方法，其特征在于，所述基于所述实时落点坐标和更新后的各按键的历史落点坐标分布，确定所述输入界面中所述目标用户点击的目标按键，包括：

获取更新后的各按键的历史落点坐标分布的概率密度函数；

将所述实时落点坐标输入至各概率密度函数，得到所述各按键的第二点击概率；

将所述输入界面中第二点击概率最大的按键，确定所述目标用户点击的目标按键。

6.根据权利要求4所述的方法，其特征在于，每个按键的历史落点坐标分布为高斯分布；每个按键的历史落点坐标分布包括历史落点横坐标分布和历史落点纵坐标分布；所调整的参数包括以下至少一项：历史落点横坐标分布的标准差、历史落点纵坐标分布的标准差。

7.根据权利要求1所述的方法，其特征在于，所述基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键，包括：

基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率；

将所述上文输入字符输入至预先训练的语言模型，得到所述目标用户对所述各按键的第二点击概率；

基于所述第一点击概率和所述第二点击概率，确定所述输入界面中所述目标用户点击的目标按键。

8.根据权利要求7所述的方法，其特征在于，所述基于所述实时落点坐标和输入界面中各按键的历史落点坐标分布，确定所述目标用户对所述各按键的第一点击概率，包括：

获取输入界面中各按键的历史落点坐标分布的概率密度函数；

将所述实时落点坐标输入至各概率密度函数，得到所述目标用户对所述各按键的第一点击概率。

9.根据权利要求1所述的方法，其特征在于，在确定所述输入界面中所述目标用户点击的目标按键之后，所述方法还包括：

基于所述实时落点坐标，更新所述目标按键的历史落点坐标分布。

10.一种按键识别装置，其特征在于，所述装置包括：

获取单元，被配置成获取目标用户输入过程中的实时落点坐标和上文输入字符；

确定单元，被配置成基于所述实时落点坐标、所述上文输入字符、输入界面中各按键的历史落点坐标分布以及预先训练的语言模型，确定所述输入界面中所述目标用户点击的目标按键。

11.根据权利要求9所述的装置，其特征在于，所述历史落点坐标分布通过如下步骤预先统计得到：

12.根据权利要求9所述的装置，其特征在于，所述确定单元，进一步被配置成：

13.根据权利要求9所述的装置，其特征在于，所述确定单元，进一步被配置成：

14.一种用于识别键盘的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，所述程序被一个或者一个以上处理器执行时，实现权利要求1-7中任一所述方法的步骤。

15.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。