CN110244861B - 数据处理方法和装置 - Google Patents

数据处理方法和装置 Download PDF

Info

Publication number
CN110244861B
CN110244861B CN201810196490.5A CN201810196490A CN110244861B CN 110244861 B CN110244861 B CN 110244861B CN 201810196490 A CN201810196490 A CN 201810196490A CN 110244861 B CN110244861 B CN 110244861B
Authority
CN
China
Prior art keywords
content
screen content
screen
type
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810196490.5A
Other languages
English (en)
Other versions
CN110244861A (zh
Inventor
左艳波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201810196490.5A priority Critical patent/CN110244861B/zh
Publication of CN110244861A publication Critical patent/CN110244861A/zh
Application granted granted Critical
Publication of CN110244861B publication Critical patent/CN110244861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种数据处理方法和装置,其中的方法具体包括:从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;建立所述第一上屏内容和所述第二上屏内容之间的多元关系。通过从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间的多元关系;这样,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,因此可以提高用户的输入效率。

Description

数据处理方法和装置
技术领域
本发明涉及输入法技术领域,尤其涉及一种数据处理方法和装置。
背景技术
目前,涉及交互的设备,通常需要用户通过输入法程序将自己的操作意图与设备交互识别。例如,用户可以输入输入串,然后由输入法程序依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。
目前,输入法程序可以通过二元关系获取输入串对应的候选项,以提高候选项的准确度;其中,该二元关系是指词汇与词汇之间的搭配关系,如“天气-好热”、“天气-晴朗”、“天真-烂漫”、“十万-八千”等可以具有二元关系。该二元关系可用于实现联想功能或者智能组词功能,其中,联想可用于依据用户输入的上文,查找二元库中的二元关系,以得到该上文对应的联想候选项;智能组词可以查找二元库中的二元关系,依据该二元关系的命中情况计算每个组词方案中词汇串的路径概率,并将具有最大路径概率的组词方案作为首选项返回给用户。
目前,二元关系包括的词汇通常仅仅包括中文词汇,然而用户可能存在中文词汇和其他类型的字符的混合输入需求,其他类型的字符可以包括:数字、字母、数字和字母的组合等,例如,用户需要输入“36克拉”、“12生肖”、“72变”、“92油价”等内容。此种情况下,输入法程序将无法依据二元关系向用户提供其所需的内容。
发明内容
本发明实施例提供一种数据处理方法和装置,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,可以提高用户的输入效率。
为了解决上述问题,本发明实施例公开了一种数据处理方法,所述方法包括:
从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
建立所述第一上屏内容和所述第二上屏内容之间的多元关系。
可选地,所述第一上屏内容对应的内容长度不超过第一长度阈值,所述第二上屏内容对应的内容长度不超过第二长度阈值。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,以得到所述目标上屏内容包括的第一上屏内容和第二上屏内容。
可选地,所述依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,包括:
依据所述目标上屏内容所包含内容对应的内容类型,从所述目标上屏内容中获取内容类型互不相同的第一上屏内容、第二上屏内容和第三上屏内容;
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型满足第一合并条件,则将所述第一上屏内容和所述第二上屏内容进行合并,作为第一上屏内容,并将所述第三上屏内容作为第二上屏内容;或者
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型满足第二合并条件,则将所述第二上屏内容和所述第三上屏内容进行合并,作为第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容;
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型符合第一预置条件,则对所述第二上屏内容和所述第三上屏内容进行合并,并将合并内容作为第二上屏内容;或者
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型符合第二预置条件,则对所述第一上屏内容和所述第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将所述第三上屏内容作为第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一上屏内容对应的内容长度不超过第一长度阈值,则保留所述第一上屏内容;或者
若所述第一上屏内容对应的内容长度超过第一长度阈值,则丢弃所述第一上屏内容。
可选地,所述从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容,包括:
依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
可选地,所述从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容,包括:
依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
可选地,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
又一方面,本发明实施例公开了一种数据处理方法,所述方法包括:
接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;
输出所述输入内容对应的候选项。
可选地,所述根据多元关系,确定所述输入内容对应的候选项,包括:
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并依据所述目标多元关系,确定所述上屏内容对应的候选项;或者
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并从所述目标多元关系中确定与所述输入串相匹配的语言单元,作为所述输入内容对应的候选项;或者
依据所述输入串、或者所述输入串对应的字词候选,在多元关系中进行查找,以得到所述输入串对应的候选项。
可选地,所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
再一方面,本发明实施例公开了一种数据处理装置,包括:
获取模块,用于从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
关系建立模块,用于建立所述第一上屏内容和所述第二上屏内容之间的多元关系。
可选地,所述第一上屏内容对应的内容长度不超过第一长度阈值,所述第二上屏内容对应的内容长度不超过第二长度阈值。
可选地,所述获取模块包括:
获取子模块,用于从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
分割子模块,用于依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,以得到所述目标上屏内容包括的第一上屏内容和第二上屏内容。
可选地,所述分割子模块包括:
获取单元,用于依据所述目标上屏内容所包含内容对应的内容类型,从所述目标上屏内容中获取内容类型互不相同的第一上屏内容、第二上屏内容和第三上屏内容;
第一合并单元,用于若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型满足第一合并条件,则将所述第一上屏内容和所述第二上屏内容进行合并,作为第一上屏内容,并将所述第三上屏内容作为第二上屏内容;或者
第二合并单元,用于若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型满足第二合并条件,则将所述第二上屏内容和所述第三上屏内容进行合并,作为第二上屏内容。
可选地,所述获取模块包括:
第一判断子模块,用于在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
第二判断子模块,用于在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
第一提取子模块,用于若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
第二提取子模块,用于若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
可选地,所述获取模块还包括:
第三提取子模块,用于若所述第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容;
第一合并子模块,用于若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型符合第一预置条件,则对所述第二上屏内容和所述第三上屏内容进行合并,并将合并内容作为第二上屏内容;或者
第二合并子模块,用于若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型符合第二预置条件,则对所述第一上屏内容和所述第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将所述第三上屏内容作为第二上屏内容。
可选地,所述获取模块还包括:
内容保留子模块,用于若所述第一上屏内容对应的内容长度不超过第一长度阈值,则保留所述第一上屏内容;或者
内容丢弃子模块,用于若所述第一上屏内容对应的内容长度超过第一长度阈值,则丢弃所述第一上屏内容。
可选地,所述第二提取子模块包括:
提取单元,用于依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
可选地,所述第三提取子模块包括:
提取单元,用于依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
可选地,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
再一方面,本发明实施例公开了一种数据处理装置,所述装置包括:
接收模块,用于接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
确定模块,用于根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;
输出模块,用于输出所述输入内容对应的候选项。
可选地,所述确定模块包括:
第一确定子模块,用于从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并依据所述目标多元关系,确定所述上屏内容对应的候选项;或者
第二确定子模块,用于从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并从所述目标多元关系中确定与所述输入串相匹配的语言单元,作为所述输入内容对应的候选项;或者
查找子模块,用于依据所述输入串、或者所述输入串对应的字词候选,在多元关系中进行查找,以得到所述输入串对应的候选项。
可选地,所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
建立所述第一上屏内容和所述第二上屏内容之间的多元关系。
可选地,所述第一上屏内容对应的内容长度不超过第一长度阈值,所述第二上屏内容对应的内容长度不超过第二长度阈值。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,以得到所述目标上屏内容包括的第一上屏内容和第二上屏内容。
可选地,所述依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,包括:
依据所述目标上屏内容所包含内容对应的内容类型,从所述目标上屏内容中获取内容类型互不相同的第一上屏内容、第二上屏内容和第三上屏内容;
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型满足第一合并条件,则将所述第一上屏内容和所述第二上屏内容进行合并,作为第一上屏内容,并将所述第三上屏内容作为第二上屏内容;或者
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型满足第二合并条件,则将所述第二上屏内容和所述第三上屏内容进行合并,作为第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容;
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型符合第一预置条件,则对所述第二上屏内容和所述第三上屏内容进行合并,并将合并内容作为第二上屏内容;或者
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型符合第二预置条件,则对所述第一上屏内容和所述第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将所述第三上屏内容作为第二上屏内容。
可选地,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一上屏内容对应的内容长度不超过第一长度阈值,则保留所述第一上屏内容;或者
若所述第一上屏内容对应的内容长度超过第一长度阈值,则丢弃所述第一上屏内容。
可选地,所述从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容,包括:
依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
可选地,所述从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容,包括:
依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
可选地,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
再一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如数据处理方法中一个或多个所述的数据处理方法。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;
输出所述输入内容对应的候选项。
可选地,所述根据多元关系,确定所述输入内容对应的候选项,包括:
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并依据所述目标多元关系,确定所述上屏内容对应的候选项;或者
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并从所述目标多元关系中确定与所述输入串相匹配的语言单元,作为所述输入内容对应的候选项;或者
依据所述输入串、或者所述输入串对应的字词候选,在多元关系中进行查找,以得到所述输入串对应的候选项。
可选地,所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
再一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如数据处理中一个或多个所述的数据处理方法。
本发明实施例包括以下优点:
从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间的多元关系;这样,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,因此可以提高用户的输入效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种数据处理方法实施例的步骤流程图;
图2是本发明的一种数据处理方法实施例的步骤流程图;
图3是本发明的一种数据处理方法实施例的步骤流程图;
图4是本发明的一种数据处理方法实施例的步骤流程图;
图5是本发明的一种数据处理方法实施例的步骤流程图;
图6是本发明的一种数据处理装置实施例的结构框图;
图7是本发明的一种数据处理装置实施例的结构框图;
图8是本发明的一种数据处理装置800的框图;及
图9是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前的多元关系通常仅包括中文词汇,但是在实际应用中,用户可能需要输入中文类型的字符与其他类型的字符的组合,则输入法程序无法根据多元关系向用户提供所需的候选项,导致用户输入的效率较低。
本发明实施例提供了一种数据处理方案,该方案可以从连续的上屏内容中获取第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间的多元关系。其中,第一上屏内容的内容类型和第二上屏内容的内容类型可以不同,而且第一上屏内容与第二上屏内容相邻。
本发明实施例从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间的多元关系;这样,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,因此可以提高用户的输入效率。
例如,在建立多元关系时,可以先根据获取的第一上屏内容和第二上屏内容建立二元关系,并再次获取第三上屏内容,建立第二上屏内容和第三上屏内容之间的二元关系,从而建立多元关系。
本发明实施例可应用于键盘符号、语音、手写等各种输入方式的输入法程序,即用户可以通过编码字符串(也即本发明实施例中的输入串)进行文字输入。在输入法领域,对于例如中文、日文、韩文、或者其它语言的输入法程序,通常可以把用户输入的输入串转换成相应语言的候选项。以下主要以中文为例进行说明,其它语言相互参照即可。可以理解,所述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等,本发明实施例对于某种语言对应的具体输入法程序不加以限制。
其中,输入法程序可以运行在终端上,上述终端具体包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
在实际应用中,对于键盘符号输入法方式,用户可以通过实体键盘、或者虚拟键盘等输入上述输入串。例如,对于具有触摸屏的终端,其可以在输入界面中设置虚拟键盘,以使用过通过触发上述虚拟键盘包括的虚拟按键进行输入串的输入。可选地,上述虚拟键盘的例子可以包括:9键键盘和26键键盘等。
根据一些实施例,上述输入串可以包括但不限于:用户通过按键所输入的一个按键符号或多个按键符号的组合。所述按键符号具体可以包括:拼音、笔画、假名等。
本发明实施例中,候选项可用于表示与输入串相对应的待被用户选择的一个或多个字符。候选项可以为中文字符、英文字符、日文字符等语言的字符,候选词条也可以为颜文字、图片等形式的符号组合。其中,所述颜文字包括但不限于线条、符号、文字所组成的图画,例如,所述颜文字的例子可以包括:“:P”、“:-o”、“:-)”等。在实际应用中,可以依据上述输入串,在词库中进行查找,以得到所对应的候选项。例如,上述词库可以包括:***词库、用户词库、细胞词库、云词库等。
方法实施例
参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括:
步骤101、从连续的上屏内容中获取第一上屏内容和第二上屏内容;
其中,该第一上屏内容和该第二上屏内容相邻,且该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型不同。
步骤102、建立第一上屏内容和第二上屏内容之间的多元关系。
图1所示方法实施例可以用于依据连续的上屏内容,建立多元关系,以根据多元关系中不同内容类型的语言单元向用户提供不同内容类型的组合内容。其中,该语言单元为上屏内容的组成单元,可以包括字、词、单词、字母、数字和符号等,本发明实施例对具体的语言单元不加以限定。
可选地,该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型可以包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
步骤101可以对连续的上屏内容进行统计分析,从连续的上屏内容中获取第一上屏内容和第二上屏内容,以便在步骤102中,根据获取的第一上屏内容和第二上屏内容,建立多元关系。
根据一种实施例,可以预先记录用户的上屏内容,并根据记录的上屏内容获取第一上屏内容和第二上屏内容。此种情况下,可以根据记录的上屏内容中语言单元之间是否存在标点符号或段落标记等,判断上屏内容是否为连续的上屏内容。若是,则可以依据语言单元的内容类型,从连续的上屏内容中获取第一上屏内容和第二上屏内容。
根据另一种实施例,可以实时监测上屏内容,根据监测的上屏内容,获取第一上屏内容和第二上屏内容。具体地,可以实时监测用户输入的标点符号或段落标记,从上屏内容中提取连续的上屏内容。并依据上屏内容的内容类型,从连续的上屏内容中获取第一上屏内容和第二上屏内容。
在获取第一上屏内容和第二上屏内容后,可以建立第一上屏内容与第二上屏内容之间的多元关系。可选地,可以将建立的多元关系存储至预先设置的存储空间中,以便在输入过程中调用预先存储的多元关系。
进一步地,可以获取多个第一上屏内容和多个第二上屏内容,并将每个第一上屏内容与相应的第二上屏内容建立多元关系,最后得到多对多元关系,并将得到的多对多元关系存储至预先设置的存储空间中。
而且,在建立多对多元关系的过程中,第一对多元关系中的第二上屏内容可能为第二对多元关系中的第一上屏内容。例如,连续的上屏内容为“我喜欢Nike篮球鞋”,则可以建立“喜欢”与“Nike”之间的第一对多元关系,还可以建立“Nike”与“篮球鞋”之间的第二对多元关系,则“Nike”在第一对多元关系中为第二上屏内容,但是在第二对多元关系中为第一上屏内容。
另外,该第一上屏内容对应的内容长度不超过第一长度阈值,该第二上屏内容对应的内容长度不超过第二长度阈值。因此,在获取第一上屏内容和第二上屏内容的过程中,可以获取第一上屏内容和第二上屏内容分别对应的内容长度,并判断获取第一上屏内容和/或第二上屏内容的内容长度是否满足相应的长度条件,再根据判断结果对第一上屏内容和/或第二上屏内容进行相应的处理。
由于第一上屏内容对应的内容类型和第二上屏内容对应的内容类型可以包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种,则当第一上屏内容和/或第二上屏内容的内容长度不满足相应的要求时,可以根据内容类型,对第一上屏内容和/或第二上屏内容进行不同的处理。
根据一种实施例,若第一上屏内容或第二上屏内容对应的内容类型为中文类型,可以对第一上屏内容或第二上屏内容进行分词,使得分词后的第一上屏内容或第二上屏内容的内容长度满足相应的长度阈值。
根据另一种实施例,若第一上屏内容或第二上屏内容对应的内容类型为英文类型,则需要丢弃第一上屏内容或第二上屏内容,不建立第一上屏内容和第二上屏内容之间的多元关系。
图1所示方法实施例所包括的至少一个步骤可由客户端和/或服务器中的任一或者组合执行,本发明实施例对于步骤的具体执行主体不加以限制。例如,客户端可以根据预先获取的上屏内容建立多元关系,也可以根据实时的上屏内容建立多元关系。又如,服务器则可以根据客户端定期上传的上屏内容,获取第一上屏内容和第二上屏内容,建立多元关系。再如,在用户的输入过程中,客户端向服务器发送用户的上屏内容,以使服务器根据客户端发送的上屏内容,建立多元关系等等。
综上,本发明实施例提供的数据处理方法,从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间多元关系;这样,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,因此可以提高用户的输入效率。
参照图2,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括:
步骤201、从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
步骤202、依据目标上屏内容所包含内容对应的内容类型,对该目标上屏内容进行分割,以得到该目标上屏内容包括的第一上屏内容和第二上屏内容。
步骤201中,该预设分割符号可以为标点符号,也可以为段落符号,还可以为空格符号等,本发明实施例具体的预设分割符号不做限定。
为了减少建立多元关系的工作量,可以先对连续的上屏内容进行筛选,去除包含预设分割符号的上屏内容,保留不包含预设分割符号的上屏内容,得到目标上屏内容,以便在后续步骤中,可以从目标上屏内容中获取第一上屏内容和第二上屏内容。
步骤201中,可以检测连续的上屏内容中的预设分割符号,当检测到预设分割符号时,则可以将第一个预设分割符号之后和与第一个预设分割符号相邻的第二个预设分割符号之前,且不存在其他预设分割符号的上屏内容作为目标上屏内容,也即是将相邻两个预设分割符号之间的上屏内容作为目标上屏内容。
需要说明的是,在实际应用中,连续的上屏内容中可以包括两个以上的预设分割符号,从而得到多个目标上屏内容,而本发明实施例主要是一个目标上屏内容为例进行说明,一个以上的目标上屏内容对应的数据处理方法相互参照即可,本发明实施例对预设分割符号和目标上屏内容的数目不做限定。
本发明实施例中,该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型不同,且该第一上屏内容和该第二上屏内容相邻。
在获取得到目标上屏内容后,则可以根据目标上屏内容中的内容所对应的内容类型,对目标上屏内容进行分割,从而得到内容类型不同的第一上屏内容和第二上屏内容。
具体地,可以对目标上屏内容中每个内容所对应的内容类型进行识别,确定每个内容的内容类型,当检测到任意两个相邻的内容所对应的内容类型不同时,则可以根据这两个相邻的内容获取第一上屏内容和第二上屏内容。
其中,该第一上屏内容可以包括这两个相邻内容中的第一内容(如前一内容、或者后一内容),且第一内容的内容类型与第一上屏内容中其他内容的内容类型一致,该第二上屏内容可以包括这两个相邻内容中的第二内容,且第二内容的内容类型与第二上屏内容中其他内容的内容类型一致。
在本发明的一种实施例中,第一上屏内容对应的内容类型和第二上屏内容对应的内容类型可以包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。相应的,在实际应用中,可以根据内容类型对目标上屏内容进行分割,按照上屏内容的出现顺序,分割得到第一上屏内容、第二上屏内容和第三上屏内容,也即是,根据内容类型可以先分割得到第一上屏内容,再得到第二上屏内容,然后得到第三上屏内容。再根据内容类型,对第一上屏内容、第二上屏内容和第三上屏内容中的两者进行合并,以得到第一上屏内容和第二上屏内容。
上述对第一上屏内容、第二上屏内容和第三上屏内容中的两者进行合并的过程可以包括:若该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型满足第一合并条件时,则将该第一上屏内容和该第二上屏内容进行合并,作为第一上屏内容,并将该第三上屏内容作为第二上屏内容;或者,若该第二上屏内容对应的内容类型和该第三上屏内容对应的内容类型满足第二合并条件,则将该第二上屏内容和该第三上屏内容进行合并,作为第二上屏内容。
其中,该第一合并条件可以为:第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。该第二合并条件可以为:第二上屏内容对应的内容类型和该第三上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。
综上,本发明实施例提供的数据处理方法,通过从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间多元关系,以便用户在需要输入不同内容类型的多元关系时,客户端可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户准确推荐用户期望上屏的候选项,从而减少用户选取候选项所花费的时间,提高用户输入的效率。
参照图3,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括:
步骤301、在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
步骤302、在接收用户的上屏内容的过程中,判断该上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;
步骤303、根据第一判断结果和第二判断结果,获取第一上屏内容和第二上屏内容;
步骤304、建立第一上屏内容和第二上屏内容之间的多元关系。
本发明实施例可以实时监测用户的上屏内容,根据用户的上屏内容建立多元关系。
具体地,在接收用户的上屏内容的过程中,可以实时记录用户的上屏内容,并监测用户是否触发了分割操作,也即是判断用户是否触发分割操作,上述分割操作用于对已经上屏的内容和即将上屏的内容进行分割。上述判断可以得到第一判断结果,以便在后续步骤中根据该第一判断结果建立多元关系。
其中,该分割操作可以为对分割按键所触发的操作,该分割按键可以包括:各个标点符号所对应的按键、段落分割对应的按键以及空格按键等,本发明实施例对此不做限定。
步骤302中,该语言单元可以包括:字符、或者单字、或者词。
在接收用户上屏内容的同时,还可以获取上屏内容中两个相邻语言单元对应的内容类型,并根据获取的内容类型,判断这两个相邻语言单元的内容类型是否一致,从而得到与内容类型相对应的第二判断结果。
例如,在检测到用户上屏某个语言单元时,可以获取该语言单元的内容类型,并将该语言单元的内容类型与之前上屏的相邻的语言单元的内容类型进行比较,判断两个相邻的语言单元的内容类型是否一致,从而得到第二判断结果。
步骤303在获取第一判断结果和第二判断结果之后,可以根据该第一判断结果和第二判断结果,从连续的上屏内容中获取第一上屏内容和第二上屏内容,以便在后续步骤中,建立第一上屏内容和第二上屏内容之间的多元关系。
其中,该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型不同,且该第一上屏内容和该第二上屏内容相邻。
由于用户的上屏内容中可以包括多个相邻的语言单元,则可以进行多次判断,从而得到多个第二判断结果。因此,本步骤303可以包括步骤303a和步骤303b。
步骤303a、若第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从上屏内容中提取位于前部的第一上屏内容。
在第一判断结果为否,且首次获取的第二判断结果也为否的情况下,说明用户的上屏内容是连续的上屏内容,而且是第一次出现两个相邻语言单元的内容类型不一致,则可以将上屏内容中位于前部的语言单元作为第一上屏内容。
例如,当用户的上屏内容为“我乘坐的航班MN”,则前部的语言单元“航班”和后部的语言单元“MN”分别对应的内容类型不一致,可以将前部的语言单元“航班”作为第一上屏内容。
步骤303b、若第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从上屏内容中提取位于第一上屏内容之后的第二上屏内容。
在第一判断结果还为否的情况下,当获取的第二判断结果第二次为否的情况下,说明步骤303a中位于后部的语言单元的内容类型与用户再次上屏的语言单元的内容类型不同,则可以将根据本次内容类型不一致的相邻的语言单元,从上屏内容中将位于第一上屏内容之后的语言单元作为第二上屏内容。
可选的,可以依据第二次出现的内容类型不一致的两个相邻语言单元,从上屏内容中提取位于第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
例如,当用户的上屏内容为“我乘坐的航班MN3587”,则前部的语言单元“MN”和后部的语言单元“3587”分别对应的内容类型不一致,可以将前部的语言单元“MN”作为第二上屏内容。
可选地,还可以包括:步骤303c和步骤303d。
步骤303c、若第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从上屏内容中提取位于第二上屏内容之后的第三上屏内容。
如果第一判断结果持续为否,第三次出现了第二判断结果为否的情况,说明步骤303b中位于后部的语言单元与用户再次上屏的语言单元的内容类型发生变化,则可以再次根据内容类型不一致的两个相邻的语言单元,提取得到第三上屏内容。
可选的,可以依据第三次出现的内容类型不一致的两个相邻语言单元,从上屏内容中提取位于第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
例如,当用户的上屏内容为“我乘坐的航班MN3587晚点了”,则前部的语言单元“3587”和后部的语言单元“晚点了”分别对应的内容类型不一致,可以将前部的语言单元“3587”作为第三上屏内容。
步骤303d、若第二上屏内容对应的内容类型和第三上屏内容对应的内容类型符合第一预置条件,则对第二上屏内容和第三上屏内容进行合并,并将合并内容作为第二上屏内容。
如果提取得到第三上屏内容,则可以根据第二上屏内容和第三上屏内容分别对应的内容类型进行判断,确定第二上屏内容对应的内容类型和第三上屏内容对应的内容类型是否符合第一预置条件。当满足该第一预置条件时,则可以将第二上屏内容和第三上屏内容进行合并,将合并后的上屏内容作为第二上屏内容。
由于第一上屏内容对应的内容类型和第二上屏内容对应的内容类型可以包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的两种,则该第一预置条件可以为:第二上屏内容对应的内容类型和第三上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。
例如,当用户的上屏内容为“我乘坐的航班MN3587晚点了”,则第一上屏内容为“航班”、第二上屏内容为“MN”、第三上屏内容为“3587”,第二上屏内容的内容类型为字母类型,第三上屏内容的内容类型为数字类型,则可以将第二上屏内容和第三上屏内容进行合并,将“MN3587”作为新的第二上屏内容。
相应的,不但可以根据第二上屏内容和第三上屏内容对应的内容类型进行合并,还可以根据第一上屏内容和第二上屏内容对应的内容类型进行判断,当满足相应的预置条件时,则可以对第一上屏内容和第二上屏内容进行合并。
可选的,若第一上屏内容对应的内容类型和第二上屏内容对应的内容类型符合第二预置条件,则对第一上屏内容和第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将第三上屏内容作为第二上屏内容。
与第一预置条件类似的,第二预置条件可以为:第一上屏内容对应的内容类型和第二上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。
需要说明的是,如果第一判断结果持续为否,但是只出现了两次第二判断结果为否的情况,则无需执行步骤303c和步骤303d;也即是,在检测到第一判断结果为是之前,只有两次第二判断结果为非的情况,则步骤303可以只包括步骤303a和步骤303b。
另外,在获取第一上屏内容和第二上屏内容的过程中,还可以对第一上屏内容和第二上屏内容的内容长度进行判断,避免内容长度过长,造成占用存储空间、利用率不高的情况。
可选的,若第一上屏内容对应的内容长度不超过第一长度阈值,则可以保留该第一上屏内容;或者,若第一上屏内容对应的内容长度超过第一长度阈值,则可以丢弃该第一上屏内容。
综上,本发明实施例提供的数据处理方法,通过从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间多元关系,以便用户在需要输入不同内容类型的多元关系时,客户端可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户准确推荐用户期望上屏的候选项,从而减少用户选取候选项所花费的时间,提高用户输入的效率。
本发明实施例不但可以根据用户输入的上屏内容建立多元关系,还可以在用户输入的过程中,根据建立的多元关系向用户推荐与用户的输入串相匹配的候选项,提高候选项的准确度,提高用户输入的效率。
参照图4,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括:
步骤401、接收用户的输入内容。
步骤402、根据多元关系,确定输入内容对应的候选项。
步骤403、输出输入内容对应的候选项。
用户输入的过程中,输入法程序可以实时监测用户输入的内容,例如用户输入的上屏内容和/或输入串等,当监测到用户输入上述内容时,则可以将用户输入的内容作为输入内容,以便在后续步骤中,可以查找得到与输入内容相匹配的候选项。
其中,该输入内容可以包括:上屏内容和/或输入串。
具体地,用户开启输入法程序后,输入法程序可以实时监测用户输入的内容,当检测到用户键入某个按键对应的字符时,则可以接收该按键对应的字符,并将该字符作为用户的输入内容。
而且,输入法程序可以根据用户输入的输入串,向用户提供候选项,当检测到用户触发的上屏操作时,则可以上屏该上屏操作对应的候选项,并将该上屏的候选项作为输入内容。
例如,当用户输入的输入串为“s-h-e-n-g-x-i-a-o”时,输入法程序可以按照用户输入的顺序,依次获取“s”、“h”、“e”、“n”、“g”、“x”、“i”、“a”和“o”作为输入串。若用户尚未输入“i”、“a”和“o”,则可以将“s-h-e-n-g-x”作为输入串,在检测到用户继续输入“i”、“a”和“o”时,则可以将“s-h-e-n-g-x-i-a-o”作为输入串。进一步地,输入法程序可以根据输入串“s-h-e-n-g-x-i-a-o”向用户推荐候选项“生肖”,当检测到用户触发上屏候选项“生肖”的操作时,则可以上屏“生肖”,并将“生肖”也作为用户的输入内容。
步骤402中,该多元关系可以包括:内容类型不同的语言单元,也即是,组成多元关系的语言单元的内容类型不同,该语言单元为上屏内容的组成单元,可以包括字、词、单词、字母、数字和符号等,本发明实施例对具体的语言单元不加以限定。例如,多元关系可以由前部语言单元和后部语言单元组成,如果多元关系为“12-生肖”,则前部语言单元为“12”,后部语言单元为“生肖”。
由于预先建立了多对多元关系,则在检测到用户输入的输入内容之后,可以将输入内容与多对多元关系中的语言单元进行比较,获取与输入内容相匹配的候选项。
例如,可以根据输入内容中的上屏内容从多对多元关系中,查找得到与上屏内容相匹配的目标多元关系,再根据目标多元关系中语言单元的输入串选取与输入内容中的输入串相匹配的语言单元作为候选项。
需要说明的是,该候选项可以与输入内容中的上屏内容组成多元关系,该候选项也可以包括多元关系中的前部语言单元和后部语言单元,本发明实施例对此不做限定。
输入法程序在用户输入的过程中,可以根据用户输入的输入内容向用户展示与输入内容相匹配的候选项,而用户的输入内容可以匹配多个候选项,为了提高向用户推荐候选项的准确度,可以将步骤402中获取的候选项对应的排序进行调整,方便用户能够快速上屏该候选项,实现对候选项的输出。
具体地,在根据多元关系获取与输入内容匹配的目标候选项后,可以先获取该候选项所对应的排序结果,再根据该目标候选项对该排序结果进行更新,根据更新后的排序结果对候选项进行输出,使得用户在上屏候选项时,可以快速查看到该目标候选项,以完成候选项的上屏。
例如,用户输入的输入内容为“s-h-e-n-g-x-i-a-o”,则与该输入内容相匹配的按照排序顺序进行排列的候选项可以包括“生效”、“笙箫”、“声效”和“生肖”等,而“生肖”对应的排序为4,也即是排在第4位向用户展示,则可以将“生肖”的排序替换为1,并将其他候选项的排序加1,也即是顺延一位,从而调整候选项的排序,按照调整后的排序对候选项进行输出。
综上,本发明实施例提供的数据处理方法,通过接收用户的输入内容,将该输入内容与多元关系进行匹配,该多元关系包括内容类型不同的语言单元,确定与输入内容相对应的候选项,最后对该候选项进行输出,使得用户可以快速查看到该候选项,并且快速上屏该候选项,从而可以提高用户输入的效率。
参照图5,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括:
步骤501、接收用户的上屏内容。
步骤502、接收用户的输入串。
步骤503、根据多元关系,确定输入内容对应的候选项,该输入内容包括:上屏内容和/或输入串。
步骤504、输出输入内容对应的候选项。
在用户的输入过程中,可以连续不断的上屏不同的内容;则可以接收用户输入的上屏内容,以便获取能够与上屏内容组成多元关系的候选项。
而且,上屏内容对应的内容类型可以相同或不同,则可以根据内容类型的不同,而采用不同的方式获取上屏内容。
例如,当上屏内容为中文类型的内容时,可以先获取上屏内容的内容长度,当内容长度不超过长度阈值时,则可以接收该上屏内容。但是,如果上屏内容的内容长度超过第一长度阈值时,则可以将该上屏内容进行分词处理,将处理后的上屏内容作为接收的上屏内容。
又如,当上屏内容为字母和/或数字时,也需要先获取上屏内容的内容长度,也即是获取连续的字母、数字或者字母和数字的组合,当上屏内容对应的内容长度不超过长度阈值时,可以接收该上屏内容。但是,如果上屏内容的长度超过第一长度阈值时,则不再接收该上屏内容。因此,上屏内容对应的内容长度不超过长度阈值。
在接收用户输入的上屏内容后,可以检测用户是否对分割按键触发了选择操作,进而对上屏内容进行分割。如果检测到用户触发的选择操作,则说明用户需要对上屏内容和随后输入的输入串进行分割,因此可以确定用户不会上屏多元关系所对应的语言单元,则可以不再执行后续步骤,而是继续执行步骤501,直至并未检测到用户触发对分割按键的选择操作。其中,该分割按键可以包括:标点符号对应的按键、回车键和空格键等,本发明实施例对此不做限定。
但是,如果在接收用户输入的上屏内容后,并未检测到用户对分割按键触发了选择操作,则说明用户不会对上屏内容进行分割,可以确定用户可能会上屏多元关系中所对应的语言单元。因此,可以继续执行步骤502,也即说明上屏内容与输入串之间不存在预设分割符号,该预设分割符合即为分割按键所对应的符合。
在接收用户输入的上屏内容和输入串后,可以将上屏内容和输入串作为用户的输入内容,并根据预先设置的多元关系和该输入内容,确定与输入内容相对应的候选项,以便在后续步骤中对该候选项进行输出。
可选地,可以从至少一对多元关系中确定与上屏内容相匹配的目标多元关系,并依据该目标多元关系,确定上屏内容对应的候选项。
具体地,可以根据预先设置的多对多元关系以及输入内容中的上屏内容,从多对多元关系中选取与上屏内容相对应的目标多元关系,并根据目标多元关系确定与上屏内容相对应的候选项。
例如,用户的上屏内容为“12”,则在用户并未输入输入串时,可以先在多元关系中查找与上屏内容“12”对应的目标多元关系,并根据该目标多元关系,选取使用频率最高的语言单元作为候选项。如果与“12”对应的目标多元关系中,包括“生肖”和“月”等语言单元,则可以将“生肖”作为候选项。
进一步地,输入法程序还可以根据用户输入的输入串进行查找,得到与上屏内容和输入串均匹配的候选项,以便准确地向用户推荐相应的候选项,提高用户的输入效率。
可选地,可以从至少一对多元关系中确定与上屏内容相匹配的目标多元关系,并从目标多元关系中确定与输入串相匹配的语言单元,作为输入内容对应的候选项。
具体地,在根据上屏内容确定目标多元关系后,还可以根据目标多元关系中语言单元对应的输入串与输入内容中的输入串进行匹配,得到与输入串相对应的候选项。
而且,当目标多元关系中语言单元对应的输入串与输入内容中的输入串并不是完全一致时,可以获取输入内容中的输入串与各个语言单元对应的输入串之间的匹配程度,可以将匹配程度最大的输入串所属的语言单元确定为与输入内容对应的候选项。
例如,在用户输入“12”之后,可以在预先设置的如表1所示的多对多元关系中,选取与“12”相对应的目标多元关系,若检测到用户输入内容中的输入串为“s-h-e-n-g-x”,则可以在如表2所示的目标多元关系中,获取各个后部语言单元对应的输入串,从而得到输入内容中的输入串与各个后部语言单元的输入串之间的匹配程度,最后得到与输入串相匹配的候选项“生肖”。
表1
前部语言单元 后部语言单元
多元关系1 12 生肖
多元关系2 36
多元关系3 72
表2
前部语言单元 后部语言单元 后部语言单元对应的输入串
12 生肖 s-h-e-n-g-x-i-a-o
12 y-u-e
另外,用户在输入过程中,不但可以先输入数字类型的内容,还可以先输入字母类型的内容,则可以将字母类型的内容以及候选项所对应的输入串一同作为输入内容。
因此,在实际应用中,输入法程序可以对输入串进行识别,判断输入内容是否包括能够组成多元关系的两个语言单元,再根据判断结果在预先设置的多元关系中查找相匹配的候选项。
可选地,可以依据输入串、或者该输入串对应的字词候选,在多元关系中进行查找,以得到输入串对应的候选项。
具体地,可以根据用户的输入内容,在多对多元关系中进行查找,判断至少一对多元关系中每对多元关系的前部语言单元是否与输入内容的部分字符相匹配。当任意一对多元关系的前部语言单元与输入内容的部分字符相匹配时,可以将该多元关系的后部语言单元对应的输入串与输入内容的剩余字符进行比较,当二者相匹配时,则可以将该目标多元关系作为候选项。
例如,若用户的输入内容为“Q-q-u”,而预先设置的多元关系中包括“Q-趣”,则可以先将输入串中的字符“Q”与多元关系中的前部语言单元“Q”进行比较,从而将多元关系“Q-趣”确定为目标多元关系,再将剩余的输入串“q-u”与目标多元关系的后部语言单元“趣”对应的输入串进行比较,最后将“Q-趣”作为候选项。
综上,本发明实施例提供的数据处理方法,通过接收用户的输入内容,将该输入内容与多元关系进行匹配,该多元关系包括内容类型不同的语言单元,确定与输入内容相对应的候选项,最后对该候选项进行输出,使得用户可以快速查看到该候选项,并且快速上屏该候选项,从而可以提高用户输入的效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图6,示出了本发明的一种数据处理装置实施例的结构框图,具体可以包括:
获取模块601,用于从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型不同,且该第一上屏内容和该第二上屏内容相邻;
关系建立模块602,用于建立该第一上屏内容和该第二上屏内容之间的多元关系。
可选地,该第一上屏内容对应的内容长度不超过第一长度阈值,该第二上屏内容对应的内容长度不超过第二长度阈值。
可选地,该获取模块601可以包括:
获取子模块,用于从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
分割子模块,用于依据该目标上屏内容所包含内容对应的内容类型,对该目标上屏内容进行分割,以得到该目标上屏内容包括的第一上屏内容和第二上屏内容。
可选地,该分割子模块可以包括:
获取单元,用于依据该目标上屏内容所包含内容对应的内容类型,从该目标上屏内容中获取内容类型互不相同的第一上屏内容、第二上屏内容和第三上屏内容;
第一合并单元,用于若该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型满足第一合并条件,则将该第一上屏内容和该第二上屏内容进行合并,作为第一上屏内容,并将该第三上屏内容作为第二上屏内容;或者
第二合并单元,用于若该第二上屏内容对应的内容类型和该第三上屏内容对应的内容类型满足第二合并条件,则将该第二上屏内容和该第三上屏内容进行合并,作为第二上屏内容。
可选地,该获取模块601可以包括:
第一判断子模块,用于在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
第二判断子模块,用于在接收用户的上屏内容的过程中,判断该上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;该语言单元包括:字符、或者单字、或者词;
第一提取子模块,用于若该第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从该上屏内容中提取位于前部的第一上屏内容;
第二提取子模块,用于若该第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从该上屏内容中提取位于该第一上屏内容之后的第二上屏内容。
可选地,该获取模块601还可以包括:
第三提取子模块,用于若该第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从该上屏内容中提取位于该第二上屏内容之后的第三上屏内容;
第一合并子模块,用于若该第二上屏内容对应的内容类型和该第三上屏内容对应的内容类型符合第一预置条件,则对该第二上屏内容和该第三上屏内容进行合并,并将合并内容作为第二上屏内容;或者
第二合并子模块,用于若该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型符合第二预置条件,则对该第一上屏内容和该第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将该第三上屏内容作为第二上屏内容。
可选地,该获取模块601还可以包括:
内容保留子模块,用于若该第一上屏内容对应的内容长度不超过第一长度阈值,则保留该第一上屏内容;或者
内容丢弃子模块,用于若该第一上屏内容对应的内容长度超过第一长度阈值,则丢弃该第一上屏内容。
可选地,该第二提取子模块可以包括:
提取单元,用于依据第二次出现的内容类型不一致的两个相邻语言单元,从该上屏内容中提取位于该第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
可选地,该第三提取子模块可以包括:
提取单元,用于依据第三次出现的内容类型不一致的两个相邻语言单元,从该上屏内容中提取位于该第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
可选地,该第一上屏内容对应的内容类型和该第二上屏内容对应的内容类型包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
综上,本发明实施例提供的数据处理装置,从连续的上屏内容中,获取相邻的且内容类型不同的第一上屏内容和第二上屏内容,并建立第一上屏内容和第二上屏内容之间的多元关系;这样,在用户需要输入不同内容类型的组合内容的情况下,可以根据建立的第一上屏内容和第二上屏内容之间的多元关系,向用户提供上述组合内容对应的候选项,因此可以提高用户的输入效率。
参照图7,示出了本发明的另一种数据处理装置实施例的结构框图,具体可以包括:
接收模块701,用于接收用户的输入内容;该输入内容包括:上屏内容和/或输入串;
确定模块702,用于根据多元关系,确定该输入内容对应的候选项;该多元关系包括:内容类型不同的语言单元;
输出模块703,用于输出该输入内容对应的候选项。
可选地,该确定模块702包括:
第一确定子模块,用于从至少一对多元关系中确定与该上屏内容相匹配的目标多元关系,并依据该目标多元关系,确定该上屏内容对应的候选项;或者
第二确定子模块,用于从至少一对多元关系中确定与该上屏内容相匹配的目标多元关系,并从该目标多元关系中确定与该输入串相匹配的语言单元,作为该输入内容对应的候选项;或者
查找子模块,用于依据该输入串、或者该输入串对应的字词候选,在多元关系中进行查找,以得到该输入串对应的候选项。
可选地,该上屏内容与该输入串之间不存在预设分割符号;和/或
该上屏内容对应的内容长度不超过长度阈值。
综上,本发明实施例提供的数据处理装置,通过接收用户的输入内容,将该输入内容与多元关系进行匹配,该多元关系包括内容类型不同的语言单元,确定与输入内容相对应的候选项,最后对该候选项进行输出,使得用户可以快速查看到该候选项,并且快速上屏该候选项,从而可以提高用户输入的效率。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行图1至图5中任一所述的方法。
参照图8,用于数据处理的装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理***,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图9是本发明的一些实施例中服务器的结构示意图。该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processingunits,CPU)922(例如,一个或一个以上处理器)和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在服务器900上执行存储介质930中的一系列指令操作。
服务器900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,一个或一个以上键盘956,和/或,一个或一个以上操作***941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如图1至图5中一个或多个所述的数据处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;建立所述第一上屏内容和所述第二上屏内容之间的多元关系。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;输出所述输入内容对应的候选项
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种数据处理方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (17)

1.一种数据处理方法,其特征在于,所述方法包括:
从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
建立所述第一上屏内容和所述第二上屏内容之间的多元关系;
所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
2.根据权利要求1所述的方法,其特征在于,所述第一上屏内容对应的内容长度不超过第一长度阈值,所述第二上屏内容对应的内容长度不超过第二长度阈值。
3.根据权利要求1所述的方法,其特征在于,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
从连续的上屏内容中获取不包含预设分割符号的目标上屏内容;
依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,以得到所述目标上屏内容包括的第一上屏内容和第二上屏内容。
4.根据权利要求3所述的方法,其特征在于,所述依据所述目标上屏内容所包含内容对应的内容类型,对所述目标上屏内容进行分割,包括:
依据所述目标上屏内容所包含内容对应的内容类型,从所述目标上屏内容中获取内容类型互不相同的第一上屏内容、第二上屏内容和第三上屏内容;
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型满足第一合并条件,则将所述第一上屏内容和所述第二上屏内容进行合并,作为第一上屏内容,并将所述第三上屏内容作为第二上屏内容;
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型满足第二合并条件,则将所述第二上屏内容和所述第三上屏内容进行合并,作为第二上屏内容;
所述第一合并条件是所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型;
所述第二合并条件是所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。
5.根据权利要求1所述的方法,其特征在于,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一判断结果为否、且第三次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容;
若所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型符合第一预置条件,则对所述第二上屏内容和所述第三上屏内容进行合并,并将合并内容作为第二上屏内容;
若所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型符合第二预置条件,则对所述第一上屏内容和所述第二上屏内容进行合并,并将合并内容作为第一上屏内容,以及,将所述第三上屏内容作为第二上屏内容;
所述第一预置条件是所述第二上屏内容对应的内容类型和所述第三上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型;
所述第二预置条件是所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型为字母类型、数字类型、符号类型、英文类型和图片类型中两种不同的内容类型。
6.根据权利要求5所述的方法,其特征在于,所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,还包括:
若所述第一上屏内容对应的内容长度不超过第一长度阈值,则保留所述第一上屏内容;
若所述第一上屏内容对应的内容长度超过第一长度阈值,则丢弃所述第一上屏内容。
7.根据权利要求1所述的方法,其特征在于,所述从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容,包括:
依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的、且内容长度不超过第二长度阈值的内容,作为第二上屏内容。
8.根据权利要求5所述的方法,其特征在于,所述从所述上屏内容中提取位于所述第二上屏内容之后的第三上屏内容,包括:
依据第三次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第二上屏内容之后的、且内容长度不超过第三长度阈值的内容,作为第三上屏内容。
9.根据权利要求1所述的方法,其特征在于,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型包括:中文类型、字母类型、数字类型、符号类型、英文类型和图片类型中的至少两种。
10.一种数据处理方法,其特征在于,所述方法包括:
接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;所述多元关系的获取方式由权利要求1中的数据处理方法实现;
输出所述输入内容对应的候选项;
所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
11.根据权利要求10所述的方法,其特征在于,所述根据多元关系,确定所述输入内容对应的候选项,包括:
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并依据所述目标多元关系,确定所述上屏内容对应的候选项;或者
从至少一对多元关系中确定与所述上屏内容相匹配的目标多元关系,并从所述目标多元关系中确定与所述输入串相匹配的语言单元,作为所述输入内容对应的候选项;或者
依据所述输入串、或者所述输入串对应的字词候选,在多元关系中进行查找,以得到所述输入串对应的候选项。
12.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
关系建立模块,用于建立所述第一上屏内容和所述第二上屏内容之间的多元关系;
所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
13.一种数据处理装置,其特征在于,所述装置包括:
接收模块,用于接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
确定模块,用于根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;所述多元关系的获取方式由权利要求1中的数据处理方法实现;
输出模块,用于输出所述输入内容对应的候选项。
所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
14.一种用于数据处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从连续的上屏内容中获取第一上屏内容和第二上屏内容;其中,所述第一上屏内容对应的内容类型和所述第二上屏内容对应的内容类型不同,且所述第一上屏内容和所述第二上屏内容相邻;
建立所述第一上屏内容和所述第二上屏内容之间的多元关系;
所述从连续的上屏内容中获取第一上屏内容和第二上屏内容,包括:
在接收用户的上屏内容的过程中,判断是否接收到用户触发的分割操作,以得到对应的第一判断结果;
在接收用户的上屏内容的过程中,判断所述上屏内容中两个相邻语言单元对应的内容类型是否一致,以得到对应的第二判断结果;所述语言单元包括:字符、或者单字、或者词;
若所述第一判断结果为否、且首次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据首次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于前部的第一上屏内容;
若所述第一判断结果为否、且第二次出现两个相邻语言单元对应的第二判断结果为否的情况,则依据第二次出现的内容类型不一致的两个相邻语言单元,从所述上屏内容中提取位于所述第一上屏内容之后的第二上屏内容。
15.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至9中一个或多个所述的数据处理方法。
16.一种用于数据处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户的输入内容;所述输入内容包括:上屏内容和/或输入串;
根据多元关系,确定所述输入内容对应的候选项;所述多元关系包括:内容类型不同的语言单元;所述多元关系的获取方式由权利要求1中的数据处理方法实现;
输出所述输入内容对应的候选项;
所述上屏内容与所述输入串之间不存在预设分割符号;和/或
所述上屏内容对应的内容长度不超过长度阈值。
17.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求10至11中一个或多个所述的数据处理方法。
CN201810196490.5A 2018-03-09 2018-03-09 数据处理方法和装置 Active CN110244861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810196490.5A CN110244861B (zh) 2018-03-09 2018-03-09 数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810196490.5A CN110244861B (zh) 2018-03-09 2018-03-09 数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN110244861A CN110244861A (zh) 2019-09-17
CN110244861B true CN110244861B (zh) 2024-02-02

Family

ID=67882340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810196490.5A Active CN110244861B (zh) 2018-03-09 2018-03-09 数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN110244861B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290632A (zh) * 2008-05-30 2008-10-22 北京搜狗科技发展有限公司 一种用户词参与智能组词输入的方法及一种输入法***
WO2012115492A2 (ko) * 2011-02-27 2012-08-30 Park Taeun 확장키를 이용한 정보입력시스템 및 정보입력방법
CN103049098A (zh) * 2012-12-28 2013-04-17 华为技术有限公司 输入法切换方法及设备
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
CN103092826A (zh) * 2012-12-31 2013-05-08 百度在线网络技术(北京)有限公司 一种根据用户的输入信息构建输入词条的方法与设备
CN104268166A (zh) * 2014-09-09 2015-01-07 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备
CN104281649A (zh) * 2014-09-09 2015-01-14 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN104978047A (zh) * 2015-06-24 2015-10-14 北京搜狗科技发展有限公司 一种跨键盘联想方法和装置
CN105759984A (zh) * 2016-02-06 2016-07-13 上海触乐信息科技有限公司 二次输入文本的方法和装置
CN106527752A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106557178A (zh) * 2016-11-29 2017-04-05 百度国际科技(深圳)有限公司 用于更新输入法词条的方法及装置
CN106855748A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种信息输入方法、装置和智能终端
CN107422872A (zh) * 2016-05-24 2017-12-01 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN107608532A (zh) * 2016-07-11 2018-01-19 北京搜狗科技发展有限公司 一种联想输入方法、装置及电子设备
CN107688399A (zh) * 2016-08-05 2018-02-13 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290632A (zh) * 2008-05-30 2008-10-22 北京搜狗科技发展有限公司 一种用户词参与智能组词输入的方法及一种输入法***
WO2012115492A2 (ko) * 2011-02-27 2012-08-30 Park Taeun 확장키를 이용한 정보입력시스템 및 정보입력방법
CN103049098A (zh) * 2012-12-28 2013-04-17 华为技术有限公司 输入法切换方法及设备
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
CN103092826A (zh) * 2012-12-31 2013-05-08 百度在线网络技术(北京)有限公司 一种根据用户的输入信息构建输入词条的方法与设备
CN104268166A (zh) * 2014-09-09 2015-01-07 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备
CN104281649A (zh) * 2014-09-09 2015-01-14 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN104978047A (zh) * 2015-06-24 2015-10-14 北京搜狗科技发展有限公司 一种跨键盘联想方法和装置
CN106855748A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种信息输入方法、装置和智能终端
CN105759984A (zh) * 2016-02-06 2016-07-13 上海触乐信息科技有限公司 二次输入文本的方法和装置
CN107422872A (zh) * 2016-05-24 2017-12-01 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN107608532A (zh) * 2016-07-11 2018-01-19 北京搜狗科技发展有限公司 一种联想输入方法、装置及电子设备
CN107688399A (zh) * 2016-08-05 2018-02-13 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN106527752A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 一种用于提供输入候选项的方法与装置
CN106557178A (zh) * 2016-11-29 2017-04-05 百度国际科技(深圳)有限公司 用于更新输入法词条的方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Graph-based retrieval of building information models for supporting the early design stages;Christoph Langenhan等;Advanced Engineering Informatics;第413-426页 *
动态规划算法提高汉字输入法音节划分的速度和准确性;程欣宇, 孟传良;贵州工业大学学报(自然科学版)(第02期);全文 *
基于嵌入式***的一种快速中文输入法的设计;张军;季伟东;;哈尔滨师范大学自然科学学报(第01期);全文 *
维吾尔文智能输入法词库结构的研究与应用;袁廷磊等;计算机工程与应用;第131-145页 *

Also Published As

Publication number Publication date
CN110244861A (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN107608532B (zh) 一种联想输入方法、装置及电子设备
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN109144285B (zh) 一种输入方法和装置
CN107291260B (zh) 一种信息输入方法和装置、及用于信息输入的装置
CN108304412B (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN107665046B (zh) 一种输入方法和装置、一种用于输入的装置
CN109521888B (zh) 一种输入方法、装置和介质
CN111198620A (zh) 一种呈现输入候选项的方法、装置和设备
CN110795014B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN108628461B (zh) 一种输入方法和装置、一种更新词库的方法和装置
CN107943317B (zh) 输入方法及装置
CN109388249B (zh) 输入信息的处理方法、装置、终端及可读存储介质
CN109725736B (zh) 一种候选排序方法、装置及电子设备
CN108536653B (zh) 一种输入方法、装置和用于输入的装置
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN107977089B (zh) 一种输入方法和装置、一种用于输入的装置
CN110244861B (zh) 数据处理方法和装置
CN108073294B (zh) 一种智能组词方法和装置、一种用于智能组词的装置
CN112987941B (zh) 生成候选词的方法及装置
CN109426359B (zh) 一种输入方法、装置以及机器可读介质
CN114115550A (zh) 联想候选的处理方法、装置和用于处理联想候选的装置
CN112764551A (zh) 词汇显示方法、装置和电子设备
CN110716653B (zh) 一种联想源确定方法和装置
CN110858100B (zh) 联想候选词生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant