CN105760521A - 信息输入方法和装置 - Google Patents

信息输入方法和装置 Download PDF

Info

Publication number
CN105760521A
CN105760521A CN201610112958.9A CN201610112958A CN105760521A CN 105760521 A CN105760521 A CN 105760521A CN 201610112958 A CN201610112958 A CN 201610112958A CN 105760521 A CN105760521 A CN 105760521A
Authority
CN
China
Prior art keywords
word
information
dictionary
input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610112958.9A
Other languages
English (en)
Inventor
马鸣
孟可丰
徐刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610112958.9A priority Critical patent/CN105760521A/zh
Publication of CN105760521A publication Critical patent/CN105760521A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了信息输入方法和装置。所述方法的一具体实施方式包括:获取用户的输入信息和用于描述信息输入场景的场景信息;根据所述输入信息和所述场景信息,对词库进行检索操作,生成候选词集合,其中,所述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的所述用户输入过的词语,基于互联网的数据分析而更新至所述词库的新词语,来自第三方数据源的词语;呈现所述候选词集合。该实施方式实现了富于针对性的候选词集合呈现。

Description

信息输入方法和装置
技术领域
本申请涉及计算机领域,具体涉及输入法领域,尤其涉及信息输入方法和装置。
背景技术
在用户使用应用的过程中,当需要在应用的信息输入区域中输入信息时,通常通过输入法来完成。输入法作为一种辅助用户输入的装置,目标是能够让用户更方便、更快捷、更准确的输入。现有的输入法技术基本是通过生成字典词典,并通过对其进行检索的方式来将输入信息转换为相应的候选词列表。但由于词库的更新代价太大,所以现有的输入法没有对热词、新兴词及用户未曾输入过的词汇进行收集并反馈给用户。现有输入法的另一个问题就是无论用户在哪一种应用场景中,同一组输入信息所对应的候选词都是完全相同的,因此现有输入法存在应用场景信息利用不足,候选词集合呈现缺乏针对性的问题。
发明内容
本申请的目的在于提出一种改进的信息输入方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种信息输入方法,所述方法包括:获取用户的输入信息和用于描述信息输入场景的场景信息;根据所述输入信息和所述场景信息,对词库进行检索操作,生成候选词集合,其中,所述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的所述用户输入过的词语,基于互联网的数据分析而更新至所述词库的新词语,来自第三方数据源的词语;呈现所述候选词集合。
在一些实施例中,所述基于互联网的数据分析而更新至所述词库的新词语包括以下至少一项:基于搜索引擎的统计分析而生成的搜索词,来自预定网站或者应用的词语。
在一些实施例中,所述词库具有用于词语查询的数据结构和与所述数据结构相对应的索引。
在一些实施例中,所述对词库进行检索操作,生成候选词集合,包括:根据所述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。
在一些实施例中,所述呈现所述候选词集合,包括:通过差异性的呈现方式来呈现各个候选词子集。
在一些实施例中,所述场景信息包括以下至少一项:接受所述输入信息的应用的应用类型信息,所述用户的地理位置信息。
第二方面,本申请提供了一种信息输入装置,所述装置包括:获取单元,配置用于获取用户的输入信息和用于描述信息输入场景的场景信息;生成单元,配置用于根据所述输入信息和所述场景信息,对词库进行检索操作,生成候选词集合,其中,所述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的所述用户输入过的词语,基于互联网的数据分析而更新至所述词库的新词语,来自第三方数据源的词语;呈现单元,配置用于呈现所述候选词集合。
在一些实施例中,所述基于互联网的数据分析而更新至所述词库的新词语包括以下至少一项:基于搜索引擎的统计分析而生成的搜索词,来自预定网站或者应用的词语。
在一些实施例中,所述词库具有用于词语查询的数据结构和与所述数据结构相对应的索引。
在一些实施例中,所述生成单元进一步配置用于:根据所述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。
在一些实施例中,所述呈现单元进一步配置用于:通过差异性的呈现方式来呈现各个候选词子集。
在一些实施例中,所述场景信息包括以下至少一项:接受所述输入信息的应用的应用类型信息,所述用户的地理位置信息。
本申请提供的信息输入方法和装置,通过获取用户的输入信息和用于描述信息输入场景的场景信息,而后根据上述输入信息和上述场景信息,对词库进行检索操作,生成候选词集合,最后呈现所生成的候选词集合,从而有效利用了场景信息,实现了富于针对性的候选词集合呈现。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的信息输入方法的一个实施例的流程图;
图3A是根据本申请的信息输入方法呈现的候选词集合的一个效果示意图;
图3B是根据本申请的信息输入方法呈现的候选词集合的另一个效果示意图;
图3C是根据本申请的信息输入方法呈现的候选词集合的再一个效果示意图;
图4是根据本申请的信息输入装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的终端设备的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息输入方法或信息输入装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如输入法类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的输入法类应用提供支持的后台服务器。后台服务器可以对接收到的数据进行存储、分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本申请实施例所提供的信息输入方法一般由终端设备101、102、103执行,相应地,信息输入装置一般设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的信息输入方法的一个实施例的流程200。所述的信息输入方法,包括以下步骤:
步骤201,获取用户的输入信息和用于描述信息输入场景的场景信息。
在本实施例中,信息输入方法运行于其上的电子设备(例如图1所示的终端设备101、102、103)可以接收用户通过键盘、触摸屏等输入装置输入的信息。在本实施例中,用户输入的信息与待输入到应用的信息输入区域的信息相关联。应用的信息输入区域可以包括以下至少一项:搜索类应用的HTML页面中的输入框、文档的编辑区域、即时通讯应用的窗口中的输入框。
在本实施例中,输入的信息可以是拼音,还可以是与待输入到应用的信息输入区域的信息预先进行绑定的信息,也可以是通过触摸屏输入的信息,本实施例对此不做限定。例如,当需要在应用的信息输入区域输入信息时,可以首先将光标定位在应用的输入区域中,当接收到用户输入的信息为拼音时,则可以呈现出与拼音对应的候选文字或候选词语,以供用户选取后输入到应用的信息输入区域中;当接收到用户输入的信息为预先与候选信息绑定的信息时,则可以呈现出与预设信息对应的候选信息,以供用户选取后输入到应用的信息输入区域中;当接收到用户输入的信息为通过触摸屏输入的信息时,则可以呈现出与输入的信息对应的候选信息,以供用户选取后输入到应用的信息输入区域中。在本实施例的一些可选的实现方式中,用户的输入场景的场景信息可以包括接受上述输入信息的应用的应用类型信息,其中,应用类型信息可以包括以下至少一项:搜索类、购物类、视频类、生活类、游戏类、即时通讯类。例如,当用户在购物类应用程序输入信息时,场景信息可以是物品类型信息(例如,裙子、零食、洗发水、高压锅),也可以是品牌信息,还可以是地点信息(例如,日本代购、韩国直邮、云南特产);当用户在视频类应用程序输入信息时,场景信息可以是节目名称,可以是电视剧或电影名称,也可以是人名,还可以是节目类型名称(例如,小品、歌舞、魔术、杂技)。
在本实施例的一些可选的实现方式中,用户的输入场景的场景信息还可以包括用户的地理位置信息。例如,当用户在医院里输入信息时,场景信息可以是药品名称(例如,创可贴、速效救心丸、消炎药),也可以是挂诊科室名称(例如,耳鼻喉科室、皮肤科、内科),还可以是病情描述信息(例如,头晕、恶心、耳鸣);当用户在商场里输入信息时,场景信息可以是电影名称(例如:老炮儿、美人鱼、功夫熊猫),也可以是菜品名称(例如,火锅、冻酸奶、铁板烧、云南菜),还可以是商店名称(例如,XX火锅、XX自助餐);当用户在旅游景区附近输入信息时,场景信息可以是旅游景区所在地的其它景区名称(例如,当用户在天安门附近输入信息时,场景信息可以是王府井、长城、南锣鼓巷),也可以是旅游景区所在地的特产(例如,北京烤鸭、老北京布鞋),还可以是旅游景区所在地的演出活动信息(例如,周杰伦演唱会、嘻哈包袱铺、开心麻花话剧)。
本领域技术人员可以理解的是,也可以综合根据用户输入信息的应用的应用类型信息和用户的地理位置信息这两个因素来获取输入场景的场景信息。
步骤202,根据输入信息和场景信息,对词库进行检索操作,生成候选词集合。
在本实施例中,词库中的词语可以包括以下至少一项:来自预设词库中的词语,所记录的用户输入过的词语,基于互联网的数据分析而更新至词库的新词语,来自第三方数据源的词语。
在本实施例中,当获取到用户的输入信息和用于描述信息输入场景的场景信息后,上述电子设备可以结合输入信息和场景信息对词库中的词语进行分析与检索,根据检索结果,生成候选词集合。例如,当获取到用户通过触摸屏输入的信息为“鱼”,并且获取到用户在中关村的商场里使用购物类应用程序时,上述电子设备可以结合用户所使用的应用程序是购物类应用程序和上述电子设备的地理位置是商场这两个因素对词库中的词语进行分析与检索,得到与输入信息“鱼”和场景信息相对应的候选词集合包括:“鱼火锅”、“美人鱼”、“鱼头泡饼”、“鱼疗”。当获取到用户的输入信息为“beiduofen”,并且获取到用户使用的是搜索类应用程序时,上述电子设备可以结合用户所使用的应用程序是搜索类应用程序,对词库中的词语进行分析与检索,得到与输入信息“beiduofen”和场景信息相对应的候选词集合包括:“贝多芬”、“音乐巨人贝多芬”、“贝多芬交响曲”。当获取到用户的输入信息为“biyan”,并且获取到用户在医院使用文档的编辑器时,上述电子设备可以结合所处的地理位置是医院这一因素对词库中的词语进行分析与检索,得到与输入信息“biyan”和场景信息相对应的候选词集合包括:“鼻炎喷雾”、“过敏性鼻炎”、“鼻窦炎”。
在本实施例中,上述电子设备还可以对词库中的词语进行垃圾信息去除、信息分类汇总和词频统计。垃圾信息可以是敏感信息,还可以是黑名单中的信息,也可以是不符合描述信息输入场景的场景信息。对词库中的词语进行信息分类汇总可以按照信息输入场景分类汇总,也可以按照词语来源分类汇总。词频统计可以是对词语的被选中次数进行统计,也可以是对词语在固定输入场景中的被提及次数进行统计。为了让新加入的词出现的频率更高,上述电子设备可以对既有词做调频处理,调频处理的方式包括以下至少一项:以固定频率衰减,以固定比例衰减,按照半衰期的模式进行衰减,以遗忘曲线的模式进行衰减和完全不衰减。
在本实施例中,上述词库中的词语可以来自预设词库中的词语,其中,预设词库可以是来源于字典词典中的词语,也可以是上述电子设备通过大数据分析与统计得到的使用次数超过预设阈值的词语,还可以是手工添加的词语。例如,当上述电子设备统计出“热咖啡”的搜索次数超过十万次时,就将“热咖啡”这一词添加到预设词库中。在具体应用时,上述预设词库可以为本地词库,或者是从服务器上下载得到的词库。
在本实施例中,上述词库中的词语可以来自所记录的上述用户输入过的词语。用户输入过的词语可以是用户通过拼音输入或通过触摸屏输入信息后并选中的词语,例如,当用户通过拼音输入“xia”后选中“下”,再输入“ban”后选中“班”,又输入“mei”后选中“没”、或者用户通过拼音输入“xiabanmei”后分别选中“下”、“班”、“没”,上述电子设备将“下班没”记录到用户输入过的词语中,当用户再次输入“xiabanmei”或“xbm”,上述电子设备将“下班没”呈现在候选区域的候选词集合中。
在本实施例的一些可选的实现方式中,上述基于互联网的数据分析而更新至上述词库的新词语可以包括:基于搜索引擎的统计分析而生成的搜索词和来自预定网站或者应用的词语。搜索引擎统计的数据可以是搜索引擎通过后台对信息的提及次数的大数据统计和分析得到的数据,也可以是通过网友的线上投票评选出的数据。预定网站或者应用可以是社交网站(例如,微博、微信、QQ),也可以是互动社区(例如,贴吧),还可以是电商网站,也可以是各类主题门户网站(例如,游戏门户网站、财经门户网站、体育门户网站、房产门户网站、汽车门户网站、教育门户网站)。可以通过对上述预定网站或者应用中的数据进行大数据分析,将搜索次数或者提及次数高于预设阈值的词语更新至词库中,例如,上述电子设备将在社交网站中提及次数超过700万的“醉了”、“duang”、“小公举”和“城会玩”更新至上述词库中。将在互动社区中提及次数超过500万的“高大上”、“笑而不语”、“累觉不爱”、“有图有真相”更新至词库中。可以将给网站带来巨大流量的词语更新至词库中,例如,将电商网站中的“爆款”、“包邮”、“明星同款”更新至上述词库中;还可以根据权威数据和网友线上投票综合评选得出的热词更新至词库中,例如,将搜索引擎统计的热词“猴赛雷”、“红包照片”更新至上述词库中。
在本实施例中,上述词库中的词语还可以是来自第三方数据源的词语,其中,第三方数据源包括以下至少一项:搜索引擎统计的数据,其中,搜索引擎统计的数据可以包括搜索引擎通过后台对信息的提及次数的大数据统计和分析得到的数据,通过网友的线上投票评选出的数据,用户正在使用的应用程序或网页提供的数据(例如,当用户在购物类应用程序上拼音输入“wenquan”,上述电子设备会在候选词集合中呈现“温泉会馆”、“温泉酒店”、“温泉门票”),用于推广的数据(例如,当用户在信息输入区域上拼音输入“beijing”,上述电子设备会在候选词集合中呈现“北京天气”、“北京地图”、“北京旅游”),广告主提供的数据(例如,当用户在信息输入区域上拼音输入“gongzuo”,上述电子设备会在候选词集合中呈现“某某招聘网站”)、用户推荐的数据(例如,当用户在信息输入区域上拼音输入“beiduofen”,上述电子设备会在候选词集合中呈现“贝多芬作品”、“贝多芬简历”)。
在本实施例的一些可选的实现方式中,上述词库具有用于词语查询的数据结构和与上述数据结构相对应的索引。上述数据结构包括以下至少一项:哈希表、二分查找树、红黑树和Trie树。上述索引包括以下至少一项:全拼拼音查询索引、五笔拼音查询索引、双拼拼音查询索引、语音拼音查询索引、手写拼音查询索引和9键拼音查询索引。作为示例,当用户在信息输入区域上利用全拼拼音键盘输入“beijing”时,上述电子设备的全拼拼音查询索引可以在哈希表中找到“beijing”所对应的候选词,可以是“北京”、“背景”或“背静”;当用户在信息输入区域上利用手写键盘输入“田”时,上述电子设备的手写拼音查询索引可以在二分查找树中找到与“田”对应的候选词,可以是“由”、“因”或“困”。
在本实施例的一些可选的实现方式中,上述电子设备对上述词库进行检索操作,生成候选词集合时,可以根据上述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。作为示例,当用户在信息输入区域上拼音输入“by”,上述电子设备可以根据来自预设词库中的候选词子集中的词语,例如“不用”、“不要”、“必要”、“半夜”,来自所记录的上述用户输入过的候选词子集中的词语,例如“表演课”、“不用啦”、“bye”,来自基于互联网的数据分析而更新至上述词库候选词子集中的词语,例如“包邮”、“包邮不”、“包邮吧”,来自第三方数据源的候选词子集中的词语,例如“包邮零食”、“阳澄湖大闸蟹”生成包括不同候选词子集的候选词集合。
步骤203,呈现候选词集合。
在本实施例中,上述电子设备呈现步骤202中生成的候选词集合。候选词集合呈现的内容可以包括以下至少一项:文字、超链接、艺术字、图片、动态图、字符画、颜文字、语音、视频和flash。作为示例,当用户在信息输入区域上通过拼音或通过触摸屏的方式输入“春晚”后,点击候选词集合中的“春晚”的周围区域(例如,右下角)的控件,会出现代表所要呈现内容的文字(例如,超链接、视频、图片、flash)列表,点击上述列表中的“超链接”,上述电子设备可以将与“春晚”有关的超链接呈现给上述用户。
在本实施例的一些可选的实现方式中,上述电子设备可以通过差异性的呈现方式来呈现上述候选词集合中的各个候选词子集。各个候选词子集的差异性的呈现,可以是依据候选词子集的来源(例如是来自预设词库或者是来自互联网的数据分析等等)来进行的。作为示例,上述差异性的呈现方式可以是来自基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语与来自预设词库中的词语和来自所记录的上述用户输入过的词语合并呈现;也可以是在来自预设词库中的词语和来自所记录的上述用户输入过的词语的候选词子集之外,基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语以独立的区域呈现候选词子集;还可以是基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语以独立的窗口或页面呈现候选词子集。
请参考图3A,其示出了根据本申请的信息输入方法呈现的候选词集合的一个效果示意图。
在图3A中,示出了用户在信息输入界面输入的信息以及多个候选结果。用户在浏览器上拼音输入“dengshan”,候选结果301为来自基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语(例如,登山装备、登山鞋、登山杖)与来自预设词库中的词语和来自所记录的上述用户输入过的词语(例如,等上、封山)合并而呈现的候选词集合。
请参考图3B,其示出了根据本申请的信息输入方法呈现的候选词集合的另一个效果示意图。
在图3B中,示出了用户在信息输入界面输入的信息以及多个候选结果。用户在浏览器上拼音输入“dengshan”,候选结果302为来自预设词库中的词语和来自所记录的上述用户输入过的词语(例如:登山、灯闪、登上)的候选词子集,候选结果303是来自基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语(例如,登山包、登山装备、登山鞋)以独立于候选结果302而呈现的候选词子集。
请参考图3C,其示出了根据本申请的信息输入方法呈现的候选词集合的再一个效果示意图。
在图3C中,示出了用户在信息输入界面输入的信息以及多个候选结果。用户在浏览器上拼音输入“dengshan”,候选结果304为来自预设词库中的词语和来自所记录的上述用户输入过的词语(例如:登山、等啥、凤山)的候选词子集,候选结果305是来自基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语(例如,登山鞋、登山团、中国山峰)以独立的窗口而呈现的候选词子集。
本申请的上述实施例提供的方法通过将描述信息输入场景的场景信息和呈现的候选词集合相关联,从而有效利用了场景信息,实现了富于针对性的候选词集合呈现。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种信息输入装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例上述的信息输入装置400包括:获取单元401、生成单元402和呈现单元403。其中,获取单元401配置用于获取用户的输入信息和用于描述信息输入场景的场景信息;生成单元402配置用于根据上述输入信息和上述场景信息,对词库进行检索操作,生成候选词集合,其中,上述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的上述用户输入过的词语,基于互联网的数据分析而更新至上述词库的新词语,来自第三方数据源的词语;而呈现单元403配置用于呈现上述候选词集合。
在本实施例中,信息输入装置400的获取单元401可以接收用户通过键盘、触摸屏等输入装置输入的信息。在本实施例中,用户的输入场景的场景信息可以来源于用户输入信息的应用程序,还可以来源于上述电子设备所处的地理位置。
在本实施例中,基于获取单元401得到的用户输入信息和用户的输入场景的场景信息,上述生成单元402结合输入信息和场景信息对词库中的词语进行分析与检索,根据检索结果,生成候选词集合。上述词库中的词语可以来自预设词库中的词语,预设词库可以是来源于字典词典中的词语,也可以是上述电子设备通过大数据分析与统计得到的使用次数超过预设阈值的词语,还可以是手工添加的词语;上述词库中的词语可以来自所记录的上述用户输入过的词语,用户输入过的词语可以是用户通过拼音输入或通过触摸屏输入信息后并选中的词语;上述词库中的词语可以来自基于互联网的数据分析而更新至上述词库的新词语;上述词库中的词语还可以是来自第三方数据源的词语。
在本实施例中,上述呈现单元403可以通过差异性的呈现方式来呈现上述生成单元402生成的候选词集合中的各个候选词子集。候选词集合呈现的内容可以包括以下至少一项:文字、超链接、艺术字、图片、动态图、字符画、颜文字、语音、视频和flash。
在本实施例的一些可选的实现方式中,上述生成单元402对上述词库进行检索操作,生成候选词集合时,可以根据上述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。
在本实施例的一些可选的实现方式中,上述呈现单元进一步配置用于通过差异性的呈现方式来呈现各个候选词子集。各个候选词子集的差异性的呈现,可以是依据候选词子集的来源(例如是来自预设词库或者是来自互联网的数据分析等等)来进行的。作为示例,上述差异性的呈现方式可以是来自基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语与来自预设词库中的词语和来自所记录的上述用户输入过的词语合并呈现;可以是在来自预设词库中的词语和来自所记录的上述用户输入过的词语的候选词子集之外,基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语以独立的区域呈现候选词子集;还可以是基于互联网的数据分析而更新至上述词库的新词和来自第三方数据源的词语以独立的窗口或页面呈现候选词子集。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备的计算机***500的结构示意图。
如图5所示,计算机***500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有***500操作所需的各种程序和数据。CPU501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、生成单元、呈现单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。例如,呈现单元还可以被描述为“候选词集合呈现单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:获取用户的输入信息和用于描述信息输入场景的场景信息;根据上述输入信息和上述场景信息,对词库进行检索操作,生成候选词集合,其中,上述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的上述用户输入过的词语,基于互联网的数据分析而更新至上述词库的新词语,来自第三方数据源的词语;呈现上述候选词集合。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种信息输入方法,其特征在于,所述方法包括:
获取用户的输入信息和用于描述信息输入场景的场景信息;
根据所述输入信息和所述场景信息,对词库进行检索操作,生成候选词集合,其中,所述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的所述用户输入过的词语,基于互联网的数据分析而更新至所述词库的新词语,来自第三方数据源的词语;
呈现所述候选词集合。
2.根据权利要求1所述的方法,其特征在于,所述基于互联网的数据分析而更新至所述词库的新词语包括以下至少一项:基于搜索引擎的统计分析而生成的搜索词,来自预定网站或者应用的词语。
3.根据权利要求1所述的方法,其特征在于,所述词库具有用于词语查询的数据结构和与所述数据结构相对应的索引。
4.根据权利要求1所述的方法,其特征在于,所述对词库进行检索操作,生成候选词集合,包括:
根据所述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。
5.根据权利要求4所述的方法,其特征在于,所述呈现所述候选词集合,包括:
通过差异性的呈现方式来呈现各个候选词子集。
6.根据权利要求1-5之一所述的方法,其特征在于,所述场景信息包括以下至少一项:接受所述输入信息的应用的应用类型信息,所述用户的地理位置信息。
7.一种信息输入装置,其特征在于,所述装置包括:
获取单元,配置用于获取用户的输入信息和用于描述信息输入场景的场景信息;
生成单元,配置用于根据所述输入信息和所述场景信息,对词库进行检索操作,生成候选词集合,其中,所述词库中的词语包括以下至少一项:来自预设词库中的词语,所记录的所述用户输入过的词语,基于互联网的数据分析而更新至所述词库的新词语,来自第三方数据源的词语;
呈现单元,配置用于呈现所述候选词集合。
8.根据权利要求7所述的装置,其特征在于,所述基于互联网的数据分析而更新至所述词库的新词语包括以下至少一项:基于搜索引擎的统计分析而生成的搜索词,来自预定网站或者应用的词语。
9.根据权利要求7所述的装置,其特征在于,所述词库具有用于词语查询的数据结构和与所述数据结构相对应的索引。
10.根据权利要求7所述的装置,其特征在于,所述生成单元进一步配置用于:
根据所述词库中的词语的不同来源,生成包括不同候选词子集的候选词集合。
11.根据权利要求10所述的装置,其特征在于,所述呈现单元进一步配置用于:
通过差异性的呈现方式来呈现各个候选词子集。
12.根据权利要求7-11之一所述的装置,其特征在于,所述场景信息包括以下至少一项:接受所述输入信息的应用的应用类型信息,所述用户的地理位置信息。
CN201610112958.9A 2016-02-29 2016-02-29 信息输入方法和装置 Pending CN105760521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610112958.9A CN105760521A (zh) 2016-02-29 2016-02-29 信息输入方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610112958.9A CN105760521A (zh) 2016-02-29 2016-02-29 信息输入方法和装置

Publications (1)

Publication Number Publication Date
CN105760521A true CN105760521A (zh) 2016-07-13

Family

ID=56331449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610112958.9A Pending CN105760521A (zh) 2016-02-29 2016-02-29 信息输入方法和装置

Country Status (1)

Country Link
CN (1) CN105760521A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445189A (zh) * 2016-12-16 2017-02-22 北京小米移动软件有限公司 候选词显示方法及装置
CN106469214A (zh) * 2016-09-06 2017-03-01 北京百度网讯科技有限公司 基于人工智能的信息呈现方法和装置
CN106774972A (zh) * 2016-11-03 2017-05-31 北京百度网讯科技有限公司 在文字输入中提供候选词的方法和装置
CN106909276A (zh) * 2017-01-10 2017-06-30 网易(杭州)网络有限公司 用于实现电子读物内容互动的方法及设备
CN106933381A (zh) * 2017-03-16 2017-07-07 联想(北京)有限公司 一种信息处理方法及装置
CN107562222A (zh) * 2017-09-25 2018-01-09 联想(北京)有限公司 一种数据处理方法及***
CN107562220A (zh) * 2017-08-15 2018-01-09 百度在线网络技术(北京)有限公司 输入信息的推荐方法、装置、计算机设备及可读介质
CN107621886A (zh) * 2016-07-15 2018-01-23 北京搜狗科技发展有限公司 一种输入推荐方法、装置及电子设备
WO2018090688A1 (zh) * 2016-11-17 2018-05-24 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN108536480A (zh) * 2017-12-28 2018-09-14 广东欧珀移动通信有限公司 输入法配置方法及相关产品
CN109062422A (zh) * 2018-08-21 2018-12-21 北京有三逗科技有限公司 快捷输入方法、客户端及服务器
WO2019218151A1 (zh) * 2017-05-15 2019-11-21 Li Chienwen 一种资料搜寻方法
CN110765271A (zh) * 2018-07-09 2020-02-07 株式会社理光 一种实体发现与实体链接的联合处理方法及装置
CN111722730A (zh) * 2020-06-23 2020-09-29 平安医疗健康管理股份有限公司 基于一体机的文字输入方法、装置、设备及可读存储介质
CN114435431A (zh) * 2022-01-13 2022-05-06 北京和利时***集成有限公司 确定车门与站台门对应关系的方法及装置
CN115757923A (zh) * 2023-01-09 2023-03-07 北京创新乐知网络技术有限公司 搜索热词的确定方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及***
CN102169503A (zh) * 2011-04-29 2011-08-31 北京百度网讯科技有限公司 一种获取与用户查询序列相对应的搜索结果的方法与设备
CN102508903A (zh) * 2011-11-09 2012-06-20 中兴通讯股份有限公司 输入法词库的更新方法、字符输入方法及终端
WO2013029239A1 (zh) * 2011-08-30 2013-03-07 宇龙计算机通信科技(深圳)有限公司 词库更新装置、输入***和输入方法及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及***
CN102169503A (zh) * 2011-04-29 2011-08-31 北京百度网讯科技有限公司 一种获取与用户查询序列相对应的搜索结果的方法与设备
WO2013029239A1 (zh) * 2011-08-30 2013-03-07 宇龙计算机通信科技(深圳)有限公司 词库更新装置、输入***和输入方法及终端
CN102508903A (zh) * 2011-11-09 2012-06-20 中兴通讯股份有限公司 输入法词库的更新方法、字符输入方法及终端

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107621886B (zh) * 2016-07-15 2021-12-21 北京搜狗科技发展有限公司 一种输入推荐方法、装置及电子设备
CN107621886A (zh) * 2016-07-15 2018-01-23 北京搜狗科技发展有限公司 一种输入推荐方法、装置及电子设备
CN106469214A (zh) * 2016-09-06 2017-03-01 北京百度网讯科技有限公司 基于人工智能的信息呈现方法和装置
CN106469214B (zh) * 2016-09-06 2019-10-15 北京百度网讯科技有限公司 基于人工智能的信息呈现方法和装置
CN106774972A (zh) * 2016-11-03 2017-05-31 北京百度网讯科技有限公司 在文字输入中提供候选词的方法和装置
CN106774972B (zh) * 2016-11-03 2020-03-20 北京百度网讯科技有限公司 在文字输入中提供候选词的方法和装置
US10802605B2 (en) 2016-11-17 2020-10-13 Beijing Sogou Technology Development Co., Ltd. Input method, device, and electronic apparatus
WO2018090688A1 (zh) * 2016-11-17 2018-05-24 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN106445189A (zh) * 2016-12-16 2017-02-22 北京小米移动软件有限公司 候选词显示方法及装置
CN106909276A (zh) * 2017-01-10 2017-06-30 网易(杭州)网络有限公司 用于实现电子读物内容互动的方法及设备
CN106909276B (zh) * 2017-01-10 2020-04-24 网易(杭州)网络有限公司 用于实现电子读物内容互动的方法及设备
CN106933381A (zh) * 2017-03-16 2017-07-07 联想(北京)有限公司 一种信息处理方法及装置
WO2019218151A1 (zh) * 2017-05-15 2019-11-21 Li Chienwen 一种资料搜寻方法
CN107562220A (zh) * 2017-08-15 2018-01-09 百度在线网络技术(北京)有限公司 输入信息的推荐方法、装置、计算机设备及可读介质
CN107562222A (zh) * 2017-09-25 2018-01-09 联想(北京)有限公司 一种数据处理方法及***
CN108536480A (zh) * 2017-12-28 2018-09-14 广东欧珀移动通信有限公司 输入法配置方法及相关产品
CN110765271A (zh) * 2018-07-09 2020-02-07 株式会社理光 一种实体发现与实体链接的联合处理方法及装置
CN110765271B (zh) * 2018-07-09 2024-02-09 株式会社理光 一种实体发现与实体链接的联合处理方法及装置
CN109062422A (zh) * 2018-08-21 2018-12-21 北京有三逗科技有限公司 快捷输入方法、客户端及服务器
CN111722730A (zh) * 2020-06-23 2020-09-29 平安医疗健康管理股份有限公司 基于一体机的文字输入方法、装置、设备及可读存储介质
CN114435431A (zh) * 2022-01-13 2022-05-06 北京和利时***集成有限公司 确定车门与站台门对应关系的方法及装置
CN115757923A (zh) * 2023-01-09 2023-03-07 北京创新乐知网络技术有限公司 搜索热词的确定方法、装置、计算机设备及存储介质
CN115757923B (zh) * 2023-01-09 2023-05-23 北京创新乐知网络技术有限公司 搜索热词的确定方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN105760521A (zh) 信息输入方法和装置
JP6606275B2 (ja) 情報をプッシュ配信するコンピュータ実施方法及び装置
US11012753B2 (en) Computerized system and method for determining media based on selected motion video inputs
US20140372179A1 (en) Real-time social analysis for multimedia content service
US20160226804A1 (en) Methods, systems, and media for suggesting a link to media content
US20130304469A1 (en) Information processing method and apparatus, computer program and recording medium
US20150379557A1 (en) Automated creative extension selection for content performance optimization
US9703534B2 (en) Dynamic entity inference for developer integration of entity-based external functionality
JP2018523386A (ja) ストリーミングメディアプレゼンテーションシステム
WO2018056964A1 (en) Video keyframes display on online social networks
CN110263272A (zh) 用于呈现与主题相关的内容项目的***和方法
US20180157763A1 (en) System and method for generating an electronic page
KR20160123377A (ko) 크리에이티브의 랜딩 페이지와 함께 기능적 확장들을 제공하는 방법들 및 시스템들
WO2015196467A1 (en) Automated click type selection for content performance optimization
US20150287069A1 (en) Personal digital engine for user empowerment and method to operate the same
US20160085515A1 (en) Entity-Based External Functionality for Software Developers
CN105871940A (zh) 信息推荐方法和***
US9569432B1 (en) Evaluating content in a computer networked environment
JP2023549903A (ja) マルチメディアのインタラクション方法、情報インタラクション方法、装置、機器及び媒体
CN107622074A (zh) 一种数据处理方法、装置和计算设备
CN105453014A (zh) 可调节的视频播放器
CN107729573A (zh) 信息推送方法和装置
US11057332B2 (en) Augmented expression sticker control and management
CN113111197A (zh) 多媒体内容的推荐方法、装置、设备及存储介质
US10037310B1 (en) Evaluating content in a computer networked environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713

RJ01 Rejection of invention patent application after publication