CN107944954A - 信息处理方法及其装置 - Google Patents

信息处理方法及其装置 Download PDF

Info

Publication number
CN107944954A
CN107944954A CN201711134979.1A CN201711134979A CN107944954A CN 107944954 A CN107944954 A CN 107944954A CN 201711134979 A CN201711134979 A CN 201711134979A CN 107944954 A CN107944954 A CN 107944954A
Authority
CN
China
Prior art keywords
specified
identified
application program
preview screen
operational order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711134979.1A
Other languages
English (en)
Inventor
陶嘉明
王哲鹏
武亚强
***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201711134979.1A priority Critical patent/CN107944954A/zh
Publication of CN107944954A publication Critical patent/CN107944954A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了一种信息处理方法,包括:获取包含有至少一个待识别对象的预览画面;对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象;获取外部输入的操作指令,其中,操作指令用于指示对识别出的至少一个对象中的指定对象执行指定操作;以及响应于操作指令,以对指定对象执行指定操作。本公开还提供了一种信息处理装置。

Description

信息处理方法及其装置
技术领域
本公开涉及一种信息处理方法及其装置。
背景技术
电子设备的摄像装置除了可以通过扫描二维码来识别对象外,还可以对着物品拍照,进而对照片中的拍摄对象执行特定的操作,如在某购物网站上,对着某一个货品拍照后,可以基于所拍摄的照片在该网站上搜索与该货品相同或相似的货品。
在实现本公开实施例的过程中,发明人发现相关技术中至少存在如下问题:对照片中的对象执行特定操作时,一次只能识别出一个,而且通常需要待识别的对象占据整个画面的较大比例才能实现,当画面中待识别的对象较多时,不能选择性的对待识别的对象执行特定操作,导致用户体验不好。
针对相关技术中的上述问题,目前还未提出有效的解决方案。
发明内容
有鉴于此,本公开提供了一种信息处理方法及其装置。
本公开的一个方面提供了一种信息处理方法,包括:获取包含有至少一个待识别对象的预览画面;对包含在上述预览画面中的上述至少一个待识别对象进行识别,以识别出至少一个对象;获取外部输入的操作指令,其中,上述操作指令用于指示对识别出的上述至少一个对象中的指定对象执行指定操作;以及响应于上述操作指令,以对上述指定对象执行上述指定操作。
可选地,对包含在上述预览画面中的上述至少一个待识别对象进行识别,以识别出至少一个对象包括:加载对象识别模型;获取包含在上述预览画面中的上述至少一个待识别对象的特征参数,其中,上述特征参数用于描述上述至少一个待识别对象的属性特征;将上述特征参数输入上述对象识别模型,以使上述对象识别模型响应于上述特征参数输出对应的识别结果;以及基于上述识别结果确定出上述至少一个对象。
可选地,上述操作指令包括语音信号,响应于上述操作指令,以对上述指定对象执行上述指定操作包括:对上述语音信号进行自然语言处理,以得到对应的语义信息;确定与上述语义信息关联的指定操作;以及对上述指定对象执行上述指定操作。
可选地,对上述指定对象执行上述指定操作包括:确定是否存在第一应用程序,其中,上述第一应用程序是预先设定的执行上述指定操作所针对的应用程序;以及若存在上述第一应用程序,则在上述第一应用程序中对上述指定对象执行上述指定操作。
可选地,上述方法还包括:若不存在上述第一应用程序,则确定能够执行上述指定操作的其他应用程序;以及在上述其他应用程序中对上述指定对象执行上述指定操作。
本公开的另一个方面提供了一种信息处理装置,包括:第一获取模块,用于获取包含有至少一个待识别对象的预览画面模块,用于获取包含有至少一个待识别对象的预览画面;识别模块,用于对包含在上述预览画面中的上述至少一个待识别对象进行识别,以识别出至少一个对象;第二获取模块,用于获取外部输入的操作指令,其中,上述操作指令用于指示对识别出的上述至少一个对象中的指定对象执行指定操作;以及执行模块,用于响应于上述操作指令,以对上述指定对象执行上述指定操作。
可选地,上述识别模块包括:加载单元,用于加载对象识别模型;获取单元,用于获取包含在上述预览画面中的上述至少一个待识别对象的特征参数,其中,上述特征参数用于描述上述至少一个待识别对象的属性特征;输入单元,用于将上述特征参数输入上述对象识别模型,以使上述对象识别模型响应于上述特征参数输出对应的识别结果;以及第一确定单元,用于基于上述识别结果确定出上述至少一个对象。
可选地,上述执行模块包括:处理单元,用于对上述语音信号进行自然语言处理,以得到对应的语义信息;第二确定单元,用于确定与上述语义信息关联的指定操作;以及执行单元,用于对上述指定对象执行上述指定操作。
可选地,上述执行单元包括:第一确定子单元,用于确定是否存在第一应用程序,其中,上述第一应用程序是预先设定的执行上述指定操作所针对的应用程序;以及第一执行子单元,用于在存在上述第一应用程序的情况下,在上述第一应用程序中对上述指定对象执行上述指定操作。
可选地,上述执行单元还包括:第二确定子单元,用于在不存在上述第一应用程序的情况下,确定能够执行上述指定操作的其他应用程序;以及第二执行子单元,用于在上述其他应用程序中对上述指定对象执行上述指定操作。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的信息处理方法及其装置的应用场景;
图2示意性示出了根据本公开实施例的信息处理方法的流程图;
图3A示意性示出了根据本公开实施例的对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象的流程图;
图3B示意性示出了根据本公开实施例的响应于操作指令,以对指定对象执行指定操作的流程图;
图3C示意性示出了根据本公开实施例的对指定对象执行指定操作的流程图;
图3D示意性示出了根据本公开另一实施例的对指定对象执行指定操作的流程图;
图4示意性示出了根据本公开实施例的信息处理装置的框图;
图5A示意性示出了根据本公开实施例的识别模块的框图;
图5B示意性示出了根据本公开实施例的执行模块的框图;
图5C示意性示出了根据本公开实施例的执行单元的框图;
图5D示意性示出了根据本公开另一实施例的执行单元的框图;以及
图6示意性示出了应用本公开实施例的可实现信息处理方法的计算机***的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的装置”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的装置等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的装置”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的装置等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体***、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开提供了一种信息处理方法,包括:获取包含有至少一个待识别对象的预览画面,对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象,获取外部输入的操作指令,其中,操作指令用于指示对识别出的至少一个对象中的指定对象执行指定操作以及响应于操作指令,以对指定对象执行指定操作。
图1示意性示出了根据本公开实施例的信息处理方法及其装置的应用场景。
根据本公开的实施例提供的信息处理方法可以实现利用电子设备的摄像装置识别出对象,进而对识别出的对象执行特定操作的场景。
如图1所示,在该场景中,有一个坐在工位上的人,他身边的电脑,杯子以及某商家的优惠券等对象,这些全部或部分对象可以是待识别的对象。当利用电子设备如手机的摄像装置如相机对着上述场景时,相机的摄像头会捕捉到一预览画面,在该预览画面中,可以包含有上述场景中的全部或部分对象,即通过调整相机摄像头的位置可以方便的获取包含有至少一个待识别对象的预览画面。
通过本公开的实施例提供的信息处理方法可以很方便就在某购物网站上搜索他穿的衬衫,同款杯子,或是在团购网站找到某商家的优惠信息等等。
需要说明的是,本实施例的应用场景仅仅是示意性的,并不能限定或缩小本公开的范围。以下将以此场景为例,对本公开提供的信息处理方法进行详细的展开。
图2示意性示出了根据本公开实施例的信息处理方法的流程图。
如图2所示,该信息处理方法可以包括操作S210~S240,其中:
在操作S210,获取包含有至少一个待识别对象的预览画面。
在操作S220,对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象。
在操作S230,获取外部输入的操作指令,其中,操作指令用于指示对识别出的至少一个对象中的指定对象执行指定操作。
在操作S240,响应于操作指令,以对指定对象执行指定操作。
当利用电子设备如手机的摄像装置如相机对着上述场景时,相机的摄像头会捕捉到一预览画面,在该预览画面中包含至少一个待识别对象,即待识别对象可以是上述场景中的一个对象,也可以是多个对象,待识别对象的个数在此不做限定。进一步地,预览画面中的待识别对象的个数可根据实际需要做相应调整,如可以通过调整电子设备的摄像装置的位置,具体地调整方法在此不做限定。同样的,对待识别对象在预览画面中的位置也不做限定,即并不需要待识别的对象占据整个画面的较大比例。需要说明的是,除了对上述场景获取预览画面之外,还可以对上述场景进行拍照。
在获取上述预览画面之后,对包含在预览画面中的待识别对象进行识别,可以识别出一个对象,还可以识别出多个对象,并将识别出的一个或/或多个对象在预览画面上标识出来,如可以将识别出的杯子、电脑、某商家的优惠券在预览画面上加一方框展示,以方便查看识别结果并根据识别出的对象确定下一步要执行的指定操作。需要说明的是,标识对象的具体方式和标识效果,在此不做限定。
在获取带有标识的对象的预览画面之后,还可以利用外部输入的操作指令对识别出来的不同对象执行不同的指定操作。外部输入的操作指令可以是语音信号,还可以是触摸操作,在此不做限定。指定操作可以是在某购物网站上搜索同款和/或相似款货品,也可以是搜索该商家的优惠券,还可以是扫描某二维码以获取该二维码对应的货品信息在此不做限定。
以上说明仅针对一个时刻的一张预览画面展开的描述,可以理解的是,对获取的包含有至少一个待识别对象的预览画面,本方案可以实时的对预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象。
通过本公开的实施例,由于采用对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象,识别出画面中的多个对象,并根据操作指令,对指定对象执行指定操作的技术方案,至少部分克服相关技术中,对象识别场景单一,且只能识别一个对象且通常需要待识别的对象占据整个画面的较大比例才能实现的技术问题,达到当画面中待识别的对象较多时能识别出多个对象并标识,选择性的对待识别的对象执行特定操作,提高用户体验且实现以用户为中心的体验效果。
下面参考图3A~图3D,结合具体实施例对图2所示的方法做进一步说明。
图3A示意性示出了根据本公开实施例的对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象的流程图。
在该实施例中,该信息处理方法除了可以包括上文参考图2所对应的实施例中描述的操作S210~S240之外,还可以包括操作S311~S314。其中,图2描述的操作S220(即对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象)可以包括操作S311~S314。如图3A所示,其中:
在操作S311,加载对象识别模型。
在操作S312,获取包含在预览画面中的至少一个待识别对象的特征参数,其中,特征参数用于描述至少一个待识别对象的属性特征。
在操作S313,将特征参数输入对象识别模型,以使对象识别模型响应于特征参数输出对应的识别结果。
在操作S314,基于识别结果确定出至少一个对象。
需要说明的是,对象识别模型是使用专门的对象训练样本预先训练得到并存储在本地或者服务器的,使用时直接加载即可。当对象识别模型有更新时,才需要重新从服务器下载更新后的对象识别模型到本地。在本公开实施例中,对象识别模型的识别依据可以包括但不限于:对象的边缘信息等。获取一个或多个对象的特征参数,可以将特征参数输入对象识别模型,以使对象识别模型响应于特征参数输出对应的识别结果,对有识别结果的对象在预览画面中进行标识,特征参数用于描述待识别对象的属性特征,不同的对象往往表现出不同的属性特性,因此根据获取的属性参数可以识别出待识别对象。
通过本公开的实施例,将获取的待识别对象的特征参数输入训练好的识别模型中,得到一个或多个对象的识别结果,至少部分克服相关技术中,对象识别场景单一,且只能识别一个对象且通常需要待识别的对象占据整个画面的较大比例才能实现的技术问题。
图3B示意性示出了根据本公开实施例的响应于操作指令,以对指定对象执行指定操作的流程图。
在该实施例中,该信息处理方法除了可以包括上文参考图2所对应的实施例中描述的操作S210~S240之外,还可以包括操作S321~S323。其中,图2描述的操作S240(即响应于操作指令,以对指定对象执行指定操作)可以包括操作S321~S323。如图3B所示,其中:
在操作S321,对语音信号进行自然语言处理,以得到对应的语义信息。
在操作S322,确定与语义信息关联的指定操作。
在操作S323,对指定对象执行指定操作。
如上所述,外部输入的操作指令,可以是语音信号,还可以是触摸操作,在此只针对操作指令为语音信号的情况进行说明,其他形式的操作指令在此不再赘述。语音信号的输入方式也不做限定,可以通过电子设备的麦克获取该语音信号,也可以通过电子设备的其他语音获取装置获取该语音信号。
对于电子设备来说,一般可以识别其预先定义好的语音信号,而输入电子设备的语音信号千差万别,有时不一定和预先定义好的语音不一致。因此,可以采用对语音信号进行自然语言处理,以得到对应的语义信息的方法,确定与语义信息关联的指定操作,使得电子设备能够识别接收到的对指定对象执行指定操作的语音信号。指定对象可以是识别出的任意对象,如可以是识别出的上衣、某商家优惠券和二维码等,在此,对指定对象不做具体限定。
如对识别出的上衣,可以通过手机麦克输入“搜索这件上衣”的语音信号,对该语音信号进行自然语言处理,得到相应的语义信息,如“搜索上衣”,可以确定出对该上衣这一指定对象执行的指定操作为“搜索”,根据从这件上衣的预览画面中获取的该件上衣的相关信息,如图片信息和/或这件上衣的属性参数,即可以在某购物网站上查找所有或部分与这件上衣相符的货品。
如对识别出的某商家优惠券,可以通过手机麦克输入“搜索这个商铺的优惠券”的语音信号,对该语音信号进行自然语言处理,得到语义信息,如“搜索优惠券”,可以确定出对该商铺这一指定对象执行的指定操作为“搜索优惠券”,根据从该商铺的预览画面中获取的该商铺的相关信息,如图片信息和/或该商铺的属性参数,即可以在某购物或/团购网站上查找所有或部分与该商铺相关的优惠券信息。
如对识别出的二维码,可以通过手机麦克输入“扫描这个二维码”的语音信号,对该语音信号进行自然语言处理,得到语义信息,如“搜索二维码”,可以确定出对二维码这一指定对象执行的指定操作为“扫描”,根据从该二维码的预览画面中获取的该二维码的相关信息,如图片信息和/或该二维码的属性参数,即可以识别出该二维码对应的信息,如可以是添加好友、支付等,在此不做限定。
需要说明的是,以上对指定对象的举例说明仅仅是示意性的,并不能限定或缩小本公开的范围,其他类型的指定对象执行指定操作的具体方式可以依本公开的具体实施例的精神做适当展开。
通过本公开的实施例,操作指令是语音信号的情况下,对语音信号进行自然语音处理得到语义信息,执行与语义信息关联的指定操作,提高用户体验,并进一步提高了操作指令的适应性。
图3C示意性示出了根据本公开实施例的对指定对象执行指定操作的流程图。
在该实施例中,该信息处理方法除了可以包括上文参考图3B所对应的实施例中描述的操作S321~S323之外,还可以包括操作S331~S332。其中,图3B描述的操作S323(即对指定对象执行指定操作)可以包括操作S331~S332。如图3C所示,其中:
在操作S331,确定是否存在第一应用程序,其中,第一应用程序是预先设定的执行指定操作所针对的应用程序。
在操作S332,若存在第一应用程序,则在第一应用程序中对指定对象执行指定操作。
需要说明的是,对指定对象执行指定操作,如对识别出的上衣这一指定对象执行的指定操作为“搜索”,可以确定是否存在预先设定的执行该搜索指定操作的应用程序,如某购物网站的应用程序,若存在则在该应用程序中执行“搜索”这一指定操作,使得能够基于该应用程序提供的货品中搜索查找所有或部分与这件上衣相符的货品。执行指定操作的应用程序的预先设定方法在此不做限定。
通过本公开的实施例,若存在预先设定的执行指定操作的第一应用程序,则在该程序中对指定对象执行指定操作,至少部分克服了相关技术中应用场景单一的技术问题,达到扩展应用场景的技术效果。
图3D示意性示出了根据本公开另一实施例的对指定对象执行指定操作的流程图。
在该实施例中,该信息处理方法除了可以包括上文参考图3C所对应的实施例中描述的操作S331~S332之外,还可以包括操作S341~S342。如图3D所示,其中:
在操作S341,若不存在第一应用程序,则确定能够执行指定操作的其他应用程序。
在操作S342,在其他应用程序中对指定对象执行指定操作。
需要说明的是,若不存在则在该应用程序中执行“搜索”这一指定操作的应用程序,为了达到搜索目的,可以通过确定能够执行指定操作的其他应用程序,使得能够基于其他应用程序提供的相关货品中搜索查找所有或部分与这件上衣相符的货品。
通过本公开的实施例,若不存在预先设定的执行指定操作的第一应用程序,则确定能够执行指定操作的其他应用程序,并在其他应用程序中执行指定操作,至少部分克服了相关技术中应用场景单一的技术问题,达到扩展应用场景的技术效果。
本公开的另一个方面提供了信息处理装置。
图4示意性示出了根据本公开实施例的信息处理装置的框图。
在该实施例中,该信息处理装置400可以包括第一获取模块410、识别模块420、第二获取模块430和执行模块440。该信息处理装置可以执行上述参考图2描述的信息处理方法。如图4所示,其中:
第一获取模块410用于获取包含有至少一个待识别对象的预览画面。
识别模块420用于对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象。
第二获取模块430用于获取外部输入的操作指令,其中,操作指令用于指示对识别出的至少一个对象中的指定对象执行指定操作。
执行模块440用于响应于操作指令,以对指定对象执行指定操作。
可以理解的是,第一获取模块410、识别模块420、第二获取模块430和执行模块440可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,第一获取模块410、识别模块420、第二获取模块430和执行模块440中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一获取模块410、识别模块420、第二获取模块430和执行模块440中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
通过本公开的实施例,由于采用对包含在预览画面中的至少一个待识别对象进行识别,以识别出至少一个对象,识别出画面中的多个对象,并根据操作指令,对指定对象执行指定操作的技术方案,至少部分克服相关技术中,对象识别场景单一,且只能识别一个对象且通常需要待识别的对象占据整个画面的较大比例才能实现的技术问题,达到当画面中待识别的对象较多时能识别出多个对象并标识,选择性的对待识别的对象执行特定操作,提高用户体验且实现以用户为中心的体验效果。
下面参考图5A~图5D,结合具体实施例对图4所示的装置做进一步说明。
图5A示意性示出了根据本公开实施例的识别模块的框图。
在该实施例中,该信息处理装置400除了可以包括上文参考图4所对应的实施例中描述的第一获取模块410、识别模块420、第二获取模块430和执行模块440之外,识别模块420还可以包括加载单元511、获取单元512、输入单元513和第一确定单元514。为了描述的简洁起见,这里省略对图4中对应模块的描述。如图5A所示,其中:加载单元511用于加载对象识别模型。获取单元512用于获取包含在预览画面中的至少一个待识别对象的特征参数,其中,特征参数用于描述至少一个待识别对象的属性特征。输入单元513用于将特征参数输入对象识别模型,以使对象识别模型响应于特征参数输出对应的识别结果。第一确定单元514用于基于识别结果确定出至少一个对象。
通过本公开的实施例,将获取的待识别对象的特征参数输入训练好的识别模型中,得到一个或多个对象的识别结果,至少部分克服相关技术中,对象识别场景单一,且只能识别一个对象且通常需要待识别的对象占据整个画面的较大比例才能实现的技术问题。
图5B示意性示出了根据本公开实施例的执行模块的框图。
在该实施例中,该信息处理装置400除了可以包括上文参考图4所对应的实施例中描述的第一获取模块410、识别模块420、第二获取模块430和执行模块440之外,执行模块440还可以包括处理单元521、第二确定单元522和执行单元523。为了描述的简洁起见,这里省略对图4中对应模块的描述。如图5B所示,其中:处理单元521用于对语音信号进行自然语言处理,以得到对应的语义信息。第二确定单元522用于确定与语义信息关联的指定操作。执行单元523用于对指定对象执行指定操作。
通过本公开的实施例,操作指令是语音信号的情况下,对语音信号进行自然语音处理得到语义信息,执行与语义信息关联的指定操作,提高用户体验,并进一步提高了操作指令的适应性。
图5C示意性示出了根据本公开实施例的执行单元的框图。
在该实施例中,该信息处理装置400除了可以包括上文参考图5B所对应的实施例中描述的处理单元521、第二确定单元522和执行单元523之外,执行单元523还可以包括第一确定子单元531和第一执行子单元532。为了描述的简洁起见,这里省略对图5B中对应模块的描述。如图5C所示,其中:第一确定子单元531用于确定是否存在第一应用程序,其中,第一应用程序是预先设定的执行指定操作所针对的应用程序。第一执行子单元532用于在存在第一应用程序的情况下,在第一应用程序中对指定对象执行指定操作。
通过本公开的实施例,若存在预先设定的执行指定操作的第一应用程序,则在该程序中对指定对象执行指定操作,至少部分克服了相关技术中应用场景单一的技术问题,达到扩展应用场景的技术效果。
图5D示意性示出了根据本公开另一实施例的执行单元的框图。
在该实施例中,该信息处理装置400除了可以包括上文参考图5C所对应的实施例中描述的处理单元521、第二确定单元522和执行单元523之外,执行单元523还可以包括第二确定子单元541和第二执行子单元542。为了描述的简洁起见,这里省略对图5C中对应模块的描述。如图5D所示,其中:第二确定子单元541用于在不存在第一应用程序的情况下,确定能够执行指定操作的其他应用程序。第二执行子单元542用于在其他应用程序中对指定对象执行指定操作。
通过本公开的实施例,若不存在预先设定的执行指定操作的第一应用程序,则确定能够执行指定操作的其他应用程序,并在其他应用程序中执行指定操作,至少部分克服了相关技术中应用场景单一的技术问题,达到扩展应用场景的技术效果。
图6示意性示出了根据本公开实施例的适于实现信息处理方法的计算机***的框图。图6示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。该计算机***600可以用于执行参考图2、图3A~图3D描述的信息处理的方法。
具体地,处理器610例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器610还可以包括用于缓存用途的板载存储器。处理器610可以是用于执行参考图2、图3A~图3D描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
可读存储介质620,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体***、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
可读存储介质620可以包括计算机程序621,该计算机程序621可以包括代码/计算机可执行指令,其在由处理器610执行时使得处理器610执行例如上面结合参考图2、图3A~图3D所描述的方法流程及其任何变形。
计算机程序621可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序621中的代码可以包括一个或多个程序模块,例如包括621A、模块621B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器610执行时,使得处理器610可以执行例如上面结合参考图2、图3A~图3D所描述的方法流程及其任何变形。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (10)

1.一种信息处理方法,包括:
获取包含有至少一个待识别对象的预览画面;
对包含在所述预览画面中的所述至少一个待识别对象进行识别,以识别出至少一个对象;
获取外部输入的操作指令,其中,所述操作指令用于指示对识别出的所述至少一个对象中的指定对象执行指定操作;以及
响应于所述操作指令,以对所述指定对象执行所述指定操作。
2.根据权利要求1所述的方法,其中,对包含在所述预览画面中的所述至少一个待识别对象进行识别,以识别出至少一个对象包括:
加载对象识别模型;
获取包含在所述预览画面中的所述至少一个待识别对象的特征参数,其中,所述特征参数用于描述所述至少一个待识别对象的属性特征;
将所述特征参数输入所述对象识别模型,以使所述对象识别模型响应于所述特征参数输出对应的识别结果;以及
基于所述识别结果确定出所述至少一个对象。
3.根据权利要求1所述的方法,其中,所述操作指令包括语音信号,响应于所述操作指令,以对所述指定对象执行所述指定操作包括:
对所述语音信号进行自然语言处理,以得到对应的语义信息;
确定与所述语义信息关联的指定操作;以及
对所述指定对象执行所述指定操作。
4.根据权利要求3所述的方法,其中,对所述指定对象执行所述指定操作包括:
确定是否存在第一应用程序,其中,所述第一应用程序是预先设定的执行所述指定操作所针对的应用程序;以及
若存在所述第一应用程序,则在所述第一应用程序中对所述指定对象执行所述指定操作。
5.根据权利要求4所述的方法,其中,所述方法还包括:
若不存在所述第一应用程序,则确定能够执行所述指定操作的其他应用程序;以及
在所述其他应用程序中对所述指定对象执行所述指定操作。
6.一种信息处理装置,包括:
第一获取模块,用于获取包含有至少一个待识别对象的预览画面;
识别模块,用于对包含在所述预览画面中的所述至少一个待识别对象进行识别,以识别出至少一个对象;
第二获取模块,用于获取外部输入的操作指令,其中,所述操作指令用于指示对识别出的所述至少一个对象中的指定对象执行指定操作;以及
执行模块,用于响应于所述操作指令,以对所述指定对象执行所述指定操作。
7.根据权利要求6所述的装置,其中,所述识别模块包括:
加载单元,用于加载对象识别模型;
获取单元,用于获取包含在所述预览画面中的所述至少一个待识别对象的特征参数,其中,所述特征参数用于描述所述至少一个待识别对象的属性特征;
输入单元,用于将所述特征参数输入所述对象识别模型,以使所述对象识别模型响应于所述特征参数输出对应的识别结果;以及
第一确定单元,用于基于所述识别结果确定出所述至少一个对象。
8.根据权利要求6所述的装置,其中,所述执行模块包括:
处理单元,用于对所述语音信号进行自然语言处理,以得到对应的语义信息;
第二确定单元,用于确定与所述语义信息关联的指定操作;以及
执行单元,用于对所述指定对象执行所述指定操作。
9.根据权利要求8所述的装置,其中,所述执行单元包括:
第一确定子单元,用于确定是否存在第一应用程序,其中,所述第一应用程序是预先设定的执行所述指定操作所针对的应用程序;以及
第一执行子单元,用于在存在所述第一应用程序的情况下,在所述第一应用程序中对所述指定对象执行所述指定操作。
10.根据权利要求9所述的装置,其中,所述执行单元还包括:
第二确定子单元,用于在不存在所述第一应用程序的情况下,确定能够执行所述指定操作的其他应用程序;以及
第二执行子单元,用于在所述其他应用程序中对所述指定对象执行所述指定操作。
CN201711134979.1A 2017-11-15 2017-11-15 信息处理方法及其装置 Pending CN107944954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711134979.1A CN107944954A (zh) 2017-11-15 2017-11-15 信息处理方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711134979.1A CN107944954A (zh) 2017-11-15 2017-11-15 信息处理方法及其装置

Publications (1)

Publication Number Publication Date
CN107944954A true CN107944954A (zh) 2018-04-20

Family

ID=61931337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711134979.1A Pending CN107944954A (zh) 2017-11-15 2017-11-15 信息处理方法及其装置

Country Status (1)

Country Link
CN (1) CN107944954A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144306A (zh) * 2019-12-27 2020-05-12 联想(北京)有限公司 信息处理方法、信息处理装置和信息处理***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和***
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN105593847A (zh) * 2013-06-05 2016-05-18 弗瑞莎伯公司 用于智能购物的方法和设备
CN106162355A (zh) * 2015-04-10 2016-11-23 北京云创视界科技有限公司 视频交互方法及终端
CN106412229A (zh) * 2015-07-28 2017-02-15 阿里巴巴集团控股有限公司 用于移动终端的交互方法、装置和移动终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和***
CN105593847A (zh) * 2013-06-05 2016-05-18 弗瑞莎伯公司 用于智能购物的方法和设备
CN106162355A (zh) * 2015-04-10 2016-11-23 北京云创视界科技有限公司 视频交互方法及终端
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN106412229A (zh) * 2015-07-28 2017-02-15 阿里巴巴集团控股有限公司 用于移动终端的交互方法、装置和移动终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁爱萍主编: "《物联网导论》", 31 March 2017, 西安电子科技大学出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144306A (zh) * 2019-12-27 2020-05-12 联想(北京)有限公司 信息处理方法、信息处理装置和信息处理***

Similar Documents

Publication Publication Date Title
US10747991B2 (en) People stream analysis method, people stream analysis apparatus, and people stream analysis system
KR101729938B1 (ko) 통합 영상 검색 시스템 및 그 서비스 방법
JP5319828B1 (ja) 物品推定システム、物品推定方法、及び物品推定プログラム
US20130181054A1 (en) System and method for processing bar-code enabled cards
CN109040461A (zh) 一种基于对象识别的业务处理方法和装置
CN110249304A (zh) 电子设备的视觉智能管理
TWI586160B (zh) 利用行動電話及雲端可視化搜尋引擎之即時物體掃描
US20190179848A1 (en) Method and system for identifying pictures
CN105117399B (zh) 一种图像搜索方法和装置
CN108197621A (zh) 企业信息获取方法及***和信息处理方法及***
JP2018128955A (ja) スクリーンショット画像解析装置、スクリーンショット画像解析方法、およびプログラム
CN107748879A (zh) 用于获取人脸信息的方法及装置
CN107708080A (zh) 数据处理方法和电子设备
JPWO2018066102A1 (ja) 情報提供システム、情報提供装置、情報提供方法、及びプログラム
KR20160106649A (ko) 증강 현실 스킨의 평가
KR101784287B1 (ko) 통합 영상 검색 시스템 및 그 서비스 방법
CN105956092B (zh) 一种应用于电子终端的试题搜索方法和装置
CN107944954A (zh) 信息处理方法及其装置
JP7468508B2 (ja) 情報処理装置、情報処理方法、プログラム、および情報処理システム
US20170061643A1 (en) User terminal, object recognition server, and method for notification
WO2019134501A1 (zh) 模拟用户试装的方法、装置、存储介质及移动终端
CN109948072A (zh) 店铺搜索信息的处理方法、装置及设备
CN108121969A (zh) 用于处理图像的方法和装置
US11659273B2 (en) Information processing apparatus, information processing method, and non-transitory storage medium
CN112329841A (zh) 图像处理方法、装置、电子设备、计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420

RJ01 Rejection of invention patent application after publication