CN111159442A - 基于语音的图片搜索***、方法、介质及设备 - Google Patents

基于语音的图片搜索***、方法、介质及设备 Download PDF

Info

Publication number
CN111159442A
CN111159442A CN201911373540.3A CN201911373540A CN111159442A CN 111159442 A CN111159442 A CN 111159442A CN 201911373540 A CN201911373540 A CN 201911373540A CN 111159442 A CN111159442 A CN 111159442A
Authority
CN
China
Prior art keywords
picture
mobile terminal
voice
search
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911373540.3A
Other languages
English (en)
Inventor
时红仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qinggan Intelligent Technology Co Ltd
Original Assignee
Shanghai Qinggan Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qinggan Intelligent Technology Co Ltd filed Critical Shanghai Qinggan Intelligent Technology Co Ltd
Priority to CN201911373540.3A priority Critical patent/CN111159442A/zh
Publication of CN111159442A publication Critical patent/CN111159442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于语音的图片搜索***、方法、介质及设备,所述基于语音的图片搜索***包括:车机端和移动终端,所述车机端与所述移动终端通信连接;所述车机端用于接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至所述移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;所述移动终端用于接收所述车机端发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端。本发明可通过车机端自动检测用户的语音并识别谈话场景,将移动终端自动搜索的图片显示于车机端,通过车机端与移动终端之间的交互提高了用户在车内的无感体验,实现了图片的无感搜索。

Description

基于语音的图片搜索***、方法、介质及设备
技术领域
本发明属于图片搜索领域,涉及一种图片的语音搜索方法,特别是涉及一种基于语音的图片搜索***、方法、介质及设备。
背景技术
随着人们生活内容的丰富,人们总是希望能通过拍摄的照片留住美好的记忆,由此,用户通过移动设备拍摄的照片越来越多,基于庞大的数据存储下也带来了另一个问题,用户在搜索自己想要的照片时需要浏览大量的照片之后才能找到,花费了大量的时间,影响用户浏览照片的心情。
目前,有些移动终端已经可以实现语音搜索图片,给用户检索照片带来了一定的便利,但不够灵活,仅能通过简单的词语识别机械式的执行搜索命令,而且并不准确,有时搜索的图片与用户所想要的并不一致或匹配度并不高,而且并未实现通过车机端以及移动终端交互的方式进行图片的搜索。
因此,如何提供一种基于语音的图片搜索***、方法、介质及设备,以解决现有技术无法通过车机端与移动终端交互的方式实现车内用户的图片搜索等缺陷,成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于语音的图片搜索***、方法、介质及设备,用于解决现有技术无法通过车机端与移动终端交互的方式实现车内用户的图片搜索的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种基于语音的图片搜索***,所述基于语音的图片搜索***包括:车机端和移动终端,所述车机端与所述移动终端通信连接;所述车机端用于接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至所述移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;所述移动终端用于接收所述车机端发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端。
本发明另一方面提供一种基于语音的图片搜索方法,所述基于语音的图片搜索方法包括:接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;其中,所述移动终端反馈的图片为所述移动终端根据所述搜索关键字/词检索的与之匹配的图片。
于本发明的一实施例中,所述接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词的步骤包括:将接收的用户的语音指令转换为语义对应的文字内容;根据预设的关键词数据库对所述文字内容进行语义识别;提取所述文字内容中出现的且包含于所述关键词数据库中的字或词语,作为搜索关键字/词。
于本发明的一实施例中,所述图片预存于所述移动终端中,包含有至少一个标签;所述移动终端根据所述搜索关键字/词检索与之匹配的图片的步骤包括:逐一在每张所述图片的标签中检索所述搜索关键字/词;提取所述标签中包含有所述搜索关键字/词的图片,并形成一图片集。
于本发明的一实施例中,所述待接收到所述移动终端反馈的图片后,予以显示该图片的步骤包括:接收所述图片集的图片;从所述图片集的所有的所述图片中选择其中一张所述图片作为显示首页,以供用户依次浏览。
于本发明的一实施例中,所述接收所述图片集的图片的步骤包括:若所述图片集的图片经所述移动终端上传云端,通过车机端从所述云端下载所述图片集的图片;或若所述图片集的图片未经所述移动终端上传云端,通过所述车机端与所述移动终端的无线通信进行所述图片集的图片同步。
于本发明的一实施例中,所述图片的标签为文字标签和/或语音标签;所述图片的标签包括物品名称、地址名称、人物、场景名称和/或纪念日期及纪念事件名称。
于本发明的一实施例中,所述图片包含多个所述标签时,通过其中一个所述标签中出现的对应的搜索关键字/词检索所述图片;或通过多个所述标签中出现的对应的搜索关键字/词的结合来检索所述图片。
本发明又一方面提供一种介质,其上存储有计算机程序,该程序被处理器执行时实现所述基于语音的图片搜索方法。
本发明最后一方面提供一种设备,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述设备执行如所述基于语音的图片搜索方法。
如上所述,本发明所述的基于语音的图片搜索***、方法、介质及设备,具有以下有益效果:
通过车机端接收并识别用户的语音指令可实现智能地从用户在车内的谈话中提取搜索关键词,实现无感的照片搜索;通过车机端将所述搜索关键字/词发送至移动终端丰富了车机端与移动终端之间的交互,提升了用户在车内的情感体验,使得车内用户在聊天或与人谈话时车载显示屏的图片自动显示与谈话场景匹配的图片,让用户的回忆需求得到即时满足,并通过实时、现场的方式将匹配的图片呈现出来分享给车内其他乘员。
附图说明
图1显示为本发明的基于语音的图片搜索***于一实施例中的应用场景架构图。
图2显示为本发明的基于语音的图片搜索方法于一实施例中的原理流程图。
图3显示为本发明的基于语音的图片搜索方法于一实施例中的识别流程图。
图4显示为本发明的基于语音的图片搜索方法于一实施例中的显示流程图。
图5显示为本发明的基于语音的图片搜索方法于一实施例中的图片接收流程图。
图6显示为本发明的基于语音的图片搜索方法于一实施例中的球场图片场景示意图。
图7显示为本发明的基于语音的图片搜索方法于一实施例中的球场图片搜索流程图。
元件标号说明
1 基于语音的图片搜索***
11 车机端
12 移动终端
S21~S22 步骤
S211~S213 步骤
S221~S222 步骤
S221A~S221B 步骤
S71~S74 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明所述基于语音的图片搜索***、方法、介质及设备的技术原理如下:接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;其中,所述移动终端反馈的图片为所述移动终端根据所述搜索关键字/词检索的与之匹配的图片。
实施例一
本实施例提供一种基于语音的图片搜索***,所述基于语音的图片搜索***包括:车机端和移动终端,所述车机端与所述移动终端通信连接;
所述车机端用于接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至所述移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;
所述移动终端用于接收所述车机端发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端。
以下将结合图示对本实施例所提供的基于语音的图片搜索***进行详细描述。需要说明的是,应理解以下***的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如:某一模块可以为单独设立的处理元件,也可以集成在下述***的某一个芯片中实现。此外,某一模块也可以以程序代码的形式存储于下述***的存储器中,由下述***的某一个处理元件调用并执行以下某一模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以下各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
以下这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),一个或多个数字信号处理器(Digital Singnal Processor,简称DSP),一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。当以下某个模块通过处理元件调用程序代码的形式实现时,该处理元件可以是通用处理器,如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。这些模块可以集成在一起,以片上***(System-on-a-chip,简称SOC)的形式实现。
请参阅图1,显示为本发明的基于语音的图片搜索***于一实施例中的应用场景架构图。如图1所示,所述基于语音的图片搜索***1包括:车机端11和移动终端12。所述车机端11与所述移动终端12通信连接。用户进入所述车机端11后,所述车机端11自动检测用户与其他乘员的谈话内容,将该谈话内容作为语音指令,并由语音指令中提取搜索关键字/词,将搜索关键字/词发送至所述移动终端12,使得所述移动终端12据此反馈匹配的照片。
所述车机端11用于接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至所述移动终端12;待接收到所述移动终端12反馈的图片后,予以显示该图片。
在本实施例中,所述车机端11包括转换模块、语义识别模块、提取模块和搜索词发送模块。所述转换模块用于将接收的用户的语音指令转换为语义对应的文字内容;所述语义识别模块用于根据预设的关键词数据库对所述文字内容进行语义识别;所述提取模块用于提取所述文字内容中出现的且包含于所述关键词数据库中的字或词语,作为搜索关键字/词;所述搜索词发送模块用于将所述搜索关键字/词发送至所述移动终端。
所述移动终端12用于接收所述车机端11发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端11。
在本实施例中,所述图片预存于所述移动终端中,包含有至少一个标签。所述图片的标签为文字标签和/或语音标签;所述图片的标签包括物品名称、地址名称、人物、场景名称和/或纪念日期及纪念事件名称。所述移动终端12包括检索模块、图片提取模块和图片发送模块。所述检索模块用于逐一在每张所述图片的标签中检索所述搜索关键字/词;所述图片提取模块用于提取所述标签中包含有所述搜索关键字/词的图片,并形成一图片集;所述图片发送模块用于将该图片反馈至车机端。
本实施例所述基于语音的图片搜索***通过车机端自动检测用户的语音并识别谈话场景,将移动终端自动搜索的图片显示于车机端,通过车机端与移动终端之间的交互提高了用户在车内的无感体验,实现了图片的无感搜索。
实施例二
本实施例提供一种基于语音的图片搜索方法,所述基于语音的图片搜索方法包括:
接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至移动终端;
待接收到所述移动终端反馈的图片后,予以显示该图片;其中,所述移动终端反馈的图片为所述移动终端根据所述搜索关键字/词检索的与之匹配的图片。
以下将结合图示对本实施例所提供的基于语音的图片搜索方法进行详细描述。请参阅图2,显示为本发明的基于语音的图片搜索方法于一实施例中的原理流程图。如图2所示,所述基于语音的图片搜索方法应用于上述实施例一所述的车机端与移动终端构成的搜索***中,具体包括以下几个步骤:
S21,接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至移动终端。
具体地,所述语音指令包括用户明确给出的带搜索指示的语音内容,例如“搜索家庭照片”、“显示出国旅游的图片”;还包括车内用户正常谈话的内容,例如“我家中刚置办了一套沙发”、“我去年出国旅游玩得很开心”,通过所述车机端接收上述语音内容,将其作为语音指令,从该语音指令中提取搜索关键字/词。例如,从“我去年出国旅游玩得很开心”这一谈话内容中提取“去年”、“出国”和/或“旅游”作为搜索关键字/词。
请参阅图3,显示为本发明的基于语音的图片搜索方法于一实施例中的识别流程图。如图3所示,S21包括:
S211,将接收的用户的语音指令转换为语义对应的文字内容。
具体地,通过所述车机端将接收到的“显示出国旅游的图片”的语音转换为对应的文字内容,以便通过文字检索和文字匹配进行识别。
S212,根据预设的关键词数据库对所述文字内容进行语义识别。
具体地,所述预设的关键词数据库中预存有若干个带有标志性的字或词,例如去年、家庭、出国、工作、旅游、美食、结婚纪念日、我、老婆、儿子等词语。
S213,提取所述文字内容中出现的且包含于所述关键词数据库中的字或词语,作为搜索关键字/词。
具体地,上述“显示出国旅游的图片”的内容中出现在预设的关键词数据库中的有“出国”和“旅游”,由此,将“出国”和“旅游”作为搜索关键词。
S22,待接收到所述移动终端反馈的图片后,予以显示该图片;其中,所述移动终端反馈的图片为所述移动终端根据所述搜索关键字/词检索的与之匹配的图片。
在本实施例中,所述图片经过编辑后预存于所述移动终端中,包含有至少一个标签;通过所述移动终端逐一在每张所述图片的标签中检索所述搜索关键字/词;提取所述标签中包含有所述搜索关键字/词的图片,并形成一图片集。
具体地,所述图片的编辑包括图片的色调、大小调整以及通过标签的方式标注图片。所述标签可以是字词或一句话,例如“这次出国旅游看到了埃菲尔铁塔”或“实现了今年的一个愿望”。
具体地,所述图片的标签为文字标签和/或语音标签;所述图片的标签包括物品名称、地址名称、人物、场景名称和/或纪念日期及纪念事件名称,所述图片的标签还包括从所述图片中根据图像识别提取的信息,例如“风景、食物、人物、物品或建筑”等。
进一步地,所述图片包含多个所述标签时,通过其中一个所述标签中出现的对应的搜索关键字/词检索所述图片;或通过多个所述标签中出现的对应的搜索关键字/词的结合检索所述图片。所述搜索关键字/词为所述标签中具有标识性的、可以表明所述图片搜索属性的字或短语。
于本实施例的一实际应用中,一张出国旅游的图片若包含标签1“这次出国旅游看到了埃菲尔铁塔”和标签2“实现了今年的一个愿望”,所述移动终端可通过“出国”这一搜索关键词搜索到该图片,也可以通过“去年”这一搜索关键词搜索到该图片。所述移动终端可结合用户发出语音的时间、标签标注的时间并结合万年历推算应该检索今年、去年或前年的照片。
请参阅图4,显示为本发明的基于语音的图片搜索方法于一实施例中的显示流程图。如图4所示,S22包括:
S221,接收所述图片集的图片。
具体地,所述车机端所接收的图片可能不止一张,而是多张符合检索条件的图片构成的图片集。
请参阅图5,显示为本发明的基于语音的图片搜索方法于一实施例中的图片接收流程图。
如图5所示,S221包括:
S221A,若所述图片集的图片经所述移动终端上传云端,通过所述车机端从所述云端下载所述图片集的图片。
于本实施例的一实际应用中,所述移动终端将检索的图片通过分享接口上传云端,待所述车机端与云端关联之后,与云端进行指令认证或通信匹配后从云端下载所述图片集的图片。
S221B,若所述图片集的图片未经所述移动终端上传云端,通过所述车机端与所述移动终端的无线通信进行所述图片集的图片同步。
于本实施例的一实际应用中,所述移动终端可通过蓝牙通信将检索到的图片集传送至所述车机端。
S222,从所述图片集的所有的所述图片中选择其中一张所述图片作为显示首页,以供用户依次浏览。
具体地,若图片集的图片较多时,所述车机端的车载显示屏受显示能力的限制,不能将所有图片进行一次性显示,或显示一张图片或显示两张等较少数量的照片,用户通过车载显示屏的触控操作进行依次浏览。
本实施例提供一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述基于语音的图片搜索方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的计算机可读存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的计算机存储介质。
于实际应用中,本实施例提供的基于语音的图片搜索方法,将球场图片作为一具体实施案例。
请参阅图6,显示为本发明的基于语音的图片搜索方法于一实施例中的球场图片场景示意图。如图6所示,所述车机端接收用户的语音指令提取到第一搜索关键词“儿子”,提取到第二搜索关键词“比赛”,提取到第三搜索关键词“球场”。所述移动终端根据上述搜索关键词进行检索之后反馈图片A。所述第一搜索关键词、第二搜索关键词和第三搜索关键词可以只使用其中一个进行图片搜索,此时,因限定条件较少,所以搜索的图片较多;也可以同时使用进行图片搜索,此时,限定条件较多,所以搜索的图片较少,甚至可以直接定位至某一张特定的图片。
具体地,请参阅图7,显示为本发明的基于语音的图片搜索方法于一实施例中的球场图片搜索流程图。如图7所示,球场图片呈现了用户的儿子在高尔夫球场进行比赛的场景,其搜索步骤包括:
S71,接收并识别用户的语音指令“我的儿子在高尔夫球场比赛得了第一名”。
具体地,用户为一男孩的妈妈,下班时同事搭乘顺风车时,男孩的妈妈与该同事正在聊天,并说道“我的儿子在高尔夫球场比赛得了第一名”。
S72,从所述语音指令中提取“儿子、比赛、球场”作为所述搜索关键字/词,将所述搜索关键字/词发送至所述移动终端。
具体地,通过所述车机端检测到该句话的内容“我的儿子在高尔夫球场比赛得了第一名”,并从中提取出“儿子、比赛、球场”发送至所述移动终端。
S73,接收所述车机端发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端。
具体地,通过男孩妈妈使用的移动终端接收“儿子、比赛、球场”的搜索关键词,结合图6所示球场图片A的三个标签:标签1-帅气的儿子,标签2-儿子的比赛,标签3-高尔夫球场。找到搜索关键词与三个标签的交集为“儿子、比赛、球场”,由此搜索到球场图片A。所述移动终端默认家属关系为男孩妈妈的家属关系,即“儿子”则判定为正在讲话的妈妈的儿子。此外,所述车机端也可将“我”作为另一搜索关键字发送至所述移动终端,所述移动终端通过预存的人物特征或绑定的人物信息对“我”进行人物识别。
S74,待接收到所述移动终端反馈的图片后,予以显示用户的儿子在高尔夫球场打比赛的图片。
本实施例所述基于语音的图片搜索方法通过车机端自动检测用户的语音并识别谈话场景,将移动终端自动搜索的图片显示于车机端,通过车机端与移动终端之间的交互提高了用户在车内的无感体验,实现了图片的无感搜索。
实施例三
本实施例提供一种设备,所述设备包括:处理器、存储器、收发器、通信接口或/和***总线;存储器和通信接口通过***总线与处理器和收发器连接并完成相互间的通信,存储器用于存储计算机程序,通信接口用于和其他设备进行通信,处理器和收发器用于运行计算机程序,使所述设备执行所述基于语音的图片搜索方法的各个步骤。
上述提到的***总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该***总线可以分为地址总线、数据总线、控制总线等。通信接口用于实现数据库访问装置与其他设备(如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(扫描应用程序licationSpecific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明所述的基于语音的图片搜索方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
本发明还提供一种基于语音的图片搜索***,所述基于语音的图片搜索***可以实现本发明所述的基于语音的图片搜索方法,但本发明所述的基于语音的图片搜索方法的实现装置包括但不限于本实施例列举的基于语音的图片搜索***的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
综上所述,本发明所述基于语音的图片搜索***、方法、介质及设备通过车机端接收并识别用户的语音指令可实现智能地从用户在车内的谈话中提取搜索关键词,实现无感的照片搜索;通过车机端将所述搜索关键字/词发送至移动终端丰富了车机端与移动终端之间的交互,提升了用户在车内的情感体验,使得车内用户在聊天或与人谈话时车载显示屏的图片自动显示与谈话场景匹配的图片,让用户的回忆需求得到即时满足,并通过实时、现场的方式将匹配的图片呈现出来分享给车内其他乘员。本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种基于语音的图片搜索***,其特征在于,所述基于语音的图片搜索***包括:车机端和移动终端,所述车机端与所述移动终端通信连接;
所述车机端用于接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至所述移动终端;待接收到所述移动终端反馈的图片后,予以显示该图片;
所述移动终端用于接收所述车机端发送的搜索关键字/词,根据所述搜索关键字/词检索与之匹配的图片,并将该图片反馈至车机端。
2.一种基于语音的图片搜索方法,其特征在于,所述基于语音的图片搜索方法包括:
接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词,将所述搜索关键字/词发送至移动终端;
待接收到所述移动终端反馈的图片后,予以显示该图片;其中,所述移动终端反馈的图片为所述移动终端根据所述搜索关键字/词检索的与之匹配的图片。
3.根据权利要求2所述的基于语音的图片搜索方法,其特征在于,所述接收并识别用户的语音指令,从所述语音指令中提取搜索关键字/词的步骤包括:
将接收的用户的语音指令转换为语义对应的文字内容;
根据预设的关键词数据库对所述文字内容进行语义识别;
提取所述文字内容中出现的且包含于所述关键词数据库中的字或词语,作为搜索关键字/词。
4.根据权利要求2所述的基于语音的图片搜索方法,其特征在于,所述图片预存于所述移动终端中,包含有至少一个标签;所述移动终端根据所述搜索关键字/词检索与之匹配的图片的步骤包括:
逐一在每张所述图片的标签中检索所述搜索关键字/词;
提取所述标签中包含有所述搜索关键字/词的图片,并形成一图片集。
5.根据权利要求4所述的基于语音的图片搜索方法,其特征在于,所述待接收到所述移动终端反馈的图片后,予以显示该图片的步骤包括:
接收所述图片集的图片;
从所述图片集的所有的所述图片中选择其中一张所述图片作为显示首页,以供用户依次浏览。
6.根据权利要求5所述的基于语音的图片搜索方法,其特征在于,所述接收所述图片集的图片的步骤包括:
若所述图片集的图片经所述移动终端上传云端,通过车机端从所述云端下载所述图片集的图片;或
若所述图片集的图片未经所述移动终端上传云端,通过所述车机端与所述移动终端的无线通信进行所述图片集的图片同步。
7.根据权利要求4所述的基于语音的图片搜索方法,其特征在于,
所述图片的标签为文字标签和/或语音标签;
所述图片的标签包括物品名称、地址名称、人物、场景名称和/或纪念日期及纪念事件名称。
8.根据权利要求7所述的基于语音的图片搜索方法,其特征在于,
所述图片包含多个所述标签时,通过其中一个所述标签中出现的对应的搜索关键字/词检索所述图片;或通过多个所述标签中出现的对应的搜索关键字/词的结合来检索所述图片。
9.一种介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求2至8中任一项所述基于语音的图片搜索方法。
10.一种设备,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述设备执行如权利要求2至8中任一项所述基于语音的图片搜索方法。
CN201911373540.3A 2019-12-27 2019-12-27 基于语音的图片搜索***、方法、介质及设备 Pending CN111159442A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911373540.3A CN111159442A (zh) 2019-12-27 2019-12-27 基于语音的图片搜索***、方法、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911373540.3A CN111159442A (zh) 2019-12-27 2019-12-27 基于语音的图片搜索***、方法、介质及设备

Publications (1)

Publication Number Publication Date
CN111159442A true CN111159442A (zh) 2020-05-15

Family

ID=70556970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911373540.3A Pending CN111159442A (zh) 2019-12-27 2019-12-27 基于语音的图片搜索***、方法、介质及设备

Country Status (1)

Country Link
CN (1) CN111159442A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289339A (zh) * 2020-06-04 2021-01-29 郭亚力 一种将语音转化为画面的***
CN112579868A (zh) * 2020-12-23 2021-03-30 北京百度网讯科技有限公司 多模态识图搜索方法、装置、设备以及存储介质
CN115966206A (zh) * 2022-11-23 2023-04-14 中创科技(广州)有限公司 Ai语音识别的智能图片生成方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868360A (zh) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 基于语音识别的内容推荐方法及装置
CN105978701A (zh) * 2016-05-11 2016-09-28 惠州市凯越电子有限公司 车载***与智能移动终端自建频道的信息交互***及方法
CN108257610A (zh) * 2016-12-27 2018-07-06 乐视汽车(北京)有限公司 一种车机及对应的语音传输方法及***
CN109710796A (zh) * 2019-01-14 2019-05-03 Oppo广东移动通信有限公司 基于语音的图片搜索方法、装置、存储介质及终端
CN109933681A (zh) * 2019-03-19 2019-06-25 深圳Tcl新技术有限公司 图片搜索方法、装置和计算机可读存储介质
CN109979036A (zh) * 2019-04-03 2019-07-05 深圳市海圳汽车技术有限公司 具有记录仪控制和语音识别控制的***及控制方法、记录仪

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868360A (zh) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 基于语音识别的内容推荐方法及装置
CN105978701A (zh) * 2016-05-11 2016-09-28 惠州市凯越电子有限公司 车载***与智能移动终端自建频道的信息交互***及方法
CN108257610A (zh) * 2016-12-27 2018-07-06 乐视汽车(北京)有限公司 一种车机及对应的语音传输方法及***
CN109710796A (zh) * 2019-01-14 2019-05-03 Oppo广东移动通信有限公司 基于语音的图片搜索方法、装置、存储介质及终端
CN109933681A (zh) * 2019-03-19 2019-06-25 深圳Tcl新技术有限公司 图片搜索方法、装置和计算机可读存储介质
CN109979036A (zh) * 2019-04-03 2019-07-05 深圳市海圳汽车技术有限公司 具有记录仪控制和语音识别控制的***及控制方法、记录仪

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289339A (zh) * 2020-06-04 2021-01-29 郭亚力 一种将语音转化为画面的***
CN112579868A (zh) * 2020-12-23 2021-03-30 北京百度网讯科技有限公司 多模态识图搜索方法、装置、设备以及存储介质
CN112579868B (zh) * 2020-12-23 2024-06-04 北京百度网讯科技有限公司 多模态识图搜索方法、装置、设备以及存储介质
CN115966206A (zh) * 2022-11-23 2023-04-14 中创科技(广州)有限公司 Ai语音识别的智能图片生成方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US20190012334A1 (en) Architecture for Responding to Visual Query
CA2770186C (en) User interface for presenting search results for multiple regions of a visual query
US9087059B2 (en) User interface for presenting search results for multiple regions of a visual query
US8326879B2 (en) System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
US8874596B2 (en) Image processing system and method
CN111159442A (zh) 基于语音的图片搜索***、方法、介质及设备
CN101971262A (zh) 用于播放图片的方法和设备
CN107111618B (zh) 将图像的缩略图链接到网页
CN101853297A (zh) 一种在电子设备中快速获得期望图像的方法
WO2016000536A1 (zh) 一种激活应用程序的方法、用户终端和服务器
US20150371629A9 (en) System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
CN104090878B (zh) 一种多媒体查找方法、终端、服务器及***
CN115129806A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN106886762B (zh) 一种连结信息的***方法、设备及***
CN115022712B (zh) 视频处理方法、装置、设备以及存储介质
TWI438636B (zh) 一種在電子設備中進行圖像檢索的方法
AU2016200659B2 (en) Architecture for responding to a visual query

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination