CN104412606A - 内容重放控制装置、内容重放控制方法和程序 - Google Patents

内容重放控制装置、内容重放控制方法和程序 Download PDF

Info

Publication number
CN104412606A
CN104412606A CN201380034857.9A CN201380034857A CN104412606A CN 104412606 A CN104412606 A CN 104412606A CN 201380034857 A CN201380034857 A CN 201380034857A CN 104412606 A CN104412606 A CN 104412606A
Authority
CN
China
Prior art keywords
content
playback control
listener
language
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380034857.9A
Other languages
English (en)
Inventor
涩谷贵史
柴田克幸
吉野研
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Publication of CN104412606A publication Critical patent/CN104412606A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41415Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance involving a public display, viewable by several users in a public space outside their home, e.g. movie theatre, information kiosk
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42201Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] biosensors, e.g. heat sensor for presence detection, EEG sensors or any limb activity sensors worn by the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Neurosurgery (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种内容重放控制装置(100),包括:用于获取作为内容提供目标的收听者的属性的获取单元(106,107,108);用于在所述获取单元获取的收听者的属性的基础上确定重放内容时的语言的确定单元(112);以及用于通过由所述确定单元确定的确定语言的音频来重放所述内容的重放控制单元(112)。

Description

内容重放控制装置、内容重放控制方法和程序
技术领域
本发明涉及内容重放控制装置、内容重放控制方法及其程序。
背景技术
在向听众呈现广告内容等内容时,为了使人印象更加深刻,有人设想出了这样一种技术手段,其将内容视频投影到按照人的形状形成的屏幕上,所述内容视频具有与屏幕轮廓匹配的形状,例如,如专利文献1所公开的发明当中所述。
引文列表
专利文献
专利文献1:未审查日本专利申请Kokai公开No.2011-150221
发明内容
技术问题
上文所述的专利文献1中公开的技术用于通过某种语言将准备好的内容向收听者播报,但是对于无法理解该内容的语言的收听者而言难以理解该内容正在说明什么信息。
考虑到上述内容,本发明的目的在于提供一种内容重放控制装置、一种内容重放控制方法以及用于其的程序,它们用于识别出收听者可理解的语言并采用收听者可理解的语言通过一种易于理解的方法重放内容。
问题解决方案
本发明的第一方面是一种用于控制内容的重放的内容重放控制装置,其包括:获取单元,所述获取单元用于获取作为内容提供目标的收听者的属性;确定单元,所述确定单元用于基于由所述获取单元获取的所述收听者的所述属性来确定重放内容时的语言;以及重放控制单元,用于通过由所述确定单元确定的确定语言的音频来重放所述内容。
本发明的第二方面是一种用于控制内容的重放的内容重放控制方法,其包括:获取步骤,所述获取步骤用于获取作为内容提供目标的收听者的属性;确定步骤,所述确定步骤用于基于由所述获取步骤获取的所述收听者的所述属性来确定重放内容时的语言;以及重放控制步骤,所述重放控制步骤用于通过由所述确定步骤确定的所述确定语言的音频来重放所述内容。
本发明的第三方面是一种由计算机执行的程序,在所述计算机中构建有用于控制内容的重放的装置,所述程序使得所述计算机作为以下单元起作用:获取单元,所述获取单元用于获取作为内容提供目标的收听者的属性;确定单元,所述确定单元用于基于由所述获取单元获取的所述收听者的所述属性来确定重放内容时的语言;以及重放控制单元,用于通过由所述确定单元确定的确定语言的音频来重放所述内容。
本发明的有利效果
采用本发明能够提供一种内容重放控制装置、一种内容重放控制方法以及用于其的程序,它们用于识别收听者可理解的语言,并采用收听者可理解的语言以易于理解的方式重放内容。
附图说明
图1是说明一种包括用于根据本发明的一个实施例的内容重放控制装置的***的使用条件的概括图。
图2是说明根据实施例的内容重放控制装置的功能的概要构成的方框图。
图3是示出了根据实施例的内容重放控制装置的动作的处理内容的流程图。
图4A是在根据实施例的内容重放控制装置的存储装置中所准备的人种-语言表的例子。
图4B是在根据实施例的内容重放控制装置的存储装置中所准备的国籍-语言表的例子。
图5是说明根据实施例的内容重放控制装置的动作中的、重放内容准备处理的流程图。
图6是说明根据实施例的内容重放控制装置的动作中的、在存在对应于确定语言的内容的情况下、选择对应于确定语言的重放内容的动作概念的图示。
图7是说明根据实施例的内容重放控制装置的动作中的、在不存在对应于确定语言的内容的情况下、转换成对应于确定语言的重放内容的动作概念的图示。
具体实施方式
下文将参考附图描述根据本发明的一个实施例的内容重放控制装置。图1是说明一种包括根据本发明的实施例的内容重放控制装置100的***的使用条件的概括图。
如图1所示,内容重放控制装置100连接至作为例如采用无线通信和/或类似手段的内容供应装置的服务器200,服务器200连接至作为内容视频重放装置的投影仪300。将屏幕310设置到这投影仪300的输出光照射方向一侧。投影仪300在接收到服务器200提供的内容之后通过输出光将人图像视频320作为内容视频投影到例如屏幕310上
内容重放控制装置100设置有麦克风107和扬声器110。内容重放控制装置100通过这一麦克风107识别收听者谈话的声音(音频)并由识别出的音频确定谈话中采用的语言。此外,内容重放控制装置100从服务器200上记录的音频内容中搜索采用确定语言的内容,并采用扬声器110将使用这一语言的内容作为音频提供给收听者(下文将对此予以详细描述)。
服务器200存储图像内容和音频内容。此外,服务器200基于来自内容重放控制装置100的命令将内容提供给投影仪300和内容重放控制装置100。
例如,投影仪300是采用DMD(数字微镜装置)的DLP(数字光处理)(注册商标)类型的数字投影仪,并且是一种显示元件,其通过以高速单独开启/关闭多个,例如,XGA(扩展图形阵列,1024像素宽×768像素高)数量的按照阵列布置的微镜的显示操作通过由其反射的光形成光学图像。
屏幕310由树脂板形成,其被切割为取得投影内容的形状。将背面投影型的投影仪的屏幕膜片固着到投影表面上,其具有充当背面投影的屏幕的功能。借助这一屏幕膜片即使在正午或者明亮室内的亮度下也有可能利用具有高光度和高对比度性能的膜片在视觉上确认投影到屏幕上的内容。
接下来,将参考图2说明根据实施例的内容重放控制装置100的概括性功能构成。
在图2中,附图标记112是指中央控制单元(CPU)。该CPU112控制内容重放控制装置100的所有动作。
该CPU112直接连接至存储装置114。存储装置114存储总控制程序114A、人种-语言表114B以及音频合成资料数据114C和/或类似信息,还包括工作区114D。
总控制程序114A包括由CPU 112运行的动作程序以及各种类型的常规数据等等。
人种/国籍语言表114B是指示对应于所确定的收听者人种/国籍的语言之间的关系的表格(下文将对此予以详细描述)。音频合成资料数据114C是用于内容的文本数据的创建当中采用的音频合成资料的数据,所述文本数据将被转换成语言,从而称为具有适当格式的音频文件(下文将对此予以详细描述)。工作数据区114D起着用于CPU 112的工作内存的作用。
CPU 112读取存储在上述存储装置114内的程序和格式数据等,并通过在工作区114D上对其进行展开并运行所述程序而将内容重放控制装置100作为整体加以控制。
上述CPU 112还连接至操作器103。操作器103接收来自未表示出的遥控器等的按键操作信号,并将这一按键操作信号提供给CPU 112。CPU 112根据来自操作器103的操作信号执行各种操作,例如,打开电源、切换模式等。
前述CPU 112还连接至显示装置104。显示装置104显示对应于来自操作器103的操作信号的各种操作状态等。
前述CPU 112还连接至通信器101和内容输入装置102。通信器101(例如)在来自CPU 112的命令的基础上采用无线通信向服务器200发送搜索命令等,以搜索在内容供应装置200中是否有希望得到的内容。自然地,采用有线通信向服务器200发送内容搜索命令等也是优选的。内容输入装置102通过无线通信或有线通信接收服务器200提供的内容,并将这一内容传送至CPU 112。
上述CPU 112还连接至存在传感器105、音频输入装置106、音频输出装置109和视频输出装置111。存在传感器105是(例如)红外传感器等,它是用于感测收听者是否处于内容重放控制装置100前面的规定范围内的传感器。在来自存在传感器105的探测输出至少与预设阈值一样大时,CPU112确定收听者处于内容重放控制装置100前面的规定范围内。
音频输入装置106连接至麦克风107。音频输入装置106采用麦克风107拾取内容重放控制装置100所处位置周围的声音,并将获取到的声音作为音频数据提供给CPU 112。音频输出装置109连接至扬声器110,音频输出装置109通过采用扬声器110将服务器200提供的音频文件转换成实际音频而产生音频。
视频输出装置111将与服务器200提供的内容当中的图像内容有关的数据提供给投影仪300。
成像器108也连接至上文所述的CPU 112。成像器108从内容重放控制装置100前面的规定范围的视角拍摄内容重放控制装置100周围的图像,并将获取到的图像数据提供给CPU 112。
上文描述的CPU 112还包括电源控制器113。电源控制器113单独控制包括内容重放控制装置100在内的所有构成装置的电源,并制定控制,从而适当地实现省电。
接下来将描述上文所述的实施例的动作。下文指示的动作是在CPU 112上运行的,其如上文所述将读取来自程序存储器13A的动作程序和格式数据等展开到工作区114D当中。作为总控制程序存储的动作程序等不仅包括这一内容重放控制装置100从工厂发货时存储的程序,还包括用户通过版本升级程序等安装的内容,所述版本升级程序等是在购买这一内容重放控制装置100之后通过通信器101经由Internet从未表示出的个人计算机等下载的。
图3是示出了根据实施例的内容重放控制装置100的动作的处理内容的流程图。在动作开始,CPU 112等待,直到有来自未表示出的遥控器等的通过操作器3开启电源的按键操作(步骤S101)。此时,CPU 112通过电源控制器113使通往各个电路的,除了通往开启电源所需的零件的电源停止。
在借助遥控器做出开启电源的按键操作时,CPU 112在上文所述的步骤S101中对此予以确定,并在执行规定的初始设置处理(步骤102)之后,通过电源控制器113(步骤S103)开始对存在传感器(红外传感器等)105的供电。
随后,CPU 112重复地判断来自存在传感器105的探测输出是否至少与预设阈值一样大,并借此判断在内容重放控制装置100前面的规定范围内是否存在作为应当向其提供重放内容的目标的人(收听者)(步骤S104)。在步骤S104中,当在(例如)规定时间内未探测到人时,CPU 112完成下文所述的步骤S130的处理。
在步骤S104中,在存在传感器105感测到人时,CPU 112指示电源控制器113开始向麦克风107供电(步骤S105)。
此外,CPU 112判断麦克风107是否可获取到至少与规定水平一样大的声音,以获取表现收听者的属性的信息(步骤S106)。当在步骤S106中未在规定时间内获取到至少与规定水平一样大的声音时,CPU 112完成下文所述的步骤S120的处理。
在判定在步骤106中获取到了至少与规定水平一样大的声音时,CPU112从获取到的声音中提取出被人为是人的语音的部分(步骤S107)。可以通过诸如频率分析等的现有算法完成该处理。
此外,CPU 112判断是否已经隔离并且提取了被认为是语音的部分(步骤S108)。当在步骤S108中判定尚未隔离并提取被认为是语音的部分时,CPU 112完成下文所述的步骤S120的处理。
当在步骤S108中判定存在语音部分时,CPU 112完成详细语音识别处理(步骤S109)。也可以采用现有的语音识别算法完成该处理。作为语音识别的结果,CPU 112判断该语音的语言(英语、汉语、日语等)是否是可识别的(步骤S110)。当在步骤S110中判定所述语音的语言并非可识别时,CPU112完成下文所述的步骤S120的处理。
当在步骤S110中判定所述语言可识别时,CPU 112指定该语言(步骤S111),并确定收听者采用的所述语言作为重放内容时的语言(步骤S112)。
接下来,对步骤S120中的处理作出解释,当在步骤S106中未在规定时间内获取到至少与规定水平一样大的声音时,当在步骤S108中判断在隔离和提取的部分中没有语音时,以及当在步骤S110中判断语音的语言不可识别时将完成所述步骤。来自步骤S120的处理是在判断不可能通过音频选择语言时实施的处理。
首先,CPU 112指示电源控制器113开始向成像器108供电(步骤S120)。此外,CPU 112对存在传感器在内容重放控制装置100前面的规定范围的视角内探测到的人的图像成像。此时,成像可以使静止图像程序,但是视频成像也好。
此外,CPU 112通过图像处理从俘获的图像中提取出被认为是人的部分(步骤S122)。此外,CPU 112提取该人的脸、眼睛颜色、头发颜色、肤色、衣物等特征,并由这些特征评估该人的人种(例如,白人、黑人、拉丁美洲人或亚洲人)或国籍(例如,美国、巴西、法国或中国)(步骤S123)。
此外,CPU 112判断是否以某种程度的确定性评估了人种/国籍(步骤S124)。当在步骤S124中判定不能评估人种/国籍时,CPU 112完成下文所述的步骤S130的处理。
当在步骤S124中判定评估了人种/国籍时,CPU 112参考存储在存储装置114内的人种/国籍语言表114B(步骤S125)并在所述人种/国籍的基础上确定对应于所述人种/国籍的语言(步骤S112)。
图4A和4B示出了人种/国籍语言表的例子,其中,图4A示出了人种语言表的例子,图4B示出了国籍语言表的例子。例如,在从人的图像评估出收听者是白种人时,CPU 112选择英语作为重放内容时的语言。此外,在从该人的图像评估收听者是巴西人时,CPU 112选择葡萄牙语作为重放内容时的语言。
接下来将说明步骤S130的处理,如上文所述,当在步骤S104中未探测到目标收听者时或者在步骤S124中判断不能评估人种/国籍时完成所述步骤。步骤S130的处理是不能完成语言指定时采用的处理。
在这种情况下,CPU 112选定预先设定的默认语言,例如英语作为在重放内容时的语言(步骤S130)。
接下来,下文将描述步骤S140中的处理,该步骤将在上述步骤S112或步骤S130中确定用于重放内容的语言之后完成。步骤S140是用于准备已经确定的重放内容的处理,将参考图5对其用以说明。
在子例程步骤S140中,首先CPU 112查看在内容供应装置200中是否存在对应于确定语言的内容(步骤S141)。
判断在内容供应装置中是否存在对应于确定语言的内容(步骤S142),当在内容供应装置200中存在对应于确定语言的内容时,CPU 112确定对应于该语言的重放内容(步骤S143)。
图6示出了此时的动作的概要。此外,在退出这一子例程的情况下,该处理返回至图3的步骤150的处理。
在子例程步骤S142中,在判断在内容供应装置200中不存在对应于确定语言的内容时,CPU 112从内容供应装置200读取推荐(第一优先次序)内容(步骤S144)。此时,所读取的内容优选不是音频文件而是文本数据,但是这取决于内容供应装置200的内容数据格式。在所读取的内容是音频文件时,优选完成将其转换为文本的处理。
接下来,CPU 112将读取的内容翻译成预定语言(步骤S145)。在这种情况下采用的翻译词典可以是内容重放控制装置100所具有的处于存储装置114内的词典。此外,优选通过通信器101调用未表示出的外部翻译服务器,并采用其词典完成翻译。此外,所述翻译服务器优选就是内容供应装置200。
接下来,CPU 112采用存储在存储装置114内的音频合成资料数据114C合成所翻译的内容的音频(步骤S146)。此外,CPU 112创建作为具有适当格式的有待重放的音频文件的重放内容文件(步骤S147)。
图7示出了这些步骤S144-S147的动作的概要。此外,在退出这一子例程时,所述处理返回至图3中的步骤S150的处理。
接下来将说明在退出上述子例程处理之后完成的步骤S150之后的处理。CPU 112通过音频输出装置109借助于扬声器110输出上述子例程步骤S140准备的内容(步骤S150)。
此时,在所述内容包括视频时,CPU 112将所准备的内容的视频部分输出至内容视频重放装置300,例如,投影仪等,并对其重放,从而使其与音频同步。例如,在合成音频时,CPU 112将音频合成为使之与包括口的活动在内的视频同步,并使其按照同步方式重放。此外,在合成音频时,CPU 112优选对视频加以校正,使之按照与音频同步的方式重放,由此使视频适合于音频。
此外,在完成内容重放之后,检测是否在操作器103上做出了操作(步骤S160)。当在步骤S160中判断没有做出操作时,CPU 112返回至步骤S150,并重放所准备好的内容。此外,优选预先设置这样的重复的次数。
当在步骤S160中判定做出了操作时,CPU 112判断该操作是否是断电操作(步骤S161)。当在步骤S161中判定所述操作是断电操作时,CPU 112完成规定的断电处理(步骤S162),之后所述处理返回至上文所述的步骤S101。
当在步骤S161中判定该处理不是断电操作时,CPU 112完成对应于该操作的处理(步骤S163),之后所述处理返回至上文所述的步骤S104。
如上文详细所述,就上述实施例而言,识别出收听者可理解的语言,并采用收听者可理解的语言重放内容,从而有可能通过易于理解的方式重放内容。
此外,对于上述实施例,在识别出收听者可理解的语言时,获取内容重放控制装置100周围的声音,并识别被人为是收听者所说的语言,因而易于确定收听者可理解的语言。
此外,就上述实施例而言,在识别收听者可识别的语言时,对内容重放控制装置100的周围成像,由所获取的视频确定人种/国籍作为收听者的属性,并确定被人为是收听者可理解的语言,因而即使在难以基于音频做出判定时也也可能确定收听者可理解的语言。
此外,就上述实施例而言,上文所述的内容重放控制装置100设有存在传感器105,在采用存在传感器105检测到人之后完成语音识别。这样有可能避免在没人时徒劳地实施具有繁重的处理过程的语音识别。此外,即使不完成诸如通过成像器108进行的图像处理等的繁重处理过程也有可能容易地检测到是否有人。在不提供存在传感器105的情况下完成语音识别和/或图像识别处理也是优选的。
此外,就上述实施例而言,首先通过语音识别确定语言,在能够做出选择时不必实施采用成像器108通过图像识别进行的语言确定。这样有可能避免成像器108徒劳地完成具有繁重的处理过程的图像识别。
此外,就上述实施例而言,完成语音识别,并且在语言识别困难时,完成采用成像器108的图像识别,但是预先通过成像器108完成处理并通过图像识别确定语言也是优选的。此外,只采用所述识别处理之一确定语言也是优选的。
此外,在希望语言选择的准确度在优先权上高于易于处理时,可以既实施通过语音识别进行处理又实施通过图像识别进行的处理,并采用两种识别的结果综合确定语言。
此外,就上述实施例而言,即使在识别出被认为是收听者能够理解的语言的语言之后该语言的内容不存在时,也可以对内容进行修改并对其重放,因而有可能重放可以确实地被收听者理解的内容。
此外,就上述实施例而言,当在识别出被认为是收听者能够理解的语言的语言之后而该语言的内容又存在时,选择适当的内容并重放,因而有可能迅速地重放收听者可理解的内容。
此外,在内容伴随有视频时,不仅要对重放音频进行选择/转换,还要使其按照与视频同步的方式重放,因此能够确实地通过易于理解的方式重放收听者可理解的内容而不使其有不舒服的感觉。
此外,就上述实施例而言,通过采用投影仪300投影到人形屏幕上对附有视频和音频的内容的视频部分进行重放,因而有可能内容(广告内容等)重放得使收听者印象更加深刻。
就上述实施例而言,通过采用投影仪300投影到人形屏幕上重放附有视频和音频的内容的视频部分,但是本发明不限于此,因为自然也有可能将本发明应用于在规则的矩形屏幕上投影的形式。此外,本发明不限于此还因为自然有可能将本发明应用于将所述视频部分显示到直接观看的显示装置上的形式。
就上述实施例而言,也有可能通过借助于存在传感器105检测是否有人并且每隔预定事件间隔就实施语音识别处理和图像识别处理而对重放语言进行适当地自动切换,但是为简单起见将不对此予以详细描述。
此外,就上述实施例而言,将内容重放控制装置100解释为独立于内容供应装置200和内容视频重放装置300的装置。但是,内容重放控制装置100也可以与内容供应装置200和/或内容视频重放装置300集成。在这种情况下,有可能使***更加紧凑。
本质上,可以通过设置有与上文所述的实施例的内容重放控制装置类似的功能和构成的内容重放控制装置来实现本发明,并且有可能通过向现有的内容重放控制装置施用程序而使其起到根据本发明的内容重放控制装置的作用。在这种情况下,有可能通过使用于实现与上文所述的内容重放控制装置相同的功能的程序在设有与上述实施例例示的内容重放控制装置相同的构成的内容重放控制装置的计算机(CPU或其他控制单元)上运行而使其发挥根据本发明的内容重放控制装置的作用。施用这样的程序的方法是任意的,例如,可以通过将其存储在诸如CD-ROM或存储卡等的存储介质上应用这一程序,或者可以通过诸如Internet等的通信媒介应用这一程序。
此外,本发明不限于上文所述的实施例,因为在实施阶段有可能存在各种不背离本发明的范围的变化。此外,可以对由上文所述的实施例所执行的功能进行适当组合,并在可能的程度上对其予以实施。在上文所述的实施例中包含多个阶段,有可能通过所公开的多个构成要素的适当组合来提取出多种发明。例如,即使从实施例所示的所有构成要素中省略若干组成要素,只要能够获得所述效果就能够将去除了这些组成要素的构成提取为发明。
本申请要求2012年6月29日提交的日本专利申请No.2012-147648的权益,以引用的方式将其全部公开内容并入本文中。
附图标记列表:
100 内容重放控制装置
101 通信器
102 内容输入装置
103 操作器
104 显示装置
105 存在传感器
106 音频输入装置
107 麦克风
108 成像器
109 音频输出装置
110 扬声器
111 视频输出装置
112 CPU
113 电源控制器
114 存储装置
200 服务器
300 投影仪
310 屏幕
320 作为内容细节投影的视频

Claims (12)

1.一种用于对内容的重放进行控制的内容重放控制装置,包括:
获取单元,所述获取单元用于获取作为内容提供目标的收听者的属性;
确定单元,所述确定单元用于基于由所述获取单元获取的所述收听者的所述属性来确定重放内容时的语言;以及
重放控制单元,所述重放控制单元用于通过由所述确定单元确定的确定语言的音频来重放所述内容。
2.根据权利要求1所述的内容重放控制装置,其中:
所述获取单元包括用于获取来自所述收听者的音频的音频获取单元;并且
所述确定单元基于作为由所述音频获取单元获取的所述收听者的属性的、来自所述收听者的音频来确定重放所述内容时的语言。
3.根据权利要求1或权利要求2所述的内容重放控制装置,其中:
所述获取单元包括用于对所述收听者进行成像的成像单元;并且
所述确定单元基于由所述成像单元成像的所述收听者的图像来评估作为所述收听者的属性的人种和/或国籍,并且基于所评估的人种和/或国籍来确定重放所述内容时的语言。
4.根据权利要求1至3中任一项所述的内容重放控制装置,还包括:
存在传感器,所述存在传感器用于检测所述收听者是否处于规定范围内;
其中,当所述存在传感器检测到所述收听者处于规定范围内时,所述获取单元获取所述收听者的所述属性。
5.根据权利要求1至4中任一项所述的内容重放控制装置,其中:
所述重放控制单元包括用于检索与所述确定语言相对应的内容的检索单元;并且
当所述检索单元无法检索到与所述确定语言相对应的内容时,将所述内容转换为与所述确定语言相对应的内容。
6.根据权利要求1至4中任一项所述的内容重放控制装置,其中:
所述重放控制单元包括用于检索与所述确定语言相对应的内容的检索单元;并且
当所述检索单元检索到与所述确定语言相对应的内容时,选择所检索的内容作为所述重放内容。
7.根据权利要求1至6中任一项所述的内容重放控制装置,其中:
所述内容包括与所述确定语言的音频一起将被重放的视频;并且
所述重放控制单元使得所述内容与所述视频将被同步地重放。
8.根据权利要求7所述的内容重放控制装置,其中:所述重放控制单元对将被重放的所述视频与所述确定语言的音频一起进行修改,并将所述内容与所述视频同步地重放。
9.根据权利要求1至8中任一项所述的内容重放控制装置,其中,所述内容重放控制装置是投影装置,所述投影装置包括用于通过将所述视频投影到屏幕上而实施显示的视频投影仪。
10.根据权利要求1至8中任一项所述的内容重放控制装置,其中,所述内容重放控制装置是显示装置,所述显示装置包括用于显示所述视频的视频显示装置。
11.一种用于控制内容的重放的内容重放控制方法,包括:
获取步骤,所述获取步骤用于获取作为内容提供目标的收听者的属性;
确定步骤,所述确定步骤用于基于由所述获取步骤获取的所述收听者的所述属性来确定重放内容时的语言;以及
重放控制步骤,所述重放控制步骤用于通过由所述确定步骤确定的确定语言的音频来重放所述内容。
12.一种由计算机执行的程序,在所述计算机中构建有用于控制内容的重放的装置,所述程序使得所述计算机作为以下单元起作用:
获取单元,所述获取单元用于获取作为内容提供目标的收听者的属性;
确定单元,所述确定单元用于基于由所述获取单元获取的所述收听者的所述属性来确定重放内容时的语言;以及
重放控制单元,用于通过由所述确定单元确定的确定语言的音频来重放所述内容。
CN201380034857.9A 2012-06-29 2013-06-21 内容重放控制装置、内容重放控制方法和程序 Pending CN104412606A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012147648A JP2014011676A (ja) 2012-06-29 2012-06-29 コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム
JP2012-147648 2012-06-29
PCT/JP2013/003911 WO2014002461A1 (en) 2012-06-29 2013-06-21 Content playback control device, content playback control method and program

Publications (1)

Publication Number Publication Date
CN104412606A true CN104412606A (zh) 2015-03-11

Family

ID=48808466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380034857.9A Pending CN104412606A (zh) 2012-06-29 2013-06-21 内容重放控制装置、内容重放控制方法和程序

Country Status (4)

Country Link
US (1) US20150143412A1 (zh)
JP (1) JP2014011676A (zh)
CN (1) CN104412606A (zh)
WO (1) WO2014002461A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649290A (zh) * 2016-12-21 2017-05-10 上海木爷机器人技术有限公司 语音翻译方法及***
CN107484034A (zh) * 2017-07-18 2017-12-15 深圳Tcl新技术有限公司 字幕显示方法、终端及计算机可读存储介质
CN108364633A (zh) * 2017-01-25 2018-08-03 晨星半导体股份有限公司 文字转语音***以及文字转语音方法
CN108694394A (zh) * 2018-07-02 2018-10-23 北京分音塔科技有限公司 人脸识别的翻译机、方法、装置及存储介质
CN109309864A (zh) * 2018-08-08 2019-02-05 周群 国籍信息智能识别***
CN109600680A (zh) * 2018-08-15 2019-04-09 罗勇 重复场景图像分组方法
CN109618221A (zh) * 2018-08-08 2019-04-12 周群 国籍信息智能识别方法
CN109862425A (zh) * 2017-11-30 2019-06-07 深圳Tcl新技术有限公司 一种电视伴音调整方法、存储介质以及智能电视
CN109977866A (zh) * 2019-03-25 2019-07-05 联想(北京)有限公司 内容翻译方法及装置、计算机***及计算机可读存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9635392B2 (en) * 2014-04-16 2017-04-25 Sony Corporation Method and system for displaying information
JP6498900B2 (ja) * 2014-09-29 2019-04-10 株式会社日立システムズ 広告評価システム、広告評価方法
JP6455117B2 (ja) * 2014-12-10 2019-01-23 カシオ計算機株式会社 表示装置、pos装置、表示方法及びプログラム
JP2016148961A (ja) * 2015-02-12 2016-08-18 カシオ計算機株式会社 コンテンツ出力装置、コンテンツ出力方法およびプログラム
JP2016155179A (ja) * 2015-02-23 2016-09-01 株式会社国際電気通信基礎技術研究所 誘導サービスシステム、誘導サービスプログラム、誘導サービス方法および誘導サービス装置
JP6996186B2 (ja) 2017-09-19 2022-01-17 株式会社Jvcケンウッド 情報処理装置、言語判定方法及びプログラム
CN108305613A (zh) * 2018-02-28 2018-07-20 柳州市实福农业科技有限公司 一种贸易会议现场记录器
JP6687954B2 (ja) * 2019-03-28 2020-04-28 みこらった株式会社 移動型プロジェクション装置及びプロジェクションシステム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046075A1 (en) * 2001-08-30 2003-03-06 General Instrument Corporation Apparatus and methods for providing television speech in a selected language
US20070271580A1 (en) * 2006-05-16 2007-11-22 Bellsouth Intellectual Property Corporation Methods, Apparatus and Computer Program Products for Audience-Adaptive Control of Content Presentation Based on Sensed Audience Demographics
CN101449569A (zh) * 2005-12-06 2009-06-03 丹尼尔·J·辛普森 交互式自然语言呼叫***
US20090328121A1 (en) * 2008-06-27 2009-12-31 Kabushiki Kaisha Toshiba Television Receiver, Method of Controlling the Receiver, and Network Construction Device
JP2012029107A (ja) * 2010-07-23 2012-02-09 Nec Casio Mobile Communications Ltd 電子機器

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6134669A (ja) * 1984-07-27 1986-02-18 Hitachi Ltd 自動取引システム
US6122668A (en) * 1995-11-02 2000-09-19 Starlight Networks Synchronization of audio and video signals in a live multicast in a LAN
JP2001028010A (ja) * 1999-05-10 2001-01-30 Matsushita Electric Ind Co Ltd マルチメディアコンテンツ自動抽出システム及びその方法
JP2001197207A (ja) * 2000-01-17 2001-07-19 Mega Chips Corp 多言語応対装置
JP3908437B2 (ja) * 2000-04-14 2007-04-25 アルパイン株式会社 ナビゲーションシステム
JP2003030210A (ja) * 2001-07-11 2003-01-31 Contents Station:Kk 通信回線網を用いた情報提供方法及び情報提供システム
KR100803586B1 (ko) * 2001-12-18 2008-02-15 삼성전자주식회사 프로젝션 텔레비전의 휘도 개선장치
CN1774715A (zh) * 2003-04-14 2006-05-17 皇家飞利浦电子股份有限公司 用于对音频-视频流执行自动配音的***和方法
JP2005210196A (ja) * 2004-01-20 2005-08-04 Sony Corp 情報処理装置、情報処理方法
JP2005275935A (ja) * 2004-03-25 2005-10-06 Omron Corp 端末装置
JP2007193166A (ja) * 2006-01-20 2007-08-02 Kenwood Corp 対話装置、対話方法及びプログラム
DE102006057159A1 (de) * 2006-12-01 2008-06-05 Deutsche Telekom Ag Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen
CN101925916B (zh) * 2007-11-21 2013-06-19 高通股份有限公司 基于媒体偏好控制电子设备的方法和***
WO2010048375A1 (en) * 2008-10-22 2010-04-29 Newzoom, Inc. Vending store inventory management and reporting system
JP2011150221A (ja) 2010-01-25 2011-08-04 Seiko Epson Corp 映像出力装置搭載機器、映像出力装置の投影方法
JP5528318B2 (ja) * 2010-03-23 2014-06-25 パナソニック株式会社 表示装置
JP2012083925A (ja) * 2010-10-10 2012-04-26 Jvc Kenwood Corp 電子機器及びその表示言語判定方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046075A1 (en) * 2001-08-30 2003-03-06 General Instrument Corporation Apparatus and methods for providing television speech in a selected language
CN101449569A (zh) * 2005-12-06 2009-06-03 丹尼尔·J·辛普森 交互式自然语言呼叫***
US20070271580A1 (en) * 2006-05-16 2007-11-22 Bellsouth Intellectual Property Corporation Methods, Apparatus and Computer Program Products for Audience-Adaptive Control of Content Presentation Based on Sensed Audience Demographics
US20090328121A1 (en) * 2008-06-27 2009-12-31 Kabushiki Kaisha Toshiba Television Receiver, Method of Controlling the Receiver, and Network Construction Device
JP2012029107A (ja) * 2010-07-23 2012-02-09 Nec Casio Mobile Communications Ltd 電子機器

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649290A (zh) * 2016-12-21 2017-05-10 上海木爷机器人技术有限公司 语音翻译方法及***
CN108364633A (zh) * 2017-01-25 2018-08-03 晨星半导体股份有限公司 文字转语音***以及文字转语音方法
CN107484034A (zh) * 2017-07-18 2017-12-15 深圳Tcl新技术有限公司 字幕显示方法、终端及计算机可读存储介质
CN109862425A (zh) * 2017-11-30 2019-06-07 深圳Tcl新技术有限公司 一种电视伴音调整方法、存储介质以及智能电视
CN108694394A (zh) * 2018-07-02 2018-10-23 北京分音塔科技有限公司 人脸识别的翻译机、方法、装置及存储介质
CN109618221A (zh) * 2018-08-08 2019-04-12 周群 国籍信息智能识别方法
CN109309864A (zh) * 2018-08-08 2019-02-05 周群 国籍信息智能识别***
CN109309864B (zh) * 2018-08-08 2019-06-07 艾博特(上海)电信科技有限公司 国籍信息智能识别***
CN109618221B (zh) * 2018-08-08 2019-07-26 厦门市东合传媒科技有限公司 国籍信息智能识别方法
CN109600680A (zh) * 2018-08-15 2019-04-09 罗勇 重复场景图像分组方法
CN109600680B (zh) * 2018-08-15 2019-06-28 上海极链网络科技有限公司 重复场景图像分组方法
CN109977866A (zh) * 2019-03-25 2019-07-05 联想(北京)有限公司 内容翻译方法及装置、计算机***及计算机可读存储介质
CN109977866B (zh) * 2019-03-25 2021-04-13 联想(北京)有限公司 内容翻译方法及装置、计算机***及计算机可读存储介质

Also Published As

Publication number Publication date
JP2014011676A (ja) 2014-01-20
US20150143412A1 (en) 2015-05-21
WO2014002461A1 (en) 2014-01-03

Similar Documents

Publication Publication Date Title
CN104412606A (zh) 内容重放控制装置、内容重放控制方法和程序
KR102488410B1 (ko) 복수의 카메라들을 이용하여 영상을 촬영하는 전자 장치와 이의 동작 방법
KR101501378B1 (ko) 비디오 스트리밍을 위한 방법 및 장치
CN111163274A (zh) 一种视频录制方法及显示设备
GB2528557A (en) Soundbar
CN102906818A (zh) 将视频摘要存储为元数据
KR102655625B1 (ko) 피사체의 근접 여부에 따라 촬영 장치를 제어하는 방법 및 촬영 장치.
US20160065849A1 (en) Iimage acquisition apparatus, method of controlling image acquisition apparatus, computer-readable recording medium non-transitorily storing control program of image acquisition apparatus, and image acquisition system
CN114296949A (zh) 一种虚拟现实设备及高清晰度截屏方法
WO2020093798A1 (zh) 一种显示目标图像的方法、装置、终端及存储介质
KR102641738B1 (ko) 영상 처리 방법 및 이를 지원하는 전자 장치
CN110996163B (zh) 用于自动字幕显示的***和方法
JP6641386B2 (ja) ヘッドマウントディスプレイ連携表示システム、及び、表示装置とヘッドマウントディスプレイとを含むシステム、及び、その表示装置
US10447965B2 (en) Apparatus and method for processing image
CN108632553B (zh) 图像处理装置、投影仪、图像处理方法以及存储介质
CN111464801A (zh) 一种振镜调整装置、***、方法及投影仪
CN107430841B (zh) 信息处理设备、信息处理方法、程序以及图像显示***
US20230289123A1 (en) System and method for displaying image, image-capturing device, and recording medium
US20170018288A1 (en) Video processing apparatus, video processing method, and program
JP2014107775A (ja) 電子カメラ
KR102138835B1 (ko) 정보 노출 방지 영상 제공 장치 및 방법
CN106060394B (zh) 一种拍照方法、装置和终端设备
EP2894866B1 (en) Display apparatus and display method thereof
CN116257159A (zh) 多媒体内容的分享方法、装置、设备、介质及程序产品
KR101452226B1 (ko) 스마트폰과 인터넷을 이용하여 제어 가능한 방송장비

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150311

WD01 Invention patent application deemed withdrawn after publication