JP2019165422A - マルチメディアコンテンツの再生方法及び装置{multimedia content playback method and apparatus} - Google Patents

マルチメディアコンテンツの再生方法及び装置{multimedia content playback method and apparatus} Download PDF

Info

Publication number
JP2019165422A
JP2019165422A JP2018093178A JP2018093178A JP2019165422A JP 2019165422 A JP2019165422 A JP 2019165422A JP 2018093178 A JP2018093178 A JP 2018093178A JP 2018093178 A JP2018093178 A JP 2018093178A JP 2019165422 A JP2019165422 A JP 2019165422A
Authority
JP
Japan
Prior art keywords
multimedia content
information
user
template
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018093178A
Other languages
English (en)
Other versions
JP6634470B2 (ja
Inventor
ウー,ウェイ
Wei Wu
ワン,チアフォン
Jiafeng Wang
ルオ,チュンナン
Junnan Luo
チアン,チョンハオ
Zhenghao Jiang
リー,チン
Jing Li
リョウ,ユエ
Yue Liu
ワン,フェイ
Fei Wang
チャン,イェン
Yan Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2019165422A publication Critical patent/JP2019165422A/ja
Application granted granted Critical
Publication of JP6634470B2 publication Critical patent/JP6634470B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25816Management of client data involving client authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25875Management of end-user data involving end-user authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computer Graphics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Library & Information Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】マルチメディアコンテンツの再生方法及び装置を提供する。【解決手段】ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得するステップと、音声情報と、既得の案内情報に対応するテンプレート情報と、をマッチングするステップと、音声情報とテンプレート情報とのマッチングの成功を確定したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するステップとを含む。マルチメディアコンテンツを取得する効率の向上を実現する。【選択図】図2

Description

本発明は、コンピュータ技術の分野に関し、具体的に、インターネット技術の分野に関し、特にマルチメディアコンテンツの再生方法及び装置に関する。
コンピュータ技術が発展されて、多様化したコンテンツ取得方法に対するユーザの要求が増加されるにつれて、より多くのマルチメディアコンテンツが生成される。通常、インテリジェントな電子機器は、ユーザの選択に応じて、ネットワーク上のマルチメディアコンテンツを再生したり、ユーザに一部のマルチメディアコンテンツを積極的にプッシュしたり、または能動的にプッシュされたマルチメディアコンテンツとユーザにより選択されたマルチメディアコンテンツとをマルチメディアコンテンツのセットに組み合わせて、セット中のマルチメディアコンテンツを順次再生することができる。
既存のマルチメディアコンテンツの再生サービスにおいて、通常、ユーザにより選択されたマルチメディアコンテンツを再生する前に、一部のプッシュされたマルチメディアコンテンツを再生する。ユーザがプッシュされたマルチメディアコンテンツに興味がない場合は、プッシュされたマルチメディアコンテンツの再生が終了するまで待たなければならなく、待っている間のユーザは、プッシュされたマルチメディアコンテンツに対し関心が向かないことが通常であり、または、ユーザは、再生スキップサービスを購入して、プッシュされたマルチメディアコンテンツの再生を直接的にスキップすることにより、プッシュされたマルチメディアコンテンツの情報を迅速かつ効率的にユーザに配信できなくなる。
第1の態様において、本発明の実施形態は、マルチメディアコンテンツの再生方法であって、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するステップと、前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするステップと、前記音声情報と前記テンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するステップと、を含むマルチメディアコンテンツの再生方法を提供する。
一部の実施形態において、前記方法は、現在のマルチメディアコンテンツの再生配置情報を取得するステップであって、前記再生配置情報は、前記現在のマルチメディアコンテンツの案内情報、前記案内情報の表示方式情報及び前記案内情報に対応するテンプレート情報を含む、ステップをさらに含む。
一部の実施形態において、前記案内情報は、前記現在のマルチメディアコンテンツの再生をスキップするための音声のコマンドを発出するようにユーザを案内するのに用い、前記テンプレート情報は、テンプレートコマンドを含み、前記音声信号の識別を行って対応する音声情報を取得するステップは、前記音声信号を対応するユーザコマンドのテキストに変換するステップを含み、前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするステップは、前記ユーザコマンドのテキストと、既得の前記案内情報に対応するテンプレートコマンドとについて語義のマッチングを行うステップを含む。
一部の実施形態において、前記案内情報及び前記案内情報に対応するテンプレート情報は、予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出し、前記キーセンテンスを前記テンプレート情報として確定し、前記キーセンテンスに対して配置された対応する案内情報を取得する、との方法によって確定された案内情報及びテンプレート情報を含む。
一部の実施形態において、前記予め設定されたマルチメディアコンテンツのライブラリは、キーコンテンツ識別子を有する複数のマルチメディアコンテンツを含み、前記予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出するステップは、前記現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出するステップと、予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの関連マルチメディアコンテンツとして確定するステップと、予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの非関連マルチメディアコンテンツとして確定するステップと、各候補センテンスを含む関連マルチメディアコンテンツの数及び各候補センテンスを含む非関連マルチメディアコンテンツの数を確定するステップと、各候補センテンスを含む関連マルチメディアコンテンツの数及び非関連マルチメディアコンテンツの数に基づいて、候補センテンスから前記現在のマルチメディアコンテンツのキーセンテンスを確定するステップと、を含む。
一部の実施形態において、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するステップは、ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証するステップと、前記音声信号の合法性の検証が通過されたことに応じて、前記音声信号に対して音声識別を行って対応する音声情報を取得するステップと、を含む。
一部の実施形態において、ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証するステップは、ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、ユーザが前記現在のマルチメディアコンテンツを視聴するのに用いられる再生装置及びユーザアカウントのセキュリティ認証情報を取得するステップと、前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とに対して認証を行うステップと、前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とがすべて通過されたことに応じて、前記音声信号の合法性の検証が通過されたと確認するステップと、を含む。
一部の実施形態において、前記方法は、音声情報と、案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに提示するための第1の提示情報を生成するステップをさらに含む。
一部の実施形態において、前記方法は、音声情報と、案内情報に対応するテンプレート情報とのマッチングの失敗を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功しなかったことをユーザに提示するための第2の提示情報を生成するステップをさらに含む。
第2の態様において、本発明の実施形態は、マルチメディアコンテンツの再生装置であって、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するように構成されている識別ユニットと、前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするように構成されているマッチングユニットと、前記音声情報と前記テンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するように構成されている生成ユニットと、を含むマルチメディアコンテンツの再生装置を提供する。
一部の実施形態において、前記装置は、現在のマルチメディアコンテンツの再生配置情報を取得するように構成されている取得ユニットであって、前記再生配置情報は、前記現在のマルチメディアコンテンツの案内情報、前記案内情報の表示方式情報及び前記案内情報に対応するテンプレート情報を含む、取得ユニットをさらに含む。
一部の実施形態において、前記案内情報は、前記現在のマルチメディアコンテンツの再生をスキップするための音声のコマンドを発出するようにユーザを案内するのに用い、前記テンプレート情報は、テンプレートコマンドを含み、前記識別ユニットは、前記音声信号を対応するユーザコマンドのテキストに変換する方法によって、前記音声信号の識別を行って対応する音声情報を取得するように構成され、前記マッチングユニットは、前記ユーザコマンドのテキストと、既得の前記案内情報に対応するテンプレートコマンドとについて語義のマッチングを行う方法によって、前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするように構成されている。
一部の実施形態において、前記案内情報及び前記案内情報に対応するテンプレート情報は、予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出し、前記キーセンテンスを前記テンプレート情報として確定し、前記キーセンテンスに対して配置された対応する案内情報を取得する、との方法によって確定された案内情報及びテンプレート情報を含む。
一部の実施形態において、前記予め設定されたマルチメディアコンテンツのライブラリは、キーコンテンツ識別子を有する複数のマルチメディアコンテンツを含み、前記テンプレート情報としてのキーセンテンスは、前記現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出し、予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの関連マルチメディアコンテンツとして確定し、予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの非関連マルチメディアコンテンツとして確定し、各候補センテンスを含む関連マルチメディアコンテンツの数及び各候補センテンスを含む非関連マルチメディアコンテンツの数を確定し、各候補センテンスを含む関連マルチメディアコンテンツの数及び非関連マルチメディアコンテンツの数に基づいて、候補センテンスから前記現在のマルチメディアコンテンツのキーセンテンスを確定する、との方法によって抽出される。
一部の実施形態において、前記識別ユニットは、さらに、ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証し、前記音声信号の合法性の検証が通過されたことに応じて、前記音声信号に対して音声識別を行って対応する音声情報を取得する、との方法によって、前記音声信号の音声識別を行って対応する音声情報を取得するように構成されている。
一部の実施形態において、前記識別ユニットは、さらに、ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、ユーザが前記現在のマルチメディアコンテンツを視聴するのに用いられる再生装置及びユーザアカウントのセキュリティ認証情報を取得し、前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とに対して認証を行い、前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とがすべて通過されたことに応じて、前記音声信号の合法性の検証が通過されたことを確認する、との方法によって、前記音声信号の合法性を検証するように構成されている。
一部の実施形態において、前記装置は、音声情報と、案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに提示するための第1の提示情報を生成するように構成されている第1の提示ユニットをさらに含む。
一部の実施形態において、前記装置は、音声情報と、案内情報に対応するテンプレート情報とのマッチングの失敗を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功しなかったことをユーザに提示するための第2の提示情報を生成するように構成されている第2の提示ユニットをさらに含む。
第3の態様において、本発明の実施形態は、1つまたは複数のプロセッサと、1つまたは複数のプログラムを格納するための記憶装置とを含み、前記1つまたは複数のプログラムが、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに第1の態様に記載されている方法を実現させる電子機器を提供する。
第4の態様において、本発明の実施形態は、コンピュータプログラムが記憶されており、前記プログラムがプロセッサによって実行されると、第1の態様に記載されている方法を実現するコンピュータ可読媒体を提供する。
本発明の実施形態のマルチメディアコンテンツの再生方法及び装置は、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得した後、音声情報と、既得の案内情報に対応するテンプレート情報と、をマッチングし、次に、音声情報とテンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成することにより、マルチメディアコンテンツを取得する効率の向上を実現する。
以下の添付された図面を参照して行った非限定的な実施形態に対する詳細な説明を閲覧することにより、本発明の他の特徴、目的および利点がより明確になる。
図1は、本発明を適用可能な例示的システム構成図である。 図2は、本発明によるマルチメディアコンテンツの再生方法の一実施例のフローチャートである。 図3は、本発明によるマルチメディアコンテンツの再生方法の一応用情景の模式図である。 図4は、本発明によるマルチメディアコンテンツの再生方法の他の一実施例のフローチャートである。 図5は、本発明によるマルチメディアコンテンツの再生装置の一構成模式図である。 図6は、本発明の実施例のサーバを実現するのに適するコンピュータシステムの構成模式図である。
以下、添付された図面及び実施例を組み合わせて、本発明をより詳細に説明する。ここで説明した具体的な実施例は、関連発明を解釈するためのものであり、当該発明を限定するためのものではないことが理解できる。なお、説明の便宜上、添付された図面には、関連発明に関する部分のみが表示される。
なお、本発明の実施例及び実施例における特徴は、矛盾しない限り、互いに組み合わせることができる。以下、添付された図面を参照し、実施例を組み合わせて、本発明を詳細に説明する。
図1は、本発明のマルチメディアコンテンツの再生方法やマルチメディアコンテンツの再生装置を適用可能な例示的システム構成100を示す。
図1に示すように、システム構成100は、端末装置101、102、103、ネットワーク104とサーバ105を含むことができる。ネットワーク104は、端末装置101、102、103とサーバ105との間で通信リンクを提供する媒体として使用される。ネットワーク104は、例えば、有線通信リンク、無線通信リンク、または光ファイバケーブルなどの各種の接続タイプを含むことができる。
ユーザ110は、端末装置101、102、103を利用して、ネットワーク104によってサーバ105とインタラクションしてメッセージなどを送受信することができる。端末装置101、102、103には、例えば、映像再生クライアント、音声再生クライアント、画像ビューア、テキストリーダーなどの各種のマルチメディア再生タイプのアプリケーションがインストールされることができる。
端末装置101、102、103は、表示装置を備えてインターネット接続をサポートする各種の電子機器であってもよく、スマートフォン、タブレットPC、スマートウォッチ、ノートパソコン、ラップトップパソコン、電子ブックリーダーなどを含むが、これに限定されない。
サーバ105は、マルチメディアコンテンツの再生サービスをサポートするマルチメディアコンテンツの再生サーバであってもよく、マルチメディアコンテンツの再生サーバは、端末装置101、102、103から送信されたマルチメディアコンテンツの再生要求を受信し、マルチメディアの再生要求を解析し、解析結果に基づいて対応するマルチメディアコンテンツを検索して、検索されたマルチメディアコンテンツを端末装置101、102、103に送信することができる。
なお、本発明の実施例で提供されるマルチメディアコンテンツの再生方法は、端末装置101、102、103またはサーバ105により実行されることができ、マルチメディアコンテンツの再生装置は、端末装置101、102、103またはサーバ105に設置されることができる。
なお、サーバは、ハードウェアであってもよく、またはソフトウェアであってもよい。サーバがハードウェアである場合に、複数のサーバで構成された分布式のサーバのセットとして実現されることができ、単一のサーバとして実装されることもできる。サーバがソフトウェアである場合に、複数のソフトウェアまたはソフトウェアモジュール(例えば、分布式のサービスを提供するための複数のソフトウェアモジュール)として実装されることができ、単一のソフトウェアまたはソフトウェアモジュールとして実装されることもできる。これに対して具体的に限定しない。
図1における端末装置、ネットワーク、サーバの数は、例示的なものだけであり、実現の必要に応じて、任意の数の端末装置、ネットワーク、サーバが備えられてもよいことを理解すべきである。
次に、図2を参照すると、図2は、本発明によるマルチメディアコンテンツの再生方法の一実施例の流れ200を示す。このマルチメディアコンテンツの再生方法は、以下のようなステップを含む。
ステップ201において、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得する。
本実施例において、マルチメディアコンテンツの再生方法の実行本体(例えば、図1に示された端末装置101、102、103またはサーバ105)は、ユーザが発出した音声信号が受信されたか否かを検出し、当該音声信号が表示された現在のマルチメディアコンテンツの案内情報に基づいて発出された信号か否かを判断することができる。ここで、案内情報は、特定の操作を実行するようにユーザに指示するための情報であることができる。現在のマルチメディアコンテンツは、現在の再生されているマルチメディアコンテンツである。マルチメディアコンテンツは、映像、音声、画像、テキストを含んでもよいが、これに限定されない。具体的に、上記実行本体は、現在のマルチメディアコンテンツを再生するためのインターフェイスに案内情報を表示し、案内情報の表示処理中に、ユーザが発出した音声信号が受信されたか否かを継続的に検出することができる。例えば、案内情報は、5秒間表示されることができ、案内情報が表示される5秒間に、ユーザにより音声信号を発出したか否かを継続的に検出することができる。
上記実行本体が、現在のマルチメディアコンテンツを再生するクライアントである場合、クライアントは現在のマルチメディアの案内情報を表示した以降、ユーザにより発出した音声信号を音声入力インタフェースを介して取得することができる。クライアントは、ユーザにより発出した音声信号を取得した以降、すぐにマルチメディアコンテンツの再生サービスを提供するサーバにユーザの音声信号を報告してもよい。上記実行本体が、マルチメディアコンテンツの再生サービスを提供するためのサーバである場合、サーバは、現在のマルチメディアコンテンツを再生するクライアントからユーザにより発出した音声信号が受信されたか否かを検出することができる。
上記ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号が検出された後に、音声信号を解析し、音声信号に対応する音声情報を識別することができる。ここで、音声情報は、音声信号の音の特徴を示す情報および/または音声信号に含まれている語義を示す情報を含むことができる。
具体的な実施例において、ユーザが発出した音声信号をトレーニングされた音声情報識別モデルに入力して、対応する音声情報を取得することができる。ここで、音声情報識別モデルは、予め設定されたサンプル音声信号とサンプル音声信号に対応する音声情報の表記結果に基づいて、機械学習法を利用してトレーニングされたものであってもよい。実践中に、サンプル音声信号の音声情報の識別結果を表記して、トレーニングしようとする音声情報識別モデルを用いて、サンプル音声信号に対応する音声情報を予測した後、音声情報識別モデルの予測結果とサンプル音声信号の表記結果との間の違いに基づいて、トレーニングしようとする音声情報識別モデルのパラメータについて繰り返して調整し、音声情報識別モデルの予測結果とサンプル音声信号の表記結果との違いが予め設定された条件を満たす時に繰り返しを停止して、トレーニングされた音声情報識別モデルを取得することができる。
別の具体的な実施例において、予め構築された語義モデルを利用して、ユーザにより発出した音声信号に対して識別を行うことができ、その語義モデルは、音声フレームを分割した後の音声信号と対応する語義の情報との間の関係を示すことができ、大規模的なデータ量のサンプル語義の語義分析に基づいて構築されることができる。上記実行本体は、語義モデルを利用して直接的に解析して、音声信号に対応する語義の情報を取得し、且つ、既存の音声特徴抽出方法を利用して音声信号から音声信号の音の特徴を抽出して、音声信号の識別結果とすることができる。
上記実行本体は、ローカルで音声信号の識別操作を実行してもよく、検出された音声信号を音声サーバに報告し、例えば、バイナリストリームの形で音声サーバに報告し、続いて、バイナリ音声ストリームに対する音声サーバの音声識別結果を受信してもよい。ユーザにより発出した音声信号の識別結果は、対応する音声情報である。
上記案内情報は、マルチメディアコンテンツのために予め配置されたものであってもよい。実践中に、各マルチメディアコンテンツに複数の案内情報が配置され、上記実行本体は、マルチメディアコンテンツの案内情報を予め取得して、マルチメディアコンテンツの再生時に表示することができる。
実際情景において、ユーザが再生されたマルチメディアコンテンツを視聴しているときに、予め配置された案内情報を再生インターフェイスに表示することができ、この案内情報は、対応した音声コマンドを送信すると、再生されている現在のマルチメディアコンテンツをスキップすることができることをユーザに知らせるように使用される。たとえば、いずれかの映像クリップを再生するときに、再生インターフェイスで「XXXを言えば、この映像をスキップすることができます。」ことをユーザに通知するように使用される。ユーザは、その案内情報を受信した後、対応する音声信号を送信して、現在の映像クリップの再生をスキップすることを請求することができる。または、ユーザがニュースを聞く時に、現在の再生されているニュースの音声案内情報を音声出力インタフェースを介してユーザに報道することができ、ユーザは、案内情報を聴取した後、音声信号を発出することができ、映像や音声を再生する装置は、ユーザの音声信号を検出し、音声信号をサーバに送信して対応する音声情報に変換することができる。
本実施例の一部の選択可能な実施形態において、上記案内情報は、上記現在のマルチメディアコンテンツの再生をスキップする音声コマンドをユーザにより発出されるように指示し、テンプレート情報は、テンプレートコマンドを含めることができ、テンプレートコマンドは、現在のマルチメディアコンテンツの再生をスキップする操作を実行するように指示することができる。このとき、以下のような方法で音声情報の識別を行って対応する音声情報を取得することができる。つまり、音声信号を対応しするユーザコマンドのテキストに変換することができる。具体的には、下記のような方法で音声情報の識別を行うことができる。つまり、まず音声信号の波形について音響特徴抽出と音声の状態細分化とを行い、音声信号の音響学の特徴と音声の状態細分化の結果とを取得し、続いて音響モデルに基づいて音声の状態細分化の結果について評価し、具体的に、音声の状態細分化の結果と音響モデルにおける各音素とのマッチングを行い、次に言語モデルを利用して、音響モデルにおけるマッチングされて取得された音素を文法構造に適合される識別結果に組み合わせることができる。
ステップ202において、音声情報と既得の案内情報に対応するテンプレート情報とをマッチングする。
各案内情報は、対応するテンプレート情報が配置されている。本実施例において、識別された音声情報と案内情報に対応するテンプレート情報とのマッチングを行うことができる。ここで、音声情報とテンプレート情報との間のマッチ度を直接的に算出してもよく、音声情報に含まれている語義とテンプレート情報の語義とについてマッチングを行ってもよく、音声情報に含まれている音の特徴情報とテンプレート情報に含まれている音の特徴情報とについてマッチングを行ってもよい。
本実施例の一部の選択可能な実施形態において、テンプレート情報は、テンプレートコマンドを含むことができ、テンプレートコマンドは、現在のマルチメディアコンテンツの再生をスキップする操作を実行するように指示する。さらに、ステップ201において表示された案内情報は、上記現在のマルチメディアコンテンツの再生をスキップする音声コマンドをユーザが発出するように指示し、ステップ201で音声信号を対応するユーザコマンドのテキストに変換することにより、音声信号の識別を実現する。このとき、ユーザコマンドのテキストと既得の上記案内情報に対応するテンプレートコマンドとについて語義のマッチングを行うことにより、音声情報と既得の案内情報に対応するテンプレート情報とのマッチングを実現することができる。ここで、テンプレートコマンドは、予め配置されたテキストコマンドであってもよい。ユーザコマンドのテキストと既得の案内情報に対応するテンプレートコマンドとについて語義のマッチングを行うことにより、現在のマルチメディアコンテンツの再生をスキップする条件を満たすか否かを判断することができる。
様々な方式を利用して、ユーザコマンドのテキストと既得の案内情報に対応するテンプレートコマンドとについて語義のマッチングを行うことができる。一つの選択可能なマッチング方式は、ユーザコマンドのテキストと上記案内情報に対応するテンプレートコマンドとについてテキスト内容のマッチングを直接的に行うものであり、マッチ度が予め設定されたマッチ度の閾値を超えたときに、両者の語義が一致したと確定することができる。つまり、ユーザコマンドのテキストと案内情報に対応するテンプレートコマンドとの語義のマッチングが成功したこと、または両者の語義のマッチングが失敗したことを確認することができる。別の選択可能なマッチング方式は、自然言語処理方式を利用して両者の語義についてマッチングを行うものであり、具体的に、ステップ201で識別されたユーザコマンドのテキストと既得の現在のマルチメディアコンテンツの案内情報に対応するテンプレートコマンドとについて語義の解析を行って両者の語義がマッチングされるか否かを判断することができる。
具体的には、自然言語処理方式を利用して、上記ユーザコマンドのテキストと上記テンプレートコマンドについて語義のマッチングを行うときは、まずユーザコマンドのテキストとテンプレートコマンドについて単語分割を行い、言語モデルを利用して、ユーザコマンドのテキストとテンプレートコマンドをベクトルに変換し、変換されたベクトルを用いて、ユーザコマンドのテキストとテンプレートコマンドの間の類似度を算出することができる。トレーニングされた深層ニューラルネットワークを利用して、ユーザコマンドのテキストとテンプレートコマンドのマッチ度を算出することもできる。このトレーニングされた深層ニューラルネットワークは、語義のマッチング結果が予め記載されているサンプルテキストのペアに基づいてトレーニングされたものであってもよい。
ステップ203において、音声情報と案内情報に対応するテンプレート情報との語義のマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成する。
ステップ202でユーザの音声信号に対応する音声情報と案内情報に対応するテンプレート情報とのマッチングが成功すると、現在のマルチメディアコンテンツの再生をスキップする条件を満たしたことを確認することができ、上記実行本体は、現在のマルチメディアコンテンツの再生をスキップすることを実行するためのコマンドを生成することができる。上記実行本体がマルチメディアコンテンツの再生サービスを提供するサーバである場合、実行本体は、生成されたコマンドを現在のマルチメディアコンテンツを再生しているクライアントに送信することができる。上記実行本体がマルチメディアコンテンツを再生するクライアントの場合、上記実行本体は、現在のマルチメディアコンテンツの再生をスキップすることを実行するためのコマンドを生成し実行することにより、現在のマルチメディアコンテンツの再生をスキップすることができる。
実践中に、現在のマルチメディアコンテンツの再生をスキップする操作を実行することは、再生ノードを現在のマルチメディアコンテンツの終わりに切り替え、または次のマルチメディアコンテンツの再生開始点に切り替えて再生してもよく、現在のマルチメディアコンテンツを予定時間(例えば、3秒)ほど続いて再生した後、再生ノードを次のマルチメディアコンテンツの再生開始点に切り替えてもよい。
本出願の実施例のマルチメディアコンテンツを再生する方法は、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得した後、音声情報と既得の案内情報に対応するテンプレート情報とをマッチングし、続いて音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成することにより、マルチメディアコンテンツを取得する効率の向上を実現することができる。
一部の実施形態において、上記マルチメディアコンテンツの再生方法は、現在のマルチメディアコンテンツの再生配置情報を取得するステップをさらに含んでもよく、再生配置情報は、現在のマルチメディアコンテンツの案内情報、案内情報の表示方式情報と案内情報に対応するテンプレート情報を含んでもよい。ここで、再生配置情報は、マルチメディアコンテンツの制作時に配置されている情報であってもよい。マルチメディアコンテンツの作成者は、マルチメディアコンテンツに対する再生配置情報を配置することができる。選択的に、作成者は、マルチメディアコンテンツに対する複数の案内情報を配置し、各案内情報の表示方式情報と各案内情報にそれぞれ対応するテンプレート情報とを配置することができる。案内情報は、例えば質問と応答を含む問答式案内語であってもよく、例えばいずれかのセンテンスを購読すると、現在のマルチメディアコンテンツの再生をスキップできることをユーザに知らせる文式案内語であってもよい。案内情報の表示方式情報は、案内情報の表示方式を説明するための情報であってもよく、案内情報の表示時点、表示持続時間、表示回数、繰り返して表示する時間間隔(例えば、20秒ごとに1回ずつ表示)、再生インターフェース中の表示位置、表示フォーム(例えば、フローティングウィンドウ方式で表示)などの情報を含むことができる。現在のマルチメディアコンテンツを再生する場合に、現在のマルチメディアコンテンツの識別子に基づいて、対応する再生配置情報を取得することができる。
例示的な情景において、ユーザによりいずれかの映像を再生することが選択されてから、映像サーバは、ユーザにより選択された映像の前に広告を挿入させて再生させることができる。各広告について複数の案内情報を配置することができ、各案内語の表示方式と対応するテンプレート情報とを配置することができる。ここで、案内情報は、テキスト、画像、映像、または音声であってもよく、表示方式は、例えば、ロボットプラカード式、テキストローリング式、5秒間継続的に表示、10秒ごとに1回ずつ表示等の方式であってもよい。ユーザが案内情報に基づいて音声コマンドを発出し、当該音声コマンドとその広告に現在表示されている案内情報に対応するテンプレート情報とがマッチングされる場合に、現在の広告の再生をスキップすることができる。
上記実施例の一部の選択可能な実施形態において、上記案内情報と案内情報に対応するテンプレート情報は、以下のような方法で確定することができる。つまり、予め設定されたマルチメディアコンテンツのライブラリに基づいて、現在のマルチメディアコンテンツを解釈して、マルチメディアコンテンツに含まれているキーセンテンスを抽出し、キーセンテンスをテンプレート情報として確定し、キーセンテンスに対して配置された対応する案内情報を取得することができる。
予め設定されたマルチメディアコンテンツのライブラリは、複数のマルチメディアコンテンツを含むことができ、例えば、実践中に、予め設定されたマルチメディアコンテンツのライブラリは、複数の広告を含む広告ライブラリであってもよい。予め設定されたマルチメディアコンテンツのライブラリにおけるマルチメディアコンテンツを解析して、マルチメディアコンテンツのキーコンテンツを分析し、主題モデルまたはテキストコンテンツによる分析方法を用いて、各マルチメディアコンテンツに含まれているキーセンテンスを抽出することができる。このキーセンテンスは、マルチメディアコンテンツから提供される重要な情報として利用することができ、マルチメディアコンテンツに含まれているテキストコンテンツのうち、情報が一番豊富であり、代表するマルチメディアコンテンツと予め設定されたマルチメディアコンテンツのライブラリにおける他のマルチメディアコンテンツに含まれている情報とを一番よく区別できるセンテンスであってもよい。マルチメディアコンテンツに含まれている各センテンスの情報エントロピーを算出し、算出された情報エントロピーと予め設定されたマルチメディアコンテンツのライブラリにおける他のマルチメディアコンテンツのキーセンテンスとの間の違いまたは類似度を結びつけて、現在のマルチメディアコンテンツのキーセンテンスを選択することもできる。
さらに、選択的に、上記予め設定されたマルチメディアコンテンツのライブラリは、予め設定されたキーコンテンツ識別子を有する複数のマルチメディアコンテンツを含んでもよい。キーコンテンツ識別子は、マルチメディアコンテンツにおける重要なコンテンツを示すためのタグであってもよく、予め配置されることができる。例えば、映像広告のタイプのマルチメディアコンテンツのキーコンテンツ識別子は、映像広告におけるブランド名であってもよい。上記実行本体は、下記のような方法によって、マルチメディアコンテンツに含まれているキーセンテンスを抽出することができる。つまり、現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出し、予め設定されたマルチメディアコンテンツのライブラリの中から、現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、現在のマルチメディアコンテンツの関連マルチメディアコンテンツに確定し、予め設定されたマルチメディアコンテンツのライブラリの中から、現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、現在のマルチメディアコンテンツの非関連マルチメディアコンテンツに確定し、各候補センテンスを含む関連マルチメディアコンテンツの数と、各候補センテンスを含む非関連マルチメディアコンテンツの数を確定して、最終的に、各候補センテンスを含む関連マルチメディアコンテンツの数と非関連マルチメディアコンテンツの数に応じて、候補センテンスから現在のマルチメディアコンテンツのキーセンテンスを確定することができる。
具体的には、ターゲットのマルチメディアコンテンツに対してキーセンテンスを抽出する場合には、まず、ターゲットのマルチメディアから複数の候補センテンスを抽出し、例えば、単にターゲットのマルチメディアコンテンツのテキストコンテンツを複数の候補センテンスに分割することができる。予め設定されたマルチメディアコンテンツのライブラリにおけるマルチメディアコンテンツがターゲットのマルチメディアコンテンツのキーコンテンツ識別子と一致するか否かに応じて、予め設定されたマルチメディアコンテンツのライブラリにおけるマルチメディアコンテンツを関連マルチメディアコンテンツと非関連マルチメディアコンテンツに細分化することができる。続いて、各候補センテンスを含む関連マルチメディアコンテンツの数と非関連マルチメディアコンテンツの数を統計することができる。各候補センテンスについて、当該候補センテンスを含む関連マルチメディアコンテンツの数が大きいほど、また、当該候補センテンスを含む非関連マルチメディアコンテンツの数が小さいほど、当該候補センテンスがターゲットのマルチメディアコンテンツのキーセンテンスとして確定される確率がより大きい。具体的な実現において、当該候補センテンスを含む関連マルチメディアコンテンツの数とこの候補センテンスを含む非関連マルチメディアコンテンツの数との間の差を候補センテンスの重要度指数として利用して、重要度指数に基づいて、各候補センテンスを降順に並べ替え、第1位に配置された候補センテンスを、ターゲットのマルチメディアコンテンツのキーセンテンスとすることができる。
例示的に、映像広告のキーセンテンスを抽出する場合に、映像広告のうち、情報エントロピーが予め設定された情報エントロピーの閾値よりも大きいセンテンスを候補センテンスとして利用することができる。続いて、広告ライブラリの中から、同じブランドの映像広告のうち各候補センテンスを含む映像広告の第1の量を統計し、異なるブランドの映像広告のうち各候補センテンスを含む映像広告の第2の量を統計し、次に、各候補センテンスの第1の量と第2量の差を算出し、第1の量と第2量の差が一番大きい候補センテンスを、抽出されたキーセンテンスとして利用することができる。
続いて、抽出されたキーセンテンスを現在のマルチメディアコンテンツのテンプレート情報として利用し、次に、当該テンプレート情報に対して配置された対応する案内情報を取得することができる。つまり、抽出されたキーセンテンスを現在のマルチメディアコンテンツの再生をスキップできるテンプレート情報として利用し、次に、当該テンプレート情報の内容に従って案内語を配置し、テンプレート情報に対応する案内情報を生成することができる。例えば、抽出されたキーセンテンスが任意のブランドのスローガンである場合に、これについて「私たちのスローガンは何か?」ことを案内情報として配置することができる。
上記キーセンテンスの抽出方法により、異なるキーコンテンツ識別子を有するマルチメディアコンテンツを区別可能なキーセンテンスを、マルチメディアコンテンツから抽出することができる。これにより、キーセンテンスを区別する能力を向上させ、そのキーセンテンスとマッチングされる音声コマンドを発出するようにユーザを案内する場合に、ユーザによりマルチメディアコンテンツのキー情報を識別し記憶する効率を向上させることができるとともに、そのマルチメディアコンテンツと他のマルチメディアコンテンツをよく区別するようにユーザを助けることができる。
上記実施例の一部の選択可能な実施形態において、マルチメディアコンテンツの再生方法は、ユーザコマンドのテキストと案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに提示するための第1の提示情報を生成するステップをさらに含んでもよい。この第1の提示情報は、予め配置された表示方式を備えてもよく、表示方式は、例えば、再生インターフェースの予め設定された位置の表示、予め設定された表示期間、予め設定された字体などを含んでもよい。マルチメディアコンテンツを再生するクライアントが第1の提示情報を取得した後、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに通知するように、予め配置された表示方式によって、第1の提示情報を表示することができる。
上記実施例の一部の選択可能な実施形態において、マルチメディアコンテンツの再生方法は、ユーザコマンドのテキストと案内情報に対応するテンプレート情報とのマッチングの失敗を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功しなかったことをユーザに提示するための第2の提示情報を生成するステップをさらに含んでもよい。ユーザコマンドのテキストと上記テンプレート情報のマッチングが失敗した場合に、第2の提示情報を生成することができる。第2の提示情報も予め設定された表示方式を備えてもよく、マルチメディアコンテンツを再生するクライアントが第2の提示情報を取得した後、対応する表示方式によって、第2の提示情報を表示することができる。選択的に、第2の提示情報は、音声信号を再入力して再生をスキップする操作を誘発するようにユーザに提示するコンテンツをさらに含んでもよい。
選択的に、上記第1の提示情報、第2の提示情報、及び第1の提示情報と第2の提示情報の表示方式は、すべて予め設定され、マルチメディアコンテンツの再生配置情報に含まれることができる。これにより、マルチメディアコンテンツの再生配置情報を取得する上記操作により、第1の提示情報、第2の提示情報、及び第1の提示情報と第2の提示情報の表示方式を取得することができる。ユーザコマンドのテキストと上記テンプレート情報とのマッチングが成功したとか、失敗した場合、既得の再生配置情報から対応する第1の提示情報又は第2の提示情報を抽出する。
上記第1の提示情報および/または第2の提示情報によって、インタラクションの過程でユーザの没入感を更に向上させることができ、現在のマルチメディアコンテンツへのユーザの関心度を向上させるのに有利である。
図3を参照すると、図3は、本発明によるマルチメディアコンテンツの再生方法の一応用情景の模式図を示す。
図3に示すように、端末装置Aで映像を再生する場合に、映像インターフェースに、「映像中の製品のブランド名を言えば、その映像をスキップすることができます。」ことをユーザに提示するための案内語を表示し、ユーザは映像中の案内語を見てから、案内語に応じて製品の名称を言え、端末装置Aは、ユーザにより発出した音声信号Bを検出し、音声識別によりユーザが言ったブランド名を解析して、既得の映像のテンプレート情報(つまり、映像中の製品のブランド名)とのマッチングを行い、マッチングが成功した場合、「すぐに本映像をスキップします。」との第1の提示情報を生成して、ユーザにプッシュすることができる。
図3の情景において、ユーザが言ったブランド名と映像中の製品のブランド名とのマッチングが成功しなかった場合は、「あなたの表現が正確ではありません。もう一度やり直してください。」との第2の提示情報を生成して、ユーザにプッシュすることもできる。
続いて、図4を参照すると、図4は、本発明によるマルチメディアコンテンツの再生方法の他の一実施例のフローチャートを示す。図4に示すように、本実施例のマルチメディアコンテンツの再生方法の流れ400は、以下のようなステップを含む。
ステップ401において、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の合法性を検証する。
本実施例において、マルチメディアコンテンツの再生方法の実行本体(例えば、図1に示された端末装置101、102、103またはサーバ105)は、ユーザにより発出した音声信号が受信されたか否かを検出し、当該音声信号が表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した信号か否かを判断することができる。ここで、案内情報は、現在のマルチメディアコンテンツの再生をスキップする音声コマンドを発出するようにユーザに指示するためのテキスト、音声などの形式の情報であることができる。音声信号が案内情報に基づいて送信されたものであることを確認した後に、様々な方法で音声信号と合法性を検証することができる。
具体的な一実施方式において、音声信号の強度が予め設定された強度閾値を超えたか否かを検査して、音声信号が現在のマルチメディアコンテンツを視聴しているユーザが発出したか否かを判断するとともに、音声信号の強度が十分に大きいか否かを判断して、音声識別結果の正確性を確保することができる。音声信号の強度が予め設定された強度の閾値よりも低い場合には、音声信号の合法性の検証が通過されなかったことを確認することができる。
本実施例の一部の選択可能な実施形態において、以下のような方法を用いて上記音声信号の合法性を検証することができる。つまり、ユーザが案内情報に基づいて発出した音声信号の検出に応じて、ユーザが現在のマルチメディアコンテンツを視聴するのに用いる再生装置とユーザアカウントのセキュリティ認証情報を取得し、再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報の認証を行い、再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報がすべての認証に通過されたことに応じて、音声信号の合法性の検証が通過されたことを確認することができる。
具体的に、ユーザがログインしたときに提出すたユーザアカウントのセキュリティ認証情報を使用して、ユーザのアイデンティティのセキュリティ検証を実行することができる。ユーザがユーザアカウントをサインした後、アクセストークン(Access Token)を取得し、このアクセストークンは、ユーザアカウントのセキュリティ認証情報である。マルチメディアコンテンツの再生サービスを提供するサーバまたはマルチメディアコンテンツを再生するクライアントは、そのアクセストークンを使用してユーザの身元を検証して、音声信号の合法性を検証することができる。再生装置のセキュリティアドレスは、再生装置のネットワークアドレス、装置ID、再生装置とマルチメディアコンテンツの再生サービスを提供するサーバとの間のセキュリティ認証を行うセキュアソケットレイヤー(Secure socket layer、ssl)証明書などを含んでもよく、再生装置のネットワークアドレス、装置ID、sslの証明書を検証して、再生装置の安全性に対する検証を行うことにより、再生装置が受信した音声信号の安全性を検証することができる。これにより、クライアントとサーバの間の双方向の検証を確保し、サーバのバックグラウンドがハイジャックされて、マルチメディアコンテンツを再生されないことを防止し、ユーザのインタラクション操作の安全性を向上させることができる。
再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報がすべての認証を通過した後、音声信号が合法性の検証に通過されたことを確認することができ、再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報のうちの少なくとも一つの検証が通過されなかつた場合には、音声信号が合法性の検証に通過されなかったことを確認することができる。この時、上記実行本体は、不適合の音声信号を遮断し、その後の音声識別などの操作を実行しなくてもよい。
ステップ402において、音声信号の合法性の検証が通過されたことに応じて、音声信号の音声識別を行って対応する音声情報を取得する。
本実施例において、音声信号の合法性の検証を通過した後に、音声を利用して、音声信号について特徴を抽出し、抽出された特徴に基づいて語義などの識別を行って、対応する音声情報を取得することができる。
ステップ403において、音声情報と既得の案内情報に対応するテンプレート情報とをマッチングする。
ここで、テンプレート情報は、予め配置された情報であってもよい。本実施例において、ユーザの音声信号に対応する音声情報と、既得の案内情報に対応するテンプレート情報とのマッチングを行うことにより、現在のマルチメディアコンテンツの再生をスキップする条件を満たすか否かを判断することができる。
ステップ404において、音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認することに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成する。
ステップ403で音声情報と案内情報に対応するテンプレート情報とのマッチングが成功した場合には、現在のマルチメディアコンテンツの再生をスキップする条件を満たしたことを確認し、上記実行本体は、現在のマルチメディアコンテンツの再生をスキップすることを実行するためのコマンドを生成することができる。上記実行本体がマルチメディアコンテンツの再生サービスを提供するサーバである場合、実行本体は、生成されたコマンドを現在のマルチメディアコンテンツを再生するクライアントにプッシュすることができる。上記実行本体がマルチメディアコンテンツを再生するクライアントである場合、上記実行本体は、現在のマルチメディアコンテンツの再生をスキップすることを実行するためのコマンドを生成して、現在のマルチメディアコンテンツの再生をスキップすることができる。
上記マルチメディアの再生方法の流れ400におけるステップ402で音声信号に対して識別を行って対応する音声情報を取得する操作、ステップ403、ステップ404は、前述した実施例におけるステップ201、ステップ202、ステップ203の具体的な実施形態とそれぞれ同じ、上記ステップ201、ステップ202、ステップ203に対する説明は、ステップ402で音声信号に対して音声識別を行って対応するユーザコマンドのテキストを取得する操作、ステップ403、ステップ404にも適用される。
また、上記図2に図示されたマルチメディアコンテンツの再生方法の実施例の各選択可能な実施形態は、図4に図示されたマルチメディアコンテンツの再生方法の実施例にも適用されることができ、これに対する重複された説明は省略する。
本発明の実施例で提供されるマルチメディアコンテンツの再生方法の流れ400は、図2に示された実施例をもとに、ユーザの音声信号の合法性を検証するステップを追加することにより、マルチメディアコンテンツを再生する過程でユーザのインタラクション操作の安全保護性能を向上させる。
さらに図5を参照すると、上記各図面に示された方法の実現として、マルチメディアコンテンツの再生装置の一実施例を提供し、この装置の実施例は、図2に示された方法の実施例と対応し、当該装置は、具体的に各種の電子機器に適用することができる。
図5に示すように、本実施例のマルチメディアコンテンツの再生装置500は、識別ユニット501、マッチングユニット502と生成ユニット503を含む。識別ユニット501は、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得するように構成されることができる。マッチングユニット502は、音声情報と、既得の案内情報に対応するテンプレート情報と、をマッチングするように構成されることができる。生成ユニット503は、音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するように構成されることができる。
本実施例において、識別ユニット501は、ユーザが発出した音声信号が受信されたか否かを検出し、その音声信号が表示された現在のマルチメディアコンテンツの案内情報に基づいて発出したか否かを判断することができる。上記ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号が検出された後に、音声信号を解析して音声信号に対応する音声情報を識別することができる。音声情報は、音声信号の音の特徴を示すための情報および/または音声信号に含まれている語義を示すための情報を含むことができる。
マッチングユニット502は、様々な方式を利用して、識別ユニット501から取得した音声情報と、既得の案内情報に対応するテンプレート情報とをマッチングを行うことができる。例えば、音声情報と上記案内情報に対応するテンプレート情報とのテキストコンテンツのマッチングを直接的に行い、マッチ度が予め設定されたマッチ度の閾値を超えたときに、両者の語義のマッチングが成功したことを確認することができる。また、例えば、自然言語処理方法を利用して、テキスト形式または特徴ベクトルに変換されて示した音声情報と、既得の案内情報に対応するテンプレート情報の語義とについてマッチングを行うことができる。
生成ユニット503は、マッチングユニット502でマッチングが成功したことを確認したとき、現在のマルチメディアコンテンツの再生をスキップする条件を満たしたことを確認して、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成することができる。
一部の選択可能な実施形態において、装置500は、現在のマルチメディアコンテンツの再生配置情報を取得するように構成された取得ユニットをさらに含んでもよく、再生配置情報は、現在のマルチメディアコンテンツの案内情報、案内情報の表示方式情報及び案内情報に対応するテンプレート情報を含んでもよい。
一部の選択可能な実施形態において、上記案内情報は、上記現在のマルチメディアコンテンツの再生をスキップする音声コマンドを発出するようにユーザを案内するのに使用されることができ、上記テンプレート情報は、テンプレートコマンドを含むことができ、上記識別ユニット501は、音声信号を対応するユーザコマンドのテキストに変換する方法によって、音声信号に対して識別を行って対応する音声情報を取得するように構成されることができる。上記マッチングユニット502は、ユーザコマンドのテキストと既得の案内情報に対応するテンプレートコマンドとについて語義のマッチングを行う方法によって、音声情報と既得の案内情報に対応するテンプレート情報とのマッチングを行うように構成されることができる。
一部の選択可能な実施形態において、上記案内情報と案内情報に対応するテンプレート情報とは、以下のような方法によって確定した案内情報とテンプレート情報を含むことができる。つまり、予め設定されたマルチメディアコンテンツのライブラリに基づいて、現在のマルチメディアコンテンツを解析し、マルチメディアコンテンツに含まれているキーセンテンスを抽出して、キーセンテンスをテンプレート情報として確定し、キーセンテンスに対して配置された対応する案内情報を取得することができる。
更に選択可能な実施形態において、予め設定されたマルチメディアコンテンツのライブラリは、キーコンテンツ識別子を有する複数のマルチメディアコンテンツを含み、テンプレート情報であるキーセンテンスは、以下のような方法によって抽出されることができる。つまり、現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出し、予め設定されたマルチメディアコンテンツのライブラリの中から、現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、現在のマルチメディアコンテンツの関連マルチメディアコンテンツに確定し、予め設定されたマルチメディアコンテンツのライブラリの中から、現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、現在のマルチメディアコンテンツの非関連マルチメディアコンテンツに確定し、各候補センテンスを含む関連マルチメディアコンテンツの数と、各候補センテンスを含む非関連マルチメディアコンテンツの数を確定し、各候補センテンスを含む関連マルチメディアコンテンツの数と非関連マルチメディアコンテンツの数に応じて、候補センテンスから現在のマルチメディアコンテンツのキーセンテンスを確定することができる。
一部の選択可能な実施形態において、上記識別ユニット501は、以下のような方法によって、音声信号に対して音声識別を行って対応する音声情報を取得するように構成されることができる。つまり、ユーザが案内情報に基づいて発出した音声信号の検出に応じて、音声信号の合法性を検証し、音声信号の合法性の検証が通過されたことに応じて、音声信号についての音声識別を行って対応する音声情報を取得することができる。
一部の選択可能な実施形態において、上記識別ユニット501は、以下のような方法によって、音声信号の合法性を検証するように構成されることができる。つまり、ユーザが案内情報に基づいて発出した音声信号の検出に応じて、ユーザが現在のマルチメディアコンテンツを視聴するのに用いる再生装置とユーザアカウントのセキュリティ認証情報を取得し、再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報の認証を行い、再生装置のセキュリティ認証情報とユーザアカウントのセキュリティ認証情報がすべての認証に通過されたことに応じて、音声信号の合法性の検証が通過されたことを確認することができる。
一部の選択可能な実施形態において、装置500は、音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップに成功したことをユーザに提示するための第1の提示情報を生成するように構成された第1提示ユニットをさらに含むことができる。
一部の選択可能な実施形態において、装置500は、音声情報と案内情報に対応するテンプレート情報とのマッチングが失敗されたことを確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップに成功しなかったことをユーザに提示するための第2の提示情報を生成するように構成された第2の提示ユニットをさらに含むことができる。
装置500に記載された一部のユニットは、図2及び図4を参照して説明した方法の各ステップに対応する。これにより、前述した方法について説明した操作と特徴は、装置500と、これに含まれているユニットに同様に適用され、これに対する重複された説明は省略する。
本発明の実施例のマルチメディアコンテンツの再生装置は、識別ユニットにより、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得し、マッチングユニットは、音声情報と既得の案内情報に対応するテンプレート情報とをマッチングし、生成ユニットは、音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成することにより、マルチメディアコンテンツを取得する効率の向上を実現することができる。
以下、本発明の実施例を実現するための電子機器に適用されるコンピュータシステム600を示す構造模式図である図6を参照する。図6に示された電子機器は、単に例示であるだけで、本発明の実施例の機能と使用範囲について何ら限定されらない。
図6に示すように、コンピュータシステム600は、読み出し専用メモリ(ROM)602に記憶されているプログラム又は記憶部608からランダムアクセスメモリ(RAM)603にロードされたプログラムに基づいて様々な適当な動作および処理を実行することができる中央処理装置(CPU)601を備える。RAM603には、システム600の操作に必要な様々なプログラムおよびデータがさらに記憶されている。CPU601、ROM602およびRAM603は、バス604を介して互いに接続されている。入力/出力(I/O)インターフェース605もバス604に接続されている。
キーボード、マウスなどを含む入力部606、陰極線管(CRT)、液晶ディスプレイ(LCD)など、およびスピーカなどを含む出力部607、ハードディスクなどを含む記憶部608、およびLANカード、モデムなどを含むネットワークインターフェースカードの通信部609は、I/Oインターフェース605に接続されている。通信部609は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ610は、必要に応じてI/Oインターフェース605に接続される。リムーバブルメディア611は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ610に取り付けられ、したがって、ドライバ610から読み出されたコンピュータプログラムが必要に応じて記憶部608にインストールされる。
特に、本発明の実施例によれば、上記フローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータプログラム製品を含み、当該コンピュータプログラム製品は、機械可読媒体に有形に具現化されるコンピュータプログラムを含み、前記コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、当該コンピュータプログラムは、通信部609を介してネットワークからダウンロードされてインストールされてもよく、および/またはリムーバブルメディア611からインストールされてもよい。そのコンピュータプログラムが中央生成ユニット(601; CPU)によって実行されると、本発明の方法に限定された上記機能を実行する。本発明のコンピュータ可読媒体は、コンピュータに読み取り可能な信号媒体、コンピュータ読み取り可能な記憶媒体または上記両者の任意の組み合わせであってもよい。コンピュータ読み取り可能な記憶媒体は、電気、磁気、光学、電磁、赤外線、または半導体のシステム、装置、素子、または上記任意の組み合わせであってもよいが、これに限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例は、1つまたは複数の導線を備える電気接続されたポータブルコンピュータ、磁気ディスク、ハードディスク、ランダムアクセスメモリ装置(RAM)、読み取り専用メモリ装置(ROM)、消去およびプログラム可能な読み取り専用メモリ装置(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ装置(CD−ROM)、光メモリ装置、磁気メモリ装置または上記任意の適切な組み合わせを含むことができるが、これに限定されない。本発明において、コンピュータ読み取り可能な記憶媒体は、プログラムを含み、または記憶する任意のタイプの媒体であってもよく、そのプログラムは、コマンドの実行システム、装置または素子によって使用され、またはこの組み合わせてで使用されることができる。本発明において、コンピュータ読み取り可能な信号媒体は、ベースバンドまたはキャリアの一部で伝達されるデータ信号を含むことができ、ここで、データ信号は、コンピュータ読み取り可能なプログラムコードが搭載される。このように伝播されるデータ信号は、様々な形式を利用することができ、電磁信号、光信号または上記任意の適切な組み合わせを含むが、これに限定されない。コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記憶媒体を除く任意のコンピュータ読み取り可能な媒体であってもいく、このコンピュータ読み取り可能な媒体は、コマンド実行システム、装置または素子によって使用されるとか、これを組み合わせて使用されるように、プログラムを送信、伝送または転送することができる。コンピュータ読み取り可能な媒体に含まれているプログラムコードは、任意の適切な媒体を利用して送信することができ、無線、有線、ケーブル、RFなど、または上記任意の適切な組み合わせを含んでもよいが、これに限定されない。
1つまたは複数のプログラミング言語、またはこれらの組み合わせで、本発明の操作を実行するためのコンピュータプログラムコードをプログラミングすることができ、プログラミング言語は、例えばJava、Smalltalk、C ++などのオブジェクト指向のプログラミング言語を含み、例えば“C”言語または類似のプログラミング言語のような従来の手続き型プログラミング言語をさらに含んでもよい。プログラムコードは、全体的にパーソナルコンピュータで実行されるとか、部分的にパーソナルコンピュータで実行されるとか、1つの独立したソフトウェアパッケージとして実行されるとか、部分的にパーソナルコンピュータで実行されて部分的にリモートコンピュータ上で実行されるとか、または全体的にリモートコンピュータまたはサーバの上で実行されることができる。リモートコンピュータの情景において、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してパーソナルコンピュータに接続することができ、または外部のコンピュータに接続することができ、例えば、インターネットサービスプロバイダを利用して、インターネットを介して接続することができる。
図面におけるフローチャートおよびブロック図は、本発明の各実施例に係るシステム、方法およびコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャートまたはブロック図における各枠は、1つのモジュール、プログラムセグメント、またはコードの一部を代表してもよく、前記モジュール、プログラムセグメント、またはコードの一部は、規定された論理機能を実現するための1つ以上の実行可能なコマンドを含む。なお、いくつかの代替実施態様として、枠に示された機能は、図面に示された順番と異なる順番で実行されてもよい。例えば、連続して示された2つの枠は、関連する機能に応じて、実際にほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図および/またはフローチャートにおける各枠と、ブロック図および/またはフローチャートにおける枠の組合せは、規定された機能または操作を実行する、ハードウェアに基づく専用システムで実現されてもよく、あるいは、専用ハードウェアとコンピュータのコマンドとの組合せで実行されてもよい。
本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサにインストールされてもよく、例えば、プロセッサが識別ユニット、マッチングユニットと生成ユニットを含むとして記載されてもよい。ここで、これらのユニットの名称は、一部のケースに該当するユニット自体を限定するものではなく、例えば、識別ユニットは、「ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得するユニット」として記載されてもよい。
他の一態様として、本発明は、コンピュータ可読媒体を提供し、そのコンピュータ可読媒体は、上記実施例で説明された装置に含まれてもよく、装置にインストールされず、独立して存在してもよい。上記コンピュータ可読媒体は、1つまたは複数のプログラムが搭載され、上記1つまたは複数のプログラムが装置によって実行されると、その装置に、ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、音声信号の識別を行って対応する音声情報を取得し、音声情報と既得の案内情報に対応するテンプレート情報とをマッチングし、音声情報と案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成することを実行させる。
以上の記載は、本発明の好ましい実施例、および使用された技術的原理の説明に過ぎない。本発明に係る特許請求の範囲が、上記技術的特徴の特定な組合せからなる技術案に限定されることではなく、本発明の趣旨を逸脱しない範囲で、上記技術的特徴または同等の特徴の任意の組合せからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記特徴と、本発明に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。

Claims (20)

  1. マルチメディアコンテンツの再生方法であって、
    ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するステップと、
    前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするステップと、
    前記音声情報と前記テンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するステップと、を含む
    ことを特徴とするマルチメディアコンテンツの再生方法。
  2. 現在のマルチメディアコンテンツの再生配置情報を取得するステップであって、前記再生配置情報は、前記現在のマルチメディアコンテンツの案内情報、前記案内情報の表示方式情報及び前記案内情報に対応するテンプレート情報を含む、ステップをさらに含む
    ことを特徴とする請求項1に記載のマルチメディアコンテンツの再生方法。
  3. 前記案内情報は、前記現在のマルチメディアコンテンツの再生をスキップするための音声のコマンドを発出するようにユーザを案内するのに用い、前記テンプレート情報は、テンプレートコマンドを含み、
    前記音声信号の識別を行って対応する音声情報を取得するステップは、
    前記音声信号を対応するユーザコマンドのテキストに変換するステップを含み、
    前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするステップは、
    前記ユーザコマンドのテキストと、既得の前記案内情報に対応するテンプレートコマンドとについて語義のマッチングを行うステップを含む
    ことを特徴とする請求項1に記載のマルチメディアコンテンツの再生方法。
  4. 前記案内情報及び前記案内情報に対応するテンプレート情報は、
    予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出し、
    前記キーセンテンスを前記テンプレート情報として確定し、
    前記キーセンテンスに対して配置された対応する案内情報を取得する、との方法によって確定された案内情報及びテンプレート情報を含む
    ことを特徴とする請求項1に記載のマルチメディアコンテンツの再生方法。
  5. 前記予め設定されたマルチメディアコンテンツのライブラリは、キーコンテンツ識別子を有する複数のマルチメディアコンテンツを含み、
    前記予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出するステップは、
    前記現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出するステップと、
    予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの関連マルチメディアコンテンツとして確定するステップと、
    予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの非関連マルチメディアコンテンツとして確定するステップと、
    各候補センテンスを含む関連マルチメディアコンテンツの数及び各候補センテンスを含む非関連マルチメディアコンテンツの数を確定するステップと、
    各候補センテンスを含む関連マルチメディアコンテンツの数及び非関連マルチメディアコンテンツの数に基づいて、候補センテンスから前記現在のマルチメディアコンテンツのキーセンテンスを確定するステップと、を含む
    ことを特徴とする請求項4に記載のマルチメディアコンテンツの再生方法。
  6. ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するステップは、
    ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証するステップと、
    前記音声信号の合法性の検証が通過されたことに応じて、前記音声信号に対して音声識別を行って対応する音声情報を取得するステップと、を含む
    ことを特徴とする請求項1に記載のマルチメディアコンテンツの再生方法。
  7. ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証するステップは、
    ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、ユーザが前記現在のマルチメディアコンテンツを視聴するのに用いられる再生装置及びユーザアカウントのセキュリティ認証情報を取得するステップと、
    前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とに対して認証を行うステップと、
    前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とがすべて通過されたことに応じて、前記音声信号の合法性の検証が通過されたと確認するステップと、を含む
    ことを特徴とする請求項6に記載のマルチメディアコンテンツの再生方法。
  8. 前記音声情報と、前記案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに提示するための第1の提示情報を生成するステップをさらに含む
    ことを特徴とする請求項1に記載のマルチメディアコンテンツの再生方法。
  9. 前記音声情報と、前記案内情報に対応するテンプレート情報とのマッチングの失敗を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功しなかったことをユーザに提示するための第2の提示情報を生成するステップをさらに含むことを特徴とする請求項1から請求項8のいずれかに記載のマルチメディアコンテンツの再生方法。
  10. マルチメディアコンテンツの再生装置であって、
    ユーザが表示された現在のマルチメディアコンテンツの案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の識別を行って対応する音声情報を取得するように構成されている識別ユニットと、
    前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするように構成されているマッチングユニットと、
    前記音声情報と前記テンプレート情報とのマッチングの成功を確認したことに応じて、現在のマルチメディアコンテンツの再生をスキップする操作を実行するためのコマンドを生成するように構成されている生成ユニットと、を含む
    ことを特徴とするマルチメディアコンテンツの再生装置。
  11. 現在のマルチメディアコンテンツの再生配置情報を取得するように構成されている取得ユニットであって、前記再生配置情報は、前記現在のマルチメディアコンテンツの案内情報、前記案内情報の表示方式情報及び前記案内情報に対応するテンプレート情報を含む、取得ユニットをさらに含む
    ことを特徴とする請求項10に記載のマルチメディアコンテンツの再生装置。
  12. 前記案内情報は、前記現在のマルチメディアコンテンツの再生をスキップするための音声のコマンドを発出するようにユーザを案内するのに用い、前記テンプレート情報は、テンプレートコマンドを含み、
    前記識別ユニットは、前記音声信号を対応するユーザコマンドのテキストに変換する方法によって、前記音声信号の識別を行って対応する音声情報を取得するように構成され、
    前記マッチングユニットは、前記ユーザコマンドのテキストと、既得の前記案内情報に対応するテンプレートコマンドとについて語義のマッチングを行う方法によって、前記音声情報と、既得の前記案内情報に対応するテンプレート情報と、をマッチングするように構成されている
    ことを特徴とする請求項10に記載のマルチメディアコンテンツの再生装置。
  13. 前記案内情報及び前記案内情報に対応するテンプレート情報は、
    予め設定されたマルチメディアコンテンツのライブラリに基づいて、前記現在のマルチメディアコンテンツを解析して、前記マルチメディアコンテンツに含まれているキーセンテンスを抽出し、
    前記キーセンテンスを前記テンプレート情報として確定し、
    前記キーセンテンスに対して配置された対応する案内情報を取得する、との方法によって確定された案内情報及びテンプレート情報を含む
    ことを特徴とする請求項10に記載のマルチメディアコンテンツの再生装置。
  14. 前記予め設定されたマルチメディアコンテンツのライブラリは、キーコンテンツ識別子を有する複数のマルチメディアコンテンツを含み、
    前記テンプレート情報としてのキーセンテンスは、
    前記現在のマルチメディアコンテンツのテキストコンテンツから複数の候補センテンスを抽出し、
    予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと同じキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの関連マルチメディアコンテンツとして確定し、
    予め設定されたマルチメディアコンテンツのライブラリの中から、前記現在のマルチメディアコンテンツと異なるキーコンテンツ識別子を有するマルチメディアコンテンツを、前記現在のマルチメディアコンテンツの非関連マルチメディアコンテンツとして確定し、
    各候補センテンスを含む関連マルチメディアコンテンツの数及び各候補センテンスを含む非関連マルチメディアコンテンツの数を確定し、
    各候補センテンスを含む関連マルチメディアコンテンツの数及び非関連マルチメディアコンテンツの数に基づいて、候補センテンスから前記現在のマルチメディアコンテンツのキーセンテンスを確定する、との方法によって抽出される
    ことを特徴とする請求項13に記載のマルチメディアコンテンツの再生装置。
  15. 前記識別ユニットは、さらに
    ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、前記音声信号の合法性を検証し、
    前記音声信号の合法性の検証が通過されたことに応じて、前記音声信号に対して音声識別を行って対応する音声情報を取得する、との方法によって、
    前記音声信号の音声識別を行って対応する音声情報を取得するように構成されている
    ことを特徴とする請求項10に記載のマルチメディアコンテンツの再生装置。
  16. 前記識別ユニットは、さらに
    ユーザが前記案内情報に基づいて発出した音声信号の検出に応じて、ユーザが前記現在のマルチメディアコンテンツを視聴するのに用いられる再生装置及びユーザアカウントのセキュリティ認証情報を取得し、
    前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とに対して認証を行い、
    前記再生装置のセキュリティ認証情報と前記ユーザアカウントのセキュリティ認証情報とがすべて通過されたことに応じて、前記音声信号の合法性の検証が通過されたことを確認する、との方法によって、
    前記音声信号の合法性を検証するように構成されている
    ことを特徴とする請求項15に記載のマルチメディアコンテンツの再生装置。
  17. 前記音声情報と、前記案内情報に対応するテンプレート情報とのマッチングの成功を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功したことをユーザに提示するための第1の提示情報を生成するように構成されている第1の提示ユニットをさらに含む
    ことを特徴とする請求項10に記載のマルチメディアコンテンツの再生装置。
  18. 前記音声情報と、前記案内情報に対応するテンプレート情報とのマッチングの失敗を確認したことに応じて、現在の再生されているマルチメディアコンテンツのスキップが成功しなかったことをユーザに提示するための第2の提示情報を生成するように構成されている第2の提示ユニットをさらに含む
    ことを特徴とする請求項10から請求項17のいずれかに記載のマルチメディアコンテンツの再生装置。
  19. 1つまたは複数のプロセッサと、
    1つまたは複数のプログラムを格納するための記憶装置とを含み、
    前記1つまたは複数のプログラムが、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1から請求項9のいずれかに記載されている方法を実現させる
    ことを特徴とする電子機器。
  20. コンピュータプログラムが記憶されており、
    前記プログラムがプロセッサによって実行されると、請求項1から請求項9のいずれかに記載されている方法を実現する
    ことを特徴とするコンピュータ可読媒体。
JP2018093178A 2018-03-20 2018-05-14 マルチメディアコンテンツの再生方法及び装置{multimedia content playback method and apparatus} Active JP6634470B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810231476.4A CN108347646B (zh) 2018-03-20 2018-03-20 多媒体内容播放方法和装置
CN201810231476.4 2018-03-20

Publications (2)

Publication Number Publication Date
JP2019165422A true JP2019165422A (ja) 2019-09-26
JP6634470B2 JP6634470B2 (ja) 2020-01-22

Family

ID=62167237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018093178A Active JP6634470B2 (ja) 2018-03-20 2018-05-14 マルチメディアコンテンツの再生方法及び装置{multimedia content playback method and apparatus}

Country Status (6)

Country Link
US (1) US10643612B2 (ja)
EP (1) EP3543998B1 (ja)
JP (1) JP6634470B2 (ja)
KR (1) KR102023842B1 (ja)
CN (1) CN108347646B (ja)
TW (1) TWI667916B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021093147A (ja) * 2019-12-06 2021-06-17 チソット・エス アー 携行型時計をリモートサーバーにセキュアに接続する方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108347646B (zh) * 2018-03-20 2019-07-02 百度在线网络技术(北京)有限公司 多媒体内容播放方法和装置
CN108933730A (zh) * 2018-06-29 2018-12-04 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN108924604A (zh) * 2018-08-22 2018-11-30 百度在线网络技术(北京)有限公司 用于播放视频的方法和装置
CN109764889A (zh) * 2018-12-06 2019-05-17 深圳前海达闼云端智能科技有限公司 导盲方法和装置,存储介质和电子设备
CN109992248B (zh) * 2019-02-25 2022-07-29 阿波罗智联(北京)科技有限公司 语音应用的实现方法、装置、设备及计算机可读存储介质
CN109979451A (zh) 2019-03-20 2019-07-05 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110992960A (zh) * 2019-12-18 2020-04-10 Oppo广东移动通信有限公司 控制方法、装置、电子设备和存储介质
CN113157236B (zh) * 2020-01-22 2024-06-14 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN111581403B (zh) * 2020-04-01 2023-05-23 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备及存储介质
CN111432030B (zh) * 2020-04-17 2023-11-28 支付宝(杭州)信息技术有限公司 一种信息发布方法、装置、设备及介质
CN111552794B (zh) * 2020-05-13 2023-09-19 海信电子科技(武汉)有限公司 提示语生成方法、装置、设备和存储介质
CN112687289A (zh) * 2020-11-27 2021-04-20 雄狮汽车科技(南京)有限公司 音频广告的屏蔽方法和电子设备
CN113722515B (zh) * 2021-08-24 2023-08-18 北京奇艺世纪科技有限公司 共享信息处理方法、装置、***及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004120324A (ja) * 2002-09-26 2004-04-15 Toshiba Corp コンテンツ再生装置、コンテンツ再生方法及びコンテンツ配信方法
JP2007322836A (ja) * 2006-06-01 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体
JP2016052130A (ja) * 2014-08-31 2016-04-11 シュムエリ,コビ 広告メッセージを送る方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180904B1 (en) * 2001-04-26 2012-05-15 Nokia Corporation Data routing and management with routing path selectivity
US9400875B1 (en) * 2005-02-11 2016-07-26 Nokia Corporation Content routing with rights management
US20080287100A1 (en) * 2007-05-18 2008-11-20 Aol Llc Mobile account access through a data processing system
CN101360234A (zh) * 2008-09-26 2009-02-04 北京新岸线网络技术有限公司 多媒体信息的播放方法和播放***、终端设备、服务器
US9876848B1 (en) * 2014-02-21 2018-01-23 Twitter, Inc. Television key phrase detection
CN103945265A (zh) * 2014-04-11 2014-07-23 飞狐信息技术(天津)有限公司 一种广告处理方法及终端
CN104681023A (zh) * 2015-02-15 2015-06-03 联想(北京)有限公司 一种信息处理方法及电子设备
CN107659847B (zh) 2016-09-22 2019-10-15 腾讯科技(北京)有限公司 语音互动方法和装置
CN106850539A (zh) * 2016-12-07 2017-06-13 广东小天才科技有限公司 一种验证信息获取方法和装置
CN107071542B (zh) * 2017-04-18 2020-07-28 百度在线网络技术(北京)有限公司 视频片段播放方法及装置
CN108347646B (zh) * 2018-03-20 2019-07-02 百度在线网络技术(北京)有限公司 多媒体内容播放方法和装置
US11605242B2 (en) * 2018-06-07 2023-03-14 Motorola Mobility Llc Methods and devices for identifying multiple persons within an environment of an electronic device
US11016720B2 (en) * 2018-06-15 2021-05-25 Bose Corporation Audio system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004120324A (ja) * 2002-09-26 2004-04-15 Toshiba Corp コンテンツ再生装置、コンテンツ再生方法及びコンテンツ配信方法
JP2007322836A (ja) * 2006-06-01 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体
JP2016052130A (ja) * 2014-08-31 2016-04-11 シュムエリ,コビ 広告メッセージを送る方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021093147A (ja) * 2019-12-06 2021-06-17 チソット・エス アー 携行型時計をリモートサーバーにセキュアに接続する方法
JP7084461B2 (ja) 2019-12-06 2022-06-14 チソット・エス アー 携行型時計をリモートサーバーにセキュアに接続する方法
US11621956B2 (en) * 2019-12-06 2023-04-04 Tissot Sa Method for securely connecting a watch to a remote server

Also Published As

Publication number Publication date
KR102023842B1 (ko) 2019-09-20
US10643612B2 (en) 2020-05-05
TW201941618A (zh) 2019-10-16
CN108347646B (zh) 2019-07-02
EP3543998B1 (en) 2022-05-04
CN108347646A (zh) 2018-07-31
TWI667916B (zh) 2019-08-01
EP3543998A1 (en) 2019-09-25
US20190295543A1 (en) 2019-09-26
JP6634470B2 (ja) 2020-01-22

Similar Documents

Publication Publication Date Title
JP6634470B2 (ja) マルチメディアコンテンツの再生方法及び装置{multimedia content playback method and apparatus}
US10586541B2 (en) Communicating metadata that identifies a current speaker
CN108683937B (zh) 智能电视的语音交互反馈方法、***及计算机可读介质
US10158633B2 (en) Using the ability to speak as a human interactive proof
JP6592583B1 (ja) 情報交換用の方法及び装置
CN108012173B (zh) 一种内容识别方法、装置、设备和计算机存储介质
WO2021175019A1 (zh) 音视频录制引导方法、装置、计算机设备及存储介质
JP6785904B2 (ja) 情報プッシュ方法及び装置
CN106971009B (zh) 语音数据库生成方法及装置、存储介质、电子设备
WO2019047613A1 (zh) 验证***、方法和装置
CN112399258B (zh) 直播回放视频生成播放方法、装置、存储介质及电子设备
WO2018211983A1 (en) Speech enhancement for speech recognition applications in broadcasting environments
US8850556B2 (en) Interactive video captcha
CN112423081B (zh) 一种视频数据处理方法、装置、设备及可读存储介质
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
CN112153397B (zh) 视频处理方法、装置、服务器及存储介质
CN117390277B (zh) 一种课程资源和服务的管理方法及***
CN112948788A (zh) 语音验证方法、装置、计算设备以及介质
KR20210009903A (ko) 질의 응답 방법 및 이를 수행하는 장치들
CN111785280A (zh) 身份认证方法和装置、存储介质和电子设备
CN113808615B (zh) 音频类别定位方法、装置、电子设备和存储介质
CN116052659A (zh) 会议场景下的信息处理方法、装置、电子设备和存储介质
CN114742152A (zh) 数据分类方法和装置、计算机可读存储介质、电子设备
KR20150114323A (ko) 말하기 서비스 제공 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191216

R150 Certificate of patent or registration of utility model

Ref document number: 6634470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250