JP2022073709A - Information processing apparatus, information processing method, and program - Google Patents
Information processing apparatus, information processing method, and program Download PDFInfo
- Publication number
- JP2022073709A JP2022073709A JP2020183866A JP2020183866A JP2022073709A JP 2022073709 A JP2022073709 A JP 2022073709A JP 2020183866 A JP2020183866 A JP 2020183866A JP 2020183866 A JP2020183866 A JP 2020183866A JP 2022073709 A JP2022073709 A JP 2022073709A
- Authority
- JP
- Japan
- Prior art keywords
- genre
- text information
- unit
- video content
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本開示は、情報処理装置、情報処理方法及びプログラムに関する。 The present disclosure relates to information processing devices, information processing methods and programs.
動画コンテンツ記録装置の大容量化及び動画コンテンツ配信技術の進歩に伴い、ユーザが視聴することのできる動画コンテンツが増加し、視聴方法も多様化している。そのため、特定のトピックを視聴したい場合、ユーザは大量の動画コンテンツの中から所望するコンテンツを探し出し、その動画コンテンツの特定部分を検索する必要がある。 With the increase in the capacity of video content recording devices and the progress of video content distribution technology, the number of video contents that can be viewed by users is increasing, and the viewing methods are also diversifying. Therefore, when it is desired to watch a specific topic, the user needs to search for the desired content from a large amount of video content and search for a specific part of the video content.
動画コンテンツの特定部分を検索する方法として、予め定めた単一の手法を適用して検索可能なインデックスを生成し、それらの各々について、動画コンテンツと同じ時間軸上での開始時間を示すタイムスタンプ情報とインデックスとをデータベースに格納することで特定部分を検索する方法が用いられていた(例えば、特許文献1)。 As a method of searching a specific part of video content, a single predetermined method is applied to generate a searchable index, and a time stamp indicating the start time of each of them on the same time axis as the video content. A method of searching for a specific part by storing information and an index in a database has been used (for example, Patent Document 1).
特許文献1に記載の情報処理装置は、動画コンテンツに含まれる音声データを動画の時間軸上で複数に分割することで生成される複数の音声データの各々について、動画の時間軸上での開始時間を示すタイムスタンプ情報と、該音声データを文字列に変換したテキスト情報と、該動画とを対応づけて格納する。これにより、ユーザは所望するコンテンツの特定部分を検索することができると説明されている。 The information processing apparatus described in Patent Document 1 starts on the time axis of a moving image for each of a plurality of audio data generated by dividing the audio data included in the moving image content into a plurality of pieces on the time axis of the moving image. The time stamp information indicating the time, the text information obtained by converting the voice data into a character string, and the moving image are stored in association with each other. It is explained that this allows the user to search for a specific part of the desired content.
動画コンテンツには多種多様なジャンルのものがあり、ジャンルによっては、文字列に変換可能な音声データを含まない動画コンテンツもある。これに対し、特許文献1に記載の情報処理装置は、動画コンテンツに含まれる音声データを文字列に変換してテキスト情報を生成するという単一の手法を用いて検索用のインデックスを生成する。 There are various genres of video content, and some genres do not include audio data that can be converted into character strings. On the other hand, the information processing apparatus described in Patent Document 1 generates a search index by using a single method of converting audio data included in a moving image content into a character string to generate text information.
このため、特許文献1に記載の情報処理装置によれば、音声データから検索に有用な文字列に変換できないジャンルの動画コンテンツの場合、ユーザが視聴を所望する特定部分の検索を行うことができないという課題があった。 Therefore, according to the information processing apparatus described in Patent Document 1, in the case of video content of a genre that cannot be converted from audio data into a character string useful for searching, it is not possible to search for a specific part desired by the user. There was a problem.
本開示は、上述のような事情に鑑みてなされたものであり、動画コンテンツのジャンルに依らず、ユーザが視聴を所望する特定部分の検索ができる情報処理装置、情報処理方法及びプログラムを提供することを目的とする。 The present disclosure has been made in view of the above circumstances, and provides an information processing device, an information processing method, and a program capable of searching a specific part desired to be viewed by a user regardless of the genre of video content. The purpose is.
上記目的を達成するため、本開示の情報処理装置は、ジャンル別の、動画コンテンツの検索に有用なテキスト情報のパターンであるジャンル別パターンを格納するパターンDB部を備える。また、情報処理装置は、テキスト情報を生成する対象である動画コンテンツのジャンルを設定するジャンル設定部と、パターンDB部に格納されている、ジャンル設定部が設定したジャンルに対応するジャンル別パターンに基づいて、動画コンテンツの画像データ又は音声データから生成したテキスト情報が、そのジャンルの検索用として有用か否かを判定し、有用であると判定したテキスト情報を動画コンテンツに対応づけて記録する記録処理部と、を備える。更に、情報処理装置は、記録処理部が記録したテキスト情報に対して検索を実行する検索部を備えることを特徴とする。 In order to achieve the above object, the information processing apparatus of the present disclosure includes a pattern DB unit for storing a genre-specific pattern, which is a pattern of text information useful for searching video content by genre. In addition, the information processing device has a genre setting unit that sets the genre of the video content that is the target of generating text information, and a genre-specific pattern that corresponds to the genre set by the genre setting unit that is stored in the pattern DB unit. Based on this, it is determined whether or not the text information generated from the image data or audio data of the video content is useful for searching the genre, and the text information determined to be useful is recorded in association with the video content. It is equipped with a processing unit. Further, the information processing apparatus is characterized by including a search unit that executes a search for the text information recorded by the recording processing unit.
本開示によれば、動画コンテンツのジャンルに適応したテキスト情報を検索に用いるため、動画コンテンツのジャンルに依らず、ユーザが視聴を所望する特定部分の検索が可能となる。 According to the present disclosure, since text information adapted to the genre of the video content is used for the search, it is possible to search for a specific part desired by the user regardless of the genre of the video content.
(実施の形態)
以下に、本開示を実施するための形態について図面を参照して詳細に説明する。
(Embodiment)
Hereinafter, embodiments for carrying out the present disclosure will be described in detail with reference to the drawings.
この開示の実施の形態に係る情報処理装置10は、動画コンテンツを記録し、動画コンテンツから特定部分の検索を実行する。図1は、本実施の形態に係る情報処理装置10のハードウェア構成例を示すブロック図であり、図2は、情報処理装置10の機能構成例を示した機能ブロック図である。
The
情報処理装置10は、図1に示すように、動画コンテンツに係る演算処理を実行するCPU(Central Processing Unit)11と、CPU11により取得し又は生成したデータを記憶する記憶装置12と、ユーザの入力操作を受け付ける操作入力デバイス13と、動画コンテンツの映像データ及び付帯するデジタルデータを受け付ける動画コンテンツ入力デバイス14と、動画コンテンツ及び検索結果を含む情報を出力する出力デバイス15と、を有する。
As shown in FIG. 1, the
CPU11は、記憶装置12に格納されるプログラムを実行することにより、図2に示すように、UI(User Interface)部111、検索部112、ジャンル指定部113、生成部114、及び、動画出力部115として機能する。なお、該プログラムは、例えばCPU11に内蔵されている不揮発性半導体メモリに格納し、又は、一時的な揮発性半導体メモリに展開することができる。
By executing the program stored in the
記憶装置12は、任意の記憶装置であり、例えば、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)を含む不揮発性半導体メモリ、又は、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disc)である。
The
記憶装置12は、図2に示すように、動画コンテンツ1211及び動画コンテンツ1211から生成したチャプター情報1212を記録する動画記録部121と、動画コンテンツ1211のジャンルに応じたテキスト情報のパターンを格納するデータベース(Data Base: DB)であるパターンDB部122と、を含む。
As shown in FIG. 2, the
操作入力デバイス13は、ユーザの入力操作を受け付ける任意のデバイスであって、例えば、マウス、タッチパッドを含むポインティングデバイス、又は、キーボードである。操作入力デバイス13は、ユーザが所望する動画コンテンツ1211の特定部分を検索するためのキーワードを受け付け、CPU11のUI部111を介して検索部112に該キーワードを渡す。また、操作入力デバイス13は、動画コンテンツ1211のジャンルを指定するユーザの入力操作を受け付けて、CPU11のジャンル指定部113を介して生成部114に該ジャンルを渡す。
The
動画コンテンツ入力デバイス14は、データ通信機能を有し、動画コンテンツの映像データ及び付帯するデジタルデータを受け付ける。動画コンテンツのデジタルデータは、例えば、動画コンテンツ名、及び、属性又は関連する情報を含むメタ情報である。動画コンテンツ入力デバイス14は、取得したデータをCPU11の生成部114に渡す。
The video
出力デバイス15は、文字及び画像を出力し、ユーザに対して表示する任意の情報表示デバイスであって、例えばLCD(Liquid crystal display)である。出力デバイス15は、UI部111が出力するユーザの入力操作画面を表示してもよい。
The
次に、図2に示したCPU11の各機能部について詳細に説明する。
Next, each functional unit of the
CPU11のジャンル指定部113は、動画コンテンツ1211のジャンルについてユーザが操作入力デバイス13へ入力した情報に基づいて、動画コンテンツ1211のジャンルを指定し、生成部114に入力する。生成部114は、動画コンテンツ入力デバイス14より入力された動画コンテンツ1211の映像データ、及び、動画コンテンツ1211のデジタルデータに基づいて、テキスト情報及びタイムスタンプ情報を含むチャプター情報1212を生成し、記憶装置12の動画記録部121に記録する。
The
生成部114は、ジャンル設定部1141と、記録処理部1142と、画像認識部1143と、音声認識部1144と、を有する。
The
ジャンル設定部1141は、チャプター情報1212を生成する対象である動画コンテンツ1211のジャンルを、該動画コンテンツの名称(動画コンテンツ名)及びメタ情報に基づいて判定したジャンル、又は、ジャンル指定部113により指定されたジャンルに設定する。ジャンルを設定後、生成部114は、設定されたジャンルに対応づけられたテキスト情報生成方法を用いて、テキスト情報を生成する。
The
例えば、テレビ番組の映像ストリームが動画コンテンツ入力デバイス14に入力された場合、テレビ番組名やテレビ番組の公式情報(Service Information)に含まれるジャンルに係るメタ情報が生成部114のジャンル設定部1141に入力される。ジャンル設定部1141は、ジャンル指定部113がユーザによる指定を取得していない場合には、動画コンテンツ1211に付帯されているメタ情報に基づいてジャンルを決定する。
For example, when a video stream of a TV program is input to the video
記録処理部1142は、ジャンル設定部1141が設定したジャンルに対応づけられたテキスト情報生成方法に従って、動画コンテンツ入力デバイス14に入力された動画コンテンツ1211の画像データを画像認識部1143に入力させ、又は、音声データを音声認識部1144に入力させる。あるいは、記録処理部1142は、ジャンル設定部1141が設定したジャンルに対応づけられたテキスト情報生成方法に従って、画像データを画像認識部1143に入力させ、かつ、音声データを音声認識部1144に入力させる。
The
画像認識部1143は、記録処理部1142から入力された画像データからテキスト情報を生成し、記録処理部1142にテキスト情報を返す。音声認識部1144は、記録処理部1142から入力された音声データからテキスト情報を生成し、記録処理部1142にテキスト情報を返す。
The
記録処理部1142は、画像認識部1143が生成したテキスト情報又は音声認識部1144が生成したテキスト情報、あるいは、画像認識部1143及び音声認識部1144が生成したテキスト情報が、ジャンル設定部1141が設定したジャンルに適したテキスト情報か否かを判定する。
In the
まず、記録処理部1142は、テキスト情報のジャンル別パターンが格納されているパターンDB部122から、ジャンル設定部1141が設定したジャンルの判定用のパターンを読み込む。記録処理部1142は、画像認識部1143及び音声認識部1144が生成したテキスト情報を読み込んで判定用のジャンル別パターンと照合することで、生成したテキスト情報が検索用として有用か否かを判定する。ジャンル別パターンとの照合の結果、テキスト情報の少なくとも一部がジャンル別パターンに一致したときに、設定されたジャンルの検索用として有用であると判定してもよい。
First, the
記録処理部1142は、有用と判定されたテキスト情報を、動画コンテンツ1211に対応づけて、チャプター情報1212として動画記録部121に記録する。
The
UI部111は、ユーザが所望する動画コンテンツ1211の特定部分を検索するためのキーワードを受け付け、該キーワードを検索部112に入力する。検索部112は、動画記録部121に保存されているチャプター情報1212に対して、UI部111から入力されたキーワードを検索し、検索結果をUI部111へ返す。
The
動画出力部115は、UI部111に返された検索結果に対して、ユーザによる指定操作があった場合に、指定された検索結果に係るテキスト情報を含むチャプター情報1212を参照し、該テキスト情報に対応した動画コンテンツ1211を出力する。
When the search result returned to the
次に、図2に示した記憶装置12に記憶した各種データついて詳細に説明する。
Next, various data stored in the
パターンDB部122は、動画コンテンツ1211に対するユーザのキーワード検索に有用なテキスト情報のパターンがジャンル別に格納されているデータベースである。このジャンル別のテキスト情報のパターンをジャンル別パターンと呼ぶ。ジャンル別パターンは、画像認識部1143又は音声認識部1144が生成したテキスト情報が、ジャンル設定部1141が設定したジャンルの検索用として有用か否かを判定するために用いられる。つまり、画像認識部1143及び音声認識部1144が生成したテキスト情報は、パターンDB部122のジャンル別パターンと照合されることにより、生成したテキスト情報の適否を判断される。
The
パターンDB部122に格納されているテキスト情報の内容は、自動又は手動でアップデートすることが可能である。アップデートは例えばインターネットに接続して予め設定したサーバよりダウンロードすることにより行う。また、ユーザが必要に応じて操作入力デバイス13に入力することによりカスタマイズしてもよい。
The content of the text information stored in the
さらに、ユーザが検索で使用したテキスト情報を、ユーザの好みのジャンル又は再生履歴に基づく使用頻度の高いジャンルのパターンとして自動的に学習し、その学習結果がパターンDB部122に反映されてもよい。この学習結果は、動画コンテンツ1211をおすすめ動画として動画出力部115から出力する際に、ユーザに提示してもよく、また、ユーザの検索キーワード又は検索結果の表示順に反映させてもよい。
Further, the text information used by the user in the search may be automatically learned as a pattern of the user's favorite genre or a frequently used genre based on the playback history, and the learning result may be reflected in the
例えば、ジャンルが「クイズ番組」であれば、「問題」、「正解」、「優勝者」、「クイズ王」がジャンルに適したテキスト情報である。言い換えると、当該テキスト情報が、ジャンルが「クイズ番組」であるジャンル別パターンである。 For example, if the genre is "quiz program", "question", "correct answer", "winner", and "quiz king" are text information suitable for the genre. In other words, the text information is a genre-specific pattern in which the genre is a "quiz program".
このようなテキスト情報のジャンル別パターンを、テキスト情報の適否の判定用として用いることで、動画コンテンツ入力デバイス14から入力されたクイズ番組の動画コンテンツのテロップ(画像データ)又は番組司会者の会話(音声データ)から画像認識部1143及び音声認識部1144が生成したテキスト情報が有用か否かを判定することができる。
By using such a pattern for each genre of text information for determining the suitability of text information, a telop (image data) of the video content of the quiz program input from the video
動画記録部121に記録された動画コンテンツ1211は、生成部114によりチャプター情報1212を生成する対象であり、又は、チャプター情報1212を生成済の動画コンテンツである。
The moving
動画記録部121に記録されたチャプター情報1212は、動画コンテンツ1211の画像データ又は音声データから生成したテキスト情報であって、設定されたジャンルの検索用として有用であると判定されたテキスト情報を含む。チャプター情報1212は、該テキスト情報と、動画コンテンツ1211の名称と、動画コンテンツ1211の時間軸上での開始時刻であるタイムスタンプと、を互いに対応づけた情報である。つまり、チャプター情報1212は、テキスト情報と、該テキスト情報を作成した対象の動画コンテンツ1211と、を対応づけた情報である。
The
図3は本実施の形態1に係るチャプター情報1212の一例を示す図である。図3において、チャプター情報1212を構成する要素は、動画記録部121に保存される動画コンテンツ1211の名称(動画コンテンツ名)と、該動画コンテンツ1211と同じ時間軸上のタイムスタンプと、画像認識部1143又は音声認識部1144が生成し、設定されたジャンルの検索用として有用であると判定されたテキスト情報である。チャプター情報1212には、ジャンル設定部1141が設定したジャンル、又は、ユーザがジャンル指定時に指定したテキスト情報を含めてもよい。
FIG. 3 is a diagram showing an example of
以上のように構成された情報処理装置10の動作について、図4に示したフローチャートを用いて説明する。図4は、CPU11が実行するチャプター情報生成処理フローの例を示すフローチャートである。
The operation of the
まず、CPU11の生成部114は、動画コンテンツ入力デバイス14から取得した動画コンテンツ1211のジャンルを設定する(ステップS101:ジャンル設定ステップ)。具体的には、ジャンル設定部1141が、動画コンテンツ入力デバイス14から入力された動画コンテンツ名及びメタ情報に基づいて判定したジャンルに設定し、又は、ジャンル指定部113により指定されたジャンルに設定する。
First, the
次に、生成部114は、ステップS101で設定したジャンルに応じたテキスト情報生成方法を選択する(ステップS102)。具体的には、生成部114がチャプター情報1212に含まれるテキスト情報を生成する方法として、ステップS101で設定したジャンルに応じたテキスト情報生成方法を選択する。テキスト情報生成方法は、テキスト情報を生成する元となるデータとして、動画コンテンツ1211の画像データ及び音声データのいずれか一方を用いるか、あるいは両方のデータを用いるかを、ジャンルに応じて定めている。また、テキスト情報生成方法は、テキスト情報の照合用データとして、パターンDB部122から読み込むジャンル別パターンのいずれを用いるかを、ジャンルに応じて定めている。
Next, the
記録処理部1142は、ステップS102で選択したテキスト情報生成方法に応じて、動画コンテンツ入力デバイス14に入力された動画コンテンツ1211の画像データを画像認識部1143に入力させ、又は、音声データを音声認識部1144に入力させる。あるいは、記録処理部1142が、テキスト情報生成方法に応じて、画像データを画像認識部1143に入力させ、かつ、音声データを音声認識部1144に入力させる。
The
画像認識部1143は、入力された画像データから画像認識によりテキスト情報を生成し、音声認識部1144は、入力された音声データから音声認識によりテキスト情報を生成する(ステップS103)。生成されたテキスト情報は、記録処理部1142に入力される。
The
次に、記録処理部1142は、画像認識部1143又は音声認識部1144が生成したテキスト情報が、ジャンル設定部1141が設定したジャンルに適したテキスト情報か否かを判定するために、該テキスト情報を、パターンDB部122のジャンル別パターンと照合する(ステップS104)。
Next, the
記録処理部1142は、テキスト情報生成方法に従って、ジャンル別パターンを読み込み、画像認識部1143又は音声認識部1144が生成したテキスト情報を、読み込んだジャンル別パターンと照合することで、生成されたテキスト情報が検索に適しているか否かを判定する(ステップS105)。
The
生成されたテキスト情報をジャンル別パターンと照合した結果、検索に適していると判定された場合には(ステップS105:Yes)、記録処理部1142が、該テキスト情報をチャプター情報1212として動画記録部121に保存する(ステップS106:記録処理ステップ)。このとき、テキスト情報を生成した対象の動画コンテンツ1211の名称と、動画コンテンツ1211の時間軸上での開始時刻を示すタイムスタンプも、該テキスト情報に対応づけてチャプター情報1212として保存する。
As a result of collating the generated text information with the genre-specific pattern, if it is determined that the text information is suitable for the search (step S105: Yes), the
生成されたテキスト情報が検索に適していないと判定された場合には(ステップS105:No)、ステップS103に戻り、次のテキスト情報の生成及び判定を行う。テキスト情報が動画記録部121に保存された後は(ステップS106)、ユーザによる終了指示があるか否かを判定し(ステップS107)、終了しない場合には(ステップS107:No)ステップS103に戻り、テキスト情報の生成及び判定を継続する。ユーザによる終了指示があった場合には(ステップS107:Yes)、チャプター情報生成処理を終了する。 If it is determined that the generated text information is not suitable for the search (step S105: No), the process returns to step S103 to generate and determine the next text information. After the text information is saved in the moving image recording unit 121 (step S106), it is determined whether or not there is an end instruction by the user (step S107), and if not, the process returns to step S103 (step S107: No). , Continue to generate and determine text information. When the user gives an end instruction (step S107: Yes), the chapter information generation process is terminated.
検索部112は、図4に示したチャプター情報生成処理により生成されたチャプター情報1212に含まれるテキスト情報に対して、ユーザが操作入力デバイス13に入力したキーワードを検索する(検索ステップ)。検索した結果を、UI部111が出力デバイス15に表示する。この検索結果に対して、ユーザが動画コンテンツ1211の特定箇所を指定した場合には、動画出力部115は、チャプター情報1212を参照して、動画コンテンツ1211を読み出し、該当箇所から再生を実行する。
The
このようにして、情報処理装置10は、動画コンテンツ1211のジャンルに適合したテキスト情報生成方法に基づいて、検索に有用なテキスト情報を含むチャプター情報1212を生成し、生成したチャプター情報1212に対して検索を実行することにより、ユーザの希望に沿った検索結果を得ることができる。例えば、音声データから検索に有用な文字列に変換できない動画コンテンツ1211の場合でも、ユーザが視聴を所望する特定部分の検索が可能になる。
In this way, the
以上説明したように本実施の形態に係る情報処理装置10は、記憶装置12のパターンDB部122に、ジャンル別の、動画コンテンツ1211の検索に有用なテキスト情報のパターンであるジャンル別パターンを格納しておく。生成部114のジャンル設定部1141はテキスト情報を生成する対象である動画コンテンツ1211のジャンルを設定する。記録処理部1142は、パターンDB部122に格納されている、設定したジャンルに対応するジャンル別パターンに基づいて、動画コンテンツ1211の画像データ又は音声データから生成したテキスト情報が、ジャンルの検索用として有用か否かを判定し、有用であると判定したテキスト情報を動画コンテンツ1211に対応づけてチャプター情報1212として記録する。そして、検索部112が、チャプター情報1212に対してユーザが入力したキーワードを検索することとした。これにより、動画コンテンツ1211のジャンルに依らず、ユーザが視聴を所望する特定部分の検索が可能になる。
As described above, the
なお、上記実施の形態において、生成部114の記録処理部1142が、パターンDB部122を参照して、画像認識部1143または音声認識部1144が生成したテキスト情報が適しているか否かを判定し、適していると判定されたテキスト情報を動画記録部121に保存するとしたが、本開示はこれに限定されるものではない。すなわち、本開示は、生成部114が動画コンテンツ1211のジャンル情報を利用して、検索に有用なテキスト情報をチャプター情報1212として動画記録部121に保存すればよい。例えば、記録処理部1142は必ずしも情報処理装置10内のパターンDB部122を利用しなくてもよい。このとき、パターンDB部122の代わりにサーバ上のデータベースを利用してもよい。
In the above embodiment, the
また、上記実施の形態に示したハードウェア構成及びフローチャートは一例であり、任意に変更及び修正が可能である。CPU11及び記憶装置12で実現する各機能は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
Further, the hardware configuration and the flowchart shown in the above embodiment are examples, and can be arbitrarily changed and modified. Each function realized by the
例えば、上記実施の形態の動作を実行するためのプログラムを、コンピュータが読み取り可能なCD-ROM(Compact Disc Read-Only Memory)、DVD、MO(Magneto Optical Disc)、メモリカード等の記録媒体に格納して配布し、プログラムをコンピュータにインストールすることにより、各機能を実現することができるコンピュータを構成してもよい。そして、各機能をOS(Operating System)とアプリケーションとの分担、又はOSとアプリケーションとの協同により実現する場合には、OS以外の部分のみを記録媒体に格納してもよい。 For example, a program for executing the operation of the above embodiment is stored in a recording medium such as a computer-readable CD-ROM (Compact Disc Read-Only Memory), DVD, MO (Magneto Optical Disc), or memory card. By distributing the DVD and installing the program on the computer, a computer capable of realizing each function may be configured. When each function is realized by sharing the OS (Operating System) and the application or by cooperating with the OS and the application, only the part other than the OS may be stored in the recording medium.
本開示は、上記実施の形態に限定されず、本開示の要旨を逸脱しない範囲での種々の変更は勿論可能である。 The present disclosure is not limited to the above-described embodiment, and various changes can be made without departing from the gist of the present disclosure.
10 情報処理装置、11 CPU、12 記憶装置、13 操作入力デバイス、14 動画コンテンツ入力デバイス、15 出力デバイス、111 UI部、112 検索部、113 ジャンル指定部、114 生成部、115 動画出力部、121 動画記録部、122 パターンDB部、1141 ジャンル設定部、1142 記録処理部、1143 画像認識部、1144 音声認識部、1211 動画コンテンツ、1212 チャプター情報。 10 Information processing device, 11 CPU, 12 Storage device, 13 Operation input device, 14 Video content input device, 15 Output device, 111 UI section, 112 Search section, 113 Genre specification section, 114 Generation section, 115 Video output section, 121 Video recording unit, 122 pattern DB unit, 1141 genre setting unit, 1142 recording processing unit, 1143 image recognition unit, 1144 voice recognition unit, 1211 video content, 1212 chapter information.
Claims (9)
テキスト情報を生成する対象である前記動画コンテンツのジャンルを設定するジャンル設定部と、
前記パターンDB部に格納されている、前記ジャンル設定部が設定した前記ジャンルに対応する前記ジャンル別パターンに基づいて、前記動画コンテンツの画像データ又は音声データから生成したテキスト情報が、前記ジャンルの検索用として有用か否かを判定し、有用であると判定した前記テキスト情報を前記動画コンテンツに対応づけて記録する記録処理部と、
前記記録処理部が記録した前記テキスト情報に対して検索を実行する検索部と、を備える、
情報処理装置。 A pattern DB section that stores patterns by genre, which are patterns of text information useful for searching video content by genre,
A genre setting unit that sets the genre of the video content that is the target for generating text information, and
Based on the genre-specific pattern stored in the pattern DB unit and corresponding to the genre set by the genre setting unit, the text information generated from the image data or audio data of the video content is the search for the genre. A recording processing unit that determines whether or not it is useful for use and records the text information determined to be useful in association with the moving image content.
A search unit that executes a search for the text information recorded by the recording processing unit is provided.
Information processing equipment.
請求項1に記載の情報処理装置。 The genre setting unit determines and sets the genre of the video content based on the meta information attached to the video content.
The information processing apparatus according to claim 1.
請求項1に記載の情報処理装置。 The genre setting unit sets the genre specified by the user's operation.
The information processing apparatus according to claim 1.
請求項1から3のいずれか1項に記載の情報処理装置。 The recording processing unit indicates the name of the video content and the start time of the video content on the time axis of the text information set by the genre setting unit that is determined to be useful for searching the genre. Record chapter information, which is information associated with the time stamp,
The information processing apparatus according to any one of claims 1 to 3.
請求項1から4のいずれか1項に記載の情報処理装置。 The recording processing unit stores the text information generated from the image data or the audio data of the moving image content in the pattern DB unit, and the genre-specific pattern corresponding to the genre set by the genre setting unit. When at least a part of the text information matches the genre-specific pattern, it is determined that the text information is useful for searching the genre and recorded.
The information processing apparatus according to any one of claims 1 to 4.
前記動画コンテンツの前記音声データから音声認識により前記テキスト情報を生成する音声認識部と、を更に備え、
前記記録処理部は、前記ジャンル設定部が設定した前記ジャンルに対応するテキスト情報生成方法に従って、前記画像認識部により生成した前記テキスト情報及び前記音声認識部により生成した前記テキスト情報のいずれか一方、あるいは、両方を、該ジャンルの検索用として有用か否かを判定し、有用であると判定した前記テキスト情報を前記動画コンテンツに対応づけて記録する、
請求項1から5のいずれか1項に記載の情報処理装置。 An image recognition unit that generates text information by image recognition from the image data of the video content, and
A voice recognition unit that generates the text information by voice recognition from the voice data of the video content is further provided.
The recording processing unit is one of the text information generated by the image recognition unit and the text information generated by the voice recognition unit according to the text information generation method corresponding to the genre set by the genre setting unit. Alternatively, it is determined whether or not both are useful for searching the genre, and the text information determined to be useful is recorded in association with the moving image content.
The information processing apparatus according to any one of claims 1 to 5.
請求項1から6のいずれか1項に記載の情報処理装置。 Further provided is a video output unit that outputs the video content based on the chapter information including the text information related to the specified search result when the user specifies an operation for the search result of the search unit. ,
The information processing apparatus according to any one of claims 1 to 6.
前記動画コンテンツの検索に有用なテキスト情報のパターンであるジャンル別パターンに基づいて、前記動画コンテンツから生成したテキスト情報が、前記ジャンル設定ステップで設定した前記ジャンルの検索用として有用か否かを判定し、有用であると判定した前記テキスト情報を前記動画コンテンツに対応づけて記録する記録処理ステップと、
前記記録処理ステップで記録した前記テキスト情報に対して検索を実行する検索ステップと、
を有する、
情報処理方法。 A genre setting step that sets the genre of the video content for which text information is generated, and
Based on the genre-specific pattern that is a pattern of text information useful for searching the video content, it is determined whether or not the text information generated from the video content is useful for searching the genre set in the genre setting step. The recording processing step of recording the text information determined to be useful in association with the moving image content, and
A search step for executing a search for the text information recorded in the recording processing step, and
Have,
Information processing method.
テキスト情報を生成する対象である動画コンテンツのジャンルを設定するジャンル設定部、
前記動画コンテンツの検索に有用なテキスト情報のパターンであるジャンル別パターンに基づいて、前記動画コンテンツから生成したテキスト情報が、前記ジャンル設定部が設定した前記ジャンルの検索用として有用であると判定した場合に、前記テキスト情報を前記動画コンテンツに対応づけて記録する記録処理部、
前記記録処理部が記録した前記テキスト情報に対して検索を実行する検索部、
として機能させるプログラム。 Computer,
Genre setting unit that sets the genre of the video content that is the target of generating text information,
Based on the genre-specific pattern, which is a pattern of text information useful for searching the video content, it is determined that the text information generated from the video content is useful for searching the genre set by the genre setting unit. In this case, a recording processing unit that records the text information in association with the video content,
A search unit that executes a search for the text information recorded by the recording processing unit,
A program that functions as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020183866A JP2022073709A (en) | 2020-11-02 | 2020-11-02 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020183866A JP2022073709A (en) | 2020-11-02 | 2020-11-02 | Information processing apparatus, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022073709A true JP2022073709A (en) | 2022-05-17 |
Family
ID=81604142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020183866A Pending JP2022073709A (en) | 2020-11-02 | 2020-11-02 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022073709A (en) |
-
2020
- 2020-11-02 JP JP2020183866A patent/JP2022073709A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7650563B2 (en) | Aggregating metadata for media content from multiple devices | |
US7735012B2 (en) | Audio user interface for computing devices | |
US9740774B2 (en) | System and method of organizing and editing metadata | |
US10346478B2 (en) | Extensible search term suggestion engine | |
US7392477B2 (en) | Resolving metadata matched to media content | |
CN101243428B (en) | Single action media playlist generation | |
US7589270B2 (en) | Musical content utilizing apparatus | |
US20120117042A1 (en) | Combining song and music video playback using playlists | |
US7930329B2 (en) | System, method and medium browsing media content using meta data | |
US20060277171A1 (en) | Custom media search tool | |
US20080074985A1 (en) | Reproducing apparatus, reproducing method, and reproducing program | |
WO2011155350A1 (en) | Content reproduction device, control method for content reproduction device, control program, and recording medium | |
US11762901B2 (en) | User consumption behavior analysis and composer interface | |
JP2006127367A (en) | Information management method, information management program, and information management apparatus | |
JP2007058562A (en) | Content classification device, content classification method, content classification program and recording medium | |
CN107564553B (en) | Control method and system of audio play list and audio play system | |
US20030137542A1 (en) | User interface for reviewing and controlling use of data objects | |
JP2022073709A (en) | Information processing apparatus, information processing method, and program | |
JP5342509B2 (en) | CONTENT REPRODUCTION DEVICE, CONTENT REPRODUCTION DEVICE CONTROL METHOD, CONTROL PROGRAM, AND RECORDING MEDIUM | |
JP6733240B2 (en) | How to update the content list | |
JP2004192560A (en) | Electronic data reproducing device, electronic text display device, electronic text display method, program and recording medium | |
JP2002055865A (en) | Apparatus and method for multimedia data editing/ managing device | |
JP2007280442A (en) | Information reproducing device, method and program for creating list, and recording medium | |
KR100732665B1 (en) | User terminal device having management function of music file and management method using the same | |
JP2005242720A (en) | Database retrieval method apparatus, and program |