JP2002330390A - Video recorder - Google Patents

Video recorder

Info

Publication number
JP2002330390A
JP2002330390A JP2001132418A JP2001132418A JP2002330390A JP 2002330390 A JP2002330390 A JP 2002330390A JP 2001132418 A JP2001132418 A JP 2001132418A JP 2001132418 A JP2001132418 A JP 2001132418A JP 2002330390 A JP2002330390 A JP 2002330390A
Authority
JP
Japan
Prior art keywords
tag information
recording
audio level
audio
recording apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001132418A
Other languages
Japanese (ja)
Other versions
JP2002330390A5 (en
JP4198331B2 (en
Inventor
Keiji Himuro
圭二 日室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001132418A priority Critical patent/JP4198331B2/en
Publication of JP2002330390A publication Critical patent/JP2002330390A/en
Publication of JP2002330390A5 publication Critical patent/JP2002330390A5/ja
Application granted granted Critical
Publication of JP4198331B2 publication Critical patent/JP4198331B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a video recorder that searches an audio level in the entire video recording areas, generates tag information when the audio level is a prescribed level or over so as to generate a digest version thereby realizing generation of the digest version with a simple configuration and deletes original contents so as to reduce the video recording areas. SOLUTION: The video recorder that records contents supplied from programs or the like including video and audio which are broadcast wirelessly or wiredly, is provided with a video recording section 15 that stores the contents and an edit section 16 that detects the audio level of the contents stored in the video recording section 15 and generates the tag information according to the audio level.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、放送されるビデオ
や音声を含む番組を、ハードディスク(HDD)やデジ
タルビデオディスク(DVD)などの記録メディアに録
画する録画装置に関し、より詳細には、録画全域を音声
スキャンしその結果からタグ情報を作成し、簡易ダイジ
ェスト版を作成する録画装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recording apparatus for recording a program including broadcast video and audio on a recording medium such as a hard disk (HDD) or a digital video disk (DVD). The present invention relates to a recording device that scans the entire area, creates tag information from the results, and creates a simple digest version.

【0002】[0002]

【従来の技術】昨今、記録保存メディアやその周辺装置
および画像処理技術などが急速に進歩してきている。こ
れにより、現行のテレビ放送波の品質を維持し、個人が
気軽に映像データ(放送コンテンツ)をHDD(ハード
ディスク)やDVD(デジタルビデオディスク)などの
記録メディアに保存したり編集するといった機能を実現
する次世代のビデオ録画装置が提供されてきている。
2. Description of the Related Art In recent years, recording and storage media, peripheral devices thereof, and image processing techniques have rapidly advanced. As a result, it is possible to maintain the quality of current TV broadcast waves and realize the function that individuals can easily save and edit video data (broadcast contents) on recording media such as HDD (hard disk) and DVD (digital video disk). Next-generation video recorders have been provided.

【0003】このような録画技術環境のなかにおいて、
たとえば、特開平7−182365号公報の「マルチメ
ディア会議録作成支援装置および方法」にはキーワー
ド、発言者などを、画像あるいは音声認識してその重要
度を判定し、その結果にしたがってダイジェスト版を作
成する旨が開示されている。
In such a recording technology environment,
For example, in Japanese Patent Application Laid-Open No. 7-182365, "Multimedia Conference Record Creation Support Apparatus and Method" includes recognizing keywords or speakers by image or voice to determine their importance, and generating a digest version according to the result. It is disclosed that it is created.

【0004】また、特開平11−196385号公報の
「蓄積型情報放送システムと、このシステムの受信端末
装置」には、TVコンテンツのダイジェスト版を、EP
G(電子番組ガイド)としてローカルに受信し、嗜好分
析やキーワード検索後、受信する本コンテンツを決定
し、蓄積する技術が開示されている。
[0004] In addition, a digest version of TV content is described in “Storage Information Broadcasting System and Receiving Terminal Device of This System” in JP-A-11-196385.
A technology is disclosed in which the content is received locally as a G (electronic program guide), and after analyzing a preference or searching for a keyword, the content to be received is determined and stored.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記に
示されるような従来の技術にあっては、音声認識によっ
て発言者を特定してダイジェスト版を作成するものの、
たとえば、スポーツ中継などにおいて注目度の高いシー
ンを抽出しダイジェスト版を撮影することができず、か
つ簡単な構成および低録画領域でのダイジェスト版を作
成するものではなかった。
However, in the prior art as described above, although a speaker is specified by voice recognition to create a digest version,
For example, it is not possible to extract a scene of high interest in sports broadcasting or the like and photograph a digest version, and to create a digest version with a simple configuration and a low recording area.

【0006】本発明は、上記に鑑みてなされたものであ
って、録画全域の音声レベルをサーチし、所定レベル以
上の音声時にタグ情報を作成してダイジェスト版を作成
することにより、簡単な構成でのダイジェスト版作成を
実現し、かつ元コンテンツを削除可能にすることにより
録画領域の削減を図ることを目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above, and has a simple configuration by searching the audio level of the entire recording area, creating tag information when the audio level exceeds a predetermined level, and creating a digest version. It is an object of the present invention to reduce the recording area by realizing a digest version by the above method and making it possible to delete the original content.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
めに、請求項1にかかる録画装置にあっては、無線また
は有線で放送されるビデオや音声を含む番組などから供
給されるコンテンツを録画する録画装置において、前記
コンテンツを保存する録画保存手段と、前記録画保存手
段に保存されているコンテンツの音声レベルを検出し、
当該音声レベルにしたがってタグ情報を作成する編集手
段と、を備えたものである。
According to a first aspect of the present invention, there is provided a recording apparatus for transmitting contents supplied from a program including video or audio broadcasted wirelessly or by wire. In a recording device for recording, a recording storage unit for storing the content, and detecting an audio level of the content stored in the recording storage unit,
Editing means for creating tag information according to the audio level.

【0008】この発明によれば、番組などの録画対象の
画像をHDDやDVDなどの保存メディアに録画する際
に、録画領域における全域に対して音声レベルをサーチ
し、その音声レベルが周りより高い部分を抽出し、その
抽出した部分、たとえば、スポーツ番組などにおいて歓
声による音声が高い注目シーンについてタグ(インデッ
クス)情報を作成することが可能になる。
According to the present invention, when an image to be recorded such as a program is recorded on a storage medium such as an HDD or a DVD, an audio level is searched for the entire recording area, and the audio level is higher than the surroundings. A portion can be extracted, and tag (index) information can be created for the extracted portion, for example, a scene of interest in which a cheering voice is high in a sports program or the like.

【0009】また、請求項2にかかる録画装置にあって
は、前記編集手段は、前記タグ情報近辺のシーンを自動
編集し、簡易ダイジェスト版を作成するものである。
[0009] In the recording apparatus according to the second aspect, the editing means automatically edits a scene near the tag information to create a simplified digest version.

【0010】この発明によれば、請求項1において、た
とえば、スポーツ番組などにおいて歓声による音声が高
い音声レベルを注目シーンの基準として利用してその近
辺のダイジェスト版を作成することが可能になる。
[0010] According to the present invention, in the first aspect, for example, it is possible to create a digest version in the vicinity of an attention scene by using a high sound level of a cheerful sound in a sports program or the like as a reference of the scene of interest.

【0011】また、請求項3にかかる録画装置にあって
は、前記編集手段は、音声レベルとして音量の絶対値を
用いて音声レベルを検出するものである。
According to a third aspect of the present invention, the editing means detects the audio level using the absolute value of the volume as the audio level.

【0012】この発明によれば、請求項1において音声
レベルの絶対値があらかじめ定めた閾値を越えた範囲を
タグ情報として付加することにより、簡単な方法による
注目シーンのタグ情報が作成される。
According to the present invention, the tag information of the scene of interest is created by a simple method by adding, as tag information, a range in which the absolute value of the audio level exceeds a predetermined threshold value.

【0013】また、請求項4にかかる録画装置にあって
は、前記編集手段は、音声レベルとしてタグ情報近辺ま
たは全体の平均音量との比率を用いるものである。
[0013] In the recording apparatus according to a fourth aspect, the editing means uses the ratio of the audio level to the vicinity of the tag information or the average volume of the whole.

【0014】この発明によれば、請求項1において音声
レベルをスキャンしてタグ情報を作成する際に、平均音
声レベル、タグ情報前後のシーンとの比率を使用するこ
とにより、注目シーンをさらに正確に確保することが可
能になる。
According to the present invention, when generating the tag information by scanning the audio level in claim 1, the target scene can be more accurately determined by using the average audio level and the ratio of the scene before and after the tag information. Can be secured.

【0015】また、請求項5にかかる録画装置にあって
は、あらかじめ分割設定されたシーンの数にしたがっ
て、前記タグ情報近辺のシーンを自動編集するものであ
る。
Further, in the recording apparatus according to the fifth aspect, scenes near the tag information are automatically edited according to the number of scenes set in advance in division.

【0016】この発明によれば、タグ情報近辺のシーン
をあらかじめ分割設定されたシーンの数にしたがって自
動編集することにより、自分好みのダイジェスト作成機
能にカスタマイズすることが可能になる。
According to the present invention, by automatically editing scenes near the tag information according to the number of scenes set in advance, it is possible to customize the digest creation function to a favorite one.

【0017】また、請求項6にかかる録画装置にあって
は、タグ情報前後の特定時間にしたがって、前記タグ情
報近辺のシーンを自動編集するものである。
According to the recording apparatus of the present invention, a scene near the tag information is automatically edited according to a specific time before and after the tag information.

【0018】この発明によれば、タグ情報前後の特定時
間にしたがって自動編集することにより、音声レベルが
上記条件をみたした部分を基準としたダイジェス版を作
成することが可能になる。
According to the present invention, by automatically editing according to a specific time before and after the tag information, it is possible to create a digest version based on a portion where the audio level meets the above conditions.

【0019】[0019]

【発明の実施の形態】以下、本発明にかかる録画装置の
好適な実施の形態について添付図面を参照し、詳細に説
明する。なお、本発明はこの実施の形態により限定され
るものではない。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of a recording device according to the present invention will be described below in detail with reference to the accompanying drawings. The present invention is not limited by the embodiment.

【0020】まず、録画装置の構成について説明する。
図1は、本発明の実施の形態にかかる録画装置の構成を
示すブロック図である。この録画装置10は、通常のV
TR(VCR)などと同様にテレビ番組などの動画情報
を録画する録画環境を実現するものである。このため、
録画装置10にはこの装置全体を統括的に制御するコン
トローラ11が設けられている。コントローラ11に
は、後述するように、外部入力部12と、放送チューナ
13と、画像取込圧縮部14と、録画部15と、編集部
16と、他の操作SW部17と、SW18と、が接続さ
れている。
First, the configuration of the recording device will be described.
FIG. 1 is a block diagram illustrating a configuration of a recording device according to an embodiment of the present invention. This recording device 10 has a normal V
It realizes a recording environment for recording moving image information such as a TV program, like a TR (VCR). For this reason,
The recording device 10 is provided with a controller 11 that controls the entire device. As will be described later, the controller 11 includes an external input unit 12, a broadcast tuner 13, an image capturing / compressing unit 14, a recording unit 15, an editing unit 16, another operation SW unit 17, an SW 18, Is connected.

【0021】コントローラ11は、高機能のマイクロコ
ンピュータ・システムで構成される。すなわち、コント
ローラ11は、制御プログラムにしたがって統括的な制
御を実行するCPU20と、制御プログラムなどが格納
されているROM21と、ワーキングメモリとして用い
られるRAM22と、予約録画などに用いられるタイマ
ー23と、を備えている。
The controller 11 is composed of a high-performance microcomputer system. That is, the controller 11 includes a CPU 20 that executes general control according to a control program, a ROM 21 storing a control program and the like, a RAM 22 used as a working memory, and a timer 23 used for scheduled recording and the like. Have.

【0022】外部入力部12は、コントローラ11を介
してユーザが各種の入力操作を行なうように、入力キー
群、液晶やLEDなどによる表示パネルなどによって構
成されている。すなわち、外部入力部12は、リモート
コントローラあるいは各装置に設けられているスイッチ
などを備え、開始信号、中断信号、番組開始時刻、番組
終了時刻などを設定するように構成されている。
The external input unit 12 includes an input key group and a display panel such as a liquid crystal display or an LED so that a user can perform various input operations via the controller 11. That is, the external input unit 12 includes a remote controller or a switch provided in each device, and is configured to set a start signal, an interruption signal, a program start time, a program end time, and the like.

【0023】画像取込圧縮部14は、たとえば、動画像
をキャプチャ(capture:ファイルとして取りこ
む)した後、MPEGフォーマットで圧縮処理を行な
う。なお、MPEGは、Moving Picture
Experts Group/Moving Pic
ture Image Experts Groupの
略称であり、カラー動画像符号化方式の標準化作業を推
進する組織により標準化された符号化方式である。
The image capturing / compressing unit 14 performs a compression process in an MPEG format, for example, after capturing a moving image (capturing as a file). Note that MPEG stands for Moving Picture
Experts Group / Moving Pic
This is an abbreviation of “ture Image Experts Group”, and is an encoding system standardized by an organization that promotes standardization work of a color moving image encoding system.

【0024】動画の圧縮符号化方式は、テレビ会議用に
作られたアルゴリズムであるDCT(Discrete
Cosine Transform:離散コサイン変
換)を用いており、リアルタイムで符号化できる。ま
た、MPEGには、H.261、MPEG1、MPEG
2といったポピューラーな3つの方式があるが、記録メ
ディアや入出力機能、放送メディアなどに合わせて選択
されるもので、このいずれであってもよく、さらに他の
動画圧縮方式であってもよい。
The moving picture compression encoding method is an algorithm created for video conference, DCT (Discrete).
Cosine Transform (Discrete Cosine Transform) is used, and encoding can be performed in real time. MPEG also includes H.264. 261, MPEG1, MPEG
There are three popular methods, such as 2, which are selected according to recording media, input / output functions, broadcast media, etc., and may be any one of them, and may be another moving image compression method.

【0025】放送チューナ13は、通常のテレビと同様
の働きをするものであり、一般のテレビの代用であって
もよい。解凍部19は、圧縮方式がMPEGフォーマッ
トである場合に、通常のTV信号(NTSC(Nati
onal Television System Co
mmittee)方式)に復号化(デコード)し、テレ
ビでの視聴が可能な信号を出力するものであり、復号化
された画像を再生し、表示装置(図示せず)に送る。
The broadcast tuner 13 has the same function as a normal television, and may be a substitute for a general television. When the compression method is the MPEG format, the decompression unit 19 outputs a normal TV signal (NTSC (Nati
onal Television System Co
and outputs a signal that can be viewed on a television. The decoded image is reproduced and sent to a display device (not shown).

【0026】録画部(保存装置)15は、HDD(ハー
ドディスク)やDVD(デジタルビデオディスク)など
の保存メディアであり、圧縮された番組データ(画像、
音声など)を保存する装置である。録画部(保存装置)
15には、通常録画領域25とダイジェスト版録画領域
26とが設けられている。なお、この実施の形態では、
通常録画領域25とダイジェスト版録画領域26とを設
けているが、場合によってはこの2つ録画領域は特に設
けなくてもよい。
The recording unit (storage device) 15 is a storage medium such as an HDD (hard disk) or a DVD (digital video disk), and stores compressed program data (images,
Device for storing audio and the like). Recording unit (storage device)
15 has a normal recording area 25 and a digest version recording area 26. In this embodiment,
Although the normal recording area 25 and the digest version recording area 26 are provided, the two recording areas need not be provided in some cases.

【0027】編集部16は、MPEGデータの切り取
り、音声レベルのサーチ、タグ情報作成、一時データの
保存、MPEGデータのマージ(merge)機能など
を行なうブロックである。SW18は、ダイジェスト版
作成用のスイッチである。
The editing unit 16 is a block for performing functions such as cutting MPEG data, searching for audio levels, creating tag information, storing temporary data, and merging MPEG data. SW 18 is a switch for creating a digest version.

【0028】つぎに、以上のように構成された録画装置
の動作について説明する。通常の番組録画は、VTRと
同様に放送チューナ13の出力を、画像取込圧縮部14
でキャプチャした後に所定のMPEGフォーマットで圧
縮し、録画部15に保存する。また、タイマ予約の場合
は、通常録画領域25に録画される。
Next, the operation of the recording apparatus configured as described above will be described. For normal program recording, the output of the broadcast tuner 13 is transmitted to the image capture / compression unit 14 in the same manner as the VTR.
Then, the data is compressed in a predetermined MPEG format and stored in the recording unit 15. In the case of timer reservation, recording is performed in the normal recording area 25.

【0029】つぎに、本発明の特徴となる動作について
説明する。図2は、本発明にかかる録画装置の動作例を
示すフローチャートである。まず、SW18がユーザに
よって押下されると(ステップS11)、指定されたコ
ンテンツ全域の音声を編集部16でサーチ(音声スキャ
ン)する(ステップS12)。続いて、あらかじめ定め
たスレッシュレベル以上の範囲のタグ情報を作成する
(ステップS13)。すなわち、音声レベルの高い部分
(特定した値を越えた部分)のタグ(インデックス)情
報を作成する。
Next, the operation that characterizes the present invention will be described. FIG. 2 is a flowchart illustrating an operation example of the recording device according to the present invention. First, when the SW 18 is pressed by the user (step S11), the editing unit 16 searches (voice scan) for the voice of the entire designated content (step S12). Subsequently, tag information in a range equal to or higher than a predetermined threshold level is created (step S13). That is, tag (index) information of a portion having a high audio level (a portion exceeding the specified value) is created.

【0030】続いて、タグ情報時間データにおける前時
間−Z時間、後時間+Z時間を算出する(ステップS1
4)。さらに、上記タグ情報を元にタグ領域をマージし
(ステップS15)、ファイル名をつけて保存し(ステ
ップS16)、本コンテンツを削除する(ステップS1
7)。
Subsequently, the preceding time-Z time and the following time + Z time in the tag information time data are calculated (step S1).
4). Further, the tag areas are merged based on the tag information (step S15), saved with a file name (step S16), and the content is deleted (step S1).
7).

【0031】すなわち、ここでは、タグ情報の前後の一
定時間あるいはあらかじめ分割されているシーン数に基
づくシーン(タグ情報±1シーンなど)が切り出され、
それぞれがつなぎ合わされ、録画部15のダイジェスト
版録画領域26に保存される。なお、特定コンテンツの
選択方法は、従来のVTR,CDなどと同様に行なう。
That is, here, a scene (tag information ± 1 scene, etc.) based on a fixed time before and after the tag information or the number of scenes divided in advance is cut out.
These are joined together and stored in the digest version recording area 26 of the recording unit 15. The specific content is selected in the same manner as a conventional VTR, CD or the like.

【0032】また、上記タグ情報を作成した後、タグ情
報+α部分を切り出し、マージ(1つの順序付けられた
リストを作成する)する。マージされて作成完了したダ
イジェスト版は、ダイジェスト版録画領域26に別名で
保存される。このタグ情報+α部分の作成方法として、
シーン数指定による方法、時間指定による方法を用い
る。
After the above-mentioned tag information is created, the tag information + α portion is cut out and merged (one ordered list is created). The digest version that has been merged and completed is stored in the digest version recording area 26 under another name. As a method of creating this tag information + α part,
A method by specifying the number of scenes and a method by specifying time are used.

【0033】また、タグ情報作成方法として、音声レベ
ルがあるレベルを越えた範囲のタグ情報を作成する方法
や、特定シーンの音声レベル(瞬間、または平均)と全
体平均の音声レベルの比率が一定レベルを越えたシーン
のタグ情報作成方法を採用する。
As a method of creating tag information, a method of creating tag information in a range in which the audio level exceeds a certain level, or a method in which the ratio of the audio level (instant or average) of a specific scene to the overall average audio level is constant Adopt a method of creating tag information for scenes that exceed the level.

【0034】つぎに、ダイジェスト版作成例について図
3、図4を用いて説明する。図3は、本発明の実施の形
態にかかるダイジェスト版作成例(その1)を示す説明
図である。図3における符号100aは3分毎に分割さ
れた本コンテンツ、符号110aはダイジェスト版であ
る。この例では、分割区間における平均音声レベルをサ
ーチし、音声スレッシュレベルが5以上のものダイジェ
スト版110aとして作成する。
Next, an example of creating a digest version will be described with reference to FIGS. FIG. 3 is an explanatory diagram illustrating a digest version creation example (part 1) according to the embodiment of the present invention. Reference numeral 100a in FIG. 3 denotes the present content divided every three minutes, and reference numeral 110a denotes a digest version. In this example, an average audio level in a divided section is searched, and a digest version 110a having an audio threshold level of 5 or more is created.

【0035】すなわち、本コンテンツ100aは、あら
かじめ一定時間(ここでは、3分)単位で分割してお
き、各分割単位の平均音声レベルを算出しておく。ダイ
ジェスト版作成時に一定の音声スレッシュレベルを設定
(この例では5以上とする)を設定しておき、そのレベ
ル以上の場所にタグ情報を付加する。なお、この付加方
法は、別領域に、タグ情報・領域Noまたは時間範囲情
報のペアで確保する。続いて、タグ部のみをマージ(1
つの順序付けられたリストを作成する)してダイジェス
ト版110aを作成し、別領域に別名で保存する。
That is, the content 100a is divided in advance in units of a predetermined time (here, three minutes), and the average audio level of each division is calculated. When a digest version is created, a certain audio threshold level is set (in this example, 5 or more), and tag information is added to a location above that level. In this addition method, a pair of tag information / area number or time range information is secured in another area. Subsequently, only the tag part is merged (1
(An ordered list is created), and a digest version 110a is created and saved in another area under a different name.

【0036】このシーン分割の方法は、時間単位以外の
図示しない方法(場面変更認識、CM−CM間など)で
もよい。また、音声レベルの検出は、前後の音声レベル
の比率、たとえば、対前シーン平均音声レベル≧2の部
分でタグ情報作成などによって行なう。
The method of dividing the scene may be a method (not shown) other than the time unit (scene change recognition, between CMs, etc.). The detection of the audio level is performed by creating tag information or the like at the ratio of the previous and next audio levels, for example, the portion where the average audio level for the previous scene ≧ 2.

【0037】図4は、本発明の実施の形態にかかるダイ
ジェスト版作成例(その2)を示す説明図である。図4
における符号100bは3分毎に分割された本コンテン
ツ、符号110bはダイジェスト版である。ここでは、
本コンテンツ100bをアナログ的に音声スキャンし、
音声レベル101が、音声スレッシュレベル102を越
えた領域から、前後の一定時間を抜き取り、タグ情報と
する。その後は前述と同様に、タグ部のみをマージ(1
つの順序付けられたリストを作成する)してダイジェス
ト版110bを作成し、別領域に別名で保存する。
FIG. 4 is an explanatory diagram showing an example (part 2) of creating a digest version according to the embodiment of the present invention. FIG.
100b is the main content divided every three minutes, and 110b is a digest version. here,
The content 100b is subjected to analog voice scanning,
From the area where the audio level 101 exceeds the audio threshold level 102, a certain period of time before and after is extracted and used as tag information. Thereafter, as described above, only the tag portion is merged (1
(An ordered list is created), and a digest version 110b is created and saved in another area under a different name.

【0038】なお、上述したSW18を設けずに、簡易
ダイジェスト版録画モードを選択して番組を録画した
後、簡易ダイジェスト版を作成して保存し、元コンテン
ツを削除することにより、録画領域を短縮する構成とし
てもよい。
It should be noted that the simple digest version recording mode is selected and the program is recorded without providing the above-mentioned SW 18, and then a simple digest version is created and stored, and the original content is deleted, thereby shortening the recording area. It is good also as a structure which performs.

【0039】上述における音声レベルのタグ付けは、絶
対レベルだけでなく、全域平均レベルに対する特定部分
の音声レベルの比率にしたがって行なうか、あるいはコ
ンテンツ全域を、あらかじめ細部に分割し、タグ情報シ
ーンの前後のシーンに対する音声レベルの絶対値または
比率で設定してもよい。
The tagging of the audio level in the above description is performed not only according to the absolute level but also according to the ratio of the audio level of the specific portion to the average level over the entire area, or the entire content area is divided into details in advance and before and after the tag information scene. May be set as an absolute value or a ratio of the audio level for the scene.

【0040】また、上記特定部分やコンテンツの細部分
割は、図示しないが、時間分割による方法、コマーシャ
ルの検出による方法、画像認識、ズーミング検出などに
よる細かいシーン分割など従来からの方法のいずれかを
用いて実現される。また、タグ部分前後の切り出しは、
時間によるものの他に、上述の方法で分割したシーン
数、あるいは時間とシーンの組み合わせなどを用いても
よい。
Further, although not illustrated, the specific portion or the detailed division of the content is performed by using any of the conventional methods such as a time division method, a commercial detection method, image recognition, and fine scene division by zooming detection. Is realized. Also, cut out before and after the tag part,
Instead of using the time, the number of scenes divided by the above method, or a combination of time and scene may be used.

【0041】したがって、以上述べてきた録画装置によ
れば、簡単な構成で、ダイジェスト版の作成を行なうこ
とができる。特に、スポーツ中継などのダイジェスト版
の作成では、注目度の高い場面において特にアナウンサ
/解説者/観客による音声レベルが高くなるため、この
高い音声レベルの部分を利用することで簡単でレベルの
高い簡易ダイジェスト版を作成することができる。
Therefore, according to the recording apparatus described above, a digest version can be created with a simple configuration. In particular, when creating a digest version of a live broadcast of a sport or the like, the voice level of the announcer / explanator / audience is particularly high in a scene with a high degree of attention. A digest version can be created.

【0042】また、タグ前後のシーン切り出し時間を変
えることにより、自分好みのダイジェスト作成機能にカ
スタマイズすることが可能になる。さらに、キーワード
検出や画像解析といった従来の方法に比べ、より簡単な
方法で盛り上がった部分のみを視聴するダイジェスト版
を作成することができる。
Further, by changing the scene cutout time before and after the tag, it becomes possible to customize the digest creation function according to the user's preference. Furthermore, it is possible to create a digest version in which only the raised portion is viewed by a simpler method than conventional methods such as keyword detection and image analysis.

【0043】[0043]

【発明の効果】以上説明したように、本発明にかかる録
画装置(請求項1)によれば、番組などの録画対象の画
像をHDDやDVDなどの保存メディアに録画する際
に、録画領域における全域に対して音声レベルをサーチ
し、その音声レベルが周りより高い部分を抽出し、その
抽出した部分、たとえば、スポーツ番組などにおいてア
ナウンサ・解説者や観客の歓声による音声が高い部分の
注目シーンについてタグ(インデックス)情報を作成す
ることが可能になるので、簡単でレベルの高いダイジェ
スト版の作成が実現すると共に、元コンテンツを削除す
れば、録画領域を削減することができる。
As described above, according to the recording apparatus of the present invention (claim 1), when an image to be recorded such as a program is recorded on a storage medium such as an HDD or a DVD, the recording area in the recording area is reduced. Search the audio level in the whole area, extract the part where the audio level is higher than the surrounding area, and focus on the extracted part, for example, the attention scene of the part where the sound of the announcer, commentator or audience is high in the cheers of the audience in sports programs etc. Since tag (index) information can be created, a simple and high-level digest version can be created, and the recording area can be reduced by deleting the original content.

【0044】また、本発明にかかる録画装置(請求項
2)によれば、請求項1において、たとえば、スポーツ
番組などにおいてアナウンサ・解説者および観客の歓声
による音声が高い音声レベルを注目シーンの基準として
求めたタグ情報を用いるため、レベルの高い注目シーン
のダイジェスト版を作成することができる。
Further, according to the recording apparatus of the present invention (claim 2), in claim 1, for example, in a sports program or the like, a high voice level of the cheering voice of an announcer / commentor and audience is used as a reference of a scene of interest. Since the tag information obtained as is used, a digest version of a high-level attention scene can be created.

【0045】また、本発明にかかる録画装置(請求項
3)によれば、請求項1において音声レベルの絶対値が
あらかじめ定めた閾値を越えた範囲をタグ情報として付
加するため、簡単な方法による注目シーンのタグ情報を
作成することができる。
Further, according to the recording apparatus of the present invention (claim 3), a range in which the absolute value of the audio level exceeds a predetermined threshold is added as tag information in claim 1, so that a simple method is used. Tag information of the scene of interest can be created.

【0046】また、本発明にかかる録画装置(請求項
4)によれば、請求項1において音声レベルをスキャン
してタグ情報を作成する際に、平均音声レベル、タグ情
報前後のシーンとの比率を使用するため、スポーツ番組
などの注目シーンをさらに正確に確保することができ
る。
Further, according to the recording apparatus of the present invention (claim 4), when creating the tag information by scanning the audio level in claim 1, the average audio level and the ratio to the scene before and after the tag information are obtained. , The attention scene such as a sports program can be more accurately secured.

【0047】また、本発明にかかる録画装置(請求項
5)によれば、タグ情報近辺のシーンをあらかじめ分割
設定されたシーンの数にしたがって自動編集するので、
自分好みのダイジェスト作成機能にカスタマイズするこ
とができる。
According to the recording apparatus of the present invention (claim 5), scenes near the tag information are automatically edited according to the number of scenes set in advance.
You can customize your favorite digest creation function.

【0048】また、本発明にかかる録画装置(請求項
6)によれば、タグ情報前後の特定時間にしたがって自
動編集するので、自分好みのダイジェスト作成機能にカ
スタマイズすることができる。
Further, according to the recording apparatus of the present invention (claim 6), the editing is automatically performed according to the specific time before and after the tag information, so that it is possible to customize the digest creating function to a favorite one.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態にかかる録画装置の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a recording device according to an embodiment of the present invention.

【図2】本発明にかかる録画装置の動作例を示すフロー
チャートである。
FIG. 2 is a flowchart showing an operation example of the recording device according to the present invention.

【図3】本発明の実施の形態にかかるダイジェスト版作
成例(その1)を示す説明図である。
FIG. 3 is an explanatory diagram showing a digest version creation example (part 1) according to the embodiment of the present invention;

【図4】本発明の実施の形態にかかるダイジェスト版作
成例(その2)を示す説明図である。
FIG. 4 is an explanatory diagram showing a digest version creation example (part 2) according to the embodiment of the present invention;

【符号の説明】[Explanation of symbols]

10 録画装置 11 コントローラ 12 外部入力部 13 放送チューナ 14 画像取込圧縮部 15 録画部(保存装置) 16 編集部 18 SW 25 通常録画領域 26 ダイジェスト版録画領域 Reference Signs List 10 Recording device 11 Controller 12 External input unit 13 Broadcast tuner 14 Image capture / compression unit 15 Recording unit (storage device) 16 Editing unit 18 SW 25 Normal recording area 26 Digest version recording area

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G11B 27/031 H04N 5/76 Z 27/34 5/91 N H04N 5/76 C 5/92 5/92 H G11B 27/02 B Fターム(参考) 5C052 AA01 AB03 CC06 CC11 DD04 DD06 5C053 FA14 FA20 GA11 GB06 GB11 GB37 JA01 JA21 KA01 KA24 5D044 AB05 AB07 DE23 DE28 DE49 DE54 DE57 DE58 DE96 GK08 GK12 5D077 CB07 HA07 HD04 5D110 AA27 AA29 CA05 CA43 DA19 DB02 DC05 DC17 EA08 FA02──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G11B 27/031 H04N 5/76 Z 27/34 5/91 N H04N 5/76 C 5/92 5/92 H G11B 27/02 B F term (reference) 5C052 AA01 AB03 CC06 CC11 DD04 DD06 5C053 FA14 FA20 GA11 GB06 GB11 GB37 JA01 JA21 KA01 KA24 5D044 AB05 AB07 DE23 DE28 DE49 DE54 DE57 DE58 DE96 GK08 GK12 5D004 CB07 HA07 DA19 DB02 DC05 DC17 EA08 FA02

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 無線または有線で放送されるビデオや音
声を含む番組などから供給されるコンテンツを録画する
録画装置において、 前記コンテンツを保存する録画保存手段と、 前記録画保存手段に保存されているコンテンツの音声レ
ベルを検出し、当該音声レベルにしたがってタグ情報を
作成する編集手段と、 を備えたことを特徴とする録画装置。
1. A recording apparatus for recording content supplied from a program including video or audio broadcasted wirelessly or by wire, wherein the recording and storage means stores the content, and the content is stored in the recording and storage means. Editing means for detecting an audio level of the content and creating tag information in accordance with the audio level.
【請求項2】 前記編集手段は、前記タグ情報近辺のシ
ーンを自動編集し、簡易ダイジェスト版を作成すること
を特徴とする請求項1に記載の録画装置。
2. The recording apparatus according to claim 1, wherein the editing unit automatically edits a scene near the tag information to create a simplified digest version.
【請求項3】 前記編集手段は、音声レベルとして音量
の絶対値を用いて音声レベルを検出することを特徴とす
る請求項1に記載の録画装置。
3. The recording apparatus according to claim 1, wherein the editing unit detects the audio level using an absolute value of the volume as the audio level.
【請求項4】 前記編集手段は、音声レベルとしてタグ
情報近辺または全体の平均音量との比率を用いることを
特徴とする請求項1に記載の録画装置。
4. The recording apparatus according to claim 1, wherein the editing unit uses a ratio between the tag information and the average volume of the whole of the tag information as the audio level.
【請求項5】 あらかじめ分割設定されたシーンの数に
したがって、前記タグ情報近辺のシーンを自動編集する
ことを特徴とする請求項2に記載の録画装置。
5. The recording apparatus according to claim 2, wherein scenes near the tag information are automatically edited according to the number of scenes set in advance in division.
【請求項6】 タグ情報前後の特定時間にしたがって、
前記タグ情報近辺のシーンを自動編集することを特徴と
する請求項2に記載の録画装置。
6. According to a specific time before and after tag information,
The recording apparatus according to claim 2, wherein a scene near the tag information is automatically edited.
JP2001132418A 2001-04-27 2001-04-27 Recording device Expired - Fee Related JP4198331B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001132418A JP4198331B2 (en) 2001-04-27 2001-04-27 Recording device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001132418A JP4198331B2 (en) 2001-04-27 2001-04-27 Recording device

Publications (3)

Publication Number Publication Date
JP2002330390A true JP2002330390A (en) 2002-11-15
JP2002330390A5 JP2002330390A5 (en) 2006-04-27
JP4198331B2 JP4198331B2 (en) 2008-12-17

Family

ID=18980433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001132418A Expired - Fee Related JP4198331B2 (en) 2001-04-27 2001-04-27 Recording device

Country Status (1)

Country Link
JP (1) JP4198331B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086476A1 (en) * 2004-03-04 2005-09-15 Matsushita Electric Industrial Co., Ltd. Video acoustic content recording device and recording method
JP2007163568A (en) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Input apparatus for digest scene, input method therefor, program for this method, and recording medium recorded with this program
JP2008079263A (en) * 2006-09-19 2008-04-03 Jcc Kk Method of automatically archiving video meeting purpose and utilizing the video
JP2012027340A (en) * 2010-07-26 2012-02-09 Brother Ind Ltd Karaoke apparatus and method of outputting still picture of karaoke singer
US8125539B2 (en) 2007-11-09 2012-02-28 Sony Corporation Information-processing apparatus and method detecting living-body information
JP2012222504A (en) * 2011-04-06 2012-11-12 Sony Corp Information processing device and method, and program
US8712221B2 (en) 2009-02-12 2014-04-29 Canon Kabushiki Kaisha Video recording and playing apparatus and its control method
WO2024075962A1 (en) * 2022-10-05 2024-04-11 주식회사 엠티이지 Method and device for providing annotations by using voice input

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086476A1 (en) * 2004-03-04 2005-09-15 Matsushita Electric Industrial Co., Ltd. Video acoustic content recording device and recording method
JP2007163568A (en) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Input apparatus for digest scene, input method therefor, program for this method, and recording medium recorded with this program
JP4627717B2 (en) * 2005-12-09 2011-02-09 日本電信電話株式会社 Digest scene information input device, input method, program for the method, and recording medium recording the program
JP2008079263A (en) * 2006-09-19 2008-04-03 Jcc Kk Method of automatically archiving video meeting purpose and utilizing the video
US8125539B2 (en) 2007-11-09 2012-02-28 Sony Corporation Information-processing apparatus and method detecting living-body information
US8712221B2 (en) 2009-02-12 2014-04-29 Canon Kabushiki Kaisha Video recording and playing apparatus and its control method
JP2012027340A (en) * 2010-07-26 2012-02-09 Brother Ind Ltd Karaoke apparatus and method of outputting still picture of karaoke singer
JP2012222504A (en) * 2011-04-06 2012-11-12 Sony Corp Information processing device and method, and program
WO2024075962A1 (en) * 2022-10-05 2024-04-11 주식회사 엠티이지 Method and device for providing annotations by using voice input

Also Published As

Publication number Publication date
JP4198331B2 (en) 2008-12-17

Similar Documents

Publication Publication Date Title
KR100915847B1 (en) Streaming video bookmarks
KR100547317B1 (en) Simultaneous recording and playback apparatus with indexing/searching/browsing functionality
US8260108B2 (en) Recording and reproduction apparatus and recording and reproduction method
JP3868820B2 (en) Broadcast receiver
JP2009076970A (en) Summary content generation device and computer program
JP4426743B2 (en) Video information summarizing apparatus, video information summarizing method, and video information summarizing processing program
JP2007524321A (en) Video trailer
US20060222318A1 (en) Information processing apparatus and its method
JP4735413B2 (en) Content playback apparatus and content playback method
JP4029487B2 (en) Recording apparatus and recording method, reproducing apparatus and reproducing method, and recording medium
US20080320046A1 (en) Video data management apparatus
US7433579B2 (en) Recording and reproducing apparatus and reproduction processing method
US8218945B2 (en) Motion picture recording/reproducing apparatus
JP4198331B2 (en) Recording device
JP4432823B2 (en) Specific condition section detection device and specific condition section detection method
JP2003179852A (en) Video audio data recording and reproducing method, and disk device employing the same
JP5521436B2 (en) Moving image recording apparatus, moving image recording method and program
JP2007066409A (en) Recording and reproducing apparatus, and recording and reproducing method
JP4424273B2 (en) Information processing apparatus and method, and program
JP2005318180A (en) Hard disk recorder and video recording apparatus
JP3794146B2 (en) Information reproducing apparatus and method, and providing medium
KR100785988B1 (en) Apparatus and method for recording broadcasting of pve system
US20060048204A1 (en) Method of storing a stream of audiovisual data in a memory
KR100696831B1 (en) Subscription recording method of video recorder system
JP4781992B2 (en) Recording / playback device

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees