JPH11162107A - デジタルビデオ情報及びオーディオ情報を編集するためのシステム - Google Patents

デジタルビデオ情報及びオーディオ情報を編集するためのシステム

Info

Publication number
JPH11162107A
JPH11162107A JP10255230A JP25523098A JPH11162107A JP H11162107 A JPH11162107 A JP H11162107A JP 10255230 A JP10255230 A JP 10255230A JP 25523098 A JP25523098 A JP 25523098A JP H11162107 A JPH11162107 A JP H11162107A
Authority
JP
Japan
Prior art keywords
character string
audio
displayed
text
display screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10255230A
Other languages
English (en)
Inventor
Axel Schulz
シュルツ アクセル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JPH11162107A publication Critical patent/JPH11162107A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 簡単で迅速で精確な編集ができるデジタルビ
デオソース情報及びオーディオソース情報の編集のため
のシステムを提供することである。 【解決手段】 上記課題は、オーディオ情報の中の音声
を識別し、時間的にこの音声に相応する文字列、とりわ
けASCII文字列を生成し、この文字列を表示手段の
ディスプレイスクリーン上にディスプレイするための手
段と、表示手段のディスプレイスクリーン上にディスプ
レイされる文字列のマーキングされる部分に基づいて編
集データを導出するための手段とによって解決される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタルビデオ情報
及びオーディオ情報を編集するためのシステムに関す
る。このシステムは、ビデオ情報及びオーディオ情報を
記録及び再生するための記憶手段と、情報を表示するた
めの表示手段と、編集データを含んでいる編集決定リス
トを作成するための手段と、編集決定リストの編集デー
タに依存して記憶手段を制御するための制御手段とを有
する。
【0002】
【従来の技術】テレビジョンスタジオでは、放送に適し
た番組を制作するためにノンリニア編集システムがます
ます使用されている。このような編集システムでは最初
にビデオ情報及びオーディオ情報の信号を整理しないま
まの形式で自由にアクセスできるメモリ、例えばディス
クメモリに書き込む。次いで、記憶されたビデオ情報及
びオーディオ情報の所定の画像シーン(テイク)にノン
リニアで、すなわち時間的遅延なしにアクセスすること
ができる。メモリに格納されたビデオ情報及びオーディ
オ情報に基づいて編集時点、すなわち放送されるテイク
の開始及び終了時点を決定するのは通常のことである。
選択されたテイクの編集時点ならびにテイクの順番は編
集決定リスト(EDL、Edit Dicision List)に入力さ
れる。この編集決定リストに入力される編集データは
(ディスク)メモリを制御するのに使用される。編集決
定リストの編集データに従って、放送に適した連続的な
画像/オーディオ列がメモリから読み出される。リニア
な(シーケンシャルな)磁気テープ技術とは対照的に、
このようなノンリニア編集システムによって、編集決定
リストに基づいて構成された画像/オーディオ列はオン
ラインで検査される。ノンリニア編集システムでは編集
決定リストへの入力を簡単に変更することができる。
【0003】編集時点はビデオ資料の再生された画像に
よって決定されるだけでなく、随伴する音によっても決
定される。この場合、ビデオ資料に時間的に平行して記
録されたオーディオ情報を聞き取り、放送される所定の
テイクの編集開始及び編集終了の場所に編集マークを付
ける。この編集方式は瞬時のニュース放送を制作するの
に適している。というのも、放送されるテイクの編集時
点はビデオ資料の画像情報よりもオーディオ情報によっ
てより迅速にかつより精確に決定できるからである。
【0004】WO94/16443からオーディオデー
タのコンピュータ支援編集のためのシステムが公知であ
る。このシステムではオーディオデータの振幅経過の部
分がモニタに表示される。振幅経過の急変によって、編
集マークのための編集時点として使用されるような音響
又は音声中断が検出される。オーディオデータに基づく
振幅曲線の実現及び評価は非常に鋭敏な感覚及び特殊な
知識を必要とする。従って、このシステムは技術的に未
熟な編集者による瞬時の(テレビの)ニュース番組編集
作業にはあまり適していない。
【0005】
【発明が解決しようとする課題】本発明の課題は、簡単
で迅速で精確な編集作業ができる、冒頭に挙げたような
タイプのデジタルビデオソース情報及びオーディオソー
ス情報の編集のためのシステムを提供することである。
【0006】
【課題を解決するための手段】上記課題は、オーディオ
情報の中の音声を識別し、この音声に時間的に相応する
文字列、とりわけASCII文字列を生成し、表示手段
のディスプレイスクリーン上にディスプレイするための
手段と、表示手段のディスプレイスクリーン上にディス
プレイされる文字列のマーキングされる部分に基づいて
編集データを導出するための手段とによって解決され
る。
【0007】
【発明の実施の形態】本発明は、通常は主に音声テクス
トを含む瞬時の(テレビの)ニュース放送が従来技術よ
りも時間的により迅速にかつ精確に編集できるという利
点を有する。編集の基礎は、もはやビデオソース資料の
画像情報又はラウドスピーカによって再生されるオーデ
ィオソース資料の情報ではなく、オーディオソース資料
のオーディオデータ列から音声識別によって導出され表
示装置のディスプレイに表示されるテクストである。デ
ィスプレイされるテクストの単語列が画像列に時間的に
結合される。というのも、ニュース番組の画像情報及び
音声情報は通常は同時に記録及び記憶されるからであ
る。記録媒体における画像及び音声情報の格納箇所はタ
イムコードによって決定される。従って、表示されるテ
クストの中の各単語にはタイムコードの所定のタイムコ
ード値が割り当てられ、このタイムコード値は有利には
編集決定リストの作成の際に使用される。
【0008】本発明の改良実施形態によれば、編集開始
及び/又は編集終了の決定のために、表示装置のディス
プレイに表示される文字列の部分の境界を示すマークが
設けられている。本発明の構成は、表示装置のディスプ
レイスクリーンに表示される文字列のマーキングされる
部分の境界の位置を決定する手段及びマーキングされる
部分の境界の位置をビデオ情報及びオーディオ情報に割
り当てられるタイムコードデータに変換し、このタイム
コードデータを編集データとして編集決定リストに記入
する手段から成る。
【0009】表示されるテクストの中のマークの位置は
所定のタイムコード値に相応する。それぞれマークによ
って示される選択されたテイクの境界(編集開始、編集
終了)は編集開始及び編集終了の所定のタイムコード値
を表す。ディスプレイ上のマークの位置をシフトするた
めにマウスが設けられている。このマウスによってクリ
ックされるマーク位置はビデオ及びオーディオ資料に割
り当てられるタイムコードデータ値に変換され、編集決
定リストに入力される。
【0010】本発明による編集決定リストの作成には熟
練した編集者は必要ない。通常瞬時のニュース放送の制
作の場合でもそうであるが、技術的又は芸術的な観点は
重要ではないので、今やジャーナリストが直接自分の放
送番組のための編集決定リストを作成し、この番組を放
送する前に編集作業結果をすぐにチェックし、場合によ
っては変更を加えることができる。
【0011】本発明の改良実施形態では、表示装置のデ
ィスプレイスクリーンがタッチスクリーンとして構成さ
れており、これによりディスプレイスクリーンにタッチ
することによって表示されている文字列の中の所定の部
分の位置境界を決定することができる。表示されている
テクストの中のセンテンスの最初又はセンテンスの終わ
りを軽く指先で触れることによって、それぞれのタイム
コードデータが編集決定リストに記入される。しかもこ
の際マークをシフトし入力を確認するためにマウスを利
用する必要がない。
【0012】外国のエージェンシー乃至は放送局が提供
し衛星を介して自国のテレビ局に伝送される瞬時のテレ
ビニューストピックスは、自国内では共通に使われてい
ない言語で提供されることが多い。受信されたニュース
資料は自国のスタジオで処理しなくてはならない。すな
わち、受信されたオーディオ資料の中の言語部分を翻訳
しオリジナルのオーディオ部分と入れ替えるべきであ
る。代替的に、放送する前に、受信されたニュース資料
をスタジオのアナウンサーが自国の言語で解説してもよ
い。
【0013】画像資料に付加されるこのような随伴する
音も音声識別部に供給され、これにより得られたテクス
トに基づいて編集決定リストを作成する。このやり方
は、音声識別部によって生成されるASCIIテクスト
ファイルがコメンテータ用のテレプロンプターの制御の
ためにも使用できるという利点を有する。オーディオピ
ッチを変化することによって、オーディオ及びビデオテ
イクが異なる長さであっても場合によって必要な音声同
期(リップシンク)を再び作り出すことができ、この場
合、検出された編集マークを基準点として使用する。
【0014】編集作業終了後に残ったASCII文字列
は必要な資料としてさらに利用できる。
【0015】本発明の改良実施形態では、音声識別手段
が音声オーディオ情報の中の異なる音声を識別するため
の装置を有し、この装置は他の音声から区別するために
それぞれの音声に所定の文字フォントを割り当てる。従
って、様々な発話者が話す表示されるテクストの中の一
節は、相応の文字形態によって、例えば文字フォント又
は文字の色で所定の(女性の又は男性の)発話者に割り
当てられる。よって、表示されるテクストは、様々な発
話者のためのシナリオのテクストに似せて作られる。
【0016】本発明の他の改良実施形態では、生成され
た文字列の文字に加えて、これらの文字に時間的に所属
する記憶されたビデオ情報の画像が表示手段のディスプ
レイスクリーン上に表示される。とりわけ、表示手段の
ディスプレイスクリーン上には、記憶されたビデオ情報
の複数の個別画像が表示される。これらの複数の個別画
像のタイムコードデータは、選択されたテイクの編集開
始及び/又は編集終了を決定するための表示された文字
列のマーキングされた部分の境界におけるタイムコード
データと一致する。
【0017】さらに有利には、編集マークによって限定
される1つ又は複数の挿入が、残りの放送時間を示すた
めにディスプレイに表示される全放送時間に時間的に結
合される。これにより、例えばコメンテータは、あとど
のくらいの時間が自分の論評解説のために残っているか
を推定できる。
【0018】
【実施例】本発明の実施例を複数の図に基づいて図面に
よって図示し、以下の記述で詳しく説明する。
【0019】図において同じ部分には同じ参照符号が設
けられている。
【0020】放送に適したテレビ番組は、個々のテイク
のシーケンスから構成される。編集者(cutter)がソー
ス資料を見て、このソース資料の中の所定のテイクを後
ほどの放送のために選択することによって、テイクの時
間的な順番を編集者(cutter)が決定する。選択された
テイクが編集者の所望する順番で放送されるように、編
集データを有するリスト、いわゆるEDL(Edit Decis
ion List)が作成される。次いでEDLの指示によって
制御される編集システムはオンラインで自由にアクセス
可能なメモリに格納されたソース資料を読み出す。以下
に記述されるEDLは所定のEDLフォーマットに固定
されていない。このEDLは周知のEDLフォーマット
のうちの1つ、例えばCMX,GVG,SONYで作成
できる。
【0021】図1に図示されたブロック線図において
は、参照符号1はオーディオ信号及びビデオ信号編集の
ためのコンピュータ支援システムである。このシステム
1は、CPU3(中央処理ユニット)及びRAM4(Ra
ndom Access Memory)を有するコンピュータ支援制御装
置2を含む。このRAM4はバス5を介してCPU3に
接続されている。このバス5にはさらに以下のものが接
続されている。すなわち、不揮発性メモリ6、例えばデ
ィスクメモリ、モニタ8を制御するためのグラフィック
モジュール7、出力側10からビデオ信号を出力しなら
びに出力側11からオーディオ信号を出力するための出
力モジュール9、オーディオソース信号を入力側13で
受信するためのオーディオ入力モジュール12、ビデオ
ソース信号を入力側15で受信するためのビデオ入力モ
ジュール14、双方向シリアルバス17を介してASC
II文字列信号を入出力するための入出力モジュール1
6、キーボード19乃至はマウス20からのデータを受
信するための入力モジュール18、そして最後に音声識
別モジュール21が接続されている。
【0022】ノンリニアに編集するために、最初に入力
側13及び15に供給されるオーディオソース信号及び
ビデオソース信号が入力モジュール12、14及びバス
5を介して不揮発性メモリ6に書き込まれる。オーディ
オソース信号及びビデオソース信号がアナログ信号であ
る場合には、これらオーディオソース信号及びビデオソ
ース信号は前もってアナログ/デジタル変換される。こ
の目的のために、入力モジュール12及び14は相応の
A/D変換器を有する。
【0023】本発明によれば、オーディオソース信号は
文字列に変換される。この変換はソフトウェア制御によ
り音声識別モジュール21で行われる。この音声識別モ
ジュール21はオーディオソース信号の中に含まれる単
語を検出し、これら検出された単語をデジタル文字列、
有利にはASCII文字列として同様に不揮発性メモリ
6に書き込む。音声識別システムはそれ自体は公知(D
E4111781A1,EP0366192A2)であ
り、それゆえここで詳しく説明する必要はない。
【0024】ASCII文字列は、生成されたASCI
I文字列とオーディオ及びビデオソース信号との間の時
間的関係が保存されたままであるように記憶される。オ
ーディオソース信号とビデオソース信号とは、記憶され
る際にタイムコード、例えばSMPTEタイムコードを
介して時間的に相互に結合されるので、生成されるAS
CII文字列はこの前提の下に時間的にオーディオ及び
ビデオソース信号に対応する。ASCII文字列が再び
メモリ6から読み出され、グラフィックモジュール7の
利用してモニタ8のディスプレイスクリーンにテクスト
として表示される場合、このテクストの各単語には所定
のタイムコード値が割り当てられる。このタイムコード
値を介して、単語に所属するビデオ信号の個々の画像乃
至はオーディオ信号の所属する部分にアクセスできる。
【0025】音声識別モジュール21により生成される
ASCII文字列はEDLの作成、つまり編集のためだ
けに使用されるのではない。この生成されるASCII
文字列は入出力モジュール16のシリアルバス17を介
して(ここには図示されていない)外部装置、例えばプ
リンタ、ASCII文字列の後続処理用装置、サーバ又
はテレプロンプターにも供給される。
【0026】入出力モジュール16のシリアルバス17
を介して編集システム1に外部のASCII文字列も供
給される。例えば外国から送られてきたテレビニュース
トピックをテクスト原稿に従ってアナウンサーが解説し
なくてはならない場合、外部のASCII文字列の供給
は有意味である。さらに外国から送られてきたニュース
トピックが受信された画像資料に随伴する音声として言
語テクストを含んでいるが、その言語が共通に使用され
ている言語でない場合には、ASCII文字列の入力が
表示される。この場合、受信されたニューストピックの
放送の前にまず翻訳が行われなければならない。今日で
はコンピュータ支援による翻訳が実施できるので、AS
CIIデータファイルとして生成される翻訳を直接コン
ピュータの出力側からシリアルバス17を介して入出力
モジュール16に供給し、テクストとしてモニタ8のデ
ィスプレイスクリーン上に表示することは適切である。
【0027】外国語オーディオ資料の翻訳によって通常
はリップシンク、つまり受信されたビデオソース資料に
対する元々の時間的関係が失われる。モニタ8のディス
プレイスクリーン上には翻訳されたテクストもこの翻訳
されたテクストに多かれ少なかれ適合する個々の画像も
表示されるので、 ASCII文字列として存在する翻
訳と受信されたビデオソース信号との時間的な結合の破
棄ならびにこれに続いて行われる編集作業、例えば表示
されたテクストの中の所定の単語の消去、挿入、置換な
どの編集作業によって、オーディオソース信号とビデオ
ソース信号との間の音声同期が再び作り出される。この
音声同期は有利には表示されたテクストを所属の画像列
と比較することによって検査される。表示されたテクス
トの編集作業の後で、もしくは場合によっては画像列の
個々の画像の編集作業の後で、テクストが時間的に画像
列に適合する場合には、時間的な結合が再び作られてお
り、そして残りの翻訳されたテクストに基づいてEDL
の作成を開始することができる。
【0028】図2はモニタ8のディスプレイスクリーン
上に表示されるグラフィックユーザインターフェースを
示す。このグラフィックユーザインターフェースは4つ
の領域に分割されている。すなわち、画像領域22、テ
クスト領域23、EDL領域24及び制御領域25であ
る。テクスト領域23には音声識別モジュール21によ
って生成されたテクスト27が表示される。生成される
テクストのサイズに応じてテクスト領域23ではテクス
ト全体か又はテクストのごく一部分だけが表示される。
テクストのスクロールアップ又はスクロールダウンによ
って、ディスプレイスクリーンに表示される所定のテク
スト部分が選択できる。テクストに基づいて編集開始及
び/又は編集終了を決定するために、表示されたテクス
トの部分にマーキングすることができる。これは例えば
光学的マークを放送されるテクスト部分の開始位置及び
終了位置に付けることによって行うことができる。テイ
ク001の開始位置(START S1)は例えばマー
ク28によって示され、このテイクの終了位置(END
E1)はマーク29によって示されている。スタート
マーク30、32及びエンドマーク31、33は続くテ
イク002及び003を限定づけている。
【0029】テクストにマーキングする他の手段は、所
望のテクスト部分を明るいバー34によって強調するこ
とである。明るいバー34の位置及び長さはマウス20
によて又はキーボード19を介するカーソルのコントロ
ールによって決定できる。
【0030】当然、所望のテクストをマーキングによっ
ても明るいバーによってもEDLに含まれるべきではな
いようなテクスト部分に対して強調することができる。
さらに別の手段は、所望のテクストの一節を放送すべき
でないようなテクストの一節からアンダーライン又はス
クリプトフォント変更によって強調することである。
【0031】EDLを作成するための補助手段としてテ
クストの一節を目立たせて表示するためには、とりわけ
有利にはタッチスクリーン制御されるモニタ8が使用さ
れる。この場合、ディスプレイスクリーンのテクスト領
域23に表示されておりかつ所望のビデオ情報及びオー
ディオ情報の形式で時間的に相応して放送されるべきテ
クストの行に沿って指先で触れる。
【0032】画像領域22は、マーキングされたテクス
ト部分によって選択されたテイク001〜003の開始
及び終了時点の画像を表示するための画像ウィンドウ3
5〜40を有する。画像ウィンドウ35にはメモリ6に
格納されているビデオ情報の個別画像が表示されてい
る。この個別画像は時間的にテイク001のスタートマ
ーク28の位置に割り当てられている。画像ウィンドウ
36にはエンドマーク29の位置に割り当てられている
個別画像が表示されている。これは、テクスト領域23
に表示されている連続するテクストが記憶されているビ
デオ情報の画像にタイムコードを介して一致するので可
能となる。テクスト領域23の編集マークの位置をシフ
トすると、画像領域22の編集位置のそれぞれ所属の画
像がタイムコードを介した結合によってメモリ6から検
索されて、ランダムアクセスメモリ4にバッファ記憶さ
れ繰り返し読み出されることによって静止画像として再
生表示される。
【0033】EDL領域24は様々なタイムコード値及
び編集時間を表示するために使用される。行41には完
成したテレビ番組に対して映像ディレクターが設定する
全時間が表示されている。行42にはまだ残っている時
間、つまり全時間と既に選択されたテイクの持続時間の
合計との差が表示されている。さらにEDL領域24は
選択されたテイクに関する幾つかの情報を有する。列4
3にはテイク番号が表示されている。列44にはスター
トマーク28、30、32の位置におけるタイムコード
値が表示されている。列45にはエンドマーク29、3
1、33の位置におけるタイムコード値が表示されてい
る。列46には個々のテイクのそれぞれの持続時間が表
示されている。列47には、選択されたテイクのために
どのくらいの時間がこれまでに累積しているのか、とい
うことに関する情報を得るために、テイクの合計時間が
表示されている。列44及び45のタイムコード値は2
8〜33のそれに相応している。
【0034】個々のタイムコード値をまず最初に求めて
次いで制御コンピュータにキーボード19によって入力
しなくてはならない従来技術とは対照的に、本発明では
編集マーク位置のタイムコード値がマークの設定乃至は
テクスト部分のマーキングによって自動的にEDL領域
24のEDLに入力される。
【0035】テクストのマーキング作業を容易にし迅速
に行うために、制御領域25は様々な再生機能を制御す
るための様々なボタンを有する。ボタン50はストップ
機能を示す。つまりテクストスクロールを停止する。ボ
タン54をマウスクリックすることによって、この編集
システムは、テクストが走り続ける標準再生動作モード
に移行する。ボタン55をクリックすると、このシステ
ムは視認可能な高速テクストフォワード状態に切り換え
られる。ボタン53をクリックすると、このシステムは
自由にアクセス可能なメモリ6に格納されているソース
資料のスタート位置にジャンプする。ボタン51をクリ
ックすると、視認可能なバックワードテクスト再生状態
になる。ボタン52をクリックすると、高速バックワー
ドテクスト再生状態になる。ボタン56をクリックする
と、自由にアクセス可能なメモリ6に格納されているテ
クストのソース資料の終了位置にジャンプする。
【0036】本発明の編集システムは、テクストが走り
続けるか又はテクストの行のマークに沿って指先で触れ
る際に、所属の画像に加えて、所属の音声も再生される
ように構成されている。
【0037】EDL、すなわち放送されるビデオ情報及
びオーディオ情報の編集シーケンスが決定すると、それ
自体は周知のやり方で自由にアクセス可能なメモリ6か
らノンリニア編集動作でEDL制御によってオンライン
で読み出されて番組が放送される。
【図面の簡単な説明】
【図1】本発明のブロック線図である。
【図2】本発明による編集決定リストを作成するための
グラフィックユーザインターフェースである。
【符号の説明】
1 コンピュータ支援編集システム 2 コンピュータ支援制御システム 3 CPU 4 RAM 5 バス 6 ディスクメモリ 7 グラフィックモジュール 8 モニタ 9 出力モジュール 10 出力側 11 出力側 12 オーディオ入力モジュール 13 入力側 14 ビデオ入力モジュール 15 入力側 16 ASCII文字列入出力モジュール 17 双方向シリアルバス 18 入力モジュール 19 キーボード 20 マウス 21 音声識別モジュール 22 画像領域 23 テクスト領域 24 EDL領域 25 制御領域 27 テクスト 28 マーク 29 マーク 30 スタートマーク 31 エンドマーク 32 スタートマーク 33 エンドマーク 34 明るいバー 35〜40 画像ウィンドウ 41及び42 行 43〜47 列 50〜56 ボタン
───────────────────────────────────────────────────── フロントページの続き (71)出願人 590000248 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 デジタルビデオ情報及びオーディオ情報
    を編集するためのシステムであって、 ビデオ情報及びオーディオ情報を記録及び再生するため
    の記憶手段と、情報を表示するための表示手段と、編集
    データを含んでいる編集決定リスト(EDL)を作成す
    るための手段と、前記編集決定リストの編集データに依
    存して前記記憶手段を制御するための制御手段とを有す
    る、デジタルビデオ情報及びオーディオ情報を編集する
    ためのシステムにおいて、 前記オーディオ情報の中の音声を識別し、時間的に前記
    音声に対応する文字列(27)、とりわけASCII文
    字列を生成し、前記表示手段(8)のディスプレイスク
    リーン上にディスプレイするための手段(21)と、 前記表示手段(8)のディスプレイスクリーン上にディ
    スプレイされる前記文字列(27)のマーキングされる
    部分(28〜34)に基づいて編集データを導出するた
    めの手段(2)とを特徴とする、デジタルビデオ情報及
    びオーディオ情報を編集するためのシステム。
  2. 【請求項2】 表示手段(8)のディスプレイスクリー
    ン上にディスプレイされる文字列(27)の部分(28
    〜34)の境界を示すマーク(28〜33)が編集開始
    及び/又は編集終了を決定することを特徴とする請求項
    1記載のシステム。
  3. 【請求項3】 表示手段(8)のディスプレイスクリー
    ン上にディスプレイされる文字列(27)のマーキング
    される部分(28〜34)の境界の位置を決定するため
    の手段(19、20)と、 前記マーキングされる部分(28〜34)の境界の位置
    をビデオ情報及びオーディオ情報に割り当てられるタイ
    ムコードデータ(41〜47)に変換し、該タイムコー
    ドデータ(41〜47)を編集データとして編集決定リ
    スト(24)に記入するための手段(3)とを特徴とす
    る請求項1及び2記載のシステム。
  4. 【請求項4】 表示手段(8)のディスプレイスクリー
    ンはタッチスクリーンとして実装されており、前記ディ
    スプレイスクリーンをタッチすることによってディスプ
    レイされた文字列(27)の所定の部分(28〜34)
    の位置境界を決定することを特徴とする請求項1〜3記
    載のシステム。
  5. 【請求項5】 音声識別手段(21)は音声オーディオ
    情報の中の異なる音声を識別するための装置を有し、該
    装置は各音声に他の音声から区別するための所定の文字
    フォントを割り当てることを特徴とする請求項1記載の
    システム。
  6. 【請求項6】 生成された文字列(27)の文字に加え
    て、文字に時間的に割り当てられる記憶されたビデオ情
    報の画像が表示手段(8)のディスプレイスクリーン上
    にディスプレイされることを特徴とする請求項1記載の
    システム。
  7. 【請求項7】 記憶されたビデオ情報の複数の個別画像
    (36〜40)が表示手段(8)のディスプレイスクリ
    ーン上にディスプレイされ、前記複数の個別画像(36
    〜40)のタイムコードデータは選択されたテイクの編
    集開始及び/又は編集終了を決定するためのディスプレ
    イされた文字列(27)のマーキングされた部分(28
    〜34)の境界のタイムコードデータに時間的に一致し
    ていることを特徴とする請求項6記載のシステム。
JP10255230A 1997-09-12 1998-09-09 デジタルビデオ情報及びオーディオ情報を編集するためのシステム Pending JPH11162107A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19740119.8 1997-09-12
DE19740119A DE19740119A1 (de) 1997-09-12 1997-09-12 System zum Schneiden digitaler Video- und Audioinformationen

Publications (1)

Publication Number Publication Date
JPH11162107A true JPH11162107A (ja) 1999-06-18

Family

ID=7842141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10255230A Pending JPH11162107A (ja) 1997-09-12 1998-09-09 デジタルビデオ情報及びオーディオ情報を編集するためのシステム

Country Status (4)

Country Link
US (1) US6185538B1 (ja)
EP (1) EP0902431A3 (ja)
JP (1) JPH11162107A (ja)
DE (1) DE19740119A1 (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6336093B2 (en) * 1998-01-16 2002-01-01 Avid Technology, Inc. Apparatus and method using speech recognition and scripts to capture author and playback synchronized audio and video
JPH11289512A (ja) * 1998-04-03 1999-10-19 Sony Corp 編集リスト作成装置
US11109114B2 (en) * 2001-04-18 2021-08-31 Grass Valley Canada Advertisement management method, system, and computer program product
US9123380B2 (en) 1998-12-18 2015-09-01 Gvbb Holdings S.A.R.L. Systems, methods, and computer program products for automated real-time execution of live inserts of repurposed stored content distribution, and multiple aspect ratio automated simulcast production
US8560951B1 (en) * 1998-12-18 2013-10-15 Thomson Licensing System and method for real time video production and distribution
KR100293768B1 (ko) * 1999-04-12 2001-06-15 박규진 디지털 오디오 캡션데이터 입력방법
AU736314B2 (en) * 1999-04-19 2001-07-26 Canon Kabushiki Kaisha Audio spotting advisor
JP2001045440A (ja) * 1999-07-13 2001-02-16 Lg Electronics Inc 音声特殊再生方法及び情報再生装置
JP3520010B2 (ja) * 1999-12-28 2004-04-19 三洋電機株式会社 録画装置
EP1947649A3 (en) * 2000-04-05 2014-07-09 Sony United Kingdom Limited Audio/video reproducing apparatus and method
WO2002029784A1 (en) * 2000-10-02 2002-04-11 Clarity, Llc Audio visual speech processing
EP1323108A2 (en) * 2000-10-06 2003-07-02 Highwired Technologies, Inc. Method and apparatus for creating mixed media messages
US20070121810A1 (en) * 2000-10-06 2007-05-31 Highwired Technologies, Inc. Automatically Mixing Audio Signals in a Predetermined Manner
JP2002157112A (ja) * 2000-11-20 2002-05-31 Teac Corp 音声情報変換装置
AR027901A1 (es) * 2000-12-13 2003-04-16 Krolovetzky Miguel Horacio Metodo para la transmision y sincronizacion de datos multimedia sobre redes de computadoras
JP2003032602A (ja) * 2001-07-11 2003-01-31 Pioneer Electronic Corp 画像編集装置及び方法、画像記録再生装置並びにコンピュータプログラム
US7343082B2 (en) * 2001-09-12 2008-03-11 Ryshco Media Inc. Universal guide track
NL1018959C2 (nl) * 2001-09-14 2003-03-17 Vjd Av Media B V Inrichting, gebruik daarvan en werkwijze voor het opslaan en afspelen van beeld- en/of geluidsopnamen, alsmede samenstel van een dergelijke inrichting met een camera.
US20030065503A1 (en) * 2001-09-28 2003-04-03 Philips Electronics North America Corp. Multi-lingual transcription system
US7432940B2 (en) * 2001-10-12 2008-10-07 Canon Kabushiki Kaisha Interactive animation of sprites in a video production
US20030074498A1 (en) * 2001-10-16 2003-04-17 Gareis Ronald E. Method and circuitry for a programmable controller system
US20030084211A1 (en) * 2001-10-29 2003-05-01 Herinckx Derald J. Monitoring method and system for remote input/output blocks
US20030171912A1 (en) * 2002-02-12 2003-09-11 Arnoldo Cabello Translation apparatus
GB2391143A (en) * 2002-04-17 2004-01-28 Rhetorical Systems Ltd Method and apparatus for scultping synthesized speech
DE10220522B4 (de) * 2002-05-08 2005-11-17 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse
DE10220524B4 (de) * 2002-05-08 2006-08-10 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
DE10220520A1 (de) * 2002-05-08 2003-11-20 Sap Ag Verfahren zur Erkennung von Sprachinformation
EP1363271A1 (de) * 2002-05-08 2003-11-19 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
DE10220521B4 (de) * 2002-05-08 2005-11-24 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen
DE10220518B4 (de) * 2002-05-08 2005-10-27 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformation
US20040044532A1 (en) * 2002-09-03 2004-03-04 International Business Machines Corporation System and method for remote audio caption visualizations
US8009966B2 (en) * 2002-11-01 2011-08-30 Synchro Arts Limited Methods and apparatus for use in sound replacement with automatic synchronization to images
AU2004201185B2 (en) * 2003-03-21 2007-11-29 Canon Information Systems Research Australia Pty Ltd Automatic Track Generation
AU2003901314A0 (en) * 2003-03-21 2003-04-03 Canon Information Systems Research Australia Pty Ltd Automatic track generation
US20040221420A1 (en) * 2003-05-08 2004-11-11 Brian Phillips Apparatus and method for cleaning soiled, surfaces with reduced environmental impact
GB0406860D0 (en) * 2004-03-26 2004-04-28 British Telecomm Computer apparatus
EP1856698A1 (en) * 2005-03-10 2007-11-21 Portalvideo, Inc. Video editing method and apparatus
WO2007030481A2 (en) * 2005-09-07 2007-03-15 Portal Video, Inc. Time approximation for text location in video editing method and apparatus
US7637588B2 (en) * 2005-10-11 2009-12-29 Silverbrook Research Pty Ltd Printhead maintenance assembly comprising maintenance roller and cleaning mechanism
US20070192107A1 (en) * 2006-01-10 2007-08-16 Leonard Sitomer Self-improving approximator in media editing method and apparatus
US8307287B2 (en) * 2007-04-13 2012-11-06 Apple Inc. Heads-up-display for use in a media manipulation operation
US20090082887A1 (en) * 2007-09-23 2009-03-26 International Business Machines Corporation Method and User Interface for Creating an Audio Recording Using a Document Paradigm
US9412372B2 (en) * 2012-05-08 2016-08-09 SpeakWrite, LLC Method and system for audio-video integration
US9953646B2 (en) * 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
US10832733B1 (en) 2019-05-15 2020-11-10 International Business Machines Corporation Verbal command video editing

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1177969A (en) 1981-04-09 1984-11-13 John H. Babbel Audio/video editing system having touch responsive function display screen
US4746994A (en) * 1985-08-22 1988-05-24 Cinedco, California Limited Partnership Computer-based video editing system
AT390685B (de) * 1988-10-25 1990-06-11 Philips Nv System zur textverarbeitung
US5136655A (en) * 1990-03-26 1992-08-04 Hewlett-Pacard Company Method and apparatus for indexing and retrieving audio-video data
DE69222102T2 (de) * 1991-08-02 1998-03-26 Grass Valley Group Bedienerschnittstelle für Videoschnittsystem zur Anzeige und interaktive Steuerung von Videomaterial
US5634020A (en) 1992-12-31 1997-05-27 Avid Technology, Inc. Apparatus and method for displaying audio data as a discrete waveform
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5600756A (en) * 1994-05-11 1997-02-04 Sony Corporation Method of labelling takes in an audio editing system
JPH0991928A (ja) 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 映像の編集方法
US6172675B1 (en) 1996-12-05 2001-01-09 Interval Research Corporation Indirect manipulation of data using temporally related data, with particular application to manipulation of audio or audiovisual data
US5911129A (en) * 1996-12-13 1999-06-08 Intel Corporation Audio font used for capture and rendering
GB9709341D0 (en) * 1997-05-08 1997-06-25 British Broadcasting Corp Method of and apparatus for editing audio or audio-visual recordings
EP0899737A3 (en) * 1997-08-18 1999-08-25 Tektronix, Inc. Script recognition using speech recognition

Also Published As

Publication number Publication date
US6185538B1 (en) 2001-02-06
DE19740119A1 (de) 1999-03-18
EP0902431A3 (de) 1999-08-11
EP0902431A2 (de) 1999-03-17

Similar Documents

Publication Publication Date Title
JPH11162107A (ja) デジタルビデオ情報及びオーディオ情報を編集するためのシステム
JP6150405B2 (ja) メディアにキャプションを付けるシステム及び方法
CN104246750B (zh) 抄录语音
CN1152335C (zh) 用于创建多媒体文件的创作设备和创作方法
US8660850B2 (en) Method for the semi-automatic editing of timed and annotated data
US20150098018A1 (en) Techniques for live-writing and editing closed captions
CN101540847A (zh) 字幕制作***及字幕制作方法
US20180226101A1 (en) Methods and systems for interactive multimedia creation
CN111538851B (zh) 自动生成演示视频的方法、***、设备及存储介质
CN109348145B (zh) 基于字幕生成关联弹幕的方法及设备、计算机可读介质
CN110781649A (zh) 一种字幕编辑方法、装置及计算机存储介质、电子设备
CN114268829A (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
KR20050012101A (ko) 시나리오를 기록한 정보저장매체, 기록장치 및 기록방법,그 정보저장매체의 재생장치 및 시나리오의 검색방법
JP2005326811A (ja) 音声合成装置および音声合成方法
KR101477492B1 (ko) 동영상 콘텐츠 편집 및 재생을 위한 장치 및 그 방법
JP2005129971A (ja) 半自動型字幕番組制作システム
JP4500957B2 (ja) 字幕制作システム
JP3841815B2 (ja) 映像デ―タ編集方法
JP2002197488A (ja) リップシンクデータ生成装置並びに方法、情報記憶媒体、及び情報記憶媒体の製造方法
JP2003224774A (ja) 半自動型字幕番組制作システム
JP2003224807A (ja) 字幕番組編集支援システムおよび半自動型字幕番組制作システム
JP3816901B2 (ja) ストリームデータの編集方法と編集システム及びプログラム
KR101103329B1 (ko) 어학 학습기 재생 방법
KR20010054297A (ko) 디지탈동영상 맵핑방법 및 이것을 이용한 반복재생방법
CN101882451A (zh) Dvd动态菜单生成装置及方法