JP2003223176A - スピーチ近似データによる字幕用データ作成・編集支援システム - Google Patents

スピーチ近似データによる字幕用データ作成・編集支援システム

Info

Publication number
JP2003223176A
JP2003223176A JP2002019193A JP2002019193A JP2003223176A JP 2003223176 A JP2003223176 A JP 2003223176A JP 2002019193 A JP2002019193 A JP 2002019193A JP 2002019193 A JP2002019193 A JP 2002019193A JP 2003223176 A JP2003223176 A JP 2003223176A
Authority
JP
Japan
Prior art keywords
speech
subtitle
data
program
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002019193A
Other languages
English (en)
Other versions
JP3944830B2 (ja
Inventor
Eiji Sawamura
英治 沢村
Takao Monma
隆雄 門馬
Noriyoshi Uratani
則好 浦谷
Katsuhiko Shirai
克彦 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Telecommunications Advancement Organization
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
NEC Corp
Nippon Hoso Kyokai NHK
Telecommunications Advancement Organization
NHK Engineering Services Inc
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Hoso Kyokai NHK, Telecommunications Advancement Organization, NHK Engineering Services Inc, Japan Broadcasting Corp filed Critical NEC Corp
Priority to JP2002019193A priority Critical patent/JP3944830B2/ja
Publication of JP2003223176A publication Critical patent/JP2003223176A/ja
Application granted granted Critical
Publication of JP3944830B2 publication Critical patent/JP3944830B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Studio Circuits (AREA)
  • Television Systems (AREA)

Abstract

(57)【要約】 【課題】 スピーチ近似データを用いることにより、ス
ピーチ区間指定の指針とすることで、字幕用データ作成
・編集作業を支援するシステムをを提供する。 【解決手段】 音声power値の特定周波数範囲(例えば
5〜7Hz)成分を適当なレベルでスライスし、2値化
したデータを作成する。ここで、高レベル範囲はスピー
チ、低レベル範囲は非スピーチ(ポーズ)の区間を表す
ので、このデータから音声中のスピーチの開始・終了タ
イミングをある程度正確に把握することができる。この
ように、音声データを特殊処理したスピーチ近似データ
を、スピーチ区間指定の指針として活用することによ
り、書き起こし及び編集作業における、スピーチ内容の
理解・テキスト化への専念を可能とし、これらの作業を
効果的に支援することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、人手による字幕制
作工程と、自動による字幕制作工程とを効果的に組み合
わせた半自動型字幕番組制作システムにおいて、スピー
チ近似データを用いることにより、スピーチ区間指定の
指針とすることで、字幕用データ作成・編集作業を支援
する技術に関する。
【0002】〔発明の概要〕本発明は、音声データを特
殊処理したスピーチ近似データをタイムライン上に表示
することにより、スピーチ区間指定の指針となるように
したものである。
【0003】スピーチ区間の指定を容易化することによ
り、書き起こし作業におけるスピーチ内容の理解・テキ
スト化への専念を可能とするもので、字幕用データ作成
・編集を効果的に支援することが可能となる。
【0004】したがって、電子化原稿のない番組や背景
音レベルの大きい番組など多様な番組に対しても、より
簡単かつ効率的に字幕用データの作成・編集が可能とな
り、字幕番組制作の効率化に大きく寄与することが出来
る。
【0005】
【従来の技術】オフラインで字幕番組を自動制作する技
術としては、ニュース番組やナレーション主体のドキュ
メンタリー番組を対象とし、電子化原稿が存在する場合
に、「自動要約」、「自動同期」、及び「自動字幕画面
作成技術」などの研究成果を集約し、「自動字幕番組制
作システム」として構築された技術が存在する。
【0006】これらの技術は、すでに特願平11−72
671号等で特許出願されているが、かかる技術を適用
できる番組範囲は限られており、電子化原稿が存在しな
い番組、ドラマやバラエティーなど背景音レベルの大き
い番組などに対しては、自動機能として限界があるた
め、限界以上の部分は、手動による字幕制作や試写・修
正の範囲でカバーせざるを得ない。
【0007】
【発明が解決しようとする課題】実際の字幕制作現場で
は、高度な専門技術、知識を持った多くの専門家が携わ
っており、字幕制作はこのような人間の能力に負ってい
る部分が多い。一方、今日のように、字幕番組の急速な
拡充が要請されている状況の下において、字幕制作は、
専門家でなくても、ワープロ作業が一応できるパートタ
イマーでも作業の一端を分担できるようなシステムとす
ることが望ましい。したがって、自動処理を前提とした
字幕制作システムのみならず、手作業を含む字幕用電子
化テキストの作成や、字幕画面の試写・編集などの作業
も含めたトータルシステムとして、字幕制作効率を考え
る必要がある。
【0008】そこで、本件発明の発明者らは、これまで
に行った自動字幕制作システムのシステム評価などから
得た知見を基に、各自動化要素技術を高性能化した新し
い自動字幕システムを中核に、新たに開発した効率的な
手動字幕制作サブシステムを適用することで、広い番組
範囲に対応可能な実用性のより高い半自動型字幕番組制
作システムを開発した。
【0009】この半自動型字幕番組制作システムは別途
出願しているが、かかる半自動型字幕番組制作システム
では、字幕用テキスト作成機能及び字幕番組データ編集
・試写機能については、手動作業で行うこととしてい
る。
【0010】すなわち、音声の、簡易・確実なテキスト
化は極めて重要なテーマであるが、現状の音声認識技術
では誤りが生じるため、半自動型字幕番組制作システム
において字幕用テキスト作成機能は、人間による「書き
起こし作業」で行うこととしている。
【0011】この「書き起こし作業」は、人間の高度な
音声認識能力、言語判断能力に頼るため、高い能力や多
くの時間を必要とする。また、スピーチの開始・終了タ
イミングを調べて記録することとしており、その分作業
者の負担は大きくなる。
【0012】ここで、この手動作業を支援するシステム
があれば、作業者に要求される能力や作業時間、緊張の
程度を低減することができ、より効率的な「書き起こし
作業」が可能となる。
【0013】また、半自動型字幕番組制作システムにお
いて、字幕番組データ編集・試写機能での作業は、一応
出来上がった字幕番組データを専門知識を有する作業者
が試写し、必要なら修正するものである。この作業にお
いて、作業者が字幕内容・タイミングなどに関する修正
がしやすいように支援するシステムがあれば、作業者に
要求される能力や、作業時間、緊張の程度を軽減するこ
とができ、より効率的な編集作業が可能となる。
【0014】本発明は、このような課題に鑑みてなされ
たもので、半自動型字幕番組制作システムにおいて、ス
ピーチの開始・終了タイミングの把握を支援し、書き起
こし作業や字幕番組データ編集作業を行う者に必要とさ
れる能力や、緊張の程度を低減することを目的とする。
【0015】
【課題を解決するための手段】本発明によるスピーチ近
似データによる字幕用データ作成・編集支援システム
は、字幕用テキスト書き起こし機能、自動字幕番組制作
機能、及び字幕番組編集・試写機能からなり、人手によ
る字幕制作機能と自動による字幕制作機能とを組み合わ
せた半自動型字幕番組制作システムに適用する字幕用デ
ータ作成・編集支援システムであって、字幕番組制作対
象となる番組用として録音された音声データ中のスピー
チ成分を強調するスピーチ近似データ作成手段と、前記
スピーチ近似データを、前記字幕番組制作対象となる番
組の時間経過を時間軸として示したタイムライン上に表
示する手段とを有すること特徴とする。
【0016】音声データを特殊処理することにより、ス
ピーチ成分を強調したデータがタイムライン上に表示さ
れるので音声中のスピーチの開始・終了のタイミング把
握の確度を上げることができる。
【0017】また、本発明においては、スピーチ近似デ
ータ作成手段は、音声のcflx解析値、音声Power値の特
定周波数範囲(例えば5〜7Hz)成分抽出値、又はこ
れらを組み合わせたものを用いることを特徴としてい
る。
【0018】音声のcflx解析値を用いる方法とは、音声
のスピーチ区間の検出に、音声レベルの特徴を利用する
ブロック・ケプストラム・フラックス法(cflx法)を用
いるもので、ブロック・ケプストラム・フラックス法
は、音響データ内の複数のLPCケプストラムベクトル
を基準フレームから相互に比較することで、音響データ
内容の切り替わり点をより安定に検出する方法である。
【0019】また、音声Power値の特定周波数範囲成分
抽出値による方法とは、番組音声パワーの時間軸方向の
変動特性に注目して行う手法である。すなわち、スピー
チに関する時間軸方向の変動特性を、スピーチの発音記
号列と比較すると、母音の発音記号に対応する音声パワ
ーが他より大きくなる傾向があり、そして、通常速度の
スピーチにおけるこの変動特性は、ほぼ4〜7Hz程度
の周波数範囲になっている。本手法は基本的にはこの周
波数成分を抽出し、その成分が所定の閾値以上の範囲を
スピーチ区間として検出するものである。
【0020】これらの値を用いることにより、スピーチ
成分を強調したデータを得ることができる。
【0021】
【発明の実施の形態】まず、本発明を適用する半自動字
幕番組制作システムについて図4を参照して説明する。
【0022】半自動型字幕番組制作システムの主要な機
能は、図4に示すように、字幕テキスト書起し機能1
と、自動字幕番組データ制作機能2と、字幕番組データ
編集・試写機能3と、全体を統括制御する基本GUIシ
ステム4とからなっている。
【0023】ここで、字幕テキスト書き起こし機能1と
は、素材番組の音声を聞き取って、字幕用テキストの書
き起こしや開始・終了タイミングなどの付加データを入
力する機能であり、素材番組の映像・音声を、パソコン
のディスクに圧縮記録するとともに、記録された映像音
声の再生および特殊再生操作のための操作キーを備え、
対応する動作を行う「ディスク記録再生制御機能」、書
き起こしおよび付加情報データの入力の手動作業を支援
するため、素材番組の映像・音声、書き起こしテキスト
などに関する各種の情報を、タイムライン上にビジュア
ルに表示する「情報表示機能」、書き起こしたテキスト
やスピーチポーズの時間データ入力操作のための操作キ
ーを備え、対応する動作をする「データ作成制御機
能」、及びデータ作成画面や主映像表示画面とからな
る。
【0024】また、自動字幕番組データ制作機能2と
は、提示時間順に配列された字幕用テキストの中から、
適切な改行・改頁によって表示単位字幕文を形成し、音
声認識処理を含む同期検出技術などを適用することによ
り、この表示単位字幕文毎に始点及び終点を同期点とし
て検出して、始点/終点タイミング情報を表示単位字幕
文毎に付与する一連の動作を自動的に行う機能であり、
必要な場合は字幕用テキストを要約する「テキスト自動
要約機能」と「表示単位字幕作成機能」と「タイミング
検出・付与機能」とからなる。
【0025】また、字幕番組データ編集・試写機能3と
は、書き起こしした字幕用テキスト及び付加情報データ
を基に、自動字幕番組データ制作部で自動制作された字
幕番組データを人手で編集・試写するためのものであ
り、始点及び終点時間、字幕の改ページ、改行などに関
し編集・試写作業支援用特殊表示操作のための専用操作
キーを備え、対応する動作をする「ディスク記録再生お
よび字幕データ制御機能」、各種の情報を、タイムライ
ン上にビジュアル表示し、特に字幕番組データについて
は、タイミング変更支援画面を表示し対応する動作をす
る「情報表示・字幕タイミング制御機能」、字幕データ
のページ単位編集のための専用操作キーを備え、対応す
る動作をする「字幕データページ編集操作キーと機
能」、映像に重畳した指定字幕データ表示のための、操
作キーを備え、対応する動作をする「字幕データ・映像
表示機能」、及び部分試写、通し試写など、試写形式の
選択に必要な操作キーを備え、対応する動作をする「試
写用キーとその機能」とからなる。
【0026】本発明にかかるスピーチ近似データによる
字幕用データ作成・編集支援システムは、前記半自動字
幕番組制作システムにおいて、字幕テキスト書き起こし
機能1及び字幕番組編集・試写機能3に適用し、これら
の機能を支援するためのシステムである。
【0027】まず、本発明にかかるスピーチ近似データ
による字幕用データ作成・編集支援システムについて、
基本原理を図5及び図6を参照して説明し、次いでこの
システムを半自動字幕番組制作システムの字幕テキスト
書き起こし機能1に適用した実施の形態を図1乃至図3
により説明し、続いてこのシステムを半自動字幕番組制
作システムの字幕番組編集・試写機能に適用した実施の
形態を図7及び図8により説明する。
【0028】本発明にかかるスピーチ近似データによる
字幕用データ作成・編集支援システムは、字幕用テキス
トの書き起こし作業及び編集作業において、スピーチの
開始・終了タイミングを把握することが重要であること
から、スピーチ近似データを作成して、それを活用し、
スピーチ区間を容易に把握できるようにすることで、ス
ピーチの開始・終了タイミングの把握を支援するもので
ある。
【0029】一般に、テープに録音したスピーチの書き
起こしでは、テープの再生速度を遅くして、聴きやすく
する方法が行われており、その効果が知られている。
【0030】しかし、ドキュメンタリーテレビ番組など
では、スピーチが連続している場合よりも比較的長い非
スピーチ(ポーズ)区間が介在している場合が多い。こ
のような場合は、テープの再生速度を遅くしてスピーチ
区間の書き起こしを行い、次いで、ポーズ区間を送った
後次のスピーチ区間テープを低速再生して書き起こしを
行う、といったテープの操作と書き起こしの作業を行う
こととなり、個々のスピーチ区間では音声を聞きながら
行う頭出し操作も必要となる場合もあるので煩雑な作業
が強いられる。
【0031】ここで、書き起こしのための頭出しも含
め、スピーチ近似データの作成・活用によってスピーチ
区間の把握が容易となれば、書き起こし作業を効果的に
支援することができる。
【0032】同様に、字幕番組の編集作業においても、
スピーチ近似データの作成・活用によってスピーチ区間
の把握が容易となれば字幕番組制作において、編集作業
を支援することができる。
【0033】図5は、スピーチ近似データとして音声デ
ータ波形51を表示した例である。
【0034】横軸は、番組の時間経過を示したタイムラ
インであり、音声を再生するとこの経過時間に応じた位
置にカーソルが表示され、かつ時間経過とともに移動す
るようにしてある。したがって、カーソルの各位置にお
ける再生音声と音声波形の対応付けができる。
【0035】音声における背景音が充分小さい場合とか
波形に関する経験状況によっては、この音声波形データ
からスピーチタイミングをある程度把握することができ
るが、通常の番組音声では、種々の背景音がありそのレ
ベルも様々であることから、一般的には、この音声波形
データからスピーチの開始・終了タイミングを正確に把
握することは難しい。
【0036】ここで、スピーチ成分を強調したスピーチ
近似データを利用するとタンミング把握の確度を高める
ことが可能となる。
【0037】図6は、音声データを特殊処理したスピー
チ近似データを用いた例である。図6において、波形6
1は音声のcflx解析値、波形62は音声power値の特定
周波数範囲(例えば5〜7Hz)成分抽出値、波形63は
波形62を適当なレベルでスライスし、2値化したデー
タである。
【0038】波形63において、高レベル範囲はスピー
チ、低レベル範囲は非スピーチ(ポーズ)の区間を表し
ており、この例ではほとんど実測したタイミングと合致
している。したがって、波形63から音声中のスピーチ
の開始・終了タイミングをある程度正確に把握すること
ができる。
【0039】このように、音声データを特殊処理したス
ピーチ近似データを、スピーチ区間指定の指針として活
用することにより、書き起こし及び編集作業における、
スピーチ内容の理解・テキスト化への専念を可能とし、
これらの作業を効果的に支援することができる。
【0040】次いで、本発明にかかるスピーチ近似デー
タによる字幕用データ作成・編集支援システムを半自動
字幕番組制作システムの字幕テキスト書き起こし機能に
適用した実施の形態を図1ないし図3を参照して説明す
る。
【0041】字幕用テキスト書き起こし機能とは、素材
番組の音声を聞き取って、字幕用テキストの書き起こし
や付加データを入力する機能であり、前述の通り「ディ
スク記録再生制御機能」、「情報表示機能」、「データ
作成制御機能」、及びデータ作成画面や主映像表示画面
とからなる。
【0042】本発明にかかるスピーチ近似データによる
字幕用データ作成・編集支援システムは、字幕用テキス
ト書き起こし機能の一部である「情報表示機能」におい
て、タイムライン上に、音声データを特殊処理したスピ
ーチ近似データを表示することによって、書き起こしお
よび付加情報データの入力の手動作業を支援するもので
ある。
【0043】図1は、本発明にかかるスピーチ近似デー
タによる字幕用データ作成・編集支援システムを適用し
た、書き起こし・編集のメイン画面を示す。
【0044】メイン画面は各機能の呼び出しを行うメニ
ュー領域11、MPEG/AVI映像の表示制御領域1
2、字幕テキストの編集領域13、及び画像と字幕テキ
ストなどの一覧領域14から成り立っている。
【0045】図2に一覧領域14部のみを取り出した画
面を示す。一覧領域14において、上段から画像21、
字幕本文22、及び波形23が表示される。一覧領域1
4の波形23欄に音声データを特殊処理したスピーチ近
似データを表示する。なお、波形23欄には横軸として
時間経過を示すタイムライン16が表示される。本実施
の形態においては、音声power値の特定周波数範囲(例
えば5〜7Hz)成分を適当なレベルでスライスし、2値
化したデータをスピーチ近似データとして表示してい
る。カーソル15は画像、字幕本文、波形領域にまたが
って、時間とともに移動して表示され、現状の相互関係
を把握することが出来る。
【0046】次に、字幕テキスト書起しと付加情報デー
タ入力の、具体的処理手順例を図3に示す。
【0047】図3に示す通り、まず、[PLAY]を押
し、映像再生開始。発話タイミングを探す(ステップS
1)。次いで、発話の確認点で、「書起開始」を押す
(ステップS2)。この点がスピーチ区間の開始点とな
る。続いて、一定時間巻き戻し、スロー再生開始する
(ステップS3)。次に、再生音を聴きながら書き起こ
し作業を行う(ステップS4)。次いで、スピーチ終了
と認識したら、適宜巻き戻して発話終了点を探し(ステ
ップS5)、発話終了点で「書起終了」を押す(ステッ
プS6)。番組が終了するまでステップS2からS6ま
での動作を繰り返す。一連の書き起こし作業が終了した
後、用字、用語をチェック、要約支援を実行し(ステッ
プS7)、続いて背景音情報を登録する(ステップS
8)。テキスト作成が終了したら、自動字幕番組データ
制作工程へすすむ(ステップS9)。
【0048】これらの操作は、図1に示す書き起こし・
編集のメイン画面を見ながら行う。メイン画面下部の一
覧領域14において、図2に示すように、書き起こそう
とする字幕本文を表示すべき欄の下の波形23欄に、映
像ファイルに記録されている音声power値の特定周波数
範囲(例えば5〜7Hz)成分を適当なレベルでスライス
し、2値化したデータが表示されるので、発話の確認及
びスピーチ終了点を見つけ出すことが容易となる。
【0049】続いて、本発明にかかるスピーチ近似デー
タによる字幕用データ作成・編集支援システムを半自動
字幕番組制作システムの字幕番組編集・試写機能に適用
した実施の形態を図7及び図8を参照して説明する。
【0050】字幕番組データ編集・試写機能3とは、前
述の通り、作成した字幕テキスト及び付加情報データを
基に、自動字幕番組データ制作部で自動制作された字幕
番組データを人手で編集・試写するためのものであり、
「ディスク記録再生および字幕データ制御機能」、「情
報表示・字幕タイミング制御機能」、「字幕データペー
ジ編集操作キーと機能」、「字幕データ・映像表示機
能」、及び「試写用キーとその機能」とからなる。
【0051】本発明にかかるスピーチ近似データによる
字幕用データ作成・編集支援システムは、字幕番組デー
タ編集・試写機能の一部である「字幕データ・映像表示
機能」において。タイムライン上に、音声データを特殊
処理したスピーチ近似データをビジュアルに表示するこ
とによって、字幕番組データ編集作業を支援するもので
ある。
【0052】図7は、本発明にかかるスピーチ近似デー
タによる字幕用データ作成・編集支援システムを適用し
た、字幕素材編集のメイン画面である。メイン画面は、
各種機能の呼び出しを行うメニュー領域71、字幕本文
の入力を行う編集領域72、及びMPEG/AVI画像
と字幕本文の一覧領域73に分けられる。
【0053】字幕本文一覧領域73には、図8に示すよ
うに、画像81と字幕本文82と波形83が表示され
る。ここで、波形として、映像ファイルに記録されてい
る音声power値の特定周波数範囲(例えば5〜7Hz)成
分を適当なレベルでスライスし、2値化したデータがス
ピーチ近似データとして、時間経過を示すタイムライン
75上に表示されるので、スピーチやポーズの位置を視
覚的に判断することができる。
【0054】すなわち、字幕本文一覧領域において、字
幕本文は、話者と本文の内容が枠に囲われて表示される
ので、カーソル74を参考にして波形として2値化され
て表示されたデータと見比べ、スピーチやポーズの位置
を確認しつつ、字幕表示の時間幅や表示タイミングの変
更を行うことが出来る。
【0055】このように、視覚的にスピーチやポーズの
位置を判断することができるので、編集作業において、
字幕の表示タイミングの編集が容易となる。
【0056】
【発明の効果】以上のように、本発明によれば、音声中
のスピーチの開始・終了タイミングをある程度正確に把
握することができるので、半自動型字幕番組制作システ
ムに、本発明を適用することによって、字幕テキスト書
き起こし作業及び編集作業を支援することができる。ま
た、スピーチの開始・終了タイミングを視覚的に把握す
ることができるので、書き起こし作業や字幕番組データ
編集作業を行う者に必要とされる能力や、緊張の程度を
低減することができる。
【図面の簡単な説明】
【図1】本発明にかかるスピーチ近似データによる字幕
用データ作成・編集支援システムを適用した、書き起こ
し・編集のメイン画面である。
【図2】図1から一覧領域部のみを取り出した画面であ
る。
【図3】字幕テキスト書起しと付加情報データ入力の処
理手順を示す図である。
【図4】本発明を適用する半自動型字幕番組制作システ
ムの機能構成図である。
【図5】スピーチ近似データとして音声データ波形51
を表示した図である。
【図6】音声データを特殊処理したスピーチ近似データ
を表示した図である。
【図7】本発明を適用した、字幕素材編集のメイン画面
である。
【図8】図7から一覧領域部のみを取り出した画面であ
る。
【符号の説明】
1 字幕テキスト書き起こし機能 2 自動字幕番組データ制作機能 3 字幕番組編集・試写機能 11 メニュー領域 12 制御領域 13 編集領域 14 一覧領域 51 音声データ波形 61 音声のcflx解析値 62 音声power値の特定周波数範囲成分抽出値 63 音声power値の特定周波数範囲成分抽出値の2値
化データ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/278 H04N 7/08 A // H04N 7/025 7/03 7/035 (71)出願人 000004352 日本放送協会 東京都渋谷区神南2丁目2番1号 (72)発明者 沢村 英治 東京都港区芝2−31−19 通信・放送機構 内 (72)発明者 門馬 隆雄 東京都港区芝2−31−19 通信・放送機構 内 (72)発明者 浦谷 則好 東京都港区芝2−31−19 通信・放送機構 内 (72)発明者 白井 克彦 東京都港区芝2−31−19 通信・放送機構 内 Fターム(参考) 5C023 AA18 BA01 BA11 CA03 CA04 CA05 5C063 AA01 AB05 AC01 AC05 AC10 CA29 DA03 DA07 DB10 5D015 DD03 KK02 5D045 AB30

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 字幕用テキスト書き起こし機能、自動字
    幕番組制作機能、及び字幕番組編集・試写機能からな
    り、人手による字幕制作機能と自動による字幕制作機能
    とを組み合わせた半自動型字幕番組制作システムに適用
    する字幕用データ作成・編集支援システムであって、 字幕番組制作対象となる番組用として録音された音声デ
    ータ中のスピーチ成分を強調するスピーチ近似データ作
    成手段と、 前記スピーチ近似データを、前記字幕番組制作対象とな
    る番組の時間経過を時間軸として示したタイムライン上
    に表示する表示手段とを有すること特徴とするスピーチ
    近似データによる字幕用データ作成・編集支援システ
    ム。
  2. 【請求項2】 前記スピーチ近似データ作成手段は、音
    声のcflx解析値、音声Power値の特定周波数範囲成分抽
    出値、又はこれらを組み合わせたものを用いることを特
    徴とする請求項1に記載のスピーチ近似データによる字
    幕用データ作成・編集支援システム。
JP2002019193A 2002-01-28 2002-01-28 スピーチ近似データによる字幕用データ作成・編集支援システム Expired - Lifetime JP3944830B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002019193A JP3944830B2 (ja) 2002-01-28 2002-01-28 スピーチ近似データによる字幕用データ作成・編集支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002019193A JP3944830B2 (ja) 2002-01-28 2002-01-28 スピーチ近似データによる字幕用データ作成・編集支援システム

Publications (2)

Publication Number Publication Date
JP2003223176A true JP2003223176A (ja) 2003-08-08
JP3944830B2 JP3944830B2 (ja) 2007-07-18

Family

ID=27743169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002019193A Expired - Lifetime JP3944830B2 (ja) 2002-01-28 2002-01-28 スピーチ近似データによる字幕用データ作成・編集支援システム

Country Status (1)

Country Link
JP (1) JP3944830B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009089032A (ja) * 2007-09-28 2009-04-23 Toshiba Corp 電子機器およびシーン種類表示方法
JP2009177750A (ja) * 2008-01-28 2009-08-06 Casio Hitachi Mobile Communications Co Ltd 字幕付映像再生装置、字幕付映像再生方法及びプログラム
WO2021044595A1 (ja) * 2019-09-05 2021-03-11 日本電気株式会社 マスク生成装置、マスク生成方法、および記録媒体
CN113938758A (zh) * 2021-12-08 2022-01-14 沈阳开放大学 一种视频编辑器中快速添加字幕的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009089032A (ja) * 2007-09-28 2009-04-23 Toshiba Corp 電子機器およびシーン種類表示方法
US8559683B2 (en) 2007-09-28 2013-10-15 Kabushiki Kaisha Toshiba Electronic apparatus and scene-type display method
JP2009177750A (ja) * 2008-01-28 2009-08-06 Casio Hitachi Mobile Communications Co Ltd 字幕付映像再生装置、字幕付映像再生方法及びプログラム
WO2021044595A1 (ja) * 2019-09-05 2021-03-11 日本電気株式会社 マスク生成装置、マスク生成方法、および記録媒体
JPWO2021044595A1 (ja) * 2019-09-05 2021-03-11
JP7211523B2 (ja) 2019-09-05 2023-01-24 日本電気株式会社 マスク生成装置、音信号処理装置、マスク生成方法、およびプログラム
US11881200B2 (en) 2019-09-05 2024-01-23 Nec Corporation Mask generation device, mask generation method, and recording medium
CN113938758A (zh) * 2021-12-08 2022-01-14 沈阳开放大学 一种视频编辑器中快速添加字幕的方法

Also Published As

Publication number Publication date
JP3944830B2 (ja) 2007-07-18

Similar Documents

Publication Publication Date Title
JP4835321B2 (ja) 番組提供方法、番組提供方法のプログラム、番組提供方法のプログラムを記録した記録媒体及び番組提供装置
JP2009163643A (ja) 映像検索装置、編集装置、映像検索方法およびプログラム
CN102290081A (zh) 语言学习播放控制方法
KR101727587B1 (ko) 디지털 녹취 파일 녹취록 생성 방법
JP4086532B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP3944830B2 (ja) スピーチ近似データによる字幕用データ作成・編集支援システム
JP2006339817A (ja) 情報処理装置およびその表示方法
JP2002344805A (ja) オープンキャプションに対する字幕表示制御方法
JP3969570B2 (ja) 逐次自動字幕制作処理システム
JP5033653B2 (ja) 映像記録再生装置及び映像再生装置
JP4854339B2 (ja) 映像再生装置
JP4455644B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
KR101781353B1 (ko) 무결성 디지털 녹취 파일 생성 방법
JP4124416B2 (ja) 半自動型字幕番組制作システム
JP2005129971A (ja) 半自動型字幕番組制作システム
JP4080965B2 (ja) 情報提示装置及び情報提示方法
JP4500957B2 (ja) 字幕制作システム
JP2003223199A (ja) 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム
JP4088669B2 (ja) タイムライン上に配置した字幕の境界移動による字幕編集支援システム
JP2003216200A (ja) 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム
JP2003224807A (ja) 字幕番組編集支援システムおよび半自動型字幕番組制作システム
JP2006332765A (ja) コンテンツ検索・再生方法、コンテンツ検索・再生装置、並びにプログラムおよび記録媒体
JP2008312066A (ja) 字幕付映像再生装置、プログラム
JP2005080247A (ja) 放送番組録画装置、放送番組録画方法及び放送番組録画プログラム
JP2005341138A (ja) 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20020318

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040513

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040517

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040903

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20041213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070329

R150 Certificate of patent or registration of utility model

Ref document number: 3944830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110420

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110420

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130420

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130420

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140420

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term