JP2020154057A - 音声データのテキスト編集装置及び音声データのテキスト編集方法 - Google Patents

音声データのテキスト編集装置及び音声データのテキスト編集方法 Download PDF

Info

Publication number
JP2020154057A
JP2020154057A JP2019050659A JP2019050659A JP2020154057A JP 2020154057 A JP2020154057 A JP 2020154057A JP 2019050659 A JP2019050659 A JP 2019050659A JP 2019050659 A JP2019050659 A JP 2019050659A JP 2020154057 A JP2020154057 A JP 2020154057A
Authority
JP
Japan
Prior art keywords
text
data
voice data
editing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019050659A
Other languages
English (en)
Inventor
晶子 千田
Akiko Senda
晶子 千田
賢悟 宮澤
Kengo Miyazawa
賢悟 宮澤
吉田 光宏
Mitsuhiro Yoshida
光宏 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Morson Japan Co Ltd
Original Assignee
Morson Japan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Morson Japan Co Ltd filed Critical Morson Japan Co Ltd
Priority to JP2019050659A priority Critical patent/JP2020154057A/ja
Publication of JP2020154057A publication Critical patent/JP2020154057A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

【課題】より効率的で、編集意図に沿った編集が容易に行える音声データのテキスト編集装置及び音声データのテキスト編集方法を提供することにある。【解決手段】音声データを記憶する音声データ記憶手段と、音声データ記憶手段に保存された音声データを、テキストデータに変換する音声データテキスト化手段と、音声データテキスト化手段で生成されたテキストデータを、表示手段に表示すると共に編集するためのテキストデータ表示編集手段と、テキストデータ表示編集手段によって編集されたテキストデータの編集の結果を、音声データに反映させるテキスト音声データ化手段とを備えることを特徴とする。【選択図】図1

Description

本発明は、音声データを編集するための音声データのテキスト編集装置及び音声データのテキスト編集方法に関する。
従来より、インタビュー等で収録された音声データを、ラジオ放送等に使用するために編集する作業がなされている。この音声データの編集は、音声データの音声波形を表示手段(モニタ)に表示させて、電子計算機上で音声波形の継ぎ接ぎにより編集を行う方法がとられている。
例えば、特許文献1に示される音声編集装置では、音声編集画面において、編集対象となる音声の波形を表示するとともに、そこに含まれる各音声部分に対応づけて、認識結果表示枠をそれぞれ表示し、その中に各音声部分に対する音声認識の結果の全部又は一部を表示するものである。
特開2002−297188号公報
しかしながら、従来の音声編集装置では、編集者が音声の波形のみならず、その波形に含まれる各音声部分の内容を目で確認できるようになり、音声編集の効率を高めるものの、単に文字面だけを見られるだけであって、より効率的な編集が求められる。
本発明は、このような事情に鑑みてなされたもので、より効率的で、編集意図に沿った編集が容易に行える音声データのテキスト編集装置及び音声データのテキスト編集方法を提供することにある。
請求項1記載の音声データのテキスト編集装置は、音声データを記憶する音声データ記憶手段と、音声データ記憶手段に保存された音声データを、テキストデータに変換する音声データテキスト化手段と、音声データテキスト化手段で生成されたテキストデータを、表示手段に表示すると共に編集するためのテキストデータ表示編集手段と、テキストデータ表示編集手段によって編集されたテキストデータの編集の結果を、音声データに反映させるテキスト音声データ化手段とを備えることを特徴とする。
請求項2記載の音声データのテキスト編集装置は、テキストデータ表示編集手段が、テキストデータの中の単語の部分は、単語のまとまりで表示することを特徴とする。
請求項3記載の音声データのテキスト編集装置は、テキストデータ表示編集手段が、所望の文字の検索ができ、検索された文字の位置を示すことを特徴とする。
請求項4記載の音声データのテキスト編集装置は、テキストデータ表示編集手段が、音声データに含まれる単語の特徴及び単語にならない音の特徴を、その特徴を区別して表示することを特徴とする。
請求項5記載の音声データのテキスト編集装置は、音声データの音声波形を表示手段に表示させる音声波形表示手段を備え、表示手段上に、テキストデータと音声波形とを共に表示できることを特徴とする。
請求項6記載の音声データのテキスト編集装置は、音声波形表示手段が、表示された音声波形を編集することで、音声データの編集ができ、音声波形が編集された音声データを、音声データテキスト化手段でテキストデータに再変換して、再変換されたテキストデータをテキストデータ表示編集手段で再表示してさらに編集できることを特徴とする。
請求項7記載の音声データのテキスト編集装置は、音声データを再生する音声データ再生手段を備え、音声波形表示手段が、音声データ再生手段で再生されている音声データの音声波形上の位置を表示すると共に、テキストデータ表示編集手段が、音声データ再生手段で再生されている音声データのテキストデータ上の位置を表示することを特徴とする。
請求項8記載の音声データのテキスト編集方法は、音声データを、テキストデータに変換し、テキストデータを表示すると共に、表示されたテキストデータを編集可能とし、編集されたテキストデータの編集の結果を、音声データに反映させることを特徴とする。
請求項9記載の音声データのテキスト編集方法は、テキストデータの表示において、テキストデータの中の単語の部分は、単語のまとまりで表示することを特徴とする。
請求項10記載の音声データのテキスト編集方法は、テキストデータの編集において、所望の文字の検索ができ、検索された文字の位置を示すことを特徴とする。
請求項11記載の音声データのテキスト編集方法は、テキストデータの表示において、音声データに含まれる単語の特徴及び単語にならない音の特徴を、その特徴を区別して表示することを特徴とする。
請求項12記載の音声データのテキスト編集方法は、テキストデータと音声データの音声波形とを共に表示できることを特徴とする。
請求項13記載の音声データのテキスト編集方法は、表示された音声波形を編集することで音声データの編集ができ、音声波形が編集された音声データを、テキストデータに再変換して、再変換されたテキストデータを再表示してさらに編集できることを特徴とする。
請求項14記載の音声データのテキスト編集方法は、音声データを再生すると共に、テキストデータ及び音声データの音声波形が表示され、再生されている音声データの音声波形上の位置を表示すると共に、再生されている音声データのテキストデータ上の位置を表示することを特徴とする。
本願の発明によれば、より効率的で、編集意図に沿った音声データの編集が容易に行える。
本発明に係る音声データのテキスト編集装置の画面の一例を示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での検索を示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での編集メニューを示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での削除を示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での削除後を示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での音量上げを示す説明図である。 同音声データのテキスト編集装置のテキスト編集画面での表示内容を示す説明図である。 同音声データのテキスト編集装置の画面での音声波形表示を示す説明図である。
以下、本発明の形態について図面を参照しながら具体的に説明する。図1は、本発明に係る音声データのテキスト編集装置の画面の一例を示す説明図である。図2は、同音声データのテキスト編集装置のテキスト編集画面での検索を示す説明図である。図3は、同音声データのテキスト編集装置のテキスト編集画面での編集メニューを示す説明図である。図4は、同音声データのテキスト編集装置のテキスト編集画面での削除を示す説明図である。図5は、同音声データのテキスト編集装置のテキスト編集画面での削除後を示す説明図である。図6は、同音声データのテキスト編集装置のテキスト編集画面での音量上げを示す説明図である。図7は、同音声データのテキスト編集装置のテキスト編集画面での表示内容を示す説明図である。図8は、同音声データのテキスト編集装置の画面での音声波形表示を示す説明図である。
本願発明に係る音声データのテキスト編集装置は、音声データを編集するためのもので、例えば放送機器の一部に組み込まれる専用装置や、単独の電子計算機により形成されるもので、ハードウェア的な構成は任意であり、ハードウェア的な構成によって限定されるものではない。また、音声データのテキスト編集装置の動作をつかさどる部分に関しては、必ずしもソフトウェアによる制御のみに限られるものではなく、ハードウェアのみで制御されてもよい。
以下で説明する音声データのテキスト編集装置は、一例として、放送機器の一部に組み込まれる専用装置として説明する。尚、専用装置としての音声データのテキスト編集装置は、例えば、ハードウェア的には、制御手段、音声データ記憶手段、表示手段、入力手段、音声データ再生手段等から構成されており、装置全体の制御は、ソフトウェアによりなされるものとし、以降で説明する音声データのテキスト編集装置の動作は、ソフトウェアでなされるものとする。
制御手段は、例えば、中央演算装置で、音声データのテキスト編集装置全体の制御を行うものである。音声データ記憶手段は、予め録音された音声の情報のデータである音声データを記憶するためのもので、制御手段との間で音声データの授受ができるものであればよい。
音声データ記憶手段は、具体的には、音声データのテキスト編集装置の内部メモリでも良いし、音声データのテキスト編集装置に外付けされるメモリであってもよい。内部メモリの場合には、音声データのテキスト編集装置の外部の録音装置や各種記録媒体にある音声データを、音声データ記憶手段に移動させる必要があるが、音声データの移動自体を自動で行うなどの機能を組み込むことも可能である。尚、音声データの録音方式としては、アナログ方式でもデジタル方式であっても構わないが、制御手段で各種の処理を行う上では、アナログ方式であってもデジタル方式に変換して処理するようにすることになる。また、音声データ記憶手段には、音声データの他、後述するテキストデータを保存する媒体として使用してもよい。
表示手段は、後述するテキストデータを表示可能で、テキストデータの編集等の操作を行うための必要な情報が表示できる手段であり、例えば、液晶モニタ等である。入力手段は、音声データのテキスト編集装置の操作の他、後述するテキストデータの編集等の操作を行うためのキーボードやマウス等である。音声データ再生手段は、テキストデータを耳で聞こえる音声として再生するもので、スピーカ等である。尚、音声データ再生手段は、本願の音声データのテキスト編集装置においては必須ではなく、編集された音声データを、本願の音声データのテキスト編集装置で音声として再生せず、他の装置において再生するようにしてもよい。
次に、本願に係る音声データのテキスト編集装置の動作を、機能的構成(ソフトウェアで実現される構成要素)と併せて説明する。音声データのテキスト編集装置の基本構成は、上述の音声データを記憶する音声データ記憶手段と、音声データ記憶手段に保存された音声データを、テキストデータに変換する音声データテキスト化手段と、音声データテキスト化手段で生成されたテキストデータを、表示手段に表示すると共に編集するためのテキストデータ表示編集手段と、テキストデータ表示編集手段によって編集されたテキストデータの編集の結果を、音声データに反映させるテキスト音声データ化手段とからなる。そして、この構成による音声データのテキスト編集装置の基本動作は、音声データを、テキストデータに変換し、テキストデータを表示すると共に、表示されたテキストデータを編集可能とし、編集されたテキストデータの編集の結果を、音声データに反映させるものである。
具体的には、まず、音声データ記憶手段に、編集を行いたい音声データを取り込んで保存させる。次に、音声データ記憶手段に保存された音声データを、音声データテキスト化手段により、テキストデータに変換する。音声データテキスト化手段は、ハードウェアのみ又はソフトウェアのみにより変換するもので、ハードウェアとソフトウェアとが協働して変換する形態でもよい。音声データテキスト化手段は、人工知能を用いた変換エンジンが想定されるが、例えば、ディープ・ラーニング(機械学習)を用いた手法による変換等、様々な手法での変換が可能である。
本願におけるテキストデータは、単に文字情報のデータだけによる構成でも良いが、文字情報以外に、後述するような単語の特徴を示す付随の情報をセットにしたものであってもよい。テキストデータとしては、例えば、ファイルの拡張子が「txt」のようなテキスト形式やHTML形式のような汎用的な形式でもよいし、専用形式であってもよく、その形式により制限されるものではない。
次に、図1等に示すように、テキストデータ表示編集手段で、音声データテキスト化手段で生成されたテキストデータを、表示手段に表示すると共に編集を可能とする。具体的には、図に示すテキスト編集画面20のテキスト表示部22に、テキストデータが文字として表示される。尚、テキスト表示部22に表示されるテキストデータは、文字に限られず、記号やマークのようなものであってもよい。また、テキスト編集画面20では、編集のための各種のツールや機能を選択するための編集メニュー24を表示させて、編集を円滑に行えるようにしてもよく、本実施の形態では、編集メニュー24により編集の各種機能を選択する方法により、以降の説明を行う。
テキストデータ表示編集手段で表示されるテキスト編集画面20のテキスト表示部22に表示されるテキストデータは、単に文字を区切りなく表示してもよいが、図に示すように、テキストデータの中の単語の部分を、単語のまとまりで表示することも可能である。単語のまとまりで表示することで、テキストデータの内容の把握が迅速に行えるようになる。尚、テキストデータを単語のまとまりで表示するための単語のまとまりに関する情報は、音声データテキスト化手段が、音声データをテキストデータにする際に、テキストデータに組み込むようにすればよい。
音声データのテキスト編集装置は、テキストデータ表示編集手段で、所望の文字の検索ができ、検索された文字の位置を示すことも可能である。具体的には、図2に示すように、テキスト編集画面20の検索ボックス26に検索したい所望の文字を入力し(図2の場合「菌がついた」)、検索ボタン26aを押下することで、テキスト表示部22の「菌がついた」の文字の部分が強調表示される。また、この検索された「菌がついた」の部分に、編集するためのカーソルを移動させることも可能である。
音声データのテキスト編集装置は、テキストデータ表示編集手段で、テキストデータに対して各種の編集を行うことができる。編集の機能としては、一般的なカットやコピーといったテキスト編集に加え、音声データの編集に独特な編集も可能になっている。編集の具体的な方法としては、例えば、入力手段であるマウスのポインタを、テキスト編集画面20のテキスト表示部22に移動させ、その位置で、マウスを右クリックすると、図3のように編集メニュー24が表示され、その編集メニュー24から編集の具体的な方法を選ぶようにする。尚、入力手段のキーボードのキーを用いて、編集の具体的な方法を指定するような方法であってもよい。さらに、マウスによるコピー・ペーストによる方法でも編集が可能である。
編集の具体的な機能としては、例えば、切り取り、コピー、貼り付け、削除、挿入、分割の他、音量を上げたり下げたりするような音声データ特有の編集も可能である。図4及び図5に示す例では、編集の機能の削除の様子を示している。図4で、上述の検索で「菌がついた」のテキストを検索し、次に、編集メニュー24を表示させて、編集メニュー24の中の削除24aを選択するようにする。すると、図5に示すように、「菌がついた」の部分が削除されることになる(削除部分24aa)。
尚、編集の具体的な機能は、上述に限定されるものではなく、任意に機能を設けるようにすればよい。そして、テキスト音声データ化手段により、テキストデータ表示編集手段によって編集されたテキストデータの編集の結果を、音声データに反映させるようにする。これにより、編集後の音声データを、音声データ再生手段で再生することが可能になる。尚、実際のテキストデータの編集では、編集と同時に、テキスト音声データ化手段により、テキストデータの編集の結果を音声データに反映させるようにする。
音声データの編集に独特な編集としては、例えば、音量を上げたり下げたりするようなものであるが、図6の例では、上述の検索で「菌がついた」のテキストを検索し、次に、編集メニュー24を表示させて、編集メニュー24の中の音量を上げる24bを選択するようにする。すると、「菌がついた」の部分が音声データとして音量が上げられた設定になる。そして、テキスト音声データ化手段により、編集後の音声データを音声データ再生手段で再生する際に、編集の結果に基づき、編集前の音声データよりも音量が上がった状態で再生されることになる。
一般的なテキストデータの編集の場合には、コピー、貼り付け、置換等は、単純にテキストデータの処理を行えば良いが、本願の音声データのテキスト編集装置の場合、まったく他の人の音声を創り出し嵌め込む等を行うと、編集された音声データとしては不自然なものになってしまう。このため、テキストデータ表示編集手段とテキスト音声データ化手段とが連携し、音声データとして保有しているテキストデータの編集対象の部分を用いて、貼り付けや置換を行うようにすることで、音声データとして自然な編集が可能となる。
音声データのテキスト編集装置は、テキストデータ表示編集手段が、音声データに含まれる単語の特徴及び単語にならない音の特徴を、その特徴を区別して表示するようにしてもよい。ここで、単語の特徴とは、主に単語の意味内容による特徴や単語の発音された音声的な特徴であるが、これら以外の特徴(例えば、単語にならない音の特徴等)であってもよい。単語の意味内容の特徴とは、例えば、差別用語や放送禁止用語等のNGワードや放送事故の恐れのある表現等がある。また、単語の発音された音声的な特徴とは、例えば、音声の大きさ(dB値)や音声の高さ(Hz)等がある。単語にならない音の特徴とは、例えば、長すぎる無音、破裂音、リップノイズ、息を吸い込む音、手を叩く音等である。
特徴を区別して表示するとは、特徴を有さない単語との区別や、他の特徴を有する単語と区別して識別できる表示方法であればよく、例えば、文字の色や大きさ等の文字自体の装飾の他、下線の有無、背景色の有無や背景色の違いや文字の近隣等に記号を表示させる等の方法による表示上の装飾等の各種の方法がある。尚、これら区別して識別できる表現の方法の組み合わせであってもよい。
特徴を有さない単語との区別や、他の特徴を有する単語と区別して識別できる表示方法の具体的な画面の例では、例えば、図7のようなものがある。図7で、「皆さん おはよう ございます」「一番効果が」「手洗い なんだそうです」「菌がついた」「うがい」「マスク」「モーニングサプリ」等は、文字の大きさが他の文字よりも大きくなっているが、これらは、音声の大きさが大きいことを示しており、「おはよう」や「菌がついた」等は、特に音が大きいことを示している。
また、図7の「本当ですね」「そうなんですか」「まずは お知らせを 挟んで 気になる 交通情報 です」「モーニングサプリ」等は、他の文字と色が異なっているが、これは、音声の高さ(Hz)の違いを示し、「本当ですね」「そうなんですか」「まずは お知らせを 挟んで 気になる 交通情報 です」は、同一の色で、周波数の低めの音を示し、「モーニングサプリ」は、周波数の高めの音を示している。記号の例としては、図7の三角の記号や波形の記号等である。
音声データのテキスト編集装置は、図1や図8に示すように、音声波形表示手段により、音声波形表示画面で音声データの音声波形を、表示手段上に、テキストデータと音声波形とを共に表示させることも可能である。そして、音声波形表示手段が、表示された音声波形を編集することで、音声データの編集ができ、音声波形が編集された音声データを、音声データテキスト化手段でテキストデータに再変換して、再変換されたテキストデータをテキストデータ表示編集手段で再表示してさらに編集できるようにしてもよい。
尚、音声データのテキスト編集装置に、上述の音声データを再生する音声データ再生手段を備えるようにして、音声波形表示手段が、音声データ再生手段で再生されている音声データの音声波形上の位置を表示すると共に、テキストデータ表示編集手段が、音声データ再生手段で再生されている音声データのテキストデータ上の位置を表示するようにしてもよい。
音声波形上の位置を表示すると共に、再生されている音声データのテキストデータ上の位置を表示する具体的な様子を示すのが図8である。上述の通り、音声データとテキストデータとは、絶えず関係づけられており、音声波形表示画面10の表示波形12の再生している位置を示す再生波形位置14が帯状に示され、またテキスト編集画面20のテキスト表示部22の再生している位置を示す再生テキスト位置28が示される。
以上のような構成と動作の音声データのテキスト編集装置によれば、より効率的で、編集意図に沿った編集が容易に行える。
本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、この発明を説明するためのものであり、本発明の範囲を限定するものではない。すなわち、本発明の範囲は、実施の形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、この発明の範囲内とみなされる。
以上のように、本発明によれば、より効率的で、編集意図に沿った編集が容易に行える音声データのテキスト編集装置及び音声データのテキスト編集方法を提供することができる。
10・・・・・音声波形表示画面
12・・・・・表示波形
14・・・・・再生波形位置
20・・・・・テキスト編集画面
22・・・・・テキスト表示部
24・・・・・編集メニュー
24a・・・・削除
24aa・・・削除部分
24b・・・・音量を上げる
26・・・・・検索ボックス
26a・・・・検索ボタン
28・・・・・再生テキスト位置

Claims (14)

  1. 音声データを編集するための音声データのテキスト編集装置において、
    該音声データを記憶する音声データ記憶手段と、
    該音声データ記憶手段に保存された該音声データを、テキストデータに変換する音声データテキスト化手段と、
    該音声データテキスト化手段で生成された該テキストデータを、表示手段に表示すると共に編集するためのテキストデータ表示編集手段と、
    該テキストデータ表示編集手段によって編集された該テキストデータの編集の結果を、該音声データに反映させるテキスト音声データ化手段とを備えることを特徴とする音声データのテキスト編集装置。
  2. 前記テキストデータ表示編集手段が、前記テキストデータの中の単語の部分は、該単語のまとまりで表示することを特徴とする請求項1記載の音声データのテキスト編集装置。
  3. 前記テキストデータ表示編集手段が、所望の文字の検索ができ、検索された文字の位置を示すことを特徴とする請求項1又は請求項2記載の音声データのテキスト編集装置。
  4. 前記テキストデータ表示編集手段が、前記音声データに含まれる単語の特徴及び単語にならない音の特徴を、その特徴を区別して表示することを特徴とする請求項1〜請求項3のいずれかに記載の音声データのテキスト編集装置。
  5. 前記音声データの音声波形を前記表示手段に表示させる音声波形表示手段を備え、
    該表示手段上に、前記テキストデータと該音声波形とを共に表示できることを特徴とする請求項1〜請求項4のいずれかに記載の音声データのテキスト編集装置。
  6. 前記音声波形表示手段が、表示された前記音声波形を編集することで、前記音声データの編集ができ、
    該音声波形が編集された該音声データを、前記音声データテキスト化手段で前記テキストデータに再変換して、再変換された該テキストデータを前記テキストデータ表示編集手段で再表示してさらに編集できることを特徴とする請求項1〜請求項5のいずれかに記載の音声データのテキスト編集装置。
  7. 前記音声データを再生する音声データ再生手段を備え、
    前記音声波形表示手段が、該音声データ再生手段で再生されている該音声データの前記音声波形上の位置を表示すると共に、
    前記テキストデータ表示編集手段が、該音声データ再生手段で再生されている該音声データの前記テキストデータ上の位置を表示することを特徴とする請求項5又は請求項6記載の音声データのテキスト編集装置。
  8. 音声データを編集するための音声データのテキスト編集方法において、
    音声データを、テキストデータに変換し、
    該テキストデータを表示すると共に、表示された該テキストデータを編集可能とし、
    編集された該テキストデータの編集の結果を、該音声データに反映させることを特徴とする音声データのテキスト編集方法。
  9. 前記テキストデータの表示において、該テキストデータの中の単語の部分は、該単語のまとまりで表示することを特徴とする請求項8記載の音声データのテキスト編集方法。
  10. 前記テキストデータの編集において、所望の文字の検索ができ、検索された文字の位置を示すことを特徴とする請求項8又は請求項9記載の音声データのテキスト編集方法。
  11. 前記テキストデータの表示において、該音声データに含まれる単語の特徴及び単語にならない音の特徴を、その特徴を区別して表示することを特徴とする請求項8〜請求項10のいずれかに記載の音声データのテキスト編集方法。
  12. 前記テキストデータと前記音声データの音声波形とを共に表示できることを特徴とする請求項8〜請求項11のいずれかに記載の音声データのテキスト編集方法。
  13. 表示された前記音声波形を編集することで前記音声データの編集ができ、
    該音声波形が編集された該音声データを、前記テキストデータに再変換して、再変換された該テキストデータを再表示してさらに編集できることを特徴とする請求項8〜請求項12のいずれかに記載の音声データのテキスト編集方法。
  14. 前記音声データを再生すると共に、前記テキストデータ及び該音声データの音声波形が表示され、
    再生されている該音声データの前記音声波形上の位置を表示すると共に、再生されている該音声データの該テキストデータ上の位置を表示することを特徴とする請求項12又は請求項13記載の音声データのテキスト編集装置。
JP2019050659A 2019-03-19 2019-03-19 音声データのテキスト編集装置及び音声データのテキスト編集方法 Pending JP2020154057A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019050659A JP2020154057A (ja) 2019-03-19 2019-03-19 音声データのテキスト編集装置及び音声データのテキスト編集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019050659A JP2020154057A (ja) 2019-03-19 2019-03-19 音声データのテキスト編集装置及び音声データのテキスト編集方法

Publications (1)

Publication Number Publication Date
JP2020154057A true JP2020154057A (ja) 2020-09-24

Family

ID=72558809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019050659A Pending JP2020154057A (ja) 2019-03-19 2019-03-19 音声データのテキスト編集装置及び音声データのテキスト編集方法

Country Status (1)

Country Link
JP (1) JP2020154057A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024024629A1 (ja) * 2022-07-26 2024-02-01 株式会社東芝 音声加工支援装置、音声加工支援方法、音声加工支援プログラム、および音声加工支援システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155467A (ja) * 1999-11-29 2001-06-08 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2007133033A (ja) * 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
JP2010256391A (ja) * 2009-04-21 2010-11-11 Takeshi Hanamura 音声情報処理装置
JP2011102862A (ja) * 2009-11-10 2011-05-26 Advanced Media Inc 音声認識結果管理装置および音声認識結果表示方法
JP2012008375A (ja) * 2010-06-25 2012-01-12 Nec Corp 音声記録装置、そのデータ処理方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155467A (ja) * 1999-11-29 2001-06-08 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2007133033A (ja) * 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
JP2010256391A (ja) * 2009-04-21 2010-11-11 Takeshi Hanamura 音声情報処理装置
JP2011102862A (ja) * 2009-11-10 2011-05-26 Advanced Media Inc 音声認識結果管理装置および音声認識結果表示方法
JP2012008375A (ja) * 2010-06-25 2012-01-12 Nec Corp 音声記録装置、そのデータ処理方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024024629A1 (ja) * 2022-07-26 2024-02-01 株式会社東芝 音声加工支援装置、音声加工支援方法、音声加工支援プログラム、および音声加工支援システム

Similar Documents

Publication Publication Date Title
JP5045670B2 (ja) 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム
US8548618B1 (en) Systems and methods for creating narration audio
US20170124044A1 (en) Operations on sound files associated with cells in spreadsheets
US20100003006A1 (en) Video searching apparatus, editing apparatus, video searching method, and program
US20220093132A1 (en) Method for acquiring video and electronic device
JP2006323806A (ja) テキストを音声に変換するシステムおよび方法
CA2899730A1 (en) System and methods for contextual text to speech conversion
KR101164379B1 (ko) 사용자 맞춤형 컨텐츠 제작이 가능한 학습 장치 및 이를 이용한 학습 방법
WO2018120819A1 (zh) 一种演示文稿的制作方法和装置
JP4741406B2 (ja) ノンリニア編集装置およびそのプログラム
JP3279684B2 (ja) 音声インタフェース・ビルダ・システム
JPH0315899A (ja) 情報処理システム
JP2020154057A (ja) 音声データのテキスト編集装置及び音声データのテキスト編集方法
JP3896760B2 (ja) 対話記録編集装置、方法及び記憶媒体
US8792818B1 (en) Audio book editing method and apparatus providing the integration of images into the text
KR20180078197A (ko) 이 보이스북 편집장치 및 재생장치
JP2005326811A (ja) 音声合成装置および音声合成方法
Ingram et al. Digital data collection and analysis
JP2004246129A (ja) 音声合成制御装置
JP7481863B2 (ja) 音声認識誤り修正支援装置、プログラムおよび方法
KR102523746B1 (ko) 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
JPH08235209A (ja) マルチメディア情報処理装置
KR20170018281A (ko) 이 보이스북 편집장치 및 재생장치
JP3364569B2 (ja) 音声情報処理装置
Bernstein Making Audio Visible: The Lessons of Visual Language for the Textualization of Sound

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190322

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220901

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230301