WO2023084806A1

WO2023084806A1 - 動画編集システム

Info

Publication number: WO2023084806A1
Application number: PCT/JP2022/014170
Authority: WO
Inventors: 真司藤原
Original assignee: 株式会社高山化成
Priority date: 2021-11-15
Filing date: 2022-03-24
Publication date: 2023-05-19
Also published as: JP2023073184A; CN118216159A

Abstract

【課題】動画編集の作業性及び利便性を大幅に向上させ、自由度の高い動画編集が可能な動画編集システムを提供する。【解決手段】本発明は、管理者端末３０と動画編集サーバ１０とを備え、動画編集サーバ１０は、動画を再生する動画再生領域１３１とタイムライン表示領域１３２とを少なくとも含む第１動画編集画面を、管理者端末３０に表示させる第１編集画面表示部１１１と、タイムライン表示領域１３２内の第１テキストオブジェクト１３５を配置し、第１テキストオブジェクト１３５に入力された文字列を表すテキストデータを受け付けるテキストオブジェクト配置部１１２と、第１テキストオブジェクト１３５に入力されたテキストデータに基づき、タイムライン表示領域１３２内に配置された第１テキストオブジェクト１３５の位置に対応する動画の再生時刻に、文字列を第１テロップとして動画に重畳表示させる第１テロップ表示部１１３とを備える。

Description

動画編集システム

　本発明は、ユーザー端末上の簡単な編集操作により、任意の動画（映像）にテキスト及び音声を重畳表示させることを可能にする動画編集システムに関する。

　近年、日本国内に於ける外国人労働者の増加に伴い、外国人労働者とのコミュニケーションや、育成及び技術指導に関する課題を抱える企業が増加している。特に、製造現場で使用される特有の専門用語等を日本語で技術指導等を行うのは、外国人労働者にとって難解であり、技術指導を行う方にも過度な負担を強いる。他方、外国人労働者の技術指導等に於いては動画や画像を用いた業務マニュアルを活用することが有用であるとの調査結果もある。

　動画等を用いた業務マニュアルの作製に於いては、撮影された動画を、コンピュータ上で動作する動画編集ソフトウェアを用いて編集処理を行う場合がある。編集処理としては、例えば、撮影や記録によって得られた各種の情報及び目次、タイトル等の付帯情報、並びに音声出力を動画に追加すること等が行われる。

　しかし、動画の編集処理には、ビデオ編集の技術や、ＨＴＭＬ（Hypertext Markup Language）及びＦｌａｓｈの知識等が必要となる。これらの技術及び知識等を備えない場合、従来の動画編集システムでは動画コンテンツの製作及び編集が困難であり、また、たとえこれらの技術等を備えていたとしても、動画の編集処理には多大な時間と手間を要し、簡単に動画編集を行うことは困難である。

　この点に関し、例えば、特許文献１には、コンテンツ素材情報をレイアウト上に配置していくルールを予め定め、保持させておき、このルールに従って、コンテンツ素材情報を自動的に配置してコンテンツを生成する、コンテンツ生成システムが開示されている。これにより、ユーザーは、用意したコンテンツ素材にルールを適用するだけで、自動的にコンテンツを生成することが可能とされている。また、コンテンツ生成のための特別の知識や技術がなくても簡単にコンテンツを作成することができ、時間条件に制限されることなく自由に再生できるとされている。

　しかし、特許文献１に記載のコンテンツ生成システムでは、コンテンツ素材情報をレイアウト上に配置する際、予め定められたルールに従って編集処理を行う必要があるため、ユーザーには動画編集の自由度が低いという問題がある。

特開２００６－４８４６５号公報

　本発明は前記問題点に鑑みなされたものであり、その目的は、動画編集の作業性及び利便性を大幅に向上させ、自由度の高い動画編集が可能な動画編集システムを提供することにある。

　本発明の動画編集システムは、前記の課題を解決するために、管理者端末と、前記管理者端末にネットワークを介して接続された動画編集サーバと、を少なくとも備える動画編集システムに於いて、前記動画編集サーバは、動画を再生する動画再生領域と、前記動画の再生時間のタイムラインを表示するタイムライン表示領域とを少なくとも含む第１動画編集画面を、前記管理者端末に表示させる第１編集画面表示部と、前記管理者端末からの要求により、前記タイムライン表示領域内の任意の位置に少なくとも１つの第１テキストオブジェクトを配置し、前記第１テキストオブジェクトに入力された文字列を表すテキストデータを受け付けるテキストオブジェクト配置部と、前記第１テキストオブジェクトに入力された前記テキストデータに基づき、前記タイムライン表示領域内に配置された前記第１テキストオブジェクトの位置に対応する前記動画の再生時刻に、前記文字列を第１テロップとして再生中の前記動画に重畳表示させる第１テロップ表示部と、を備えることを特徴とする。

　前記の構成に於いて、前記第１編集画面表示部は、前記タイムライン表示領域内に於いて、任意の位置にオブジェクトの配置を可能にするオブジェクト配置領域をさらに前記管理者端末に表示させるものであり、前記動画編集サーバは、前記管理者端末からの要求により、前記オブジェクト配置領域の任意の位置に少なくとも１つのオブジェクトを配置するオブジェクト配置部と、前記オブジェクト配置領域内に配置された前記オブジェクトの位置に対応する前記動画の再生時刻に、第２テキストオブジェクトを前記動画に重畳表示させるテキストオブジェクト表示部と、前記管理者端末からの要求により、前記テキストオブジェクト表示部により前記動画に重畳表示された前記第２テキストオブジェクトに、文字列を表すテキストデータの入力を受け付けるテキストオブジェクト編集部と、前記テキストオブジェクト編集部により受け付けられた前記文字列を、前記オブジェクト配置領域内に配置された前記第２テキストオブジェクトの位置に対応する前記動画の再生時刻に、第２テロップとして再生中の前記動画に重畳表示させる第２テロップ表示部と、をさらに備えることが好ましい。

　さらに前記の構成に於いては、前記動画編集サーバに前記ネットワークを介して接続された多言語翻訳サーバをさらに備え、前記テキストオブジェクト配置部及び前記テキストオブジェクト編集部は、前記第１テキストオブジェクト又は前記第２テキストオブジェクトに入力された文字列を表すテキストデータを前記多言語翻訳サーバに送信し、前記多言語翻訳サーバは、前記テキストオブジェクト配置部又は前記テキストオブジェクト編集部から受信した前記テキストデータに基づき、前記文字列とは異なる少なくとも１つ以上の言語に翻訳し、翻訳後の文字列を表すテキストデータを前記動画編集サーバに送信し、前記第１テロップ表示部及び前記第２テロップ表示部は、前記多言語翻訳サーバから受信した前記翻訳後の文字列を表すテキストデータに基づき、前記翻訳後の文字列を第１テロップ又は第２テロップとして、再生中の前記動画にそれぞれ重畳表示させることが好ましい。

　また前記の構成に於いて、前記動画編集サーバは、音声合成用の音情報が格納された記憶部と、前記記憶部に格納されている前記音情報を読み出して、前記第１テキストオブジェクトに入力された前記文字列を表すテキストデータ、又は前記翻訳後の文字列を表すテキストデータに対応した合成音声を生成する音声合成部と、前記音声合成部で合成された音声を、前記第１テロップ表示部による前記第１テロップの重畳表示に同期させて出力する音声出力部と、をさらに備えるようにしてもよい。

　前記の構成に於いて、前記テキストオブジェクト配置部は、前記タイムライン表示領域内の任意の位置に配置された前記第１テキストオブジェクトの領域を拡張又は縮小することにより、前記動画に重畳表示させる前記第１テロップの重畳表示時間を調整することが好ましい。

　前記の構成に於いて、前記オブジェクト配置部は、前記オブジェクト配置領域内の任意の位置に配置された前記オブジェクトの領域を拡張又は縮小することにより、前記動画に重畳表示させる前記第２テロップの重畳表示時間を調整することが好ましい。

　前記の構成に於いて、前記動画編集サーバは、前記記憶部に格納されている素材動画データを呼び出し、前記素材動画データを構成する複数のフレーム画像を時系列に配置して表示する第２動画編集画面を、前記管理者端末に表示させる第２編集画面表示部と、前記第２動画編集画面に於いて、時系列に配置して表示されている前記複数のフレーム画像に対して、１以上のフレーム画像を含む一部区間を範囲指定することにより、範囲指定されなかった区間を削除するカット編集部と、をさらに備えるようにしてもよい。

　また前記の構成に於いて、前記第２編集画面表示部は、複数の前記素材動画データを前記記憶部から呼び出し、前記素材動画データを構成する複数のフレーム画像を時系列にそれぞれ配置して表示するものであり、前記動画編集サーバは、前記第２編集画面表示部が呼び出した複数の前記素材動画データに基づき、１つの画面内で同期させて各々再生させる合成動画を生成する合成動画生成部をさらに備えることが好ましい。

　さらに前記の構成に於いて、前記カット編集部は、前記合成動画に於ける任意の１つの素材動画を構成する複数のフレーム画像に対し、前記範囲指定した区間の長さを変更した場合、他の素材動画を構成する複数のフレーム画像に対しても、前記範囲指定した区間に対応する区間の長さを同期して変更することが好ましい。

　本発明によれば、動画の再生時間のタイムラインを表示するタイムライン表示領域の任意の位置にテキストオブジェクトを配置することで、テキストオブジェクトに入力された文字列を第１テロップとして、再生する動画中に重畳表示させることができる。また、第１テロップを重畳表示させる時刻を、タイムライン表示領域に於いてオブジェクトの配置位置を調整することにより容易に設定することができる。すなわち、本発明によれば、動画編集の作業性及び利便性を大幅に向上させ、自由度の高い動画編集が可能な動画編集システムを提供することができる。

本発明の実施の形態１に係る動画編集システムの構成の一例を示す概念図である。本発明の実施の形態１に係る動画編集サーバのハードウェア構成を表すブロック図である。本発明の実施の形態１に係る管理者端末のハードウェア構成を表すブロック図である。本発明の実施の形態１に係る動画編集サーバの機能構成の一例を示すブロック図である。管理者端末に表示させる第１動画編集画面を表す説明図である。管理者による動画編集処理の流れを示すフローチャートである。動画編集処理に於ける第１テロップ編集処理の流れを示すフローチャートである。動画編集処理に於ける第２テロップ編集処理の流れを示すフローチャートである。第１動画編集画面に於いて、第２テキストオブジェクトの編集の様子を表す説明図である。編集済み動画再生時の第１テロップ表示処理の流れを示すフローチャートである。編集済み動画再生時の第２テロップ表示処理の流れを示すフローチャートである。本発明の実施の形態２に係る動画編集サーバの機能構成の一例を示すブロック図である。管理者端末に表示させる第２動画編集画面を表す説明図である。管理者による合成動画編集処理の流れを示すフローチャートである。カット編集処理の流れを示すフローチャートである。

（実施の形態１）
　［動画編集システム］
　先ず、本発明の実施の形態１に係る動画編集システムについて、以下に説明する。

　＜動画編集システムの全体構成＞
　本実施の形態１の動画編集システムは、図１に示すように、ネットワーク２０を介して、動画編集サーバ１０、管理者が使用する管理者端末３０、ユーザーが使用するユーザー端末４０及び多言語翻訳サーバ５０が相互に通信可能に接続されて構成されている。図１は、本実施の形態１に係る動画編集システムの構成の一例を示す概念図である。

　動画編集サーバ１０は、例えば、ワークステーションやパーソナルコンピュータ、その他のコンピュータ装置に於いて、動画編集プログラムが実行されることで実現される。動画編集サーバ１０は、動画データ及び音声データ等を格納し、管理者端末３０からの要求により、素材となる動画コンテンツにテロップを重畳表示させるなどの動画編集を可能にする。また、動画編集サーバ１０は、ユーザー端末４０からの要求により、編集済み動画コンテンツの再生を可能にする。

　尚、本明細書に於いて、「動画」とは複数の静止画（フレーム画像）の列から構成されるものを意味する。「動画」には、例えば、コンピュータ・システム、ハンドヘルドコンピュータ、携帯電話、テレビ等の表示装置上に表示される動画が含まれる。コンピュータ等の表示装置上に表示される動画は例えば、仮想３次元空間の動画やネットワークを介して配信される動画を含む。動画の例としては、例えば、企業や家庭等で撮影された映像の他、テレビの映像等を含み得る。「動画データ」とは、前記動画のデータを意味する。動画データは、例えば、デジタル・データの形態で動画編集サーバ１０に記録され得る。また、「テロップ」とは、動画（映像）コンテンツに重畳して表示される文字列（数字、記号及び符号等を含む。）を意味する。また本発明に於ける「テロップ」は、キャプション、サブタイトル、ティッカー、アラート又はスーパーインポーズ等と換言することもできる。

　動画編集サーバ１０のハードウェア構成は、具体的には例えば、次の通りである。すなわち、動画編集サーバ１０は、図２に示すように、ＣＰＵ（Central Processing Unit）１１、ＲＯＭ（Read Only Memory）１２、ＲＡＭ（Random Access Memory）１３、通信制御インターフェース１４、記憶装置１５及び入力操作部１６を少なくとも備える。また、これらの各構成要素は、図２に示す通り、パス１７を介して相互に通信可能に接続される。尚、図２は、動画編集サーバのハードウェア構成を表すブロック図である。

　ＣＰＵ１１は、動画編集サーバ１０の全体を制御するために各種演算処理等を行う。より具体的には、ＣＰＵ１１は、ＲＯＭ１２から動画編集プログラムを読み出し、ＲＡＭ１３を作業領域に用いて実行することで、動画編集サーバ１０の各構成要素の動作を制御する。ＲＯＭ１２は、読み出し専用のメモリであって、例えば動画編集サーバ１０の起動時にＣＰＵ１１に実行させる初期プログラムなどを格納する。ＲＡＭ１３は、書き込み可能な揮発性のメモリであって、実行中のプログラムやデータ等を一時的に格納する。通信制御インターフェース１４は、外部へのデータ送信の制御や外部からのデータ受信の制御を行う。動画編集サーバ１０は、通信制御インターフェース１４を介してネットワーク２０と通信可能に接続される。記憶装置１５は、例えば、磁気ディスク装置等からなり、動画編集サーバ１０の電源がオフにされても保持されるべき各種プログラム・各種データを格納する。入力操作部１６は、具体的には、キーボードやマウス等であって、管理者等による入力操作を受け付ける。

　ネットワーク２０は、インターネットや専用回線、ＷＡＮ（Wide Area Network）、電灯線ネットワーク、無線ネットワーク、公衆回線網、携帯電話網等の種々のものを用いることにより実現される。さらに、ネットワーク２０はＶＰＮ（Virtual Private Network）等の仮想専用ネットワーク技術を用いることで、セキュリティ性を向上させたインターネット通信を確立するようにしてもよい。

　管理者端末３０は、携帯電話、スマートフォン、ＰＨＳ（Personal Handy-phone System）及びＰＤＡ（Personal Digital Assistant）等の携帯端末装置、並びにデスクトップ型又はノート型のパーソナルコンピュータ等の情報処理装置等により実現される。管理者端末３０には、本実施の形態１の動画編集システムを実現するために、インターネットブラウザ等が搭載されていることが好ましい。また管理者端末３０のハードウェア構成は、例えば、図３に示すように、ＣＰＵ３１、ＲＯＭ３２、ＲＡＭ３３、表示部３４、入力部３５及び通信制御インターフェース３６を少なくとも備える。図３は、管理者端末３０のハードウェア構成を表すブロック図である。

　ＣＰＵ３１は、管理者端末３０の全体を制御するために各種演算処理等を行う。より具体的には、ＣＰＵ３１は、ＲＯＭ３２からコンピュータプログラムを読み出し、ＲＡＭ３３を作業領域に用いて実行することで、管理者端末３０の各構成要素の動作を制御する。ＲＯＭ３２は、書き込み可能な不揮発性のメモリであって、管理者端末３０の電源がオフにされても保持されるべき各種プログラム・各種データを格納することができる。ＲＡＭ３３は、書き込み可能な揮発性のメモリであって、実行中のプログラムやデータ等を一時的に格納することができる。表示部３４は、例えば、液晶又は有機ＥＬ（Electro Luminescence）等から構成されるディスプレイ、モニタ、又はタッチパネル等により実現される。通信制御インターフェース３６は、管理者端末３０から外部へのデータ送信の制御や、外部から管理者端末３０へのデータ受信の制御を行う。管理者端末３０は、通信制御インターフェース３６を介してネットワーク２０と通信可能に接続される。

　ユーザー端末４０は、携帯電話、スマートフォン、ＰＨＳ及びＰＤＡ等の携帯端末装置、並びにデスクトップ型又はノート型のパーソナルコンピュータ等の情報処理装置等により実現される。本実施の形態１の動画編集システムに於いて、ユーザー端末４０は少なくとも１台あればよく、複数台でもよい。ユーザー端末４０には、本実施の形態１の動画編集システムを実現するために、インターネットブラウザ等が搭載されていることが好ましい。ユーザー端末４０のハードウェア構成は管理者端末３０と同様、ＣＰＵ、ＲＯＭ、ＲＡＭ、表示部、入力部及び通信制御インターフェースを少なくとも備えたハードウェア構成を採用することができる。従って、ユーザー端末４０のハードウェア構成の詳細については、その説明を省略する。

　多言語翻訳サーバ５０は、動画編集サーバ１０から取得したテロップ用の文字列をテキストデータに対し１以上の他の言語に翻訳する機能を有する。多言語翻訳サーバ５０は、例えば、辞書データベース（図示しない）に翻訳用の辞書情報を予め格納しておいてもよい。多言語翻訳サーバ５０は、動画編集サーバ１０からテロップ用の文字列の翻訳要求を受け付けると共に、当該文字列のテキストデータを取得する。また多言語翻訳サーバ５０は、必要に応じて翻訳用の辞書情報を参照しながら、文字列を他の言語に翻訳した後、翻訳後の文字列を表すテキストデータを動画編集サーバ１０に送信する。

　尚、多言語翻訳サーバ５０としては、既存の多言語翻訳サービスで提供されるものを利用することもできる。既存の多言語翻訳サービスとしては特に限定されず、例えば、Google（登録商標）翻訳等が挙げられる。

　＜動画編集サーバ＞
　次に、動画編集サーバ１０の機能構成について、以下に説明する。
　動画編集サーバ１０は、図４に示すように、機能概念的には制御部１０１、記憶部１０２及びインターフェース部１０３を少なくとも備える。図４は、動画編集サーバ１０の機能構成の一例を示すブロック図である。

　制御部１０１は、ＯＳ（Operating System）等の制御プログラムや、各種の処理手順等を規定したプログラム、及び所要データを格納するための内部メモリを有する。制御部１０１は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部１０１は、図４に示すように、機能概念的には第１編集画面表示部１１１、テキストオブジェクト配置部１１２、第１テロップ表示部１１３、オブジェクト配置部１１４、テキストオブジェクト表示部１１５、テキストオブジェクト編集部１１６、第２テロップ表示部１１７、音声合成部１１８及び音声出力部１１９を少なくとも備える。

　第１編集画面表示部１１１は、管理者端末３０に第１動画編集画面１３０を表示させる。第１動画編集画面１３０には、図５に示すように、動画を再生する動画再生領域１３１と、前記動画の再生時間のタイムラインを表示するタイムライン表示領域１３２とを少なくとも含む。図５は、第１動画編集画面１３０を表す説明図である。

　動画再生領域１３１は、動画編集サーバ１０の記憶部１０２に格納されている動画データに基づき動画を再生表示する。タイムライン表示領域１３２は、動画の再生時間のタイムラインを表示する。またタイムライン表示領域１３２は、第１テキストオブジェクト１３５の配置を可能にするテキストオブジェクト配置領域１３３と、オブジェクト１３６の配置を可能にするオブジェクト配置領域１３４とを有する（これらの詳細については後述する。）。

　タイムライン表示領域１３２は、図５の矢印Ｘで示す方向に向かって再生時間の時間経過を表す。また、タイムライン表示領域１３２には、現在の再生時間位置を示す再生時刻表示線１３７も表示される。再生時刻表示線１３７は、動画が再生されると、再生時間の経過と共に矢印Ｘで示す方向に水平移動する。また、動画の再生が一時停止される場合、再生時刻表示線１３７は一時停止となった時刻で水平移動を停止する。そして再生時刻表示線１３７と、後述の第１テキストオブジェクト及びオブジェクトとの位置関係から、現在どの第１テキストオブジェクトに基づく第１テロップ１３８、又はどのオブジェクトに基づく第２テロップが動画中に重畳表示されているかを容易に確認することができる。例えば、水平移動する再生時刻表示線１３７が第１テキストオブジェクトと重なって表示されている場合には、第１テキストオブジェクト内に入力された文字列が第１テロップ１３８として動画に重畳表示される。

　テキストオブジェクト配置部１１２は、管理者端末３０の要求に応じて、動画の再生中に重畳表示させる第１テロップの再生時刻や終了時刻、及び第１テロップとして表示させる内容を簡便に編集可能にする。

　すなわち、テキストオブジェクト配置部１１２は、管理者端末３０からの要求に応じて、テキストオブジェクト配置領域１３３内の任意の位置に少なくとも１つの第１テキストオブジェクト１３５を配置することを受け付ける。また、テキストオブジェクト配置部１１２は、配置された第１テキストオブジェクト１３５のテキストオブジェクト配置領域１３３内での移動や、第１テキストオブジェクト１３５の領域の拡張及び縮小を、管理者端末３０からの要求に応じて受け付ける。ここで、テキストオブジェクト配置領域１３３内に配置された第１テキストオブジェクト１３５の左端の位置は、当該第１テキストオブジェクト１３５内にテキスト入力された文字列が第１テロップ１３８として再生中の動画内に重畳表示される開始時刻に対応する。また、第１テキストオブジェクト１３５の右端の位置は、動画内での第１テロップ１３８の重畳表示が終了する時刻に対応する。従って、管理者は、第１テキストオブジェクト１３５をテキストオブジェクト配置領域１３３内で移動させ、又は第１テキストオブジェクト１３５の領域を拡張又は縮小させるだけで、再生中の動画に重畳表示させる第１テロップの開始時刻や終了時刻（重畳表示時間）を簡便に調節することができる。尚、第１テキストオブジェクト１３５の移動、拡張及び縮小は、管理者端末３０の入力手段、具体的には、例えば、マウス等により可能である。第１テキストオブジェクト１３５の領域の拡張及び縮小は、例えば、テキストオブジェクト配置領域１３３内に於いて、動画の再生時間のタイムラインを示す矢印Ｘで示す方向、又はその反対方向に行う。

　また、テキストオブジェクト配置部１１２は、管理者端末３０の入力手段により第１テキストオブジェクト１３５内への文字列を表すテキストデータの入力を受け付ける。さらに、テキストオブジェクト配置部１１２は、管理者端末３０の要求に応じて、第１テキストオブジェクト１３５内に入力された文字列の多言語翻訳を受け付けることもできる。この場合、テキストオブジェクト配置部１１２は第１テキストオブジェクト１３５内に入力された文字列を表すテキストデータを多言語翻訳サーバ５０に送信し、多言語翻訳サーバ５０で翻訳された翻訳後の文字列を表すテキストデータを受け付ける。尚、文字列を表すテキストデータとは、文字情報、数字情報、記号情報及びこれらが結合した情報を含む。

　テキストオブジェクト配置部１１２は、テキストオブジェクト配置領域１３３内に第１テキストオブジェクト１３５が配置されると、第１テロップ情報を動画データに対応付けてテロップ情報データベース（詳細については後述する。）に格納させる。第１テロップ情報には、第１テロップ１３８の重畳表示の開始時刻情報及び終了時刻情報の他、第１テキストオブジェクト１３５に入力された文字列を表すテキストデータや翻訳後の文字列を表すテキストデータ、図形情報及び音声情報が含まれる。また第１テロップ情報には、第１テロップ１３８の動画内に於ける表示位置に関する情報を含ませてもよい。

　第１テロップ表示部１１３は、テロップ情報データベースに格納されている第１テロップ情報を読み出し、当該第１テロップ情報に基づき、第１テロップ１３８を再生中の動画の任意の位置に重畳表示させる。第１テロップ１３８として表示される文字列は、第１テロップ情報に含まれる第１テキストオブジェクト１３５に入力された文字列を表すテキストデータ、又は翻訳後の文字列を表すテキストデータに基づき生成される。また、第１テロップ１３８の重畳表示は、第１テロップ情報に含まれる第１テロップ１３８の重畳表示の開始時刻情報及び終了時刻情報に基づき、所定の再生時刻に重畳表示が開始され、かつ終了する。第１テキストオブジェクト１３５が、テキストオブジェクト配置部１１２により、テキストオブジェクト配置領域１３３内に複数配置されている場合は、第１テロップ表示部１１３は、順次、テロップ情報データベースに格納されている第１テロップ情報を読み出し、それぞれの第１テキストオブジェクト１３５に入力されたテキストデータの文字列を第１テロップ１３８として、所定の再生時刻に重畳表示させる。

　オブジェクト配置部１１４は、管理者端末３０からの要求に応じて、オブジェクト配置領域１３４内の任意の位置に少なくとも１つのオブジェクト１３６を配置することを受け付ける。オブジェクト１３６をオブジェクト配置領域１３４内で自由に配置可能にすることで、管理者はオブジェクト１３６の管理を視覚的に行うことができる。その結果、多数のオブジェクト１３６を配置する場合にも管理が煩雑になるのを回避できる上、管理者がオブジェクト１３６の編集を行う場合にも、編集対象となるオブジェクト１３６を容易に見つけ出すことができるなど、操作性及び作業効率の向上が図れる。また、オブジェクト配置部１１４は、配置されたオブジェクト１３６のオブジェクト配置領域１３４内での移動や、オブジェクト１３６の領域の拡張及び縮小を、管理者端末３０からの要求に応じて受け付ける。ここで、オブジェクト配置領域１３４内に配置されたオブジェクト１３６の左端の位置は、第２テロップ（又は、第２テキストオブジェクト１３９）を再生中の動画内に重畳表示させる開始時刻に対応する。また、オブジェクト１３６の右端の位置は、第２テロップ（又は、第２テキストオブジェクト１３９）を再生中の動画内に重畳表示させるのを終了する時刻に対応する。従って、管理者は、オブジェクト１３６をオブジェクト配置領域１３４内で移動させ、又はオブジェクト１３６の領域を拡張又は縮小させるだけで、再生中の動画に重畳表示させる第２テロップの開始時刻や終了時刻（重畳表示時間）を簡便に調節することができる。尚、オブジェクト１３６の移動、並びにオブジェクト１３６の領域の拡張及び縮小は、管理者端末３０の入力手段、具体的には、例えば、マウス等により可能である。オブジェクト１３６の領域の拡張及び縮小は、例えば、オブジェクト配置領域１３４内に於いて、動画の再生時間のタイムラインを示す矢印Ｘで示す方向、又はその反対方向に行うことができる。またオブジェクト配置部１１４は、複数のオブジェクト１３６を動画の再生時間のタイムラインに対し垂直となる方向に於いて並列配置させることができる。これにより、動画の再生中、同じ再生時刻に同時に２つ以上のテキストオブジェクト１３９を重畳表示させることができる。尚、オブジェクト配置部１１４は、テキストオブジェクト配置部１１２と異なり、管理者端末３０の要求により、文字列を表すテキストデータの入力を受け付けない。

　オブジェクト配置部１１４は、オブジェクト配置領域１３４内に少なくとも１つのオブジェクト１３６が配置されると、第２テキストオブジェクト１３９の重畳表示の開始時刻情報及び終了時刻情報を第２テロップ情報として動画データに対応付けて、テロップ情報データベースに格納させる。第２テキストオブジェクト１３９の重畳表示の開始時刻情報及び終了時刻情報は、第２テロップの重畳表示の開始時刻情報及び終了時刻情報になるものである。

　テキストオブジェクト表示部１１５は、オブジェクト配置部１１４により少なくとも１つのオブジェクト１３６がオブジェクト配置領域１３４内に配置されると、編集中の動画に対し、オブジェクト１３６が配置された位置に対応する再生時刻に第２テキストオブジェクト１３９を重畳表示させる。この第２テキストオブジェクト１３９は、管理者端末３０の入力手段により、文字列を表すテキストデータの入力が可能なオブジェクトである。テキストオブジェクト表示部１１５は、動画編集を伴わない動画再生に於いては、第２テキストオブジェクト１３９を重畳表示しない。尚、第２テキストオブジェクト１３９の重畳表示は、テロップ情報データベースに格納されている第２テロップ情報をテキストオブジェクト表示部１１５が呼び出し、当該第２テロップ情報に含まれる第２テキストオブジェクト１３９の重畳表示の開始時刻情報及び終了時刻情報に基づき実行される。

　テキストオブジェクト編集部１１６は、第２テキストオブジェクト１３９内への文字列を表すテキストデータ（文字情報、数字情報、記号情報及びこれらが結合した情報）の、管理者端末３０の入力手段による入力を受け付ける。さらに、テキストオブジェクト編集部１１６は、管理者端末３０の要求に応じて、第２テキストオブジェクト１３９内に入力された文字列の多言語翻訳を受け付ける。この場合、テキストオブジェクト編集部１１６は第２テキストオブジェクト１３９内に入力された文字列を表すテキストデータを多言語翻訳サーバ５０に送信し、多言語翻訳サーバ５０で翻訳された翻訳後の文字列を表すテキストデータを受け付ける（受信する。）。

　また、テキストオブジェクト編集部１１６は、動画内での第２テキストオブジェクト１３９の表示位置の移動や、第２テキストオブジェクト１３９の領域の拡張及び縮小を、管理者端末３０からの要求に応じて受け付ける。第２テキストオブジェクト１３９を移動させることで、第２テロップを動画内の任意の位置に移動させ、重畳表示させることができる。さらにテキストオブジェクト編集部１１６は、第２テキストオブジェクト１３９の形状や表示させる色、テキスト入力された文字列のフォントや文字サイズ等の変更を、管理者端末３０からの要求に応じて受け付ける。

　テキストオブジェクト編集部１１６は、第２テロップ（第２テキストオブジェクト１３９）の動画内に於ける表示位置に関する情報、第２テキストオブジェクト１３９の形状や表示させる色等に関する情報、第２テキストオブジェクト１３９に入力された文字列を表すテキストデータ、翻訳後の文字列を表すテキストデータ、及び第２テキストオブジェクト１３９に入力された文字列のフォントや文字サイズ等に関する情報等を第２テロップ情報に含めて、テロップ情報データベースに格納させる。

　第２テロップ表示部１１７は、テロップ情報データベースに格納されている第２テロップ情報を読み出し、当該第２テロップ情報に基づき、再生中の動画に第２テロップを重畳表示させる。第２テロップは、第２テロップ情報に含まれる第２テキストオブジェクト１３９の配置位置や領域、形状及び色等に関する情報と、第２テロップ情報に含まれる第２テキストオブジェクト１３９に入力された文字列を表すテキストデータ又は翻訳後の文字列を表すテキストデータ等とに基づき生成される。また、第２テロップの重畳表示は、第２テロップ情報に含まれる第２テキストオブジェクト１３９の重畳表示の開始時刻情報及び終了時刻情報に基づき、所定の再生時刻に重畳表示が開始され、かつ終了する。オブジェクト１３６が、オブジェクト配置部１１４により、オブジェクト配置領域１３４内に複数配置されている場合、第２テロップ表示部１１７は、テロップ情報データベースに格納されている第２テロップ情報を読み出して、順次又は同時刻に複数の第２テロップを重畳表示させる。

　音声合成部１１８は、音声データベース（詳細については後述する。）に格納されている音声合成用の音情報を読み出して、第１テキストオブジェクト１３５に入力された文字列を表すテキストデータ、又は翻訳後の文字列を表すテキストデータに対応した合成音声を生成する。尚、音声合成部１１８には、生成した合成音声のデータを第１テロップ情報に対応付けてテロップ情報データベースに格納させるようにしてもよい。

　音声出力部１１９は、音声合成部１１８で合成された音声を、第１テロップ表示部１１３による第１テロップ１３８の重畳表示に同期させて出力する。音声出力部１１９は、合成音声のデータが第１テロップ情報に対応付けてテロップ情報データベースに格納されている場合には、当該テロップ情報データベースから合成音声のデータを読み出して、第１テロップ１３８の重畳表示の際に出力するようにしてもよい。

　記憶部１０２は、例えば、その内部に複数の記憶領域が定義されており、動画データベース１２１、テロップ情報データベース１２２及び音声データベース１２３を少なくとも備える。この記憶部１０２としては、保存用のデータやプログラムを記憶するためのハードディスク等の記憶媒体を使用することができる。

　動画データベース１２１は、素材動画データを格納する。素材動画データは、動画編集前の素材となる動画データを含む。

　テロップ情報データベース１２２は、動画データベース１２１に格納されている素材動画データに対応付けられた第１テロップ情報及び／又は第２テロップ情報を格納する。

　音声データベース１２３は、音声合成用の音情報を格納する。ここで、「音情報」とは音声を合成するために必要な情報であり、短音、単語、文節単位等に対する合成音を出力するための音素データを含み得る。

　インターフェース部１０３は、ウェブページの生成による入出力を可能にするものであり、当該ウェブページをネットワーク２０上で転送し、ウェブブラウザで管理者端末３０及びユーザー端末４０に表示させる。より詳細には、ＣＧＩ（Common Gateway Interface）スクリプトによって実現される。ＣＧＩとは、クライアントのブラウザから送信される要求に対してＷＷＷサーバ側で対応するプログラム、すなわちＣＧＩスクリプトを起動し、このプログラムで得た結果をクライアント側に返送するインターフェースである。ＣＧＩスクリプトはメモリに格納されている。インターネットに接続された動画編集サーバ１０から管理者端末３０及びユーザー端末４０へのＨＴＭＬ文書の伝送に際しては、プロトコルとしてＨＴＴＰ（Hypertext Transport Protocol）が採用される。これにより、パーソナルコンピュータやスマートフォン等の管理者端末３０に於いて汎用ウェブブラウザ等を用いた動画編集が可能となり、またユーザー端末４０に於いても編集済み動画の再生等が可能となる。

　［動画編集システムの動作］
　次に、本実施の形態１に係る動画編集システムの動作について説明する。
　動画編集システムに於ける動画編集処理等の各種の動作は、動画編集サーバ１０の記憶部１０２が、制御部１０１に於ける第１編集画面表示部１１１等の各構成部の機能を実現すべく備える動画編集プログラムによって実現される。ここで、動画編集プログラムは、以下に説明される各種の動作を行うためのコードから構成されており、各構成部の機能を実装したものとなる。

　＜動画編集処理＞
　先ず、本実施の形態１の動画編集システムを用いた動画編集処理について、図６～図９に基づき説明する。図６は、管理者による動画編集処理の流れを示すフローチャートである。図７は、動画編集処理に於ける第１テロップ編集処理の流れを示すフローチャートである。図８は、動画編集処理に於ける第２テロップ編集処理の流れを示すフローチャートである。図９は、第１動画編集画面に於いて、第２テキストオブジェクトの編集の様子を表す説明図である。

　管理者は、図６に示すように、本実施の形態１の動画編集システムを利用するため、先ず管理者端末３０からネットワーク２０を介して動画編集サーバ１０にアクセスする。動画編集サーバ１０へアクセスすると、動画編集サーバ１０の第１編集画面表示部１１１は、第１動画編集画面１３０を表示するためのＨＴＭＬ文書のデータを、管理者端末３０に送信する。これにより、管理者端末３０のディスプレイ等には、第１動画編集画面１３０が表示される（Ｓ１０１）。

　管理者は、第１動画編集画面１３０に於いて、管理者端末３０に備えられているキーボードやマウス等の入力手段を用いて、動画データベース１２１に格納されている素材動画データの中から、動画編集を行う素材動画を選択し呼び出す。第１編集画面表示部１１１は管理者端末３０からの要求に応じて、動画再生領域１３１に素材動画を表示させる（Ｓ１０２）。

　次に、管理者が第１テロップ編集処理（Ｓ１０３、Ｓ１０４）を行う場合、図７に示すように、テキストオブジェクト配置部１１２は、管理者端末３０からの要求に応じて、テキストオブジェクト配置領域１３３内の任意の位置に少なくとも１つの第１テキストオブジェクト１３５の配置を受け付ける（Ｓ１０３、Ｓ１０４）。具体的には、管理者端末３０に備えられているキーボードやマウス等の入力手段を用いて、テキストオブジェクト配置領域１３３内の任意の位置に少なくとも１つの第１テキストオブジェクト１３５が追加される（Ｓ２０１）。続いて、第１テロップ１３８が再生中の動画に重畳表示させる時刻を調整したい場合には、管理者端末３０の入力手段を用いて第１テキストオブジェクト１３５の配置位置を移動させる。さらに、第１テロップの重畳表示の時間を調整した場合には、管理者端末３０の入力手段を用いて第１テキストオブジェクト１３５の領域を拡張又は縮小させる（Ｓ２０２）。

　続いて、テキストオブジェクト配置部１１２は、管理者端末３０の入力手段により第１テキストオブジェクト１３５内への文字列を表すテキストデータの入力を受け付ける（Ｓ２０３）。入力された文字列の少なくとも一部は第１テキストオブジェクト１３５内に表示され、これにより管理者は配置した第１テキストオブジェクト１３５と第１テロップとの対応付けを容易に判別することができる。また、第１テキストオブジェクト１３５内に入力された文字列は、他の言語に翻訳させることもできる（Ｓ２０４）。この場合、テキストオブジェクト配置部１１２は第１テキストオブジェクト１３５内に入力された文字列を表すテキストデータを多言語翻訳サーバ５０に送信する（Ｓ２０５）。多言語翻訳サーバ５０に於いて他の言語に翻訳され、当該多言語翻訳サーバ５０から翻訳後の文字列を表すテキストデータが送信されると、テキストオブジェクト配置部１１２は第１テキストオブジェクト１３５内に他の言語への翻訳後の文字列を表示する（Ｓ２０６）。尚、第１テキストオブジェクト１３５内への文字列の他の言語への翻訳は動画の再生中でも可能であり、必ずしも再生の停止を要しない。

　さらに管理者端末３０により編集済み動画データの格納が要求されると、テキストオブジェクト配置部１１２は、第１テロップ１３８の重畳表示の開始時刻情報及び終了時刻情報、第１テキストオブジェクト１３５に入力された文字列を表すテキストデータ並びに翻訳後の文字列を表すテキストデータを第１テロップ情報として素材動画データに対応付け、テロップ情報データベース１２２に格納させる（Ｓ２０７）。これにより、第１テロップ編集処理が終了する。

　続いて、第２テロップ編集処理（Ｓ１０５、Ｓ１０６）を行う場合、図８に示すように、オブジェクト配置部１１４は、管理者端末３０からの要求に応じて、オブジェクト配置領域１３４内の任意の位置に少なくとも１つのオブジェクト１３６の配置を受け付ける（Ｓ３０１）。具体的には、管理者端末３０に備えられているキーボードやマウス等の入力手段を用いて、オブジェクト配置領域１３４内の任意の位置に少なくとも１つのオブジェクト１３６が追加される。続いて、第２テロップが再生中の動画に重畳表示させる時刻を調整したい場合には、管理者端末３０の入力手段を用いてオブジェクト１３６の配置位置を移動させる。さらに、第２テロップの重畳表示の時間を調整した場合には、管理者端末３０の入力手段を用いてオブジェクト１３６の領域を拡張又は縮小させる（Ｓ３０２）。

　オブジェクト配置部１１４によりオブジェクト１３６が配置されると、テキストオブジェクト表示部１１５は、編集中の動画に対し、オブジェクト１３６が配置された位置に対応する再生時刻に第２テキストオブジェクト１３９を重畳表示させる（Ｓ３０４）。

　続いて、テキストオブジェクト編集部１１６は、管理者端末３０からの要求に応じて、第２テキストオブジェクト１３９内への文字列を表すテキストデータの入力を受け付ける（Ｓ３０５）。入力された文字列の少なくとも一部は、オブジェクト１３６内にも表示される。そのため、管理者は、配置したオブジェクト１３６と、第２テキストオブジェクト１３９及び第２テロップとの対応付けを容易に判別することができる。また、テキストオブジェクト編集部１１６は、管理者端末３０からの要求に応じて、第２テキストオブジェクト１３９の動画内での表示位置を移動させ、あるいは第２テキストオブジェクト１３９の領域を拡張又は縮小させる。第２テキストオブジェクト１３９を移動させることで、第２テロップを、再生される動画内の任意の位置に重畳表示させることができる。また、第２テキストオブジェクト１３９の領域を拡張又は縮小させることで、第２テロップの表示領域を拡張又は縮小させることができる。

　さらに、テキストオブジェクト編集部１１６は、図９に示すように、管理者端末３０からの要求に応じて、第２テキストオブジェクト１３９の形状や表示させる色、テキスト入力された文字列のフォントや文字サイズ等を変更させることができる。第２テキストオブジェクト１３９の編集は、例えば、テキストオブジェクト編集部１１６がＧＵＩ（Graphical User Interface）機能を備えた編集パレット１４０を第１動画編集画面１３０に表示させることにより行うことができる。編集パレット１４０は、第２テキストオブジェクト１３９の形状や色を変更するためのアイコン（ボタン）、第２テキストオブジェクト１３９内に入力された文字列の書体、色及びサイズを変更するためのアイコン（ボタン）等を備える。

　また、テキストオブジェクト編集部１１６は、管理者端末３０からの要求に応じて、第２テキストオブジェクト１３９内に入力された文字列の他の言語への翻訳も受け付ける（Ｓ３０６）。この場合、テキストオブジェクト編集部１１６は、第２テキストオブジェクト１３９内に入力された文字列を表すテキストデータを多言語翻訳サーバ５０に送信する（Ｓ３０７）。多言語翻訳サーバ５０に於いて他の言語に翻訳され、当該多言語翻訳サーバ５０から翻訳後の文字列を表すテキストデータが送信されると、テキストオブジェクト編集部１１６は、第２テキストオブジェクト１３９内に、他の言語への翻訳後の文字列を表示する（Ｓ３０８）。尚、第２テキストオブジェクト１３９内に入力された文字列の他言語への翻訳は動画の再生中でも可能であり、必ずしも再生の停止を要しない。

　さらに管理者端末３０により編集済み動画データの格納が要求されると、テキストオブジェクト編集部１１６は、第２テロップ情報をテロップ情報データベース１２２に格納させ（Ｓ３０９）、これにより第２テロップ編集処理が終了する。この第２テロップ情報には、第２テロップ（第２テキストオブジェクト１３９）の動画内に於ける表示位置に関する情報、第２テキストオブジェクト１３９の形状や表示させる色等に関する情報、第２テキストオブジェクト１３９に入力された文字列を表すテキストデータ、翻訳後の文字列を表すテキストデータ、及び第２テキストオブジェクト１３９に入力された文字列のフォントや文字サイズ等に関する情報等が含まれる。

　＜テロップ表示処理＞
　次に、編集済み動画を再生する際のテロップ表示処理について説明する。図１０は、編集済み動画再生時の第１テロップ表示処理の流れを示すフローチャートである。図１１は、編集済み動画再生時の第２テロップ表示処理の流れを示すフローチャートである。

　先ず、第１テロップ表示処理について説明する。図１０に示すように、動画データベース１２１に格納されている素材動画データの中から、動画再生を行う動画データを選択して呼び出し、動画再生を行う（Ｓ４０１）。選択された動画データには第１テロップ情報が対応付けられているため、第１テロップ表示部１１３は、テロップ情報データベース１２２に格納されている第１テロップ情報を読み出す（Ｓ４０２）。そして第１テロップ表示部１１３は、第１テロップ情報に含まれる第１テロップの重畳表示の開始時刻情報に基づき、第１テロップ１３８を再生中の動画に重畳表示させる（Ｓ４０３）。また、音声合成部１１８は、音声データベース１２３に格納されている音声合成用の音情報を読み出して、第１テキストオブジェクト１３５に入力された文字列を表すテキストデータ、又は翻訳後の文字列を表すテキストデータに対応した合成音声を生成する。さらに音声出力部１１９が、音声合成部１１８で合成された音声を、第１テロップ１３８の重畳表示に同期させて出力する（Ｓ４０４）。その後、第１テロップ情報に含まれる第１テロップの重畳表示の終了時刻情報に基づき、第１テロップ１３８の重畳表示を終了させる（Ｓ４０５）。これにより、第１テロップの表示処理が終了する。

　次に、第２テロップ表示処理について説明する。先ず、図１１に示すように、第１テロップ表示処理の場合と同様、動画データベース１２１に格納されている素材動画データの中から動画データを選択し動画再生を行う（Ｓ５０１）。選択された動画データには第２テロップ情報が対応付けられているため、第２テロップ表示部１１７は、テロップ情報データベース１２２に格納されている第２テロップ情報を読み出す（Ｓ５０２）。そして第２テロップ表示部１１７は、第２テロップ情報に含まれる第２テロップの重畳表示の開始時刻情報に基づき、第２テロップを再生中の動画に重畳表示させる（Ｓ５０３）。その後、第２テロップ情報に含まれる第２テロップの重畳表示の終了時刻情報に基づき、第２テロップの重畳表示を終了させる（Ｓ５０４）。これにより、第２テロップの表示処理が終了する。

　以上の通り、本発明の動画編集システムによれば、極めて簡便な方法により自由度の高い動画編集が可能であり、特定の専門的知識や技術等を有しなくても、再生中の動画に容易にテロップを重畳表示させることができる。また、テロップの重畳表示の際に合成音声を出力したり、他の言語に翻訳して表示させたりすることも可能である。その結果、本発明の動画編集システムは、例えば、外国人労働者に対する技術指導等のための動画を用いた業務マニュアル等に極めて有用である。

（実施の形態２）
　［動画編集システム］
　次に、本発明の実施の形態２に係る動画編集システムについて、以下に説明する。
　本実施の形態２に係る動画編集システムは、実施の形態１と比較して、テロップ編集前の素材動画に対し、簡便かつ作業性を大幅に向上させたカット編集や合成動画の生成を可能にしている点で異なる。より詳細には以下の通りである。尚、以下の説明においては、実施の形態１に係る動画編集システムと同様の機能を有する構成要素や、当該実施の形態１に係る動画編集方法と同一の処理を行うステップについては、同一の符号を付して詳細な説明を省略する場合がある。

　＜動画編集システムの全体構成＞
　本実施の形態２に係る動画編集システムの全体構成は、実施の形態１の場合と同様、ネットワークを介して、動画編集サーバ、管理者端末、ユーザー端末及び多言語サーバが相互に通信可能に接続されたものである（図１参照）。また、動画編集サーバ、管理者端末、ユーザー端末及び多言語サーバのハードウェア構成も実施の形態１の場合と同様の構成を採用することができる（図２及び図３参照）。従って、これらのハードウェア構成の詳細な説明については省略する。

　＜動画編集サーバ＞
　本実施の形態２に係る動画編集サーバの詳細な構成について、図１２に基づき説明する。図１２は、動画編集サーバ１０’の構成を示すブロック図である。同図に示すように、動画編集サーバ１０’は、機能概念的には制御部１０１’、記憶部１０２及びインターフェース部１０３を少なくとも備える。

　制御部１０１’は、図１２に示すように、第２編集画面表示部１２４、カット編集部１２５及び合成動画生成部１２６を備える点で、実施の形態１に係る制御部１０１と異なる。

　第２編集画面表示部１２４は、管理者端末３０からの要求に応じて、管理者端末３０に第２動画編集画面１５０を表示させる。第２動画編集画面１５０は、図１３に示すように、素材動画表示領域１５１と、フレーム画像表示領域１５２と、合成動画を再生する合成動画再生領域１５３とを少なくとも有する。尚、図１３は、第２動画編集画面１５０を表す説明図である。

　素材動画表示領域１５１は、少なくとも１つの素材動画１５４を表示することができる。素材動画１５４は、記憶部１０２の動画データベース１２１に格納されている素材動画データに基づくものであり、管理者端末３０からの要求に応じて、第２編集画面表示部１２４が呼び出したものである。また素材動画表示領域１５１は、素材動画１５４だけでなく、（静止）画像や編集中の合成動画（詳細については、後述する。）も表示することができる。

　フレーム画像表示領域１５２は、複数のフレーム画像１５５を時系列に配置して表示する。フレーム画像１５５は、素材動画表示領域１５１に表示されている素材動画１５４を構成するものである。素材動画が複数選択され、素材動画表示領域１５１にそれぞれ表示されている場合には、例えば図１３に示すように、第１フレーム画像表示領域１５２ａと第２フレーム画像表示領域１５２ｂのそれぞれに、対応する素材動画を構成する複数のフレーム画像１５５が時系列で表示される。さらに、フレーム画像表示領域１５２は、時系列に配置して表示された複数のフレーム画像１５５上に重畳するようにして、再生位置表示線１５６を表示する。再生位置表示線１５６は、再生中の素材動画に於いて、どの再生時刻にどのフレーム画像１５５が再生表示されるのかを示す。再生位置表示線１５６は、素材動画が再生されると、再生時間の経過と共に矢印Ｙで示す方向に水平移動する。また、素材動画の再生が一時停止される場合、再生位置表示線１５６は一時停止となった時刻で水平移動を停止する。そして、フレーム画像表示領域１５２に於ける再生位置表示線１５６の位置関係から、どのフレーム画像が動画再生されているのかを容易に確認することができる。尚、図１３中に示す矢印Ｙで示す方向は、素材動画の再生時間の時間経過を表す。

　合成動画再生領域１５３は合成動画を表示する領域であり、第１動画再生領域１５３ａと第２動画再生領域１５３ｂとを少なくとも有する。第１動画再生領域１５３ａでは、第１フレーム画像表示領域１５２ａでカット編集された第１素材動画を再生することができる。また、第２動画再生領域１５３ｂでは、第２フレーム画像表示領域１５２ｂでカット編集された第２素材動画を再生することができる。尚、本明細書に於いて「合成動画」とは、１つの画面内で複数の素材動画を同期して再生させる動画を意味する。本実施の形態の合成動画では、第１素材動画と第２素材動画とが同期して再生される場合を例にしている。

　カット編集部１２５は、素材動画データを構成する複数のフレーム画像のうち、動画再生させるフレーム画像を区間（範囲）指定して、カット編集する。具体的には、カット編集部１２５は、管理者端末３０からの要求に応じて、フレーム画像表示領域１５２内の任意の位置に少なくとも１つのオブジェクト１５７を配置させる。これにより、フレーム画像表示領域１５２内に時系列で配置して表示されているフレーム画像１５５上に、オブジェクト１５７を重畳表示させることができる。ここで、オブジェクト１５７は、フレーム画像表示領域１５２に時系列で表示されている複数のフレーム画像のうち、動画再生に必要なフレーム画像だけを区間（範囲）指定するものである。そして、オブジェクト１５７により指定されていない区間については、動画再生されないように除外される。そのため、管理者は、オブジェクト１５７を、時系列で複数配置されているフレーム画像１５５上に重畳表示させるだけで、容易にカット編集を行うことができる。

　またカット編集部１２５は、配置されたオブジェクト１５７のフレーム画像表示領域１５２内での移動や、オブジェクト１５７の領域の拡張及び縮小を、管理者端末３０からの要求に応じて受け付ける。これにより、管理者は、オブジェクト１５７をフレーム画像表示領域１５２内で移動させるだけで、素材動画の再生部分を変更することができる。また、オブジェクト１５７の領域を拡張又は縮小させるだけで、再生時間を適宜調整することができる。尚、オブジェクト１５７の領域の拡張及び縮小は、例えば、フレーム画像表示領域１５２内の水平となる方向（図１３の矢印Ｙで示す方向に平行な方向）に於いて行うことができる。

　さらに、カット編集部１２５は、オブジェクト１５７の領域の拡張及び縮小が、合成動画を構成する任意の１つの素材動画に対して行われるものである場合、同期して再生される他の素材動画に対しても同様に反映させることができる。例えば、第１素材動画を構成するフレーム画像の指定区間を拡張させた場合、第２素材動画に於いても当該指定区間に同期して再生されるフレーム画像の指定区間を、第１素材動画と同様に拡張させることができる。

　またカット編集部１２５は、複数のオブジェクトにより、フレーム画像表示領域１５２に複数の異なる区間を指定することもできる。図１３では、第２フレーム画像表示領域１５２ｂに於いて、オブジェクト１５７ａ～１５７ｃにより、それぞれ３つの異なる区間が指定されている。このような場合、カット編集部１２５は、各指定区間の再生順序を任意に変更して設定することもできる。例えば、オブジェクト１５７ａで指定される区間が再生された後に、オブジェクト１５７ｃで指定される区間が再生され、その後にオブジェクト１５７ｂで指定される区間が再生されるように設定することができる。

　さらにカット編集部１２５は、管理者端末３０からの要求に応じて、カット編集後の素材動画データを動画データベース１２１に格納させることができる。

　合成動画生成部１２６は、管理者端末３０からの要求に応じて、１つの画面内で各々の素材動画が同期して再生可能な合成動画を生成する。素材動画は、動画データベース１２１に格納されていたものを、管理者端末３０からの要求に応じて第２編集画面表示部１２４が呼び出し、素材動画表示領域１５１に表示されていたものである。また、素材動画は、カット編集部１２５によりカット編集されている場合、カット編集後の素材動画である。図１３では、第１フレーム画像表示領域１５２ａでカット編集された第１素材動画と、第２フレーム画像表示領域１５２ｂでカット編集された第２素材動画とが組み合わされ、合成された合成動画が示されている。また合成動画生成部１２６は、管理者端末３０からの要求に応じて、合成動画に関する動画データを動画データベース１２１に格納させることができる。

　［動画編集システムの動作］
　次に、本実施の形態２に係る動画編集システムの動作について説明する。
　動画編集システムに於ける動画編集処理等の各種の動作は、動画編集サーバ１０’の記憶部１０２が、制御部１０１’の第２編集画面表示部１２４等の各構成部の機能を実現すべく備える動画編集プログラムによって実現される。ここで、動画編集プログラムは、以下に説明される各種の動作を行うためのコードから構成されており、各構成部の機能を実装したものとなる。

　＜合成動画生成処理＞
　先ず、本実施の形態２に係る動画編集システムを用いた合成動画編集処理について図１４及び図１５に基づき説明する。尚、以下の説明では、２つの素材動画からなる合成動画を生成する場合を例にして説明する。図１４は、管理者による合成動画編集処理の流れを示すフローチャートである。図１５は、管理者によるカット編集処理の流れを示すフローチャートである。

　管理者は、図１４に示すように、本実施の形態２の動画編集システムを利用するため、先ず管理者端末３０からネットワーク２０を介して動画編集サーバ１０’にアクセスする。動画編集サーバ１０’へアクセスすると、動画編集サーバ１０’の第２編集画面表示部１２４は、第２動画編集画面１５０を表示するためのＨＴＭＬ文書のデータを、管理者端末３０に送信する。これにより、管理者端末３０のディスプレイ等には、第２動画編集画面１５０が表示される（Ｓ６０１）。

　次に、管理者は、第２動画編集画面１５０に於いて、管理者端末３０に備えられているキーボードやマウス等の入力手段を用いて、動画データベース１２１に格納されている素材動画データの中から、合成動画の生成に用いる複数の素材動画データを選択し呼び出す。これにより、第２編集画面表示部１２４は、管理者端末３０からの要求に応じて、素材動画表示領域１５１に、選択された複数の素材動画データに基づく素材動画をそれぞれ表示させる（Ｓ６０２）。

　続いて、管理者がカット編集処理（Ｓ６０３、Ｓ６０４）を行う場合、図１５に示すように、カット編集部１２５は、管理者端末３０からの要求に応じて、カット編集処理の対象となる素材動画の選択を受け付ける（Ｓ７０１）。例えば、合成動画を構成する素材動画として第１素材動画と第２素材動画の２つが選択された場合には、図１３に示すように、第１素材動画を構成するフレーム画像を、第１フレーム画像表示領域１５２ａに時系列で配置して表示させると共に、第２素材動画を構成するフレーム画像を、第２フレーム画像表示領域１５２ｂに時系列で配置して表示させる。

　次に、動画再生させたい区間の指定は、オブジェクト１５７を第１フレーム画像表示領域１５２ａや第２フレーム画像表示領域１５２ｂに重畳表示させることにより行う。すなわち、図１３中に示す「カット追加」のアイコン１５８が選択されると、カット編集部１２５は管理者端末３０からのオブジェクト１５７の重畳表示の要求を受け付ける。さらにカット編集部１２５は、オブジェクト１５７を、第１フレーム画像表示領域１５２ａ及び第２フレーム画像表示領域１５２ｂに表示されている複数のフレーム画像１５５上に重畳表示させる（Ｓ７０２）。

　動画再生させたい区間（指定された区間）の移動は、管理者端末３０からの要求に応じて、重畳表示させたオブジェクト１５７を、第１フレーム画像表示領域１５２ａや第２フレーム画像表示領域１５２ｂ内で、水平となる方向に適宜移動させることにより可能である。また、動画再生させたい区間の拡張や縮小は、管理者端末３０からの要求に応じて、オブジェクト１５７の領域を拡張又は縮小させることにより可能である（Ｓ７０３）。これにより、素材動画で再生させたい区間だけを抽出するカット編集が行われる。

　また、同じ再生時刻に同期して再生させたい場合には、第１フレーム画像表示領域１５２ａでオブジェクトにより指定された区間と、第２フレーム画像表示領域１５２ｂでオブジェクトにより指定された区間とを対応付けることにより可能である。これにより、第１フレーム画像表示領域１５２ａで指定された区間を拡張又は縮小させた場合には、第２フレーム画像表示領域１５２ｂで指定されている区間も同期して拡張又は縮小させることができる。

　カット編集の終了後、合成動画を生成する場合には、図１３中に示す「動画生成」のアイコン１６０を選択する。これにより、合成動画生成部１２６は、管理者端末３０からの要求を受け付け、カット編集後の第１素材動画及び第２素材動画が、１つの画面内で、同じ再生時刻に同期して各々再生される合成動画データを生成する（Ｓ６０７）。尚、格納される合成動画データに於いては、第１素材動画と第２素材動画とに於いて、同じ再生時刻に同期して再生されるフレーム画像が対応付けられている。さらに、図１３に示す「保存」のアイコン１５９が選択されると、合成動画生成部１２６は合成動画データの保存を受け付け、動画データベース１２１に当該合成動画データを格納させる。これにより、合成動画編集処理が終了する。

　尚、合成動画編集処理により生成された合成動画に対しては、さらに実施の形態１で説明した動画編集処理やテロップ表示処理を実行させることができる。

１０、１０’…動画編集サーバ、１１…ＣＰＵ、１２…ＲＯＭ、１３…ＲＡＭ、１４…通信制御インターフェース、１５…記憶装置、１６…入力操作部、２０…ネットワーク、３０…管理者端末、３１…ＣＰＵ、３２…ＲＯＭ、３３…ＲＡＭ、３４…表示部、３５…入力部、３６…通信制御インターフェース、４０…ユーザー端末、５０…多言語翻訳サーバ、１０１、１０１’…制御部、１０２…記憶部、１０３…インターフェース部、１１１…第１編集画面表示部、１１２…テキストオブジェクト配置部、１１３…第１テロップ表示部、１１４…オブジェクト配置部、１１５…テキストオブジェクト表示部、１１６…テキストオブジェクト編集部、１１７…第２テロップ表示部、１１８…音声合成部、１１９…音声出力部、１２１…動画データベース、１２２…動画データベース、１２３…音声データベース、１２４…第２編集画面表示部、１２５…カット編集部、１２６…合成動画生成部、１３０…第１動画編集画面、１３１…動画再生領域、１３２…タイムライン表示領域、１３３…テキストオブジェクト配置領域、１３４…オブジェクト配置領域、１３５…第１テキストオブジェクト、１３６…オブジェクト、１３７…再生時刻表示線、１３８…第１テロップ、１３９…第２テキストオブジェクト、１５０…第２動画編集画面、１５１…素材動画表示領域、１５２…フレーム画像表示領域、１５３…合成動画再生領域、１５４…素材動画、１５５…フレーム画像、１５７…オブジェクト

Claims

　管理者端末と、前記管理者端末にネットワークを介して接続された動画編集サーバと、を少なくとも備える動画編集システムに於いて、
　前記動画編集サーバは、
　動画を再生する動画再生領域と、前記動画の再生時間のタイムラインを表示するタイムライン表示領域とを少なくとも含む第１動画編集画面を、前記管理者端末に表示させる第１編集画面表示部と、
　前記管理者端末からの要求により、前記タイムライン表示領域内の任意の位置に少なくとも１つの第１テキストオブジェクトを配置し、前記第１テキストオブジェクトに入力された文字列を表すテキストデータを受け付けるテキストオブジェクト配置部と、
　前記第１テキストオブジェクトに入力された前記テキストデータに基づき、前記タイムライン表示領域内に配置された前記第１テキストオブジェクトの位置に対応する前記動画の再生時刻に、前記文字列を第１テロップとして再生中の前記動画に重畳表示させる第１テロップ表示部と、
　を備える動画編集システム。
　前記第１編集画面表示部は、前記タイムライン表示領域内に於いて、任意の位置にオブジェクトの配置を可能にするオブジェクト配置領域をさらに前記管理者端末に表示させるものであり、
　前記動画編集サーバは、
　前記管理者端末からの要求により、前記オブジェクト配置領域の任意の位置に少なくとも１つのオブジェクトを配置するオブジェクト配置部と、
　前記オブジェクト配置領域内に配置された前記オブジェクトの位置に対応する前記動画の再生時刻に、第２テキストオブジェクトを前記動画に重畳表示させるテキストオブジェクト表示部と、
　前記管理者端末からの要求により、前記テキストオブジェクト表示部により前記動画に重畳表示された前記第２テキストオブジェクトに、文字列を表すテキストデータの入力を受け付けるテキストオブジェクト編集部と、
　前記テキストオブジェクト編集部により受け付けられた前記文字列を、前記オブジェクト配置領域内に配置された前記第２テキストオブジェクトの位置に対応する前記動画の再生時刻に、第２テロップとして再生中の前記動画に重畳表示させる第２テロップ表示部と、
　をさらに備える請求項１に記載の動画編集システム。
　前記動画編集サーバに前記ネットワークを介して接続された多言語翻訳サーバをさらに備え、
　前記テキストオブジェクト配置部及び前記テキストオブジェクト編集部は、前記第１テキストオブジェクト又は前記第２テキストオブジェクトに入力された文字列を表すテキストデータを前記多言語翻訳サーバに送信し、
　前記多言語翻訳サーバは、前記テキストオブジェクト配置部又は前記テキストオブジェクト編集部から受信した前記テキストデータに基づき、前記文字列とは異なる少なくとも１つ以上の言語に翻訳し、翻訳後の文字列を表すテキストデータを前記動画編集サーバに送信し、
　前記第１テロップ表示部及び前記第２テロップ表示部は、前記多言語翻訳サーバから受信した前記翻訳後の文字列を表すテキストデータに基づき、前記翻訳後の文字列を第１テロップ又は第２テロップとして、再生中の前記動画にそれぞれ重畳表示させる請求項２に記載の動画編集システム。
　前記動画編集サーバは、
　音声合成用の音情報が格納された記憶部と、
　前記記憶部に格納されている前記音情報を読み出して、前記第１テキストオブジェクトに入力された前記文字列を表すテキストデータ、又は前記翻訳後の文字列を表すテキストデータに対応した合成音声を生成する音声合成部と、
　前記音声合成部で合成された音声を、前記第１テロップ表示部による前記第１テロップの重畳表示に同期させて出力する音声出力部と、
　をさらに備える請求項３に記載の動画編集システム。
　前記テキストオブジェクト配置部は、前記タイムライン表示領域内の任意の位置に配置された前記第１テキストオブジェクトの領域を拡張又は縮小することにより、前記動画に重畳表示させる前記第１テロップの重畳表示時間を調整する請求項１～４の何れか１項に記載の動画編集システム。
　前記オブジェクト配置部は、前記オブジェクト配置領域内の任意の位置に配置された前記オブジェクトの領域を拡張又は縮小することにより、前記動画に重畳表示させる前記第２テロップの重畳表示時間を調整する請求項２～４の何れか１項に記載の動画編集システム。
　前記動画編集サーバは、
　前記記憶部に格納されている素材動画データを呼び出し、前記素材動画データを構成する複数のフレーム画像を時系列に配置して表示する第２動画編集画面を、前記管理者端末に表示させる第２編集画面表示部と、
　前記第２動画編集画面に於いて、時系列に配置して表示されている前記複数のフレーム画像に対して、１以上のフレーム画像を含む一部区間を範囲指定することにより、範囲指定されなかった区間を削除するカット編集部と、
　をさらに備える請求項１～６の何れか１項に記載の動画編集システム。
　前記第２編集画面表示部は、複数の前記素材動画データを前記記憶部から呼び出し、前記素材動画データを構成する複数のフレーム画像を時系列にそれぞれ配置して表示するものであり、
　前記動画編集サーバは、
　前記第２編集画面表示部が呼び出した複数の前記素材動画データに基づき、１つの画面内で同期させて各々再生させる合成動画を生成する合成動画生成部をさらに備える請求項７に記載の動画編集システム。
　前記カット編集部は、
　前記合成動画に於ける任意の１つの素材動画を構成する複数のフレーム画像に対し、前記範囲指定した区間の長さを変更した場合、
　他の素材動画を構成する複数のフレーム画像に対しても、前記範囲指定した区間に対応する区間の長さを同期して変更する請求項８に記載の動画編集システム。