JP2019159333A - 文字入力支援システム、文字入力支援プログラム - Google Patents

文字入力支援システム、文字入力支援プログラム Download PDF

Info

Publication number
JP2019159333A
JP2019159333A JP2019091320A JP2019091320A JP2019159333A JP 2019159333 A JP2019159333 A JP 2019159333A JP 2019091320 A JP2019091320 A JP 2019091320A JP 2019091320 A JP2019091320 A JP 2019091320A JP 2019159333 A JP2019159333 A JP 2019159333A
Authority
JP
Japan
Prior art keywords
file name
data
image
character
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019091320A
Other languages
English (en)
Inventor
峰岩 金
Hogan Kin
峰岩 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Gas Co Ltd
Original Assignee
Tokyo Gas Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Gas Co Ltd filed Critical Tokyo Gas Co Ltd
Priority to JP2019091320A priority Critical patent/JP2019159333A/ja
Publication of JP2019159333A publication Critical patent/JP2019159333A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】静止画、動画を問わず、撮像現場での状況を発話することで、リアルタイムに発話音声の内容を撮像画像のファイル名や画像に関するコメントとして登録する。【解決手段】記録データに特殊ファイル名を付与する、コメントは付与しない、かつ、編集しない、という基本的な処理の流れに特化して要約すると、まず、撮像者は、通信端末装置12を持って、現場で撮像する(動画、静止画は問わない)。次に、通信端末のモニタ機能で、プレビュー表示する(動画の場合は収録の一部の動画又は間引きしたコマ送りの静止画)。次に、撮像者からのタイミングで発話の開始指示があると、発話音声−文字変換制御装置16によって発話音声が文字に変換される。最後に、文字変換された文字データをプレビュー表示されている画像データのファイル名領域に特殊ファイル名として保存する。【選択図】図4

Description

本発明は、撮像現場での発話音声データを用いて、ファイル名やコメントを登録するための文字入力支援システム、文字入力支援制御装置、文字入力支援プログラムに関するものである。
例えば、製造業等の広大な工場を管理する企業において、日々の点検業務やトラブル時の対応業務の際、デジタルカメラやスマートホン(スマートフォンという場合もある)を用いて現場の状況をデジタルファイルとして映像記録する必要がある。また、撮像デバイスとして、近年では、スマートグラスに代表されるウェアラブル端末を用いることもある。
ところで、撮像したデジタルファイルの対象物及びファイル名の紐付けは、オフィス等に戻ってからパソコン等でリネームする必要があったが、類似の映像記録から撮像時の状況を思い出して入力するのは労力がかかっている。
なお、参考として、撮像したデジタルファイルを自動で整理する技術として、特許文献1〜特許文献3の技術が提案されている。
特許文献1には、デジタルカメラ等で撮像した画像データの中から、ユーザのプリント傾向・嗜好を反映させたプリント推奨画像を自動的に選択することが記載されている。
また、特許文献2には、動画像からベストショットに対応するフレーム画像を、精度よく、効率的かつ高速に抽出することが記載されている。
さらに、特許文献3には、予め登録された認識用の画像パターンに応じて自動的に撮像画像を振り分けることが記載されている。
特開2006−172097号公報 特開2016−225679号公報 特開2010−56884号公報
しかしながら、特許文献1及び特許文献2のように、大量の映像を自動で整理、または類似映像からベストショットだけを抜き出すなどの画像解析技術は従来から存在し、サービスとしても提供されているが、上記課題(類似の映像記録から撮像時の状況を思い出して入力するときの労力膨大)を解決するものではない。
なお、特許文献3では、予め登録した認識用の画像パターンに応じて、自動的に撮像画像を振り分けているが、初期設定(認識用の画像パターンの登録)が必須であり、撮像現場における様々な状況変化に対応できない。
本発明は、静止画、動画を問わず、撮像現場での状況を発話することで、リアルタイムに発話音声の内容を撮像画像のファイル名や画像に関するコメントとして登録することができる文字入力支援システム、文字入力支援制御装置、文字入力支援プログラムを得ることにある。
本発明に係る文字入力支援システムは、画像を撮像する撮像機能、撮像した画像を表示する表示機能、及び、発話音声を入力する音声入力機能を備え、外部とデータ通信可能な通信端末装置と、音声データを文字データに変換するデータ変換制御装置と、を有する文字入力支援システムであって、前記通信端末装置が、撮像された画像に自動的に付与される通常ファイル名とは別に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付ける受付部と、前記受付部で受け付けた音声データから、前記データ変換制御装置により変換された文字データを取得する取得部と、文字登録可能なコメント領域に、発話による音声データによって文字を付与するコメント付与部とを有し、前記取得部で取得した文字データ、及びコメント付与部で付与された文字データを、撮像された画像に付与する特殊ファイル名とすることを特徴としている。
本発明に係る文字入力支援プログラムは、上記の文字入力支援システムにおける、通信端末装置の受付部、取得部、コメント付与部、として動作させることを特徴としている。
本発明は以下の形態をとり得る。
文字入力支援システムは、画像を撮像する撮像機能、撮像した画像を表示する表示機能、及び、発話音声を入力する音声入力機能を備え、外部とデータ通信可能な通信端末装置と、音声データを文字データに変換するデータ変換制御装置と、を有する文字入力支援システムであって、前記通信端末装置が、前記撮像機能によって撮像した画像を、前記表示機能によってプレビュー表示するプレビュー表示手段と、撮像された画像に自動的に付与される通常ファイル名とは別に、特殊ファイル名を付与するか否かを、対話形式で問い合わせる問い合わせ手段と、問い合わせ手段の問い合わせにより、前記特殊ファイル名を付与する要求があった場合に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付ける受付手段と、前記受付手段で受け付けた音声データから、前記データ変換制御装置により変換された文字データを取得する取得手段とを有し、前記取得手段で取得した文字データを、撮像された画像に付与する特殊ファイル名とすることを特徴としている。
撮像機能、表示機能、及び、音声入力機能を備えた通信端末装置と、データ変換制御装置と、で文字入力支援システムを構成する。
通信端末装置では、プレビュー表示手段が、通信端末の撮像機能によって撮像した画像を、表示機能にプレビュー表示する。
問い合わせ手段では、撮像された画像に自動的に付与される通常ファイル名とは別に、特殊ファイル名を付与するか否かを、対話形式で問い合わせる。
受付手段では、問い合わせ手段の問い合わせにより、前記特殊ファイル名を付与する要求があった場合に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付ける。
取得手段では、受付手段で受け付けた発話による音声データから、変換制御装置のデータ変換機能により変換された文字データを取得する。
取得した文字データは、撮像された画像の画像データを格納する場合の特殊ファイル名とされる。
すなわち、撮像現場において、撮像した状況を見ながら当該撮像画像を容易に特定し得る特殊ファイル名を付与することができるため、撮像現場とは異なる場所(例えば、ファイル管理施設)でのファイル整理を実行する場合の仕分け等の作業が容易となる。
また、発話による音声データを文字データに変換して特殊ファイル名を付与することができるため、撮像者の労力を増大させることがない。
前記通常ファイル名又は前記特殊ファイル名が付与された画像を含む記録データファイルを受け付けて、格納するファイルサーバーをさらに有している。
文字入力支援システムとして、例えば、ネットワークに接続された記録データ管理制御装置の一部であるファイルサーバーを備えることで、当該記録データ管理制御装置により、記録データファイルの格納、読み出し、及び編集等、一括管理することができる。
前記通常ファイル名又は前記特殊ファイル名が付与された画像を含む記録データファイルには、文字登録可能なコメント領域が付与されており、当該コメント領域に、発話による音声データによって文字を付与するコメント付与手段をさらに有している。
発話による音声データにより、記録データファイルに設けられたコメント領域に文字データを登録することができる。
文字入力支援制御装置は、画像を撮像する撮像機能、撮像した画像を表示する表示機能、発話音声を入力する音声入力機能、及び、音声データを文字データに変換するデータ変換機能を有する記録データファイル名入力支援制御装置であって、前記撮像機能によって撮像した画像を、前記表示機能によってプレビュー表示するプレビュー表示手段と、撮像された画像に自動的に付与される通常ファイル名とは別に、特殊ファイル名を付与するか否かを、対話形式で問い合わせる問い合わせ手段と、問い合わせ手段の問い合わせにより、前記特殊ファイル名を付与する要求があった場合に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付ける受付手段と、前記受付手段で受け付けた音声データから、前記データ変換機能により変換された文字データを取得する取得手段とを有し、前記取得手段で取得した文字データを、撮像された画像の画像データを格納する記録データファイルの特殊ファイル名とすることを特徴としている。
文字入力支援制御装置は、撮像機能、表示機能、音声入力機能、及び、データ変換機能を備えている。
文字入力支援制御装置では、プレビュー表示手段が、通信端末の撮像機能によって撮像した画像を、表示機能にプレビュー表示する。
問い合わせ手段では、撮像された画像に自動的に付与される通常ファイル名とは別に、特殊ファイル名を付与するか否かを、対話形式で問い合わせる。
受付手段では、問い合わせ手段の問い合わせにより、特殊ファイル名を付与する要求があった場合に、プレビュー表示されている画像に付与する特殊ファイル名として、発話による入力を受け付ける。
取得手段では、受付手段で受け付けた発話による音声データから、変換制御装置のデータ変換機能により変換された文字データを取得する。
取得した文字データは、撮像された画像の画像データを格納する場合の特殊ファイル名とされる。
すなわち、撮像現場において、撮像した状況を見ながら当該撮像画像を容易に特定し得る特殊ファイル名を付与することができるため、撮像現場とは異なる場所(例えば、ファイル管理施設)でのファイル整理を実行する場合の仕分け等の作業が容易となる。
また、発話による音声データを文字データに変換して特殊ファイル名を付与することができるため、撮像者の労力を増大させることがない。
前記通常ファイル名又は前記特殊ファイル名が付与された画像を含む記録データファイルを格納するファイルサーバー機能をさらに有している。
記録データファイル名入力支援制御装置がファイルサーバー機能を備えることで、当該記録データファイル名入力支援制御装置により、記録データファイルの格納、読み出し、及び編集等、一括管理することができる。
前記通常ファイル名又は前記特殊ファイル名が付与された画像を含む記録データファイルには、文字登録可能なコメント領域が付与されており、当該コメント領域に、発話による音声データによって文字を付与するコメント付与手段をさらに有している。
発話による音声データにより、記録データファイルに設けられたコメント領域に文字データを登録することができる。
文字入力支援プログラムは、画像を撮像する撮像機能、撮像した画像を表示する表示機能、及び、発話音声を入力する音声入力機能を備えたコンピュータに、前記撮像機能によって撮像した画像を、前記表示機能によってプレビュー表示し、撮像された画像に自動的に付与される通常ファイル名とは別に、特殊ファイル名を付与するか否かを、対話形式で問い合わせすると共に、問い合わせにより、前記特殊ファイル名を付与する要求があった場合に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付け、受け付けた音声データを文字データに変換し、変換した文字データを、撮像された画像の画像データを格納する記録データファイルの特殊ファイル名とする、ことを実行させることを特徴としている。
発話による音声データにより、通常ファイル名とは別に、特殊ファイル名を付与することができる。
文字入力支援プログラムは、画像を撮像する撮像機能、撮像した画像を表示する表示機能、及び、発話音声を入力する音声入力機能を備えたコンピュータに、前記撮像機能によって撮像した画像を、前記表示機能によってプレビュー表示し、撮像された画像に設定されたコメント領域にコメントを付与するか否かを、対話形式で問い合わせすると共に、問い合わせにより、前記コメントを付与する要求があった場合に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付け、受け付けた音声データを文字列に変換し、前記コメント領域に、文字列を付与する、
ことを実行させることを特徴としている。
発話による音声データにより、通常ファイル名とは別に、特殊ファイル名を付与することができる。
本発明では、従来技術に対し、撮像現場で特殊ファイル名等を付与することができ、かつ、発話による音声データを文字データに変換して特殊ファイル名等とすることができる。
本発明によれば、静止画、動画を問わず、撮像現場での状況を発話することで、リアルタイムに発話音声の内容を撮像画像のファイル名や画像に関するコメントとして登録することができる。
本実施の形態に係る記録データファイル名入力支援システムが構築されたネットワーク図である。 本実施の形態に係る通信端末装置のハード構成を示すブロック図である。 本実施の形態に適用可能な通信端末装置の例であり、(A)がスマートフォンの斜視図、(B)がデジタルカメラの斜視図、(C)がヘッドセット型ウェアラブルカメラの斜視図、(D)がスマートグラス型ウェアラブルカメラの斜視図である。 本実施の形態に係る記録データファイル名入力支援プログラムを実行するときの機能ブロック図である。 本実施の形態に係る記録データファイル名入力支援プログラムを実行するときのフローチャートである。 特殊ファイル名を付与するときのサブルーチンを示すフローチャートである。 記録データの格納状態とファイル名の付与の関係を示す概念図である。 変形例に係る記録データファイル名入力支援プログラムを実行するときの機能ブロック図であり、通信端末装置が文字変換機能を備えた場合を示す。
図1には、本実施の形態に係る記録データファイル用文字入力支援システム10の概略構成図が示されている。
記録データファイル用文字入力支援システム10は、通信端末装置12と、記録データ管理制御装置14と、発話音声−文字変換制御装置16とで構成され、ネットワーク18を介して、相互に通信可能となっている。
(通信端末装置12)
図2に示される如く、通信端末装置12は、マイクロコンピュータ20を備えている。マイクロコンピュータ20は、CPU20A、RAM20B、ROM20C、入出力ポート20D、及びこれらを接続するデータバスやコントロールバス等で構成されたバス20Eによって構成されている。
I/O20Dには、入出力デバイス22、ハードディスク24、撮像デバイス26、及びネットワーク18と接続するための通信I/F28が接続されている。
入出力デバイス22は、モニタ及び入力パッドとして機能するタッチパネル部22Aと、スピーカ22Bと、マイクロフォン22Cとを備える。
通信I/F28は、ネットワーク18に接続された無線中継装置30を介してネットワーク18との間で、データを送受信する。より具体的には、撮像デバイス26で撮像した画像データを、ネットワーク18を介して記録データ管理制御装置14(図1参照)へ送信するようになっている。なお、撮像は、動画と静止画の何れであってもよい。
動画の場合は、マイクロフォン22Cで収録した音データ(後述する環境音データ)を含み、静止画の場合は、環境音データは存在しないという違いはある。
以下において、単に、「撮像」とした場合は、動画と静止画とを含むものとする。また、以下において、画像データと音声データとを総称して、「記録データ」という。すなわち、記録データ管理制御装置14は、画像データと音声データとを管理制御する機能を有する。
また、以下において、単に、音声データという場合は、撮像デバイス26による動画の撮像時の周辺環境音データと、通信端末装置12を管理(所持)する管理者が撮像している対象を特定するために発話する発話音声データとを含むものとし、必要に応じて、環境音データと発話音声データとは、区別して説明する。また、静止画の場合、発話音声データは収録可能である。
(通信端末装置12の適用例)
通信端末装置12は、少なくとも、上記基本機能(入出力デバイス機能(特に、マイクロフォン)、撮像デバイス機能、及び通信I/F機能)を備えていればよい。一例として、図3(A)に示すスマートフォン12SPが代表的な通信端末装置12として適用可能である。
すなわち、図3(A)に示される如く、スマートフォン12SPは、通信機能(通信I/F28に相当)を備えており、筐体32の前面がタッチパネル部22Aとされ、タッチパネル部22Aの周囲には、スピーカ22B及びマイクロフォン22Cが設けられている。また、筐体の前面及び背面には、撮像デバイス26が設けられている。
また、その他の通信端末装置12の例としては、図3(B)に示すデジタルカメラ12DC、図3(C)に示すヘッドセット型ウェラブルカメラユニット12HSが適用可能である。
なお、ヘッドセット型ウェラブルカメラユニット12HSに限らず、図3(D)に示される如く、入出力デバイス22及び撮像デバイス26を含む一部又は全部の機能が眼鏡型の装着部に組み込まれたスマートグラス型ウェラブルカメラユニット12SGであってもよい。
(記録データ管理制御装置14)
図1に示される如く、記録データ管理制御装置14は、マイクロコンピュータとしての機能を備えており(詳細省略)、ハード構成としては、制御装置本体14A、モニタ14B、キーボード14C、及びマウス14Dを有する。制御装置本体14Aは、図示は省略するが、CPU、RAM、ROM、I/O、及びバスを備えている。
また。記録データ管理制御装置14は、記録データファイルサーバ14Eを備えており、記録データファイルサーバ14Eには、制御装置本体14Aの制御に基づき、通信端末装置12から受信した記録データがファイル化されて格納されるようになっている。
このとき、ファイル名は、規則性を持つ番号や日付等が、自動的に付与され、設定されるのが一般的である(例えば、「DVC01012020-001」等)。
ここで、ファイル名が設定され、記録データファイルサーバ14Eに格納された複数のファイルは、記録データ管理制御装置14の制御装置本体14Aに一時的に読み出され、ファイル内の記録データの編集等が実行される。
このとき、複数のファイルの中から、必要なファイルを選択するには、ファイル名が重要となる。このため、記録データが比較的に容易に特定し得る特殊ファイル名を、自動的に付与されたファイル名に代えて、或いは追加して付与(以下、ファイル名の変更という)する場合がある。
特殊ファイル名への変更は、比較例として、撮像拠点ではなく、記録データ管理制御装置14の設置拠点(オフィス等)において、記録データファイルサーバ14Eに格納された状態で,記録データ管理制御装置14の制御装置本体14Aに読み出して実行されていた。
しかしながら、比較例では、類似の記録データから撮像時の状況を思い出して、変更するべき特殊ファイル名を入力するのは労力がかかっている。
そこで、本実施の形態では、通信端末装置12による撮像が実行される撮像拠点において、撮像が動画の場合は、撮像中又は撮像後のプレビュー表示中に、撮像者34(図1参照)が発話した音声(発話音声データ)を文字情報に変換し、記録データの特殊ファイル名とした。
また、撮像が静止画の場合は、静止画の撮像後に当該静止画を一定時間プレビュー表示させている間に、撮像者34(図1参照)が発話した音声(発話音声データ)を文字情報に変換し、記録データの特殊ファイル名とした。
なお、特殊ファイル名と共に、或いは特殊ファイル名に代えて、記録データに付加されるコメント領域のコメント内容とするようにしてもよい。例えば、自動的に付与されるファイル名を維持したい場合は、記録データを特定し得る情報をコメント領域のコメント内容として保存すれば、コメント領域のコメント内容が、特殊ファイル名と同等の機能を有する。
本実施の形態では、この発話音声データから文字情報への変換は、通信端末装置12とネットワーク18を介して接続されている発話音声−文字変換制御装置16により、通信端末装置12の撮像デバイス26(図2参照)による撮像と同期して実行される。
図4は、本実施の形態に係る通信端末装置12で実行される、撮像時の特殊ファイル名及び/又はコメント付与のための記録データファイル名入力支援制御を機能別に示した機能ブロック図である。なお、図2における各ブロックは、通信端末装置12のハード構成を限定するものではなく、一部又は全部の機能が、マイクロコンピュータ20(図2参照)に予めインストールされたソフトウェア(アプリケーションプログラム)の動作として実行させるようにしてもよい。
図2に示される如く、撮像デバイス26は、撮像制御部50に接続されている。撮像制御部50は、入出力デバイス22からの撮像開始指示及び撮像終了指示を受けて、撮像デバイス26及び画像取込部52を制御する。
撮像デバイス26で撮像された画像データは、画像取込部52に取り込まれる。
画像取込部52には、撮像制御部50を介して、撮像時に入出力デバイス22のマイクロフォンで同期して収録した撮像時の環境音データが入力される。
画像取込部52は、一時格納部54に接続されている。画像取込部52では、画像データと環境音データとが結合されて記録データファイルが生成される共に、当該記録データファイルには自動的に通常ファイル名が付与されて、一時格納部54に一時的に格納される。
一方、画像取込部52は、プレビュー制御部56に接続されている。画像取込部52は、撮像デバイス26から取り込んだ画像データをプレビュー制御部56へ送出する。
プレビュー制御部56は、入出力デバイス22及び特殊ファイル名要否判定部58に接続されている。
プレビュー制御部56は、入出力デバイス22との間で、情報の送受信を実行する。
すなわち、プレビュー制御部56は、モニタに撮像中の画像を表示する(プレビュー表示)と共に、通常ファイル名と、特殊ファイル名を付与するか否かの問い合わせのためのメッセージを表示する。
また、プレビュー制御部56は、入出力デバイス22の機能であるタッチパネル部22A(図2参照)の入力パッドの操作に基づく、問い合わせの回答を受け付け、受け付けた回答を、特殊ファイル名要否判定部58へ送出する。
特殊ファイル名要否判定部58は、特殊ファイル名管理制御部60及び記録データ取込部62に接続されている。
特殊ファイル名管理制御部60は、入出力デバイス22に接続されている。
特殊ファイル名管理制御部60では、特殊ファイル名要否判定部58から、特殊ファイルが必要である旨の判定結果(必要判定)を受けると、入出力デバイス22の機能であるタッチパネル部22A(図2参照)のモニタに対して、発話開始指示を送信すると共に、当該発話開始指示後は、入出力デバイス22の機能であるマイクロフォン22Cで収録した発話音声データを取り込む体制をとる。
この場合、予め定めた命令語(「はじめ」「おわり」等)によって、発話開始時期と発話終了時期を認識することは、周知の技術が適用可能である。
特殊ファイル名管理制御部60に取り込んだ、発話音声データは、通信I/F28及びネットワーク18を介して発話音声−文字変換制御装置16へ通知することで、文字データに変換された状態で返信される。
特殊ファイル名管理制御部60では、返信された文字データを入出力デバイス22へ送出することで、文字データの編集が可能である。編集するか否かは、撮像者に問い合わせればよい。
なお、編集の要否は、撮像者に問い合わせることなく、例えば、AI機能を搭載し、画像データとの照合で、過去の撮像者の要求(適正な特殊ファイル名)を適宜学習し、変換した文字データを取捨選択し、自動的に編集するようにしてもよい。
また、特殊ファイル名管理制御部60は、特殊ファイル名(文字情報)の生成と同様に、記録データに付与されるコメント領域へのコメント情報に関しても、発話音声データから文字情報を生成する。
特殊ファイル名管理制御部60は、文字データの編集が終了すると、特殊ファイル名・コメント付与部64に文字情報を送出すると共に、記録データ取込部62に対して、送信指示を出力する。
記録データ取込部62では、前記特殊ファイル名要否判定部58から、特殊ファイル不要(否)情報が通知されると、一時格納部54から記録データを取り込み、記録データと通常ファイル名を記録データ送信部66へ送出する。
一方、記録データ取込部62では、前記特殊ファイル名要否判定部58から、特殊ファイル必要(要)情報が通知されると、特殊ファイル名管理制御部60からの送信指示を待って、一時格納部54から記録データを取り込み、記録データと通常ファイル名を特殊ファイル名・コメント付与部64へ送出する。
特殊ファイル名・コメント付与部64では、記録データに特殊ファイル名(+コメント)を付加して、記録データ送信部66へ送出する。
記録データ送信部66は、記録データを通信I/F28及びネットワーク18を介して、記録データ管理制御装置14へ送出する。記録データ管理制御装置14では、受信した記録データを記録データ管理制御装置14の記録データファイルサーバ14Eへ格納する。
以下に、本実施の形態の作用を、図5及び図6のフローチャートに従い説明する。
ステップ100では、撮像が終了したか否かを判断し、撮像が終了するまで(否定判定)は、ステップ100で待機し、肯定判定されると、ステップ102へ移行して、プレビュー表示する。
プレビュー表示は、必要に応じて、静止画の場合は低解像度に変換し、動画の場合は間引きした動画又は静止画を繰り返し再生して、処理速度を高めるようにしてもよい。
次のステップ104では、プレビュー表示された画像に自動付与される通常ファイル名を表示して、ステップ106へ移行する。
ステップ106では、特殊ファイル名の要否に関するメッセージを報知する。報知の手段としては、通信端末装置12のタッチパネル部22Aに表示する(視覚を通じた報知)、並びに、スピーカ22Bを適用して音声で出力する(聴覚を通じた報知)、の少なくとも一方の報知手段を用いる。
視覚を通じた報知例としては、タッチパネル部22Aに、前記プレビュー表示及び通常ファイル名と共に、「特殊ファイル名を付与しますか?」と表示する。聴覚を通じた報知例としては、この表示文字を音声として出力すればよい。
次のステップ108では、報知したメッセージに対して、回答があったか否かを判断し、否定判定された場合は、ステップ110へ移行する。ステップ110では、所定時間経過したか否かを判断し、否定判定された場合は、ステップ108へ戻る。また、ステップ110で肯定判定、すなわち、報知メッセージが実行されてから所定時間経過しても回答がない場合は、特殊ファイル名を付与する必要がないと判断し、ステップ112へ移行して、記録データを通常ファイル名で保存処理し、ステップ114へ移行する。ステップ114では、コメント領域に関する処理が実行され(後述、図6のフローチャート参照)、このルーチンは終了する。
また、ステップ108で、肯定判定、すなわち、報知メッセージに対して回答があると、ステップ116へ移行する。ステップ116では、回答内容として、特殊ファイル名を付与するか付与しないかを判断し、回答内容が付与しないと判定された場合は、ステップ112へ移行して、記録データを通常ファイル名で保存処理し、ステップ114へ移行する。ステップ114では、コメント領域に関する処理が実行され(後述、図6のフローチャート参照)、このルーチンは終了する。
一方、ステップ116で、回答内容が付与すると判定された場合は、ステップ118へ移行して、発話音声の取得処理及び文字変換処理を実行する。
具体的には、予め定め命令語等によって、発話開始を指示し、次いで、撮像者は、プレビュー表示を見ながら、特殊ファイル名となる内容を発話する。
この発話音声データは、発話音声−文字変換制御装置16へ送出され、文字データに変換されて、返信される。
発話音声データから文字データへの変換は、音声認識による単純文字変換や、予め定めた文字コマンドに基づく文字変換等、特に変換手段は限定されるものではない。
特殊ファイル名に関する発話が終了すると、発話終了を指示することで、ステップ118の発話音声の取得処理及び文字変換処理が終了し、ステップ120へ移行する。
ステップ120では、特殊ファイル名となる文字列を、タッチパネル部22Aのモニタに表示し、ステップ122へ移行する。
ステップ122では、特殊ファイル名の編集の要否に関するメッセージを報知する。報知の手段としては、通信端末装置12のタッチパネル部22Aに表示する(視覚を通じた報知)、並びに、スピーカ22Bを適用して音声で出力する(聴覚を通じた報知)、の少なくとも一方の報知手段を用いる。
視覚を通じた報知例としては、タッチパネル部22Aに、特殊ファイル名と共に、「特殊ファイル名を編集しますか?」と表示する。聴覚を通じた報知例としては、この表示文字を音声として出力すればよい。
次のステップ124では、報知したメッセージに対して、回答があったか否かを判断し、否定判定された場合は、ステップ126へ移行する。ステップ126では、所定時間経過したか否かを判断し、否定判定された場合は、ステップ124へ戻る。また、ステップ126で肯定判定、すなわち、報知メッセージが実行されてから所定時間経過しても回答がない場合は、特殊ファイル名を編集する必要がないと判断し、ステップ128へ移行して、記録データを現在の特殊ファイル名で保存処理し、ステップ130へ移行する。ステップ130では、コメント領域に関する処理が実行され(後述、図5のフローチャート参照)、このルーチンは終了する。
また、ステップ124で、肯定判定、すなわち、報知メッセージに対して回答があると、ステップ132へ移行する。ステップ132では、回答内容として、特殊ファイル名に対して、編集必要か編集不要かを判断し、回答内容が編集不要と判定された場合は、ステップ128へ移行して、記録データを現在の特殊ファイル名で保存処理し、ステップ130へ移行する。ステップ130では、コメント領域に関する処理が実行され(後述、図5のフローチャート参照)、このルーチンは終了する。
一方、ステップ132で、回答内容が編集必要と判定された場合は、ステップ134移行して、編集内容を特定するメッセージを、表示及び/又は音声で報知する。報知メッセージ例としては、「編集要件(書換、挿入、削除)と、編集範囲(一部、全部)を指定して下さい」等といった、編集に関する詳細事項の提示を要求する内容である。
次のステップ136では、特殊ファイル名の編集内容を確定し、ステップ118へ戻り、上記工程を繰り返す。すなわち、編集箇所に対して、発話音声データの入力を実行する。
なお、入出力デバイス22のモニタに特殊ファイル名が表示されているので、タッチパネル部22Aの入力パッドを適用し、表示されている特殊ファイル名を所謂ワードプロセッサ機能で編集するようにしてもよい。特に、編集箇所が一部である場合は、入力パッドを適用した方が、簡便となる場合がある。
図6は、図5のステップ114又はステップ130におけるコメント領域に関する処理の詳細を示すフローチャートである。基本的には、特殊ファイル名を付与する処理の流れと同等であるが、図6に従い、発話音声データの入力から、コメント領域へ文字データを付与するまでの一連の処理を説明する。
ステップ150では、コメント領域への文字付与の要否に関するメッセージを報知する。報知の手段としては、通信端末装置12のタッチパネル部22Aに表示する(視覚を通じた報知)、並びに、スピーカ22Bを適用して音声で出力する(聴覚を通じた報知)、の少なくとも一方の報知手段を用いる。
視覚を通じた報知例としては、タッチパネル部22Aに、前記プレビュー表示及び通常ファイル名と共に、「コメント領域に文字を付与しますか?」と表示する。聴覚を通じた報知例としては、この表示文字を音声として出力すればよい。
次のステップ152では、報知したメッセージに対して、回答があったか否かを判断し、否定判定された場合は、ステップ154へ移行する。ステップ154では、所定時間経過したか否かを判断し、否定判定された場合は、ステップ152へ戻る。また、ステップ154で肯定判定、すなわち、報知メッセージが実行されてから所定時間経過しても回答がない場合は、コメント領域に文字を付与する必要がないと判断し、このルーチンは終了する(図5のステップ114又はステップ130の後にリターンし、終了する)。
また、ステップ152で、肯定判定、すなわち、報知メッセージに対して回答があると、ステップ156へ移行する。ステップ156では、回答内容として、コメント領域に文字を付与するか付与しないかを判断し、回答内容が付与しないと判定された場合は、このルーチンは終了する(図5のステップ114又はステップ130の後にリターンし、終了する)。
一方、ステップ156で、回答内容が付与すると判定された場合は、ステップ158へ移行して、発話音声の取得処理及び文字変換処理を実行する。
具体的には、予め定め命令語等によって、発話開始を指示し、次いで、撮像者は、例えば、プレビュー表示を見ながら、コメント領域に付与する文字列となる内容を発話する。
この発話音声データは、発話音声−文字変換制御装置16へ送出され、文字データに変換されて、返信される。
発話音声データから文字データへの変換は、音声認識による単純文字変換や、予め定めた文字コマンドに基づく文字変換等、特に変換手段は限定されるものではない。
コメント領域に付与する文字列に関する発話が終了すると、発話終了を指示することで、ステップ158の発話音声の取得処理及び文字変換処理が終了し、ステップ160へ移行する。
ステップ160では、コメント領域に付与する文字列を、タッチパネル部22Aのモニタに表示し、ステップ162へ移行する。
ステップ162では、コメント領域に付与する文字列の編集の要否に関するメッセージを報知する。報知の手段としては、通信端末装置12のタッチパネル部22Aに表示する(視覚を通じた報知)、並びに、スピーカ22Bを適用して音声で出力する(聴覚を通じた報知)、の少なくとも一方の報知手段を用いる。
視覚を通じた報知例としては、タッチパネル部22Aに、特殊ファイル名と共に、「コメントを編集しますか?」と表示する。聴覚を通じた報知例としては、この表示文字を音声として出力すればよい。
次のステップ164では、報知したメッセージに対して、回答があったか否かを判断し、否定判定された場合は、ステップ166へ移行する。ステップ166では、所定時間経過したか否かを判断し、否定判定された場合は、ステップ164へ戻る。また、ステップ166で肯定判定、すなわち、報知メッセージが実行されてから所定時間経過しても回答がない場合は、コメント領域に付与する文字列を編集する必要がないと判断し、ステップ168へ移行して、現在のコメント内容の文字列で保存処理し、このルーチンは終了する(図5のステップ114又はステップ130の後にリターンし、終了する)。
また、ステップ164で、肯定判定、すなわち、報知メッセージに対して回答があると、ステップ170へ移行する。ステップ170では、回答内容として、コメント領域に付与する文字列に対して、編集必要か編集不要かを判断し、回答内容が編集不要と判定された場合は、ステップ168へ移行して、記録データを現在のコメント内容の文字列で保存処理し、このルーチンは終了する(図5のステップ114又はステップ130の後にリターンし、終了する)。
一方、ステップ170で、回答内容が編集必要と判定された場合は、ステップ172へ移行して、編集内容を特定するメッセージを、表示及び/又は音声で報知する。報知メッセージ例としては、「編集要件(書換、挿入、削除)と、編集範囲(一部、全部)を指定して下さい」等といった、編集に関する詳細事項の提示を要求する内容である。
次のステップ174では、コメント領域に付与する文字列の編集内容を確定し、ステップ158へ戻り、上記工程を繰り返す。すなわち、編集箇所に対して、発話音声データの入力を実行する。
なお、入出力デバイス22Aのモニタに特殊ファイル名が表示されているので、タッチパネル部22Aの入力パッドを適用し、表示されているコメント領域に付与する文字列を所謂ワードプロセッサ機能で編集するようにしてもよい。特に、編集箇所が一部である場合は、入力パッドを適用した方が、簡便となる場合がある。
ここで、図5及び図6のフローチャートの処理の流れを、記録データに特殊ファイル名を付与する、コメントは付与しない、かつ、編集しない、という基本的な処理の流れに特化して要約すると、以下の手順となる。
(手順1) 撮像者は、通信端末装置12を持って、現場で撮像する(動画、静止画は問わない)。
(手順2) 通信端末のモニタ機能で、プレビュー表示する(動画の場合は収録の一部の動画又は間引きしたコマ送りの静止画)
(手順3) 撮像者からのタイミングで発話を開始指示があると、発話音声−文字変換制御装置16によって発話音声が文字に変換される。
(手順4) 文字変換された文字データをプレビュー表示されている画像データのファイル名領域に特殊ファイル名として保存する。
図7は、上記手順に基づき、記録データの格納状態とファイル名の付与の関係を示す概念図を示したものである。
記録データには、静止画ファイル70と動画ファイル72とが混在しているが、撮像順に通常ファイル名が付与される。図7では、連番として、「0001」、「0002」、・・・「0006」が付与されている。
プレビュー表示されると、例えば、通常ファイル名「0001」において、撮像者が、『LNGタンク設備の外観』と発話すると、音声解析によって文字列に変換され、通常ファイル名「0001」が、特殊ファイル名「0001−LNGタンク外観」に変更される。この場合、編集によって、発話から変換された文字が編集されて(・・・「設備の」が削除)特殊ファイル名となっている。
また、通常ファイル名「0006」において、撮像者が、『サテライト基地のLNG運搬状況』と発話すると、音声解析によって文字列に変換され、通常ファイル名「0006」が、特殊ファイル名「0001−サテライト基地のLNG運搬状況」に変更される。この場合、編集はされず、発話から変換された文字がそのまま特殊ファイル名となっている。
(変形例)
上記実施の形態では、ネットワーク18を介して、通信端末装置12と、発話音声−文字変換制御装置16とを相互に連携させることで、発話音声データから、記録データに特殊ファイル名を付与するようにしたが、通信端末装置12に音声−文字データ変換機能を備えるようにしてもよい。
また、ハードディスク24を、記録データファイルサーバ14Eとして機能させるようにしてもよい。
この変形例に係る通信端末装置12は、単体で、記録データファイル用文字入力支援システム、記録データファイル用文字入力支援制御装置として機能させることができる。
図8は、変形例に係る記録データファイル名入力支援プログラムを実行するときの機能ブロック図である。なお、図4に示す、本実施の形態の記録データファイル名入力支援プログラムを実行するときの機能ブロック図と同一構成部分については、同一の符号を付して、その構成の説明を省略する。
図8に示される如く、変形例に係る通信端末装置12Aの特殊ファイル名管理制御部60は、音声−文字データ変換処理部60Aを備えている。
特殊ファイル名管理制御部60は、特殊ファイル名要否判定部58から、特殊ファイルが必要である旨の判定結果(必要判定)を受けると、入出力デバイス22の機能であるタッチパネル部22A(図2参照)のモニタに対して、発話開始指示を送信すると共に、当該発話開始指示後は、入出力デバイス22の機能であるマイクロフォン22Cで収録した発話音声データを取り込む体制をとる。
この場合、予め定めた命令語(「はじめ」「おわり」等)によって、発話開始時期と発話終了時期を認識することは、周知の技術が適用可能である。
特殊ファイル名管理制御部60に取り込んだ、発話音声データは、発話音声−文字変換処理部60Aで文字データに変換される。
特殊ファイル名管理制御部60では、変換された文字データを入出力デバイス22へ送出することで、文字データの編集が可能である。編集するか否かは、撮像者に問い合わせればよい。
また、特殊ファイル名管理制御部60は、特殊ファイル名(文字情報)の生成と同様に、記録データに付与されるコメント領域へのコメント情報に関しても、発話音声データから文字情報を生成する。
特殊ファイル名管理制御部60は、文字データの編集が終了すると、特殊ファイル名・コメント付与部64に文字情報を送出すると共に、記録データ取込部62に対して、送信指示を出力する。
記録データ取込部62では、前記特殊ファイル名要否判定部58から、特殊ファイル不要(否)情報が通知されると、一時格納部54から記録データを取り込み、記録データと通常ファイル名を記録データ格納処理部68へ送出する。
一方、記録データ取込部62では、前記特殊ファイル名要否判定部58から、特殊ファイル必要(要)情報が通知されると、特殊ファイル名管理制御部60からの送信指示を待って、一時格納部54から記録データを取り込み、記録データと通常ファイル名を特殊ファイル名・コメント付与部64へ送出する。
特殊ファイル名・コメント付与部64では、記録データに特殊ファイル名(+コメント)を付加して、記録データ格納処理部68へ送出する。
記録データ格納処理部68は、ハードディスク24を制御して、記録データを当該ハードディスク24へ格納する。
10 記録データファイル用文字入力支援システム
12 通信端末装置
12SP スマートフォン
12DC デジタルカメラ
12HS ヘッドセット型ウェラブルカメラユニット
12SG スマートグラス型ウェラブルカメラユニット
14 記録データ管理制御装置
14A 制御装置本体
14B モニタ
14C キーボード
14D マウス
14E 記録データファイルサーバ
16 発話音声−文字変換制御装置
18 ネットワーク
20 マイクロコンピュータ
20A CPU
20B RAM
20C ROM
20D 入出力ポート
20E バス
22 入出力デバイス
22A タッチパネル部
22B スピーカ
22C マイクロフォン
24 ハードディスク
26 撮像デバイス
28 通信I/F
30 無線中継装置
32 筐体
34 撮像者
50 撮像制御部
52 画像取込部
54 一時格納部
56 プレビュー制御部
58 特殊ファイル名要否判定部
60 特殊ファイル名管理制御部
62 記録データ取込部
64 特殊ファイル名・コメント付与部
66 記録データ送信部
70 静止画ファイル
72 動画ファイル
本発明は、撮像現場での発話音声データを用いて、ファイル名やコメントを登録するための文字入力支援システム、文字入力支援プログラムに関するものである。
本発明は、静止画、動画を問わず、撮像現場での状況を発話することで、リアルタイムに発話音声の内容を撮像画像のファイル名や画像に関するコメントとして登録することができる文字入力支援システム、文字入力支援プログラムを得ることにある。

Claims (2)

  1. 画像を撮像する撮像機能、撮像した画像を表示する表示機能、及び、発話音声を入力する音声入力機能を備え、外部とデータ通信可能な通信端末装置と、
    音声データを文字データに変換するデータ変換制御装置と、
    を有する文字入力支援システムであって、
    前記通信端末装置が、
    撮像された画像に自動的に付与される通常ファイル名とは別に、発話され、かつ前記音声入力機能によって入力された特殊ファイル名を示す音声データを受け付ける受付部と、
    前記受付部で受け付けた音声データから、前記データ変換制御装置により変換された文字データを取得する取得部と、
    文字登録可能なコメント領域に、発話による音声データによって文字を付与するコメント付与部とを有し、
    前記取得部で取得した文字データ、及びコメント付与部で付与された文字データを、撮像された画像に付与する特殊ファイル名とする文字入力支援システム。
  2. コンピュータを、
    請求項1の文字入力支援システムにおける、通信端末装置の受付部、取得部、コメント付与部、
    として動作させる文字入力支援プログラム。
JP2019091320A 2019-05-14 2019-05-14 文字入力支援システム、文字入力支援プログラム Pending JP2019159333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019091320A JP2019159333A (ja) 2019-05-14 2019-05-14 文字入力支援システム、文字入力支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019091320A JP2019159333A (ja) 2019-05-14 2019-05-14 文字入力支援システム、文字入力支援プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018018414A Division JP2019135609A (ja) 2018-02-05 2018-02-05 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム

Publications (1)

Publication Number Publication Date
JP2019159333A true JP2019159333A (ja) 2019-09-19

Family

ID=67996925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019091320A Pending JP2019159333A (ja) 2019-05-14 2019-05-14 文字入力支援システム、文字入力支援プログラム

Country Status (1)

Country Link
JP (1) JP2019159333A (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09135417A (ja) * 1995-11-10 1997-05-20 Ricoh Co Ltd デジタルスチルビデオカメラ
JP2003219327A (ja) * 2001-09-28 2003-07-31 Canon Inc 画像管理装置、画像管理方法、制御プログラム、情報処理システム、画像データ管理方法、アダプタ、及びサーバ
US20040041921A1 (en) * 2002-08-29 2004-03-04 Texas Instruments Incorporated Voice recognition for file naming in digital camera equipment
JP2005012377A (ja) * 2003-06-17 2005-01-13 Sharp Corp 通信端末、通信端末の制御方法、音声認識処理装置、音声認識処理装置の制御方法、通信端末制御プログラム、通信端末制御プログラムを記録した記録媒体、音声認識処理装置制御プログラム、および、音声認識処理装置制御プログラムを記録した記録媒体
WO2012147274A1 (ja) * 2011-04-26 2012-11-01 Necカシオモバイルコミュニケーションズ株式会社 入力補助装置、入力補助方法及びプログラム
JP2014142934A (ja) * 2013-01-23 2014-08-07 Lg Electronics Inc 電子機器及び電子機器の制御方法
JP2016122344A (ja) * 2014-12-25 2016-07-07 株式会社東芝 システム、サーバ装置及び電子機器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09135417A (ja) * 1995-11-10 1997-05-20 Ricoh Co Ltd デジタルスチルビデオカメラ
JP2003219327A (ja) * 2001-09-28 2003-07-31 Canon Inc 画像管理装置、画像管理方法、制御プログラム、情報処理システム、画像データ管理方法、アダプタ、及びサーバ
US20040041921A1 (en) * 2002-08-29 2004-03-04 Texas Instruments Incorporated Voice recognition for file naming in digital camera equipment
JP2005012377A (ja) * 2003-06-17 2005-01-13 Sharp Corp 通信端末、通信端末の制御方法、音声認識処理装置、音声認識処理装置の制御方法、通信端末制御プログラム、通信端末制御プログラムを記録した記録媒体、音声認識処理装置制御プログラム、および、音声認識処理装置制御プログラムを記録した記録媒体
WO2012147274A1 (ja) * 2011-04-26 2012-11-01 Necカシオモバイルコミュニケーションズ株式会社 入力補助装置、入力補助方法及びプログラム
JP2014142934A (ja) * 2013-01-23 2014-08-07 Lg Electronics Inc 電子機器及び電子機器の制御方法
JP2016122344A (ja) * 2014-12-25 2016-07-07 株式会社東芝 システム、サーバ装置及び電子機器

Similar Documents

Publication Publication Date Title
US7831598B2 (en) Data recording and reproducing apparatus and method of generating metadata
JP2005276187A (ja) 画像識別方法および端末装置
JP7427408B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US11611600B1 (en) Streaming data processing for hybrid online meetings
CN109895092B (zh) 信息处理装置、信息处理方法以及计算机可读介质
JP2019135609A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
JP2019160187A (ja) フォトブック作製システム及びサーバ装置
JP2005175627A (ja) 議事録作成システム
JP2019159333A (ja) 文字入力支援システム、文字入力支援プログラム
JP5246592B2 (ja) 情報処理端末、情報処理方法、及び情報処理プログラム
JP2020009011A (ja) フォトブック作製システム及びサーバ装置
CN116472705A (zh) 一种会议内容显示的方法、会议***及会议设备
JP2006203670A (ja) テンプレート配信装置
JP6642630B2 (ja) 情報処理装置及びプログラム
JP2020119444A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援制御方法、文字入力支援プログラム
JP2007174369A (ja) 状況管理システム
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP2020009012A (ja) フォトブック作製システム及びサーバ装置
JP2019160186A (ja) フォトブック作製システム及びサーバ装置
US20230262200A1 (en) Display system, display method, and non-transitory recording medium
JP7139839B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2019050444A (ja) データ編集のためのインターフェイス装置、キャプチャ装置、画像処理装置、データ編集方法及びデータ編集プログラム
JP2009244432A (ja) 携帯端末の音声認識装置、方法、プログラム
JP2021135810A (ja) 文字入力支援制御装置、文字入力支援システム、文字入力支援プログラム
KR20230008687A (ko) 스마트폰에서 사진 자동 레이블링 및 녹음 장치 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190517

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190517

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190827

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191105