JP2011065467A - 会議中継装置及びコンピュータプログラム - Google Patents
会議中継装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2011065467A JP2011065467A JP2009216003A JP2009216003A JP2011065467A JP 2011065467 A JP2011065467 A JP 2011065467A JP 2009216003 A JP2009216003 A JP 2009216003A JP 2009216003 A JP2009216003 A JP 2009216003A JP 2011065467 A JP2011065467 A JP 2011065467A
- Authority
- JP
- Japan
- Prior art keywords
- conference
- information
- unit
- area
- relay device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】発言者の発言内容に該当する箇所を強調させて会議資料を表示させることが可能な会議中継装置及びコンピュータプログラムを提供する。
【解決手段】音声認識部15は、通信部を介して受信した音声信号に対して音声認識処理を行なってテキスト情報を生成する。キーワード抽出部16は、音声認識部15が生成したテキスト情報に対して言語解析処理を行なって単語に分解する。キーワード抽出部16は、分解した単語と、会議資料情報DB24及び位置特定情報DB27のそれぞれに格納してある情報とを照合し、発言者の発言内容にいずれの情報が含まれるかを判断する。キーワード抽出部16が、発言者の発言内容にいずれかの情報が含まれると判断した場合、位置特定部17が、会議資料中の、この情報に対応する領域を特定し、特定した領域を強調させる処理を行なってディスプレイに表示させる。
【選択図】図7
【解決手段】音声認識部15は、通信部を介して受信した音声信号に対して音声認識処理を行なってテキスト情報を生成する。キーワード抽出部16は、音声認識部15が生成したテキスト情報に対して言語解析処理を行なって単語に分解する。キーワード抽出部16は、分解した単語と、会議資料情報DB24及び位置特定情報DB27のそれぞれに格納してある情報とを照合し、発言者の発言内容にいずれの情報が含まれるかを判断する。キーワード抽出部16が、発言者の発言内容にいずれかの情報が含まれると判断した場合、位置特定部17が、会議資料中の、この情報に対応する領域を特定し、特定した領域を強調させる処理を行なってディスプレイに表示させる。
【選択図】図7
Description
本発明は、通信可能に接続された複数の通信装置間で行なわれる通信会議を中継する会議中継装置、該会議中継装置をコンピュータによって実現するためのコンピュータプログラムに関する。
プレゼンテーションを行なう際に、液晶プロジェクタ等の投影装置、大型液晶ディスプレイ等の表示装置、スピーカ等の音声出力装置等、各種の視聴覚機器をパーソナルコンピュータに接続して構成されるプレゼンテーションツールが用いられる。プレゼンテーションツールを用いることにより、聴講者に視聴覚的に大きな影響を与えることができるので、効率よくプレゼンテーションを行なうことができる。
また、発表者が発する声の大きさ及び抑揚、発表者の顔の表情等によって発表者の感情を認識し、投影装置又は表示装置によって表示される表示画面中の対応する箇所を強調表示させる技術が提案されている(特許文献1参照)。特許文献1に開示された技術では、発表者の声が大きくなった場合又は発表者の声の抑揚が大きくなった場合に、表示画面中の、そのときの発表内容に該当する箇所を強調して表示させる。このように、発表者の感情をプレゼンテーションに用いる表示画面に反映させることにより、より効果的なプレゼンテーションが可能となる。
特許文献1は、発表者が表示画面中の普通名詞又は固有名詞を用いて、表示画面に表示されている内容を説明する状況を想定しており、発表者の声が大きくなった場合又は発表者の声の抑揚が大きくなった場合の発表内容に含まれる普通名詞又は固有名詞を含む箇所を強調して表示させる構成である。しかしながら、実際のプレゼンテーションでは、発表者が表示画面中の普通名詞又は固有名詞を用いて表示画面に表示されている内容を説明することは稀であり、表示画面中の普通名詞又は固有名詞を、指示代名詞等の代名詞を用いて言い換えて説明する場合が少なくない。
発表者の発言内容(発表内容)には、このような代名詞又は同音異義語等、曖昧性を有する要素又は不確定要素が含まれる。また、場合によっては、曖昧性を有する要素又は不確定要素と関連する箇所が、発表者が意図する重要箇所であり、強調して表示すべき箇所であることも多い。従って、特許文献1に開示された技術では、発表者が表示画面中の普通名詞又は固有名詞を用いてプレゼンテーションを行なわない場合には、発表者が意図する重要な内容を効果的に聴講者に訴えることは困難であるという問題がある。また、特許文献1に開示された技術では、発表者だけでなく聴講者も発言するような質疑応答又は議論中において、聴講者の発言内容に対応する箇所を強調して表示させることはできない。従って、聴講者の発言内容が意味するポイントを参加者(発表者及び他の聴講者)に対して効果的に指し示すことはできなかった。
本発明はかかる事情に鑑みてなされたものであり、その目的とするところは、発表者だけでなく聴講者を含める発言者の発言内容に対応する箇所を強調表示することにより、会議の参加者に、発言者が意図する内容を容易に通知することが可能な会議中継装置及びコンピュータプログラムを提供することにある。
本発明に係る会議中継装置は、複数の通信装置と通信可能に接続され、前記複数の通信装置間で行なわれる通信会議を中継する会議中継装置において、会議資料を表示させるための資料情報を前記複数の通信装置に提供する情報提供部と、音声情報を取得する音声取得部と、該音声取得部が取得した音声情報を認識してテキスト情報に変換する音声認識部と、該音声認識部が変換したテキスト情報が示す前記会議資料中の領域を特定する特定部と、該特定部が特定した前記会議資料中の領域を強調させて表示させるための処理を、前記情報提供部が提供する資料情報に行なう強調処理部とを備えることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、前記会議資料中の上下左右方向の領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、複数行に亘って情報が記載されている前記会議資料中のいずれかの行を含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、複数種類のオブジェクトが記載されている前記会議資料中のいずれかのオブジェクトを含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、前記テキスト情報が示す特性を有するオブジェクトを含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、マトリクス状の図表が記載されている前記会議資料中の図表におけるいずれかの要素を含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、複数頁からなる前記会議資料中のいずれかの頁を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、前記テキスト情報が示す特性を有する文字を含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、前記テキスト情報が示す特性を有する領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記音声認識部が変換したテキスト情報に含まれる単語を抽出する抽出部を備え、前記特定部は、前記抽出部が抽出した単語を含む領域を特定するようにしてあることを特徴とする。
本発明に係る会議中継装置は、前記特定部は、前記テキスト情報が示す領域として、1枚の会議資料が有する複数の領域のいずれかを特定するようにしてあることを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、通信可能に接続された複数の通信装置間で行なわれる通信会議を中継させるためのコンピュータプログラムにおいて、コンピュータに、会議資料を表示させるための資料情報を前記複数の通信装置に提供するステップと、音声情報を取得し、取得した音声情報を認識してテキスト情報に変換するステップと、変換したテキスト情報が示す前記会議資料中の領域を特定するステップと、特定した前記会議資料中の領域を強調させて表示させるための処理を、前記通信装置に提供する資料情報に行なうステップとを実行させることを特徴とする。
本発明によれば、会議中継装置は、通信可能に接続された複数の通信装置間で行なわれる通信会議を中継しつつ、会議資料を表示させるための資料情報を各通信装置に提供する。会議中継装置は、音声情報を取得した場合に、取得した音声情報を認識してテキスト情報に変換し、得られたテキスト情報が示す会議資料中の領域を特定する。そして、会議中継装置は、特定された会議資料中の領域を強調させて表示させるための処理を、各通信装置に提供する資料情報に行なう。よって、会議中継装置は、通信装置に提供されて表示される会議資料において、入力された音声情報が示す領域を強調させることが可能となる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報に基づいて、会議資料中の上下左右方向の領域を特定する。よって、会議中継装置は、入力された音声情報が示す方向を特定し、通信装置で表示される会議資料の、特定された方向の領域を強調させることが可能となる。即ち、会議中継装置は、上方向、下方向等のように会議資料中の方向を示す音声情報が入力された場合に、入力された音声情報が示す方向の領域を強調させる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報に基づいて、複数行に亘って情報が記載されている会議資料中のいずれかの行を含む領域を特定する。よって、会議中継装置は、入力された音声情報が示す行番号を特定し、通信装置で表示される会議資料の、特定された行番号の行を含む領域を強調させることが可能となる。即ち、会議中継装置は、1行目、2行目等のように会議資料中の行番号を示す音声情報が入力された場合に、入力された音声情報が示す行番号の行を含む領域を強調させる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報に基づいて、複数種類のオブジェクトが記載されている会議資料中のいずれかのオブジェクトを含む領域を特定する。よって、会議中継装置は、入力された音声情報が示すオブジェクトを特定し、通信装置で表示される会議資料の、特定されたオブジェクトを含む領域を強調させることが可能となる。即ち、会議中継装置は、テキスト、図(イラスト)、グラフ、表、写真画像等のように会議資料中のオブジェクトを示す音声情報が入力された場合に、入力された音声情報が示すオブジェクトを含む領域を強調させる。また、会議中継装置は、円グラフ、折れ線グラフ、棒グラフ等のようにオブジェクトの呼称又は総称、オブジェクトの種別等が音声入力された場合に、適切なオブジェクトを含む領域を強調できる。
本発明によれば、会議中継装置は、テキスト情報が示す特性を有するオブジェクトを含む領域を特定する。よって、会議中継装置は、丸い図、四角い写真等のように各オブジェクトの形状的な特性が音声入力された場合、また、赤い図、モノクロ写真等のように各オブジェクトの色彩的な特性が音声入力された場合などに、適切なオブジェクトを含む領域を強調できる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報に基づいて、マトリクス状の図表が記載されている会議資料中の図表におけるいずれかの要素を特定する。よって、会議中継装置は、入力された音声情報が示す図表中の要素を特定し、通信装置で表示される会議資料の、特定された図表中の要素を含む領域を強調させることが可能となる。即ち、会議中継装置は、1行目の1列目、1行目の2列目等のように会議資料中の図表中の要素を示す音声情報が入力された場合に、入力された音声情報が示す要素を含む領域を強調させる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報に基づいて、複数頁からなる会議資料中のいずれかの頁を特定する。よって、会議中継装置は、入力された音声情報が示す頁番号を特定し、通信装置で表示される会議資料の、特定された頁番号の頁を強調させることが可能となる。即ち、会議中継装置は、1頁目、2頁目等のように会議資料中の頁番号を示す音声情報が入力された場合に、入力された音声情報が示す頁番号の頁を強調させる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報が示す特性を有する文字を含む領域を特定する。よって、会議中継装置は、入力された音声情報が示す特性の文字の領域を特定し、通信装置で表示される会議資料の、特定された領域を強調させることが可能となる。即ち、会議中継装置は、赤色の文字、大きな文字、太文字、アルファベットで書かれた部分、英語で書かれた部分、アラビア数字の表記部分、イタリック表記の部分、ゴシック体で書かれた部分等のように文字の特性が音声入力された場合に、適切な文字領域を強調させる。
本発明によれば、会議中継装置は、音声情報を変換して得られたテキスト情報が示す特性を有する領域を特定する。よって、会議中継装置は、青い領域、青色表示の領域、四角の枠で囲まれた領域、矢印(星印)が付けられた部分、吹き出し部分、カギ括弧でくくられた部分等のように各領域の特性が音声入力された場合に、適切な領域を強調させる。
本発明によれば、音声情報を変換して得られたテキスト情報に含まれる単語を抽出し、抽出した単語を含む領域を特定する。よって、会議中継装置は、入力された音声情報が示す単語(内容)を含む領域を特定し、通信装置で表示される会議資料の、特定された領域を強調させることが可能となる。
本発明によれば、例えば、1枚の会議資料中の領域を、テキストが記載された領域、図(画像)が記載された領域、表が記載された領域等のように複数の領域に分割できる場合、会議中継装置は、入力された音声情報が示す領域としていずれかの領域を特定する。よって、会議中継装置は、入力された音声情報が示す領域を、会議資料中の各領域を用いて容易に特定できる。
本発明では、会議中継装置は、会議資料を表示させるための資料情報を通信装置に提供しており、音声情報が入力された場合に、通信装置に提供する資料情報に対して、入力された音声情報が示す領域を強調させて表示させるための処理を行なう。よって、会議中継装置は、入力された音声情報が示す領域を強調させた会議資料を通信装置で表示させることができる。これにより、発表者が発表している状況、聴講者が発表者に対して質問している状況、発表者が聴講者の質問に対して応答している状況、複数の参加者が議論している状況等において、発言者(発表者、聴講者、参加者)の発言内容に対応する箇所を適宜強調表示できる。よって、発言者以外の各参加者に、発言者が意図する内容(箇所)を容易に通知でき、会議の円滑化が図られる。
以下に、本発明に係る会議中継装置及びコンピュータプログラムについて、その実施形態を示す図面に基づいて詳述する。なお、以下の実施形態では、本発明に係るコンピュータプログラムを公知のパーソナルコンピュータ、サーバコンピュータ等に読み取らせ、パーソナルコンピュータ又はサーバコンピュータのCPU(Central Processing Unit)等に実行させることによって本発明に係る会議中継装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る会議中継装置を実現してもよい。
以下に、本発明に係る会議中継装置を備えた会議システムについて説明する。図1は本実施形態の会議システムの構成を示す模式図である。本実施形態の会議システム100は、複数の端末装置(通信装置)4,4…と、端末装置4,4…の一部又は全部の間で行なわれる通信会議を中継する会議サーバ(会議中継装置)1とを備える。なお、図1では、会議サーバ1は、破線の閉曲線でそれぞれ囲まれる3つの端末装置4,4,4間でそれぞれ行なわれている会議1と会議2とをそれぞれ独立して中継している。
端末装置4,4…及び会議サーバ1は、LAN(Local Area Network)又はWAN(Wide Area Network)等のIP(Internet Protocol)ネットワーク100aを介して相互に接続されている。また、端末装置4,4…及び会議サーバ1は、IPネットワーク100aを介して、例えば、H.323、T.120、SIP(Session Initiation Protocol)、HTTP(Hyper Text Transfer Protocol)等の通信プロトコルに従って、音声信号及び映像信号を含む各種の信号の送受信を行なう。なお、端末装置4,4…及び会議サーバ1は、これらの通信プロトコルを適宜組み合わせて利用してもよい。
本実施形態の会議システム100では、端末装置4,4…及び会議サーバ1は、IPネットワーク100aを介して相互に接続されている。しかし、例えば、端末装置4,4…のそれぞれは接続されておらず、端末装置4,4…のそれぞれが会議サーバ1と1対1通信を行なうように接続されていてもよい。また、1つの端末装置4が会議サーバ1の機能を備え、この端末装置4を親機とし、他の端末装置4(子機)のそれぞれを親機と1対1通信できるように接続してもよい。
本実施形態の会議システム100は、例えば、同一の通信会議に参加する端末装置4,4…は全て同一の部屋に設置されているものとする。即ち、例えば、同一の会議に参加する参加者の人数分の端末装置4,4…が同一の部屋に用意されており、各参加者はそれぞれ1つの端末装置4を用いて会議に参加する。そして、参加者は、自身が使用する端末装置4,4…に会議資料を表示させつつ、議長又は発言者の説明を聞き、会議に参加する。なお、端末装置4,4…は必ずしも同一の部屋に設置されている必要はなく、離れた拠点に設置されていてもよい。この場合、本実施形態の会議システム100は、離れた拠点間での遠隔会議に用いることができる。
以下に、本実施形態の会議システム100に用いられる端末装置4について説明する。図2は端末装置4の内部構成を示すブロック図である。本実施形態の端末装置4は、制御部40、記憶部41、認証要求部42、入力処理部43、通信部44、信号処理部45、入力音声処理部46、出力音声処理部47、表示処理部48等を備える。制御部40、記憶部41、認証要求部42、入力処理部43、通信部44及び信号処理部45は、バスを介して相互に接続されている。また、入力音声処理部46、出力音声処理部47及び表示処理部48はそれぞれ信号処理部45に接続されている。
制御部40は、CPU、MPU(Micro Processing Unit)等であり、上述したようなハードウェア各部を制御すると共に、記憶部41に格納されている制御プログラムを適宜実行する。記憶部41は、EEPROM(Electrically Erasable and Programmable ROM)、フラッシュROM、HDD(Hard Disk Drive)等である。記憶部41は、端末装置4を動作させるために必要な種々の制御プログラム、制御部40による制御プログラムの実行時に発生する種々のデータ、自身の端末装置4に割り当てられた端末ID及びIPアドレス等を記憶する。なお、記憶部41は、制御プログラムとして、例えば、会議サーバ1を介したテレビ会議を実行するためのテレビ会議実行処理プログラム、会議サーバ1を含む外部装置で保持されている共有ドキュメントを閲覧するためのドキュメント閲覧処理プログラム等を記憶している。
認証要求部42は、会議システム100が提供する通信会議に端末装置4を用いて参加したい参加者が正当な参加者であるかの認証を会議サーバ1に要求する。具体的には、操作部34を介してユーザID及びパスワードが入力された場合、認証要求部42は、入力されたユーザID及びパスワードを通信部44から会議サーバ1へ送信し、会議サーバ1に認証を要求する。また、認証要求部42は、会議サーバ1からの認証結果を通信部44を介して取得し、取得した認証結果を制御部40へ通知する。
入力処理部43は、操作部34に接続されており、操作部34を介してユーザが入力した各種の情報を取得する。操作部34は、例えば、マウス、キーボード、タブレット等であり、ユーザが端末装置4を操作するために必要な各種のボタンを備える。入力処理部43は、ユーザが操作部34を介して入力した各種の情報を制御部40へ送出し、制御部40は、入力処理部43から取得した情報に応じた処理を実行する。
通信部44は、IPネットワーク100aに接続するためのインタフェースであり、IPネットワーク100aを介して会議サーバ1との間で情報の送受信を行なう。
通信部44は、IPネットワーク100aに接続するためのインタフェースであり、IPネットワーク100aを介して会議サーバ1との間で情報の送受信を行なう。
入力音声処理部46は、マイクロホン31に接続されている。入力音声処理部46は、例えば、A/D(アナログ/デジタル)変換器を備え、マイクロホン31が集音したアナログの音声信号をデジタルの音声信号に変換し、信号処理部45へ出力する。信号処理部45は、音声信号を符号化する音声符号化部を備え、入力音声処理部46から取得した音声信号を符号化する。なお、信号処理部45によって符号化された音声信号は、例えば、通信部44へ転送され、通信部44を介して会議サーバ1へ送信される。これにより、端末装置4のマイクロホン31によって集音された音声信号は、会議サーバ1へ送信される。なお、音声符号化部は、例えば、G.711、G.722、G.728、G.729、MPEG(Moving Picture Experts Group)−4 AAC(Advanced Audio Coding)等の規格に従った符号化処理を行なう。
信号処理部45は、符号化された音声信号を復号する音声復号部を備える。なお、通信部44は、IPネットワーク100aを介して会議サーバ1から符号化された音声信号を受信しており、信号処理部45は、通信部44から取得した符号化された音声信号を復号する。なお、音声復号部は、音声符号化部が行なう符号化処理の規格と同一の規格に従った復号処理を行なう。信号処理部45は、通信部44から取得して復号した音声信号を出力音声処理部47へ出力する。出力音声処理部47は、スピーカ32に接続されている。出力音声処理部47は、例えば、D/A(デジタル/アナログ)変換器を備え、信号処理部45から取得したデジタルの音声信号をアナログの音声信号に変換し、スピーカ32へ出力する。これにより、会議サーバ1から受信した音声信号に基づく音声がスピーカ32から出力される。
また、信号処理部45は、符号化された映像信号を復号する映像復号部を備える。なお、通信部44は、IPネットワーク100aを介して会議サーバ1から符号化された映像信号を受信しており、信号処理部45は、通信部44から取得した符号化された映像信号を復号する。なお、映像復号部は、例えば、H.261、H.263、H.264等の規格に従った復号処理を行なう。信号処理部45は、通信部44から取得して復号した映像信号を表示処理部48へ出力する。表示処理部48は、ディスプレイ33に接続されており、信号処理部45から取得した映像信号をディスプレイ33へ出力する。これにより、会議サーバ1から受信した映像信号に基づく映像がディスプレイ33に表示される。なお、ディスプレイ33は、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)等の表示装置である。
なお、上述したように、マイクロホン31、スピーカ32、ディスプレイ33及び操作部34は、端末装置4の本体とは別体に構成されてもよいし、全てが一体に構成されてもよい。また、ディスプレイ33及び操作部34は、タッチパネル又はタブレットによって構成されてもよい。
また、本実施形態では、会議に参加する参加者は同一の部屋で端末装置4,4…を操作する構成であるので、各端末装置4,4…を使用する各参加者の顔を撮影して、端末装置4,4…間で送受信する必要はない。しかし、会議システム100を遠隔会議に用いる場合、端末装置4,4…が離れた拠点に設置されることになる。従って、端末装置4,4…にカメラを接続し、端末装置4,4…の内部に、カメラによって撮影して得られた映像信号を処理する映像処理部を備えてもよい。なお、映像処理部は、例えば、カメラによって撮影して得られた映像信号を符号化する映像符号化部であり、映像符号化部は、例えば、H.261、H.263、H.264等の規格に従った符号化処理を行なう。
なお、本実施形態では、会議に参加する参加者が同一の部屋で端末装置4,4…を操作する状況を想定しているので、全ての参加者が所定範囲内にいるような会議では、発話者が発した音声を直接聞くことが可能である。従って、このような会議に会議システム100を用いる場合、端末装置4,4…にスピーカ32を備える必要はない。ただし、本実施形態の会議サーバ1は、各参加者の発言内容に基づいて、会議資料中の、発言内容に対応する箇所を特定し、特定した箇所を強調表示させる機能を有するので、端末装置4,4…はマイクロホン31を必ず備えている。
以下に、本実施形態の会議システム100に用いられる会議サーバ1について説明する。図3は会議サーバ1の内部構成を示すブロック図である。本実施形態の会議サーバ1は、制御部10、認証部11、通信部12、出力部13、記憶部20等を備える。上述したハードウェア各部は、バスを介して相互に接続されている。制御部10は、CPU、MPU等であり、上述したようなハードウェア各部を制御すると共に、記憶部20に格納されている制御プログラムを適宜実行する。
記憶部20は、HDD等の大容量の記憶装置である。記憶部20は、会議サーバ1を動作させるために必要な種々の制御プログラム、制御部10による制御プログラムの実行時に発生する種々のデータ等を記憶する。また、本実施形態の会議サーバ1は、ウェブサーバの機能を有しており、ウェブサーバとしてIPネットワーク100aを介して公開しているウェブページを記憶部20に記憶している。更に、記憶部20は、IPネットワーク100aを介して共有(公開)されている会議資料データ、図4(a)に示すようなユーザ情報テーブル21、図4(b)に示すような予約状況管理テーブル22、図4(c)に示すような開催状況管理テーブル23、図5及び図6に示すような会議資料情報データベース(以下、会議資料情報DBという)24を記憶する。
また、記憶部20は、音声信号をテキスト情報に変換する音声認識処理を制御部10が行なうための音声認識処理プログラム、音声認識処理に用いる音声認識用データベース(以下、音声認識用DBという)25を記憶する。また、記憶部20は、テキスト情報を日本語の文法に沿って単語に分解する言語解析処理を制御部10が行なうための言語解析処理プログラム、言語解析処理に用いる言語解析用データベース(以下、言語解析用DBという)26を記憶する。更に、記憶部20は、通信会議におけるいずれかの発言者による発言内容が、会議資料中のいずれの領域に記載された内容であるのかを特定するための特定処理プログラム、特定処理に用いる位置特定情報データベース(以下、位置特定情報DBという)27を記憶する。
会議資料データは、ドキュメントデータ、画像データ等であり、IPネットワーク100aを介して端末装置4,4…で閲覧可能に公開されている。なお、会議資料データは、特定のユーザにのみ公開されているデータであってもよい。この場合、会議サーバ1は、各会議資料データの閲覧を許可されたユーザのユーザ情報(ユーザID)を保持しておき、IPネットワーク100aを介して閲覧要求してきたユーザが、予めユーザ情報を保持しているユーザであれば閲覧を許可する。なお、記憶部20に記憶されている各テーブルの詳細な構成については後述する。
認証部11は、端末装置4の操作部34を介して入力され、端末装置4の認証要求部42から送信されたユーザID及びパスワードを通信部12を介して取得する。認証部11は、取得したユーザID及びパスワードが、後述のユーザ情報テーブル21に既に登録されているか否かに基づいて、このユーザ(参加者)が会議システム100の利用を許可された正当な参加者であるかを認証する。認証部11は、取得したユーザID及びパスワードがユーザ情報テーブル21に登録されていれば、正当な参加者であると判断し、登録されていなければ、正当な参加者ではないと判断する。認証部11は、取得したユーザID及び認証結果を、ユーザID及びパスワードを送信してきた端末装置4へ返信する。
通信部12は、IPネットワーク100aに接続するためのインタフェースであり、IPネットワーク100aを介して端末装置4,4…との間で情報の送受信を行なう。
出力部13は、LCD、CRT又はPDP等のディスプレイ13aに接続されており、制御部10による指示に従った映像信号をディスプレイ13aへ出力する。これにより、会議サーバ1は、会議の参加者に所望の情報を通知できる。
出力部13は、LCD、CRT又はPDP等のディスプレイ13aに接続されており、制御部10による指示に従った映像信号をディスプレイ13aへ出力する。これにより、会議サーバ1は、会議の参加者に所望の情報を通知できる。
図4乃至図6は記憶部20に記憶されているテーブルの格納内容を示す模式図である。なお、図4(a)はユーザ情報テーブル21の格納内容を、図4(b)は予約状況管理テーブル22の格納内容を、図4(c)は開催状況管理テーブル23の格納内容を、図5及び図6は会議資料情報DB24の格納内容をそれぞれ示す。
図4(a)に示すように、ユーザ情報テーブル21には、会議サーバ1によって提供される会議システム100の利用が可能なユーザに関するユーザ情報が格納される。ユーザ情報は、例えば、各ユーザに予め割り当てられたユーザID、各ユーザによって予め登録されたパスワード等を含む。なお、ユーザ情報は、各ユーザを識別し、各ユーザが適正であるか否かを認証するための情報であればよい。また、ユーザ情報は、各ユーザの氏名、所属、役職等を含んでもよい。ユーザ情報テーブル21の格納内容は、会議システム100の利用が可能なユーザのユーザ情報が追加、変更又は削除される都度、制御部10によって登録、更新又は削除される。なお、ユーザ情報は、会議サーバ1の操作部(図示せず)、会議サーバ1とIPネットワーク100aを介して接続された端末装置4又はその他の通信装置の操作部を介して会議サーバ1に入力される。このようなユーザ情報テーブル21によって、会議サーバ1は、会議システム100の利用が可能なユーザを管理できる。
図4(b)に示すように、予約状況管理テーブル22には、会議システム100によって開催される会議(通信会議)の予約情報が格納される。予約情報は、予約された会議に割り当てられた会議ID、会議の予約を行なったユーザ(登録者)のユーザID(登録者ID)、会議の開催日時、会議に使用する会議資料の資料情報、会議に参加するユーザ(参加者)のユーザID(参加者ID)等を含む。資料情報は、例えば、各会議資料データのフォルダ及びファイル名等であり、各会議資料データを識別するための情報である。なお、会議に使用される会議資料は、資料情報が予約状況管理テーブル22に登録される前に記憶部20に予め格納させておく。
予約状況管理テーブル22の格納内容は、会議システム100の利用が可能なユーザが会議の開催を予約又は予約をキャンセルする都度、制御部10によって登録又は削除される。また、予約状況管理テーブル22に格納された予約情報は、登録者が予約内容を変更する都度、制御部10によって更新される。なお、予約情報も、会議サーバ1、端末装置4又はその他の通信装置の操作部を介して会議サーバ1に入力される。このような予約状況管理テーブル22によって、会議サーバ1は、予約された会議の内容を管理できる。
図4(c)に示すように、開催状況管理テーブル23には、会議システム100によって実際に開催されている会議(通信会議)に割り当てられた会議IDに、会議に参加中のユーザ(参加者)に関する参加者情報が対応付けて格納される。参加者情報は、会議の参加者のユーザID(参加者ID)、各参加者が使用中の端末装置4の端末ID等を含む。開催状況管理テーブル23の参加者情報は、予約情報に登録されている登録者及び参加者のいずれかが会議に参加するために会議サーバ1にログインしてきた場合に、制御部10によって、会議IDに対応付けて登録される。また、最初にログインした参加者の参加者情報が開催状況管理テーブル23に登録された後は、各参加者が会議サーバ1にログインする都度、各参加者の参加者情報が順次追加して格納される。
このような開催状況管理テーブル23によって、会議サーバ1は、開催中の会議において、会議の参加者、各参加者がいずれの端末装置4を使用しているかを管理できる。なお、会議IDに対応付けられて最初の参加者情報が開催状況管理テーブル23に登録されるタイミングは、例えば、会議を予約した登録者が会議サーバ1にログインしてきた時点でもよい。
図5及び図6に示すように、会議資料情報DB24には、記憶部20に記憶してある会議資料データに関する情報(会議資料情報)が格納される。会議資料情報は、会議資料データを識別するための資料情報、会議資料データに含まれる各ページのページ番号、各ページに含まれるテキストの情報、図の情報、グラフの情報、表の情報、その他の情報等を含む。なお、図5及び図6のそれぞれには、会議資料情報DB24の一部を省略して図示してある。具体的には、図5ではグラフの情報及び表の情報の詳細な内容が省略されており、図6ではテキストの情報及び図の情報の詳細な内容が省略されている。
テキストの情報は、各ページにおいてテキスト形式で記載された領域に関する情報であり、テキストの位置を示す情報、テキストの特徴を示す情報、テキストに含まれる単語(キーワード)等を含む。テキストの位置を示す情報は、1ページの会議資料においてテキスト形式で記載された領域の相対的な位置を示しており、例えば、「左」、「右」、「上」、「下」、「左上」、「右上」、「左下」、「右下」等で表される。テキストの特徴を示す情報は、各テキストが縦書きされているか横書きされているか、領域内の行数、文字の色、フォント、サイズ等を示す。なお、テキストの特徴を示す情報は、例えば、会議資料データに含まれる、各テキスト(文字)の特徴を示すタグ情報等から抽出できる。
また、フォントの情報としては、フォントそのもののほかに、例えば、英語、日本語等のような言語の種類、アルファベット、アラビア数字、イタリック表記等のような文字の種類等を用いてもよい。なお、同一のテキスト領域内に異なる特徴の文字が含まれる場合、それぞれの特徴を示す情報が会議資料情報DB24に格納される。図5には、ページ番号2,3,4の各ページでは、上から1行目とその他の4行とにおける特徴が異なる例を示している。テキストに含まれるキーワードは、各領域内に記載されているテキストに含まれる一般名詞及び固有名詞である。
図の情報は、各ページ中の図(イラスト)の領域に関する情報であり、図の位置を示す情報、図の特徴を示す情報等を含む。図の位置を示す情報は、1ページの会議資料における図の相対的な位置を示しており、例えば、「左」、「右」、「上」、「下」、「左上」、「右上」、「左下」、「右下」等で表される。図の特徴を示す情報は、図の形状、図の色彩的な特徴等を示す。なお、図の特徴を示す情報は、例えば、会議資料データに含まれる、各図の特徴を示すタグ情報等から抽出できる。
グラフの情報は、各ページ中のグラフの領域に関する情報であり、グラフの位置を示す情報、グラフの種類を示す情報、グラフの特徴を示す情報等を含む。グラフの位置を示す情報は、1ページの会議資料におけるグラフの相対的な位置を示しており、例えば、「左」、「右」、「上」、「下」、「左上」、「右上」、「左下」、「右下」等で表される。グラフの種類を示す情報は、例えば、「棒グラフ」、「折れ線グラフ」、「円グラフ」等の各グラフの呼称又は総称で表される。グラフの特徴を示す情報は、グラフの色彩的な特徴等を示す。なお、グラフの種類及び特徴を示す情報は、例えば、会議資料データに含まれる、各グラフの種類及び特徴を示すタグ情報等から抽出できる。
表の情報は、各ページ中の表の領域に関する情報であり、表の位置を示す情報、表の構成(特徴)を示す情報、表中の各要素に含まれる単語(キーワード)等を含む。表の位置を示す情報は、1ページの会議資料における表の相対的な位置を示しており、例えば、「左」、「右」、「上」、「下」、「左上」、「右上」、「左下」、「右下」等で表される。表の構成を示す情報は、各表の行数及び列数等を示す。表中の各要素に含まれるキーワードは、各要素として記載されているテキストに含まれる一般名詞及び固有名詞である。各キーワードは、表を構成する要素(例えば、1行1列目の要素)毎に会議資料情報DB24に格納されてもよい。なお、表の構成を示す情報は、例えば、会議資料データに含まれる、各表の構成(特徴)を示すタグ情報等から抽出できる。
その他の情報は、各ページにおいて上述した各情報以外の情報であり、例えば、1ページ中の一部の領域が他の領域と異なる色を有することを示す情報、丸又は四角等の枠で囲まれている領域を示す情報、矢印又は星印等が付与されている領域を示す情報、吹き出しが記載されている領域を示す情報、カギ括弧又は丸括弧等が付与されている領域を示す情報等がある。
会議資料情報DB24の格納内容は、制御部10が会議資料データを解析することによって、会議資料の各ページ中のテキスト、図、グラフ、表のそれぞれの位置、特徴、キーワード等を抽出する都度、制御部10によって格納される。なお、会議資料情報DB24には、上述したような情報のほかに、テキスト、図、グラフ、表等の各領域の相対的な位置関係、例えば、テキストの領域の下側に図の領域があることを示す情報を格納してもよい。また、テキスト、図、グラフ、表の各領域の位置を示す情報は、上下左右等の方向だけでなく、各領域の左上及び右下の座標値、又は、各領域の左上の座標値及び該左上の座標を始点として右方向及び下方向の長さ等のように、各領域を特定できる領域情報としてもよい。
音声認識用DB25は、例えば、音声認識処理の認識結果となる認識単語のそれぞれについて読み及び音素列が対応付けて登録されている単語辞書、又は認証単語のそれぞれについて音声データ(音声信号)が対応付けて登録されている単語辞書等である。なお、各認識単語の音素列は、各認識単語に含まれる音素について、各音素の特徴を示す音響モデルの並びを示している。また、音声認識用DB25は、日本語の音素毎に各音素の特徴を表す音響モデル(音声認識の分野で通常用いられる音響パラメータ)を格納している。言語解析用DB26は、例えば、各単語のそれぞれについて表記、読み、品詞情報等が対応付けて登録されており、形態素解析に用いられる単語辞書である。
図示しないが、位置特定情報DB27には、「このページ」、「先頭のページ」、「最後のページ」、「1つ前のページ」、「1つ後のページ」、「2ページ目」等のように会議資料中のページ番号を示す情報、「上から3行目」、「1番上の行」、「最終行」、「最初の段落」、「2段落目」等のように会議資料中のテキストの領域の行番号を示す情報、上、下、左、右、左上、左下、真ん中、中央、1番上等の会議資料中の位置の方向を示す情報が格納されている。また、位置特定情報DB27には、「1列目」、「1行目」、「1番左の列」、「右から3列目」等の会議資料中の表を構成する各要素の位置を示す情報、「ページ中のテキスト」、「ページ中の図」、「ページ中の表」等の会議資料中のオブジェクトを示す情報が格納されている。なお、「ページ」の代わりに、「スライド」、「画面」等の用語を用いてもよい。
位置特定情報DB27には、これらの情報のそれぞれに対応付けて、各情報に対応する領域を特定する領域情報が格納されている。上述した各情報は、例えば、各情報を記載したテキストの情報であってもよいし、各情報を発声した際の音声情報(音響モデル)であってもよい。また、領域情報は、会議サーバ1が端末装置4,4…に提供する会議資料中の各領域を示し、領域の左上及び右下の座標値、又は、領域の左上の座標値及び該左上の座標を始点として右方向及び下方向の長さ等を含む。
記憶部20に格納される各情報は、記憶部20に予め格納されている構成に限られない。会議サーバ1が外部メモリ(図示せず)に記憶してあるデータの読み出しが可能なドライバ(図示せず)を備える場合には、外部メモリに記憶された各種情報をドライバによって読み出して記憶部20に格納させてもよい。また、会議サーバ1が、インターネット等を介して外部の装置から各種情報をダウンロードして記憶部20に格納させてもよい。
会議サーバ1は、上述した構成のほかに更に、会議サーバ1を操作するための操作部を備えてもよい。この場合、会議システム100の管理者は、操作部及びディスプレイ13aを用いて、記憶部20に記憶される会議資料データ、各種のテーブルの記憶内容等を容易に変更できる。
以下に、上述した構成の会議システム100において、会議サーバ1及び端末装置4,4…が行なう処理について説明する。上述した構成の会議システム100において、会議の予約を行ないたいユーザは、端末装置4を用いて会議サーバ1にアクセスする。なお、端末装置4の使用を開始する際に、ユーザID及びパスワードを用いて認証処理を行なうことによって、端末装置4を使用できるユーザを、会議システム100の利用が可能なユーザに制限してもよい。
会議サーバ1は、ウェブサーバの機能を有しており、会議システム100が提供する会議の予約を受け付けるためのウェブページを端末装置4へ提供する。図示しないが、会議の予約を受け付けるためのウェブページは、会議の予約を行なうユーザのユーザID、会議の開催日時、会議に使用する会議資料データを特定する資料情報(例えば、会議資料データのファイル名)、会議の参加者の参加者ID(ユーザID)等の予約情報を入力するための入力欄を有する。会議の予約を行なうユーザは、このようなウェブページを介して、自身のユーザID(登録者ID)、開催日時、資料情報、参加者ID等の予約情報を入力し、端末装置4の制御部40は、入力された予約情報を会議サーバ1へ送信し、会議の予約を行なう。
会議サーバ1の制御部10は、端末装置4から予約情報を取得した場合、予約する会議に会議IDを割り当て、割り当てた会議IDに取得した予約情報を対応付けて予約状況管理テーブル22に格納する。これにより、会議の予約が完了する。なお、会議IDは、各会議を識別できる情報であればよく、例えば、予約状況管理テーブル22に格納された順に1,2,3…の会議IDが割り当てられてもよい。
次に、上述したように会議の予約情報が会議サーバ1の予約状況管理テーブル22に格納されている会議システム100において、予約された会議が開催され、開催された会議が中継される際に会議サーバ1及び端末装置4,4…が行なう処理について説明する。予約されている会議に参加したい参加者(登録者も含む)は、端末装置4を用いて会議サーバ1にアクセスする。会議サーバ1は、予約されている会議又は既に開催されている会議への参加要求を受け付けるためのウェブページを端末装置4へ提供する。図示しないが、会議への参加要求を受け付けるためのウェブページは、例えば、予約されている会議又は既に開催されている会議に関する情報を一覧表示しており、これらの会議から1つの選択を受け付けるように構成されている。
このようなウェブページをディスプレイ33に表示している端末装置4の制御部40は、一覧表示された情報の1つを参加者が操作部34を用いて選択した場合、任意の会議への参加要求を受け付ける。制御部40は、任意の会議への参加要求を受け付けた場合、操作部34を介して参加者のユーザID及びパスワードを受け付け、自身の端末装置4の端末IDと共に通信部44から会議サーバ1へ送信し、会議への参加要求を送信する。なお、任意の会議への参加要求を受け付けた場合ではなく、端末装置4の使用を開始する際に、ユーザ情報による認証処理を行なうことによって、会議への参加を要求できるユーザを、会議システム100の利用が可能なユーザに制限してもよい。
会議サーバ1の制御部10は、通信部12を介して端末装置4から会議への参加要求を受信した場合、会議への参加を要求してきたユーザが、この会議への参加が許可された正当な参加者であるか否かを認証部11によって認証する。具体的には、認証部11は、まず、端末装置4から受信したユーザ情報(ユーザID及びパスワード)に基づいて、このユーザが会議システム100の利用を許可されているか否かを認証する。ここでは、認証部11は、受信したユーザ情報がユーザ情報テーブル21に既に登録されているか否かを判断し、ユーザ情報がユーザ情報テーブル21に登録されていれば、正当なユーザであると判断し、登録されていなければ、正当なユーザではないと判断する。
次に、認証部11は、会議システム100の利用を許可されていると判断したユーザについて、端末装置4から受信した会議ID及びユーザIDに基づいて、参加要求してきた会議の参加者に登録されているか否かを判断する。ここでは、認証部11は、受信した会議IDの予約情報を予約状況管理テーブル22から読み出し、読み出した予約情報の登録者ID又は参加者IDに、受信したユーザIDが含まれているか否かを判断する。認証部11は、予約情報の登録者ID又は参加者IDに、受信したユーザIDが含まれていれば、正当な参加者であると判断し、含まれていなければ、正当な参加者ではないと判断する。
会議サーバ1の制御部10は、認証部11による認証の結果、会議への参加を要求してきたユーザが正当な参加者ではない場合、認証されなかった旨を示す認証結果(認証不可)を、会議への参加要求を送信してきた端末装置4に通知する。なお、正当な参加者ではない場合とは、会議への参加を要求してきたユーザが、会議システム100の利用を予め許可されたユーザではない場合、又は参加を要求した会議への参加者として登録されたユーザではない場合である。端末装置4の制御部40は、会議サーバ1から認証不可を通知された場合、例えば「ユーザID・パスワードが誤りです」、「御希望の会議には参加できません」等のメッセージをディスプレイ33に表示させ、会議に参加できない旨をユーザに通知する。
認証の結果、会議への参加を要求してきたユーザが正当な参加者である場合、会議サーバ1の制御部10は、このユーザ(参加者)の参加者情報(参加者ID及び端末ID)を生成し、端末装置4から受信した会議IDに対応付けて開催状況管理テーブル23に格納する。また、端末装置4から受信した会議IDが既に開催状況管理テーブル23に格納されている場合、制御部10は、既に格納されている会議IDに対応する格納領域に、生成した参加者情報を格納する。
会議サーバ1の制御部(情報提供部)10は、参加者情報(登録者情報)を開催状況管理テーブル23に格納した後、会議への参加要求を送信してきた端末装置4に、参加要求された会議に使用される会議資料データを送信する。具体的には、制御部10は、予約状況管理テーブル22を参照し、参加要求された会議に使用される会議資料データの資料情報を読み出し、読み出した資料情報が示す会議資料の1ページ目の会議資料データを記憶部20から読み出して端末装置4に配信する。
なお、本実施形態の会議サーバ1は、会議の予約を行なった登録者(会議の議長又は発表者)の端末装置4からの要求に従った会議資料データを、登録者の端末装置4だけでなく、各参加者の端末装置4,4…にも配信する。よって、会議の各参加者は、登録者が閲覧中の会議資料と同一の会議資料を各端末装置4,4…を介して閲覧する。従って、会議サーバ1の制御部10は、会議の登録者から会議資料データを要求された場合、要求された会議資料データを登録者の端末装置4に配信すると共に、同一の会議資料データを、他の参加者の端末装置4,4…にも配信する。これにより、会議の各参加者は、登録者が閲覧中の資料を同時に閲覧できる。
なお、会議サーバ1は、このような構成に限らず、各端末装置4,4…を介して各参加者からそれぞれ任意の会議資料データの要求を受け付け、それぞれ異なる会議資料データを端末装置4,4…に配信してもよい。これにより、各参加者は、登録者が閲覧中の会議資料データを登録者と同期して閲覧できるだけでなく、所望の会議資料データを会議サーバ1から取得して閲覧できる。
端末装置4の制御部40は、会議サーバ1から会議資料データを受信した場合、受信した会議資料データを信号処理部45及び表示処理部48を介してディスプレイ33へ出力して表示させる。なお、ディスプレイ33に表示される表示画面には、会議を終了させるための終了ボタンが表示されており、各参加者は、終了ボタンを操作することによって会議を終了させることができる。また、本実施形態の会議サーバ1では、例えば、各会議の登録者が終了ボタンを操作した場合、会議全体を終了させるが、登録者以外の参加者が終了ボタンを操作した場合、その参加者のみ会議を終了させる。
即ち、会議サーバ1の制御部10は、会議の終了要求を受信した場合、会議の終了を要求してきた参加者が登録者であれば、登録者によって終了が要求された会議の会議IDに対応する全ての参加者情報を開催状況管理テーブル23から削除する。また、制御部10は、開催状況管理テーブル23から参加者情報を削除した参加者の端末装置4,4…に、会議の終了を通知する画面、又は会議への参加要求を新たに受け付けるためのウェブページを送信する。これにより、端末装置4,4…の参加者は、会議が終了されたことを把握できる。なお、制御部10は、予約状況管理テーブル22に格納してある予約情報に基づいて、会議の終了要求を送信してきた端末装置4の参加者が、会議の登録者であるか否かを判断する。
一方、制御部10は、会議の終了を要求してきた参加者が登録者以外の参加者であれば、会議の終了を要求してきた参加者の参加者情報のみを開催状況管理テーブル23から削除する。そして、制御部10は、登録者からの会議資料データの要求に従って会議資料データの端末装置4,4…への配信を継続する。なお、会議サーバ1の制御部10は、会議への参加を終了した参加者の端末装置4に、会議への参加要求を受け付けるためのウェブページを再度送信してもよい。
上述した処理では、会議サーバ1が、端末装置4,4…からの要求に応じた会議資料データを適宜端末装置4,4…に配信する処理について説明した。しかし、本実施形態の会議サーバ1は、会議資料データを端末装置4,4…に配信しつつ、端末装置4,4…のマイクロホン31で集音した音声信号を集め、それぞれの端末装置4,4…に配信する処理も行なう。これにより、会議システム100を用いて遠隔会議を行なう場合であっても、各参加者の発言を端末装置4,4…間で送受信できる。
なお、本実施形態の会議サーバ1は、音声信号を端末装置4,4…に配信する際に、例えば、最も音量の大きい音声信号を選択して端末装置4,4…に配信するようにしてもよい。また、本実施形態の会議サーバ1は、予め登録された端末装置4(例えば登録者の端末装置4)のマイクロホン31で集音された音声信号を他の端末装置4,4…に配信するようにしてもよい。
本実施形態の会議サーバ1は、上述したように複数の端末装置4,4…間で行なわれる通信会議を中継すると共に、会議においていずれかの参加者が発言した場合に、その発言内容が、会議で使用される会議資料中のいずれの領域に記載されているかを判定し、判定した領域を強調表示させる処理を行なう。なお、本実施形態の会議サーバ1は、発言内容が会議資料中のいずれの領域に記載されているかを判定する際に、会議資料情報DB24及び位置特定情報DB27を用いる。また、会議資料情報DB24は、予め用意されている会議資料データに基づいて制御部10によって生成される。
具体的には、会議サーバ1は、端末装置4,4…間で送受信される音声情報、即ち、会議において各参加者の発言内容に基づいて、各会議における発言内容が、各会議で使用される会議資料中のいずれの領域に記載されているかを判定する。そして、会議サーバ1は、判定した領域を強調させた会議資料データをディスプレイ13a又は端末装置4,4…のディスプレイ33に表示させる。
以下に、会議サーバ1の制御部10による会議資料情報DB24の生成処理、及び、会議資料情報DB24及び位置特定情報DB27を用いた制御部10による判定処理について説明する。なお、会議資料情報DB24の生成処理及び判定処理は、制御部10が、記憶部20に記憶してある制御プログラムを実行することによって実行される。
本実施形態の会議サーバ1は、制御部10が記憶部20に記憶してある制御プログラムを実行することによって、図7に示すような各機能を実現する。図7は本実施形態の会議サーバ1の機能構成を示す機能ブロック図である。本実施形態の会議サーバ1において、制御部10は、ページ構成解析部14、音声認識部15、キーワード抽出部16、位置特定部17等の機能を実現する。
ページ構成解析部14は、会議に使用される会議資料データに基づいて、会議資料の各ページに含まれるテキスト、図、グラフ、表の各領域を解析し、会議資料情報を生成して会議資料情報DB24に格納する。なお、ページ構成解析部14による会議資料情報の生成処理の詳細については後述する。
音声認識部15は、例えば、通信部(音声取得部)12を介して受信した音声信号に対して、音声認識用DB25を用いた音声認識処理を行ない、音声信号をテキスト情報に変換する。具体的には、音声認識部15は、音声信号を音響分析して音響パラメータを抽出し、音声認識用DB25に格納されている音響モデルと照合し、最も類似する音響モデルに対応する単語を認識結果とする。音声認識部15は、音声認識処理を行なって得られたテキスト情報をキーワード抽出部16へ出力する。
キーワード抽出部16は、音声認識部15によって生成されたテキスト情報に対して、言語解析用DB26を用いた形態素解析等の言語解析処理を行ない、例えば、単語に分解する。キーワード抽出部16は、言語解析処理によって分解した各単語が、会議資料情報DB24に格納されている各情報のいずれかに、又は位置特定情報DB27に格納されている情報のいずれかに一致するか否かを判断する。
具体的には、キーワード抽出部16は、各単語が、会議資料情報DB24にテキストの情報として格納されている単語のいずれか、図の情報として格納されている単語のいずれか、グラフの情報として格納されている単語のいずれか、表の情報として格納されている単語のいずれか、その他の情報として格納されている単語のいずれかに一致するかを判断する。例えば、分解された単語が「横書き」であれば、キーワード抽出部16は、会議資料情報DB24にテキストの特徴を示す情報として格納されている「横書き」に一致すると判断する。また、分解された単語が「このページ」であれば、キーワード抽出部16は、位置特定情報DB27に格納されている情報「このページ」に一致すると判断する。
キーワード抽出部16は、各単語が会議資料情報DB24に格納されているいずれかの情報に一致すると判断した場合、一致した情報に対応する位置の情報を会議資料情報DB24から読み出して位置特定部17に通知する。例えば、分解された単語が「割合」であれば、キーワード抽出部16は、資料情報が「資料1」の会議資料中の1ページ目の左側のテキスト領域に「割合」というキーワードが存在することを判断する。そして、このときキーワード抽出部16は、このテキスト領域の位置を示す「左」を会議資料情報DB24から読み出して位置特定部17に通知する。
一方、キーワード抽出部16は、各単語が位置特定情報DB27に格納されているいずれかの情報に一致すると判断した場合、一致した情報に対応付けて位置特定情報DB27に格納してある領域情報を位置特定情報DB27から読み出して位置特定部17に通知する。例えば、分解された単語が「このページ」であれば、キーワード抽出部16は、「このページ」が示す領域(現在表示中の会議資料)を特定する領域情報を位置特定情報DB27から読み出して位置特定部17に通知する。
なお、キーワード抽出部16は、各単語がいずれの情報にも一致しないと判断した場合、何も行なわない。
なお、キーワード抽出部16は、各単語がいずれの情報にも一致しないと判断した場合、何も行なわない。
位置特定部17は、キーワード抽出部16による照合処理の結果に基づいて、会議資料において、参加者の発言内容に合致する内容が記載されている領域を特定する。具体的には、位置特定部17は、キーワード抽出部16が会議資料情報DB24から読み出した位置を示す情報を通知された場合、通知された情報が示す領域を特定する。なお、キーワード抽出部16が会議資料情報DB24から読み出した情報が、上下左右等のように会議資料中の方向等を示す情報である場合には、その情報に対応する領域情報を位置特定情報DB27から読み出し、読み出した領域情報が示す領域を特定する。また、位置特定部17は、キーワード抽出部16が位置特定情報DB27から読み出した領域情報を通知された場合、通知された領域情報が示す領域を特定する。なお、キーワード抽出部16による照合処理、照合処理の結果に基づく位置特定部17による領域判定処理の詳細については後述する。
位置特定部17は、端末装置4,4…に配信している会議資料データに対して、特定した領域を強調させて表示させるための処理を行なう。また、位置特定部17は、このような処理を行なった会議資料データを通信部12から端末装置4,4…に、又は、出力部13からディスプレイ13aに出力して表示させる。これにより、特定した領域に所定のマークを付加し、又は特定した領域を強調させることができ、会議の参加者に、現在の発言者の発言内容に該当する箇所を通知できる。
以下に、ページ構成解析部14による会議資料情報DB24の生成処理についてフローチャートに基づいて説明する。図8及び図9は会議資料情報DB24の生成処理の手順を示すフローチャートである。なお、以下の処理は、会議サーバ1の制御部10(ページ構成解析部14)によって実行される。
会議サーバ1のページ構成解析部14は、ある通信会議で使用される会議資料データにおいて、1ページ分の会議資料データを抽出する(S1)。ページ構成解析部14は、抽出した会議資料データを、この1ページ分の会議資料に含まれるオブジェクトに分解する(S2)。具体的には、ページ構成解析部14は、1ページ分の会議資料を、テキスト(文字又は文章)の領域、図の領域、グラフの領域、表の領域、その他の領域に分解する。
ページ構成解析部14は、ステップS2で分解したオブジェクトにテキストの領域が含まれているか否かを判断し(S3)、テキストの領域が含まれていないと判断した場合(S3:NO)、ステップS8に処理を移行する。また、テキストの領域が含まれていると判断した場合(S3:YES)、ページ構成解析部14は、テキストの領域の位置を特定する(S4)。ページ構成解析部14は、会議資料中のテキストの領域の位置を、左、右上、左下等のように方向を示す情報によって特定してもよいし、各領域の左上の座標値及び右下の座標値によって特定してよいし、各領域の左上の座標値及び左上の座標から右方向及び下方向の長さによって特定してもよい。なお、テキストの領域だけでなく、図の領域、グラフの領域、表の領域もそれぞれ同様である。
次にページ構成解析部14は、位置を特定した領域におけるテキストの特徴を抽出する(S5)。ページ構成解析部14は、テキストの特徴として、縦書き又は横書き、行数、文字の色、フォント、サイズ等を、会議資料データから抽出する。更にページ構成解析部14は、位置を特定した領域に記載されているテキストに対して、キーワード抽出部16による形態素解析処理と同様の処理を行なって単語に分解し、分解した単語から、ここでのテキストに含まれるキーワードとして普通名詞又は固有名詞を抽出する(S6)。
ページ構成解析部14は、ステップS1で記憶部20から読み出した会議資料データの資料情報と、ページ番号とに対応付けて、ステップS4で特定した位置を会議資料情報DB24のテキストの位置を示す情報の欄に、ステップS5で抽出した特徴を会議資料情報DB24のテキストの特徴を示す情報の欄に、ステップS6で抽出したキーワードを会議資料情報DB24のテキストのキーワードの欄にそれぞれ格納する(S7)。
ページ構成解析部14は、ステップS2で分解したオブジェクトに図の領域が含まれているか否かを判断し(S8)、図の領域が含まれていないと判断した場合(S8:NO)、ステップS12に処理を移行する。また、図の領域が含まれていると判断した場合(S8:YES)、ページ構成解析部14は、図の領域の位置を特定する(S9)。ページ構成解析部14は、位置を特定した図の特徴を抽出する(S10)。ページ構成解析部14は、図の特徴として、形状的な特徴、色彩的な特徴等を、会議資料データから抽出する。ページ構成解析部14は、ステップS1で記憶部20から読み出した会議資料データの資料情報と、ページ番号とに対応付けて、ステップS9で特定した位置を会議資料情報DB24の図の位置を示す情報の欄に、ステップS10で抽出した特徴を会議資料情報DB24の図の特徴を示す情報の欄にそれぞれ格納する(S11)。
ページ構成解析部14は、ステップS2で分解したオブジェクトにグラフの領域が含まれているか否かを判断し(S12)、グラフの領域が含まれていないと判断した場合(S12:NO)、ステップS17に処理を移行する。また、グラフの領域が含まれていると判断した場合(S12:YES)、ページ構成解析部14は、グラフの領域の位置を特定する(S13)。ページ構成解析部14は、位置を特定したグラフの種類を特定し(S14)、位置を特定したグラフの特徴を抽出する(S15)。ページ構成解析部14は、グラフの特徴として色彩的な特徴等を、会議資料データから抽出する。ページ構成解析部14は、ステップS1で記憶部20から読み出した会議資料データの資料情報と、ページ番号とに対応付けて、ステップS13で特定した位置を会議資料情報DB24のグラフの位置を示す情報の欄に、ステップS14で特定した種類を会議資料情報DB24のグラフの種類を示す情報の欄に、ステップS15で抽出した特徴を会議資料情報DB24のグラフの特徴を示す情報の欄にそれぞれ格納する(S16)。
ページ構成解析部14は、ステップS2で分解したオブジェクトに表の領域が含まれているか否かを判断し(S17)、表の領域が含まれていないと判断した場合(S17:NO)、ステップS22に処理を移行する。また、表の領域が含まれていると判断した場合(S17:YES)、ページ構成解析部14は、表の領域の位置を特定する(S18)。ページ構成解析部14は、位置を特定した表の構成(行数及び列数等)を特定し(S19)、位置を特定した表に含まれる各要素(各升目)に記載されているテキストに対して、キーワード抽出部16による形態素解析処理と同様の処理を行なって単語に分解し、分解した単語から、ここでの表に含まれるキーワードとして普通名詞又は固有名詞を抽出する(S20)。
ページ構成解析部14は、ステップS1で記憶部20から読み出した会議資料データの資料情報と、ページ番号とに対応付けて、ステップS18で特定した位置を会議資料情報DB24の表の位置を示す情報の欄に、ステップS19で特定した構成を会議資料情報DB24の表の構成を示す情報の欄に、ステップS20で抽出したキーワードを会議資料情報DB24の表のキーワードの欄にそれぞれ格納する(S21)。なお、表のキーワードの欄には、表中の各要素を特定する情報に対応付けて、各要素に記載されているキーワードを格納してもよい。例えば、表中の1行1列目の要素に対するキーワードとして会議資料情報DB24に格納してもよい。
ページ構成解析部14は、1ページ分の会議資料データに、上述したようなテキスト、図、グラフ、表の領域の他に何らかの特徴を有する領域が含まれているか否かを判断する(S22)。例えば、ページ構成解析部14は、他の領域とは異なる色(背景色)の領域があるか否か、丸又は四角の枠で囲まれた領域があるか否か、矢印又は星印等が付与された領域があるか否か、吹き出しを用いて記載された領域があるか否か、カギ括弧又は丸括弧等が付与された領域があるか否か等を判断する。
ページ構成解析部14は、その他の特徴を有する領域があると判断した場合(S22:YES)、その領域の特徴を抽出し、会議資料情報DB24のその他の情報の欄に格納する(S23)。ページ構成解析部14は、その他の特徴を有する領域がないと判断した場合(S22:NO)、ステップS23の処理をスキップし、会議資料に含まれる全てのページの会議資料データに対して上述した処理を終了したか否かを判断する(S24)。
ページ構成解析部14は、全てのページに対する処理を終了していないと判断した場合(S24:NO)、ステップS1に処理を戻し、まだ処理されていないページの会議資料データを抽出し(S1)、抽出した会議資料データに対して、上述したステップS2〜S23の処理を行なう。ページ構成解析部14は、全てのページに対する処理を終了したと判断した場合(S24:YES)、上述した処理を終了する。これにより、会議サーバ1の制御部10(キーワード抽出部16)が行なう判定処理に用いられる会議資料情報DB24が生成される。
図10及び図11は会議資料データの例を示す模式図である。例えば、会議資料データにおいて、図10(a)に示した会議資料が1ページ目で、図10(b)に示した会議資料が2ページ目で、図10(c)に示した会議資料が3ページ目で、図10(d)に示した会議資料が4ページ目であるとする。このような会議資料データに基づいてページ構成解析部14が会議資料情報を生成した場合、図5に示すような会議資料情報を生成できる。
具体的には、図10(a)に示す1ページ目の会議資料について、ページ構成解析部14は、会議資料の左側の位置に横書きで7行のテキストの領域があることを検出し、検出したテキストは黒文字で記載され、そのフォントはゴシック体で、サイズは12ポイントであることを検出し、更に、そのテキストの領域内に「割合」というキーワードを検出する。また、ページ構成解析部14は、会議資料の右下側の位置に四角い図の領域があることを検出する。
また、図10(b)に示す2ページ目の会議資料について、ページ構成解析部14は、会議資料の左側の位置に横書きのテキストの領域があることを検出し、検出したテキスト中の上から1行目は、赤文字で記載され、そのフォントはゴシック体で、サイズは14ポイントであり、その他の4行は、黒文字で記載され、そのフォントはゴシック体で、サイズは12ポイントであることを検出する。また、ページ構成解析部14は、会議資料の右下側の位置に四角い図の領域があることを検出する。
また、図10(c)に示す3ページ目の会議資料について、ページ構成解析部14は、会議資料の左側の位置に横書きのテキストの領域があることを検出し、検出したテキスト中の上から1行目は、黒文字で記載され、そのフォントはゴシック体で、サイズは24ポイントであり、その他の4行は、黒文字で記載され、そのフォントはゴシック体で、サイズは12ポイントであることを検出する。また、ページ構成解析部14は、会議資料の右下側の位置に四角い図の領域があることを検出する。
また、図10(d)に示す4ページ目の会議資料について、ページ構成解析部14は、会議資料の左側の位置に横書きのテキストの領域があることを検出し、検出したテキスト中の上から1行目は、黒文字で記載され、そのフォントはCentury体で、サイズは12ポイントであり、その他の4行は、黒文字で記載され、そのフォントはゴシック体で、サイズは12ポイントであることを検出する。また、ページ構成解析部14は、会議資料の右下側の位置に四角い図の領域があることを検出する。
また、会議資料データにおいて、図11(a)に示した会議資料が1ページ目で、図11(b)に示した会議資料が2ページ目で、図11(c)に示した会議資料が3ページ目で、図11(d)に示した会議資料が4ページ目であるとする。このような会議資料データに基づいてページ構成解析部14が会議資料情報を生成した場合、図6に示すような会議資料情報を生成できる。
具体的には、図11(a)に示す1ページ目の会議資料について、ページ構成解析部14は、会議資料の上側の位置に表の領域があることを検出し、検出した表が3行3列の構成を有し、表に含まれる各要素に「ABC」、「XYZ」というキーワードを検出する。なお、図11(a)に示す会議資料中のテキストの領域についての説明は省略する。表に含まれる各要素は、図11(a)に示すように罫線によって区切られている構成に限らず、所定の間隔を隔てることによって各要素を区切ってある構成でもよい。また、図11(b)に示す2ページ目の会議資料について、ページ構成解析部14は、会議資料の上側の位置に表の領域があることを検出し、検出した表が3行3列の構成を有し、表に含まれる各要素に「A社」、「B社」、「C社」というキーワードを検出する。
また、図11(c)に示す3ページ目の会議資料について、ページ構成解析部14は、会議資料の左上側の位置に棒グラフ及び折れ線グラフの領域があることを検出し、会議資料の右下側の位置に円グラフの領域があることを検出し、検出した各グラフの特徴(棒グラフであれば各棒の色)を検出する。なお、図11(c)に示す会議資料中のテキストの領域についての説明は省略する。また、図11(d)に示す4ページ目の会議資料について、ページ構成解析部14は、会議資料の全体にテキストの領域があることを検出し、検出したテキストの4行目〜5行目が四角い枠で包囲されていることを検出する。
なお、会議資料情報DB24は、会議が開催されるまでに生成されて登録されていればよい。従って、ページ構成解析部14による会議資料情報の生成処理及び会議資料情報DB24への登録処理は、会議が予約された直後に行なう必要はない。会議資料情報の生成処理及び会議資料情報DB24への登録処理は、例えば、1日における所定時刻に、複数の会議についてまとめて行なってもよい。また、会議資料情報DB24に格納される会議資料情報は、ページ構成解析部14によって会議資料データから自動的に生成される構成のほかに、例えば、会議の登録者によって手動で登録されてもよい。
なお、ページ構成解析部14は、会議資料中のテキスト、図、グラフ、表の位置のほかに、同一の会議資料中の各オブジェクト(テキスト、図、グラフ、表)の相対的な位置を示す情報を検出して会議資料情報DB24に格納してもよい。例えば、テキストの右下側に図があるということを示す情報を会議資料情報DB24に格納してもよい。
次に、本実施形態の会議サーバ1において、上述したように会議資料情報DB24に格納された会議資料情報を用いて制御部10が行なう判定処理についてフローチャートに基づいて説明する。図12は会議資料情報を用いた判定処理の手順を示すフローチャートである。なお、以下の処理は、会議サーバ1の制御部10(音声認識部15、キーワード抽出部16、位置特定部17を含む)によって実行される。
会議サーバ1の制御部10は、上述したような通信会議の中継処理を行ないつつ、ある通信会議において、端末装置4,4…間で送受信される音声信号を通信部12で取得したか否かを判断する(S31)。なお、端末装置4,4…の制御部40は、マイクロホン31によって集音された音声信号を随時会議サーバ1へ送信している。会議サーバ1の制御部10は、音声信号を取得していないと判断した場合(S31:NO)、通信会議の中継処理を行ないつつ待機する。
音声信号を取得したと判断した場合(S31:YES)、音声認識部15は、取得した音声信号に対して、音声認識用DB25を用いた音声認識を行ない(S32)、音声信号をテキスト情報に変換する。キーワード抽出部16は、生成したテキスト情報に対して、言語解析用DB26を用いた言語解析を行ない、テキスト情報を単語に分解する(S33)。キーワード抽出部16は、分解した単語と、会議資料情報DB24に格納してある各情報及び位置特定情報DB27に格納してある各情報とを照合する(S34)。
具体的には、キーワード抽出部16は、分解した単語が、会議資料情報DB24に格納してあるいずれかの情報に一致するか否かを判断する(S35)。より具体的には、キーワード抽出部16は、分解した単語が、会議資料情報DB24のテキストの位置及び特徴を示す情報の欄、テキスト中のキーワードの欄、図の位置及び特徴を示す情報の欄、グラフの位置、種類及び特徴を示す情報の欄、表の位置及び構成を示す情報の欄、表中のキーワードの欄、その他の情報の欄のいずれかに格納されている情報に一致するか否かを判断する。
キーワード抽出部16は、分解した単語が、会議資料情報DB24に格納してあるいずれかの情報に一致すると判断した場合(S35:YES)、一致した情報に対応する位置を示す情報を会議資料情報DB24から読み出す(S36)。例えば、端末装置4,4…間でやり取りされる音声情報に「赤い文字」が含まれている場合、キーワード抽出部16は、図5に示す会議資料情報に基づいて、この会議資料データの2ページ目の上から1行目のテキストが赤文字であることを検出する。この場合、キーワード抽出部16は、対応する位置の情報として、2ページ目の左側のテキスト領域の上から1行目を特定し、この情報を位置の情報として読み出す。
また、端末装置4,4…間でやり取りされる音声情報に「割合」が含まれている場合、キーワード抽出部16は、図5に示す会議資料情報に基づいて、この会議資料データの1ページ目の左側のテキストに「割合」が含まれていることを検出する。この場合、キーワード抽出部16は、対応する位置の情報として、1ページ目の左側のテキスト領域を特定し、この情報を位置の情報として読み出す。なお、キーワード抽出部16は、読み出した位置を示す情報を位置特定部17に通知する。
一方、会議資料情報DB24に格納してあるいずれの情報にも一致しないと判断した場合(S35:NO)、キーワード抽出部16は、分解した単語が、位置特定情報DB27に格納してあるいずれかの情報、即ち、位置を示すキーワードのいずれかに一致するか否かを判断する(S37)。キーワード抽出部16は、分解した単語が、位置特定情報DB27に格納してあるいずれかの情報に一致すると判断した場合(S37:YES)、一致した情報に対応する領域情報を位置特定情報DB27から読み出す(S38)。キーワード抽出部16は、読み出した領域情報を位置特定部17に通知する。
例えば、端末装置4,4…間でやり取りされる音声情報に「ページの左側」、「ページの右側」等の位置を示す単語が含まれる場合、キーワード抽出部16は、この単語(ページの左側、ページの右側)に対応する領域情報、例えば、「ページの左側」が示す領域の左上の座標値及び右下の座標値を位置特定情報DB27から読み出す。位置特定情報DB27に格納してあるいずれの情報にも一致しないと判断した場合(S37:NO)、キーワード抽出部16は、ステップS40に処理を移行する。なお、ステップS36において会議資料情報DB24から読み出した情報が、上下左右等の方向を示す情報である場合、位置特定部17は、キーワード抽出部16から通知された位置を示す情報に対応する領域情報を位置特定情報DB27から読み出しておく(S38)。例えば、会議資料情報DB24から読み出した位置情報が「2ページ目の右上側のテキスト」である場合、この位置情報が示す領域の左上の座標値及び右下の座標値を位置特定情報DB27から取得する。
位置特定部17は、キーワード抽出部16から通知された領域情報又は自身が位置特定情報DB27から読み出した領域情報が示す領域を特定し、特定した領域に対して強調処理を行なう(S39)。これにより、発言者の発言内容に対応する箇所を強調表示させた会議資料を会議の参加者に提供できる。会議サーバ1の制御部10は、端末装置4,4…間での通信会議が終了したか否かを判断する(S40)。なお、制御部10は、会議の登録者が端末装置4において終了ボタンを操作することによって、端末装置4から会議の終了要求を受信した場合に、通信会議を終了させる。
制御部10は、通信会議が終了していないと判断した場合(S40:NO)、ステップS31に処理を戻し、順次入力されてくる音声信号に対して上述した処理を繰り返す。また、制御部10は、通信会議が終了したと判断した場合(S40:YES)、上述した処理を終了する。
上述したように、本実施形態の会議サーバ1は、複数の端末装置4,4…間での通信会議を中継しつつ、会議資料情報DB24及び位置特定情報DB27に格納してある各情報に基づいて、各参加者に提供している会議資料において、発言者の発言内容に該当する箇所を特定する。そして、特定した箇所を強調して表示させることにより、発言者の発言内容を他の参加者に効率よく通知できる。
図13及び図14は強調表示された会議資料データの例を示す模式図である。例えば、図10(a)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「このページの上から3行目…」と発言した場合、会議サーバ1は、位置特定情報DB27に基づいて位置を示す情報として「このページ」及び「上から3行目」を検出する。これにより、会議サーバ1は、図13(a)に示すように、表示中の会議資料の上から3行目を含む領域を強調させて表示させることができる。なお、図13(a)では、発言者の発言内容に対応する箇所の白黒を反転させて表示させているが、黒字の背景を所定の色で表示させてもよい。
また、図10(b)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「赤い文字で書かれている箇所…」、「赤文字で書かれている箇所…」又は「赤で書かれている箇所…」等と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「赤い文字」、「赤文字」又は「赤」を検出する。これにより、会議サーバ1は、図13(b)に示すように、表示中の会議資料の赤い文字で記載されている領域(図13(b)では「今月の売上」)を強調させて表示させることができる。
また、図10(c)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「大きい文字で書かれている箇所…」又は「大きく書かれている箇所」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「大きい文字」又は「大きく」を検出する。これにより、会議サーバ1は、図13(c)に示すように、表示中の会議資料の、他の文字よりもサイズが大きい文字で記載されている領域(図13(c)では「今月の売上」)を強調させて表示させることができる。
また、図10(d)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「英語で書かれている箇所…」又は「アルファベットで書かれている箇所…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「英語」又は「アルファベット」を検出する。これにより、会議サーバ1は、図13(d)に示すように、表示中の会議資料の英語(アルファベット)で記載されている領域を強調させて表示させることができる。
また、図11(a)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「表中の2列目の2行目…」と発言した場合、会議サーバ1は、位置特定情報DB27に基づいて位置を示すキーワードとして「表」、「2列目」及び「2行目」を検出する。これにより、会議サーバ1は、図13(e)に示すように、表示中の会議資料の表中の2列目の2行目の升目(要素)を含む領域を強調させて表示させることができる。なお、図13(e)では、発言者の発言内容に対応する箇所(2列目2行目の要素)の背景を、他の要素の背景と異なる色で表示させているが、このような構成に限らない。
また、図11(b)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「B社のシステムは…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「B社」を検出する。これにより、会議サーバ1は、図13(f)に示すように、表示中の会議資料の表中のB社に関する欄(要素)を含む領域を強調させて表示させることができる。なお、図13(f)では、発言者の発言内容に対応する箇所(B社に関する要素)の背景を、他の要素の背景と異なる色で表示させているが、このような構成に限らない。
また、図11(c)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「このページの上の図…」と発言した場合、会議サーバ1は、位置特定情報DB27に基づいて位置を示すキーワードとして「このページ」及び「上の図」を検出する。これにより、会議サーバ1は、図14(a)に示すように、表示中の会議資料の上の図を含む領域を強調させて表示させることができる。なお、図14(a)では、発言者の発言内容に対応する箇所(図)を閉曲線で囲んで表示させているが、この閉曲線を点滅させて表示させてもよく、対応する図自体を点滅させて表示させてもよい。
また、図11(c)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「この円グラフ…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「円グラフ」を検出する。これにより、会議サーバ1は、図14(b)に示すように、表示中の会議資料中の円グラフを含む領域を強調させて表示させることができる。なお、図14(b)では、発言者の発言内容に対応する円グラフを白抜き矢符で指示しているが、このような構成に限らない。
同様に、図11(c)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「この折れ線グラフ…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「折れ線グラフ」を検出する。これにより、会議サーバ1は、図14(c)に示すように、表示中の会議資料中の折れ線グラフを含む領域を強調させて表示させることができる。なお、図14(c)では、発言者の発言内容に対応する折れ線グラフを閉曲線で囲んで表示させているが、このような構成に限らない。
また、図11(c)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「棒グラフの青い項目…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「棒グラフ」及び「青い項目」を検出する。これにより、会議サーバ1は、図14(d)に示すように、表示中の会議資料中の棒グラフに含まれる青い項目(左から3本目の棒)を含む領域を強調させて表示させることができる。
また、図11(d)に示す会議資料が各端末装置4,4…のディスプレイ33及び会議サーバ1のディスプレイ13aで表示されているとする。この状態で、1人の参加者(質問者、発言者)が、「四角で囲んだ部分…」と発言した場合、会議サーバ1は、会議資料情報DB24に基づいて会議資料に関する情報として「四角で囲んだ」を検出する。これにより、会議サーバ1は、図14(e)に示すように、表示中の会議資料中の四角の枠で囲まれた領域を強調させて表示させることができる。なお、図14(e)では、発言者の発言内容に対応する領域を閉曲線で囲んで表示させているが、このような構成に限らない。
本実施形態の会議サーバ1は、会議資料データから生成された会議資料情報に基づいて、会議資料中の、発言者の発言内容に該当する箇所を特定し、特定した箇所を強調させて表示させる。よって、例えば、発表者が発表している場合に、発表内容に対応した箇所を強調表示させることにより、発表者が会議資料(表示画面)中のどの箇所についての説明を行なっているのかを聴講者に通知できる。また、質疑応答又は議論を行なう際に、発言者の発言内容に対応した箇所を強調表示させることにより、発言者が会議資料(表示画面)中のどの箇所についての発言を行なっているのかを他の参加者(発表者も含む)に通知できる。よって、会議の円滑な進行及び各参加者の理解の促進が図られる。
本実施形態の会議サーバ1は、発言者の発言内容に対応する箇所を強調された会議資料を端末装置4,4…のディスプレイ33又は会議サーバ1のディスプレイ13aに表示させる構成であった。例えば、会議の参加者が同室内にいる状況であれば、発言者の発言内容に対応する箇所を強調された会議資料を会議サーバ1のディスプレイ13aに表示させることによって、端末装置4,4…のディスプレイ33における会議資料の表示を妨げることなく、発言者の発言内容に対応する箇所を各参加者に通知できる。また、会議の参加者が遠隔地にいる状況であれば、発言者の発言内容に対応する箇所を強調された会議資料を端末装置4,4…のディスプレイ33に表示させることによって、発言者の発言内容に対応する箇所を各参加者に確実に通知できる。
本実施形態の会議サーバ1は、発言者の発言内容が、会議資料情報DB24に格納されているいずれかの情報又は位置特定情報DB27に格納されているいずれかの情報に一致するか否かの照合処理を、通信会議を開催している間継続して行なっていた。このほかに、例えば、照合処理を行なうか否かを、例えば、会議の議長、発表者、登録者等によって切り替えることができるように会議サーバ1を構成してもよい。これにより、発言内容に該当する箇所を強調表示させる処理を、所望のタイミング、例えば、質疑応答中又は議論中のみに制限できる。例えば、会議資料を用いたプレゼンテーション中は、発表者(プレゼンター)の発表内容に該当する箇所を逐次強調表示させる必要がない場合が多く、このような場合に不要な処理を削減できる。
本実施形態の会議サーバ1は、例えば、テキスト領域における文字を反転表示させる方法、対応する図、グラフ又は表等のオブジェクトを閉曲線によって包囲する方法、対応する領域の背景を異なる色又は模様に変更する方法、矢印マーク等を表示させて対応する箇所を指し示す方法によって、発言者の発言内容に該当する箇所を強調表示させていた。このほかに、例えば、対応する領域を点滅させる方法等の照明効果によって、発言者の発言内容に該当する箇所を強調表示させてもよい。また、表示画面による効果だけでなく、例えば所定の通知音を出力させる等の音響効果も用いて発言者の発言内容に該当する箇所を強調表示させることにより、より効率よく、発言者の発言内容に該当する箇所を他の参加者に通知できる。
本実施形態の会議サーバ1は、会議の参加者の発言内容、具体的には、端末装置4,4…間で送受信される音声信号に、会議資料情報DB24又は位置特定情報DB27に記憶されている情報が含まれているか否かを判定していた。しかし、会議システム100では、例えば、会議サーバ1にマイクロホンが接続され、このマイクロホンを用いて、発表者(プレゼンター、議長)、質問者又は討論者が発言することも考えられる。この場合、会議サーバ1は、通信部12を介して受信した音声信号ではなく、マイクロホンを介して直接入力される音声信号に、会議資料情報DB24又は位置特定情報DB27に記憶されている情報が含まれているか否かを判定してもよい。
本実施形態では、各ユーザを識別するユーザ情報としてユーザID及びパスワードを用いる構成であった。しかし、このような構成に限られず、各ユーザの名刺をスキャナで読み取った情報をユーザ情報として用いてもよい。この場合、各ユーザが、繁雑な入力処理によって自身のユーザ情報を入力する必要がなく、操作性が向上する。特に、会議システム100にユーザ登録されていないユーザ(例えば来客者)が会議に参加する際に要する操作が簡略化される。
以上、本発明の好適な実施形態についてそれぞれ具体的に説明したが、各構成及び動作等は適宜変更可能であって、上述の実施形態に限定されることはない。
100 会議システム
1 会議サーバ(会議中継装置)
10 制御部(情報提供部)
12 通信部(音声取得部)
15 音声認識部
16 キーワード抽出部(抽出部)
17 位置特定部(特定部、強調処理部)
4 端末装置(通信装置)
1 会議サーバ(会議中継装置)
10 制御部(情報提供部)
12 通信部(音声取得部)
15 音声認識部
16 キーワード抽出部(抽出部)
17 位置特定部(特定部、強調処理部)
4 端末装置(通信装置)
Claims (12)
- 複数の通信装置と通信可能に接続され、前記複数の通信装置間で行なわれる通信会議を中継する会議中継装置において、
会議資料を表示させるための資料情報を前記複数の通信装置に提供する情報提供部と、
音声情報を取得する音声取得部と、
該音声取得部が取得した音声情報を認識してテキスト情報に変換する音声認識部と、
該音声認識部が変換したテキスト情報が示す前記会議資料中の領域を特定する特定部と、
該特定部が特定した前記会議資料中の領域を強調させて表示させるための処理を、前記情報提供部が提供する資料情報に行なう強調処理部と
を備えることを特徴とする会議中継装置。 - 前記特定部は、前記会議資料中の上下左右方向の領域を特定するようにしてあることを特徴とする請求項1に記載の会議中継装置。
- 前記特定部は、複数行に亘って情報が記載されている前記会議資料中のいずれかの行を含む領域を特定するようにしてあることを特徴とする請求項1又は2に記載の会議中継装置。
- 前記特定部は、複数種類のオブジェクトが記載されている前記会議資料中のいずれかのオブジェクトを含む領域を特定するようにしてあることを特徴とする請求項1から3までのいずれかひとつに記載の会議中継装置。
- 前記特定部は、前記テキスト情報が示す特性を有するオブジェクトを含む領域を特定するようにしてあることを特徴とする請求項4に記載の会議中継装置。
- 前記特定部は、マトリクス状の図表が記載されている前記会議資料中の図表におけるいずれかの要素を含む領域を特定するようにしてあることを特徴とする請求項1から5までのいずれかひとつに記載の会議中継装置。
- 前記特定部は、複数頁からなる前記会議資料中のいずれかの頁を特定するようにしてあることを特徴とする請求項1から6までのいずれかひとつに記載の会議中継装置。
- 前記特定部は、前記テキスト情報が示す特性を有する文字を含む領域を特定するようにしてあることを特徴とする請求項1から7までのいずれかひとつに記載の会議中継装置。
- 前記特定部は、前記テキスト情報が示す特性を有する領域を特定するようにしてあることを特徴とする請求項1から8までのいずれかひとつに記載の会議中継装置。
- 前記音声認識部が変換したテキスト情報に含まれる単語を抽出する抽出部を備え、
前記特定部は、前記抽出部が抽出した単語を含む領域を特定するようにしてあることを特徴とする請求項1から9までのいずれかひとつに記載の会議中継装置。 - 前記特定部は、前記テキスト情報が示す領域として、1枚の会議資料が有する複数の領域のいずれかを特定するようにしてあることを特徴とする請求項1から10までのいずれかひとつに記載の会議中継装置。
- コンピュータに、通信可能に接続された複数の通信装置間で行なわれる通信会議を中継させるためのコンピュータプログラムにおいて、
コンピュータに、
会議資料を表示させるための資料情報を前記複数の通信装置に提供するステップと、
音声情報を取得し、取得した音声情報を認識してテキスト情報に変換するステップと、
変換したテキスト情報が示す前記会議資料中の領域を特定するステップと、
特定した前記会議資料中の領域を強調させて表示させるための処理を、前記通信装置に提供する資料情報に行なうステップと
を実行させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009216003A JP2011065467A (ja) | 2009-09-17 | 2009-09-17 | 会議中継装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009216003A JP2011065467A (ja) | 2009-09-17 | 2009-09-17 | 会議中継装置及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011065467A true JP2011065467A (ja) | 2011-03-31 |
Family
ID=43951636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009216003A Pending JP2011065467A (ja) | 2009-09-17 | 2009-09-17 | 会議中継装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011065467A (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014002795A (ja) * | 2013-10-07 | 2014-01-09 | Toshiba Corp | 電子機器、表示方法、およびプログラム |
JP2014132342A (ja) * | 2013-01-07 | 2014-07-17 | Samsung Electronics Co Ltd | 対話型サーバ、ディスプレイ装置及びその制御方法 |
WO2016067348A1 (ja) * | 2014-10-27 | 2016-05-06 | 富士通株式会社 | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 |
JP2016118873A (ja) * | 2014-12-19 | 2016-06-30 | 日本電信電話株式会社 | コンテンツ加工方法、コンテンツ加工装置及びコンテンツ加工プログラム |
JP2016118738A (ja) * | 2014-12-24 | 2016-06-30 | 日本電信電話株式会社 | 音声認識方法、音声認識装置及び音声認識プログラム |
JP2017130118A (ja) * | 2016-01-21 | 2017-07-27 | コニカミノルタ株式会社 | 文書閲覧システムプログラム |
JP2018139397A (ja) * | 2017-02-24 | 2018-09-06 | 沖電気工業株式会社 | 音声表示装置および音声表示プログラム |
KR101994044B1 (ko) * | 2018-09-03 | 2019-06-27 | 강병진 | 스마트 회의 통합 시스템 |
CN111866421A (zh) * | 2019-04-30 | 2020-10-30 | 陈筱涵 | 会议记录***与会议记录方法 |
CN113611308A (zh) * | 2021-09-08 | 2021-11-05 | 杭州海康威视数字技术股份有限公司 | 一种语音识别方法、装置、***、服务器及存储介质 |
WO2022025024A1 (ja) * | 2020-07-31 | 2022-02-03 | 株式会社I’mbesideyou | 反応解析システムおよび反応解析装置 |
WO2022145041A1 (ja) * | 2020-12-31 | 2022-07-07 | 株式会社I’mbesideyou | ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム |
WO2023182061A1 (ja) * | 2022-03-23 | 2023-09-28 | パナソニックIpマネジメント株式会社 | 会議支援システム、会議支援装置および会議支援方法 |
-
2009
- 2009-09-17 JP JP2009216003A patent/JP2011065467A/ja active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014132342A (ja) * | 2013-01-07 | 2014-07-17 | Samsung Electronics Co Ltd | 対話型サーバ、ディスプレイ装置及びその制御方法 |
JP2014002795A (ja) * | 2013-10-07 | 2014-01-09 | Toshiba Corp | 電子機器、表示方法、およびプログラム |
WO2016067348A1 (ja) * | 2014-10-27 | 2016-05-06 | 富士通株式会社 | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 |
JPWO2016067348A1 (ja) * | 2014-10-27 | 2017-05-25 | 富士通株式会社 | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 |
JP2016118873A (ja) * | 2014-12-19 | 2016-06-30 | 日本電信電話株式会社 | コンテンツ加工方法、コンテンツ加工装置及びコンテンツ加工プログラム |
JP2016118738A (ja) * | 2014-12-24 | 2016-06-30 | 日本電信電話株式会社 | 音声認識方法、音声認識装置及び音声認識プログラム |
JP2017130118A (ja) * | 2016-01-21 | 2017-07-27 | コニカミノルタ株式会社 | 文書閲覧システムプログラム |
JP2018139397A (ja) * | 2017-02-24 | 2018-09-06 | 沖電気工業株式会社 | 音声表示装置および音声表示プログラム |
KR101994044B1 (ko) * | 2018-09-03 | 2019-06-27 | 강병진 | 스마트 회의 통합 시스템 |
CN111866421A (zh) * | 2019-04-30 | 2020-10-30 | 陈筱涵 | 会议记录***与会议记录方法 |
WO2022025024A1 (ja) * | 2020-07-31 | 2022-02-03 | 株式会社I’mbesideyou | 反応解析システムおよび反応解析装置 |
JPWO2022025024A1 (ja) * | 2020-07-31 | 2022-02-03 | ||
JP7197957B2 (ja) | 2020-07-31 | 2022-12-28 | 株式会社I’mbesideyou | 反応解析システムおよび反応解析装置 |
WO2022145041A1 (ja) * | 2020-12-31 | 2022-07-07 | 株式会社I’mbesideyou | ビデオミーティング評価端末、ビデオミーティング評価システム及びビデオミーティング評価プログラム |
CN113611308A (zh) * | 2021-09-08 | 2021-11-05 | 杭州海康威视数字技术股份有限公司 | 一种语音识别方法、装置、***、服务器及存储介质 |
CN113611308B (zh) * | 2021-09-08 | 2024-05-07 | 杭州海康威视数字技术股份有限公司 | 一种语音识别方法、装置、***、服务器及存储介质 |
WO2023182061A1 (ja) * | 2022-03-23 | 2023-09-28 | パナソニックIpマネジメント株式会社 | 会議支援システム、会議支援装置および会議支援方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011065467A (ja) | 会議中継装置及びコンピュータプログラム | |
JP5094804B2 (ja) | 会議中継装置及びコンピュータプログラム | |
JP2011053629A (ja) | 会議中継装置及びコンピュータプログラム | |
US11483273B2 (en) | Chat-based interaction with an in-meeting virtual assistant | |
EP3271917B1 (en) | Communicating metadata that identifies a current speaker | |
JP5795335B2 (ja) | ミックスされた能力を備えたデバイス及びインターフェース間における通信セッション | |
JP5564459B2 (ja) | ビデオ会議に翻訳を追加するための方法及びシステム | |
US20110044212A1 (en) | Information processing apparatus, conference system and information processing method | |
JP7467635B2 (ja) | 使用者端末、ビデオ通話装置、ビデオ通話システム、及びその制御方法 | |
JP2018173752A (ja) | 会議システム、会議システム制御方法、およびプログラム | |
US20210350784A1 (en) | Correct pronunciation of names in text-to-speech synthesis | |
JP2018174439A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
JP2018174442A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
JP7119615B2 (ja) | サーバ、音データ評価方法、プログラム、通信システム | |
JP2003323628A (ja) | 発言者特定映像装置およびそのプログラムならびに発言者特定映像表示方法 | |
JP2011086123A (ja) | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム | |
JP5907231B1 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
US8775163B1 (en) | Selectable silent mode for real-time audio communication system | |
JP2012253478A (ja) | 会議支援システム、会議支援装置、会議支援方法およびコンピュータープログラム | |
CN115171645A (zh) | 一种配音方法、装置、电子设备以及存储介质 | |
CN106658167A (zh) | 一种视频互动的方法及装置 | |
JP6296193B2 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP6172303B2 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP6112239B2 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP2019071061A (ja) | 映像表示装置 |