JPWO2018135057A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JPWO2018135057A1
JPWO2018135057A1 JP2018562875A JP2018562875A JPWO2018135057A1 JP WO2018135057 A1 JPWO2018135057 A1 JP WO2018135057A1 JP 2018562875 A JP2018562875 A JP 2018562875A JP 2018562875 A JP2018562875 A JP 2018562875A JP WO2018135057 A1 JPWO2018135057 A1 JP WO2018135057A1
Authority
JP
Japan
Prior art keywords
image
user
information processing
processing apparatus
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018562875A
Other languages
English (en)
Other versions
JP6969577B2 (ja
Inventor
大輔 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2018135057A1 publication Critical patent/JPWO2018135057A1/ja
Application granted granted Critical
Publication of JP6969577B2 publication Critical patent/JP6969577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/176Dynamic expression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/011Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Processing (AREA)

Abstract

ネットワークを介したユーザ間のコミュニケーションをより好適な態様で実現する。外部装置と所定のネットワークを介して通信を行う通信部と、第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行う制御部と、を備える、情報処理装置。

Description

本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
ネットワークやコミュニケーションツールの発達に伴い、遠隔地のユーザ間におけるコミュニケーションの態様が多様化してきており、音声によるコミュニケーションに限らず、静止画像や動画像のような映像を介したコミュニケーションも可能となってきている。
また、近年では、コミュニケーションツールとして、HMD(Head Mounted Display)のような頭部装着型の装置の利用を想定した、遠隔地のユーザ間におけるコミュニケーションのための技術も各種検討されている。例えば、特許文献1には、ネットワークを介したユーザ間のコミュニケーションを実現するための技術の一例として、頭部装着型の装置を利用したシステムの一例が開示されている。
特開2013−258555号公報
ところで、対面でのユーザ間においては、音声等の言語による言語コミュニケーションのみに限らず、表情や視線、姿勢、身体動作等を利用した所謂非言語コミュニケーションがあわせて用いられることで、より円滑なコミュニケーションが実現される。このような状況から、ネットワークを介したユーザ間のコミュニケーションにおいても、非言語コミュニケーションをより好適な態様で実現することが可能な技術の提供が求められている。
そこで、本開示では、ネットワークを介したユーザ間のコミュニケーションをより好適な態様で実現することが可能な情報処理装置、情報処理方法、及びプログラムを提案する。
本開示によれば、外部装置と所定のネットワークを介して通信を行う通信部と、第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行う制御部と、を備える、情報処理装置が提供される。
また、本開示によれば、コンピュータが、外部装置と所定のネットワークを介して通信を行うことと、第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、を含む、情報処理方法が提供される。
また、本開示によれば、コンピュータに、外部装置と所定のネットワークを介して通信を行うことと、第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、を実行させる、プログラムが提供される。
以上説明したように本開示によれば、ネットワークを介したユーザ間のコミュニケーションをより好適な態様で実現することが可能な情報処理装置、情報処理方法、及びプログラムが提供される。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理システムの概略的なシステム構成の一例を示した図である。 同実施形態に係る情報処理装置の概略的な構成の一例について説明するための説明図である。 同実施形態に係る情報処理装置の機能構成の一例を示したブロック図である。 表情の種類に応じて適用されるゲインの設定の一例を示した図である。 同実施形態に係る情報処理システムによる制御の一例について説明するための説明図である。 同実施形態に係る情報処理装置の一連の処理の流れの一例を示したフローチャートである。 同実施形態に係る情報処理装置の一連の処理の流れの一例を示したフローチャートである。 変形例1に係る情報処理装置の機能構成の一例を示したブロック図である。 変形例2に係る情報処理装置の機能構成の一例を示したブロック図である。 変形例2に係る情報処理システムにおけるゲイン制御の一例について説明するための説明図である。 変形例3に係る情報処理装置300の機能構成の一例を示したブロック図である。 変形例3に係る情報処理システムにおけるゲイン制御の一例について説明するための説明図である。 変形例4に係る情報処理システムの構成の一例を示した図である。 本開示の一実施形態に係る情報処理装置のハードウェア構成の一構成例を示す機能ブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.概略構成
2.ユーザ間のコミュニケーションに関する検討
3.技術的特徴
3.1.概要
3.2.機能構成
3.3.処理
3.4.変形例
4.ハードウェア構成の一例
5.むすび
<<1.概略構成>>
まず、本開示の一実施形態に係る情報処理システムの概略的な構成の一例について説明する。例えば、図1は、本開示の一実施形態に係る情報処理システムの概略的なシステム構成の一例を示した図である。
本実施形態に係る情報処理システム1は、複数のユーザ間におけるネットワークを介したコミュニケーションを実現するための仕組みを提供する。具体的には、図1に示すように、本実施形態に係る情報処理システム1は、複数の情報処理装置100を含む。例えば、図1に示す例では、ユーザUa及びUbは、それぞれに関連付けられた情報処理装置100a及び100bをコミュニケーションツールとして利用する。情報処理装置100aと情報処理装置100bとは、所定のネットワークN11を介して互いに情報を送受信可能に接続されている。また、情報処理システム1は、サーバ800を含んでもよく、当該サーバ800により情報処理装置100aと情報処理装置100bとの間の通信が仲介されてもよい。
なお、ネットワークN11の種別は特に限定されない。具体的な一例として、ネットワークN11は、Wi−Fi(登録商標)規格に基づくネットワークのような、所謂無線のネットワークにより構成されていてもよい。また、他の一例として、ネットワークN11は、インターネット、専用線、LAN(Local Area Network)、または、WAN(Wide
Area Network)等により構成されていてもよい。また、ネットワークN11は、複数のネットワークを含んでもよく、少なくとも一部が有線のネットワークとして構成されていてもよい。
情報処理装置100は、所謂HMDのような頭部装着型の装置として構成されている。例えば、図2は、本実施形態に係る情報処理装置の概略的な構成の一例について説明するための説明図である。図2に示すように、情報処理装置100は、ユーザの頭部に装着されることで、当該ユーザの眼前に、画像を表示するための出力部191(例えば、表示パネル)を保持するように構成されている。また、情報処理装置100は、所謂スピーカ、ヘッドホン、イヤホン等のように、音声等の音響を出力するための音響出力部(図示を省略する)を備えてもよい。
また、図示は省略するが、情報処理装置100は、所謂マイクロホンのように、ユーザの音声や周囲の環境音等の音響を集音する集音部や、所謂デジタルカメラのように、ユーザの画像を撮像する撮像部等を備えてもよい。また、当該集音部や当該撮像部は、情報処理装置100とは異なる装置として設けられ、当該情報処理装置100と連携して動作するように構成されていてもよい。
なお、情報処理装置100として適用可能な頭部装着型の表示装置(HMD)には、所謂、没入型HMD、シースルー型HMD、ビデオシースルー型HMD、及び網膜投射型HMDが含まれる。
没入型HMDは、ユーザの頭部または顔部に装着された場合に、ユーザの眼を覆うように装着され、ユーザの眼前にディスプレイ等の表示部が保持される。そのため、没入型HMDを装着したユーザは、外部の風景(即ち、現実世界の風景)を直接視野に入れることが困難であり、表示部に表示された映像のみが視界に入ることとなる。このような構成により、没入型HMDは、画像を視聴しているユーザに対して没入感を与えることが可能となる。なお、図2に示す情報処理装置100は、没入型HMDとして構成され得る。
シースルー型HMDは、例えば、ハーフミラーや透明な導光板を用いて、透明な導光部等からなる虚像光学系をユーザの眼前に保持し、当該虚像光学系の内側に画像を表示させる。そのため、シースルー型HMDを装着したユーザは、虚像光学系の内側に表示された画像を視聴している間も、外部の風景を視野に入れることが可能となる。なお、シースルー型HMDの具体的な一例として、メガネのレンズに相当する部分を虚像光学系として構成した、所謂メガネ型のウェアラブルデバイスが挙げられる。
ビデオシースルー型HMDは、没入型HMDと同様に、ユーザの眼を覆うように装着され、ユーザの眼前にディスプレイ等の表示部が保持される。一方で、ビデオシースルー型HMDは、周囲の風景を撮像するための撮像部を有し、当該撮像部により撮像されたユーザの視線方向の風景の画像を表示部に表示させる。このような構成により、ビデオシースルー型HMDを装着したユーザは、外部の風景を直接視野に入れることは困難ではあるが、表示部に表示された画像により、外部の風景を確認することが可能となる。
網膜投射型HMDは、ユーザの眼前に投影部が保持されており、当該投影部からユーザの眼に向けて、外部の風景に対して画像が重畳するように当該画像が投影される。より具体的には、網膜投射型HMDでは、ユーザの眼の網膜に対して、投影部から画像が直接投射され、当該画像が網膜上で結像する。このような構成により、近視や遠視のユーザの場合においても、より鮮明な映像を視聴することが可能となる。また、網膜投射型HMDを装着したユーザは、投影部から投影される画像を視聴している間も、外部の風景を視野に入れることが可能となる。
また、本実施形態に係る情報処理装置100は、例えば、加速度センサや、角速度センサ(ジャイロセンサ)等の各種センサが設けられ、当該情報処理装置100を装着したユーザの頭部の動き(頭部の姿勢)を検知可能に構成されていてもよい。具体的な一例として、情報処理装置100は、ユーザの頭部の動きとして、ヨー(yaw)方向、ピッチ(pitch)方向、及びロール(roll)方向それぞれの成分を検出してもよい。このような構成に基づき、例えば、情報処理装置100は、各種センサによりユーザの頭部の動きの検知結果に応じて当該ユーザの視線の方向を推定し、推定された視線の方向に応じた映像を、出力部191を介してユーザに提示することが可能となる。これにより、例えば、ユーザは、所謂全天周画像や、所謂VR(Virtual Reality)技術により実現された仮想空間内の画像のように、当該ユーザの視野よりも広く展開された画像を、見回すように視点を移動させながら参照することが可能となる。
以上のような構成に基づき、例えば、ユーザUaが使用する情報処理装置100aは、撮像部により撮像されたユーザUaの映像(例えば、動画像や静止画像)を、ネットワークN11を介して他の情報処理装置100bに送信する。ユーザUbが使用する情報処理装置100bは、ネットワークN11を介して情報処理装置100aから送信されるユーザUaの映像を、出力部191を介してユーザUbに提示する。同様に、ユーザUbの映像が、情報処理装置100bからネットワークN11を介して情報処理装置100aに送信され、当該情報処理装置100aの出力部191を介してユーザUaに提示されてもよい。また、ユーザの映像に限らず、例えば、マイクロホン等のような集音部により集音されたユーザの音声が情報処理装置100a及び100b間で送受信され、スピーカ、イヤホン、またはヘッドホン等のような音響出力部を介して各ユーザに提示されてもよい。以上のような構成により、ユーザUa及びUbは、情報処理装置100をコミュニケーションツールとして利用することで、遠隔地間においても、ネットワークN11を介して互いにコミュニケーションをとることが可能となる。
以上、図1及び図2を参照して、本開示の一実施形態に係る情報処理システムの概略的な構成の一例について説明した。
<<2.ユーザ間のコミュニケーションに関する検討>>
続いて、ユーザ間のコミュニケーションについて、特に、HMDのような頭部装着型の装置をコミュニケーションツールとして利用した場合に着目して説明したうえで、本実施形態に係る情報処理システムの課題について整理する。
一般的には、対面でのユーザ間においては、音声等の言語による言語コミュニケーションのみに限らず、表情や視線、姿勢、身体動作等を利用した所謂非言語コミュニケーションがあわせて用いられることで、より円滑なコミュニケーションが実現される。
また、近年、ネットワークやコミュニケーションツールの発達に伴い、遠隔地のユーザ間におけるコミュニケーションの態様が多様化してきており、音声によるコミュニケーションに限らず、静止画像や動画像のような映像を介したコミュニケーションも可能となってきている。
例えば、近年では、コミュニケーションツールとして、HMDのような頭部装着型の装置の利用が注目されており、当該装置の利用を想定した、遠隔地のユーザ間におけるコミュニケーションのための技術も各種検討されている。具体的な一例として、VR技術を応用することで、遠隔地のユーザどうしが、ネットワークを介して仮想空間を共有し、当該仮想空間内において互いにコミュニケーションをとることが可能である。このような仮想空間内におけるコミュニケーションにおいて、コミュニケーションツールとしてHMDを利用することで、ユーザに対して、あたかも仮想空間内にいるかのような臨場感あふれる体験を提供することが可能となる。これにより、例えば、仮想空間内におけるユーザ間のコミュニケーションにおいて、当該ユーザどうしがあたかも対面しているような状況を模擬することも可能となる。
また、他の一例として、所謂AR(Augmented Reality)技術を、ネットワークを介したユーザ間のコミュニケーションに応用することも可能である。具体的な一例として、AR技術を応用することで、コミュニケーションの相手となる他のユーザの映像を、実空間上に重畳するように提示することが可能となる。このような構成により、遠隔地のユーザ間のコミュニケーションにおいて、一方のユーザの眼の前に、あたかもコミュニケーションの相手となる他のユーザが存在し、当該ユーザどうしが対面しているような状況を模擬することも可能となる。なお、この場合には、コミュニケーションツールとして、例えば、シースルー型HMD、ビデオシースルー型HMD、網膜投射型HMD等を適用すればよい。
このように、近年の各種技術の発展に伴い、遠隔地のユーザどうしがあたかも対面しているような状況を模擬することが可能となってきている。このような背景から、ネットワークを介したユーザ間においても、より円滑なコミュニケーションを可能となるために、当該ユーザ間における非言語コミュニケーションをより好適な態様で実現することが可能な技術の提供が求められている。
一方で、HMDのような頭部装着型の装置をコミュニケーションツールとして利用するような状況下では、当該装置を頭部に装着した状態でコミュニケーションが行われることとなる。そのため、例えば、外付けの撮像部等によりユーザの外観の映像を撮像したとしても、頭部に装着された装置によりユーザの顔の少なくとも一部(特に、眼の周辺)が遮蔽されるため、撮像された映像からユーザの表情を判別することが困難となる場合がある。このような状況下では、ユーザの表情を利用した非言語コミュニケーションを実現することが困難となる場合がある。
また、ネットワークを介したコミュニケーションにおいては、各ユーザが置かれる環境が異なる場合がある一方で、各ユーザが置かれている環境を他のユーザが認識することが困難な場合がある。そのため、あるユーザについては、比較的大きいリアクションを取ることが困難な環境に置かれているような状況が想定され、このような状況を他のユーザが認識することが困難な場合もあり得る。このような場合においては、例えば、あるユーザは、リアクションを小さくせざるを得ない状況も想定され、このようなリアクションが、他のユーザに対して本来の意図とは異なる印象を与え、ひいては誤解が生じる場合も想定され得る。
また、リアクションの大きさにより受ける印象は、体調等のようなユーザの状態に応じて異なる場合がある一方で、ネットワークを介したコミュニケーションにおいては、当該ユーザの状態を他のユーザが認識することが困難な場合がある。そのため、例えば、一方のユーザが、体調不良等により、他方のユーザのリアクションが大きすぎることが負担(例えば、ストレス)になっているような状況下においても、他方のユーザが、一方のユーザの状態を鑑みて自発的にリアクションの大きさを調整することが困難な場合も想定され得る。
このような状況を鑑み、本開示では、ネットワークを介したユーザ間のコミュニケーション、特に、HMD等の頭部装着型の装置をコミュニケーションツールとして利用した非言語コミュニケーションをより好適な態様で実現することが可能な技術を提案する。
<<3.技術的特徴>>
<3.1.概要>
まず、本実施形態に係る情報処理システムの概要について説明する。前述したように、本実施形態に係る情報処理システムでは、HMD等のような頭部装着型の装置がコミュニケーションツールとして利用されるため、当該装置を装着したユーザを撮像した画像からは、当該ユーザの表情を判別することが困難となる場合がある。
そこで、本実施形態に係る情報処理装置100は、各種センサ等のような所定の検出部により、利用者であるユーザの各種状態を検出し、検出結果に応じて当該ユーザの表情や感情を推定する。具体的な一例して、情報処理装置100は、所謂生体情報取得センサによるユーザの生体情報の検出結果に基づき、当該ユーザの表情や感情を推定してもよい。生体情報としては、例えば、体温、脈拍、血液成分、発汗、脳波、脳血流、眼電位、筋電等が挙げられる。
なお、上記検出部の構成や設置位置については、検出対象に応じて適宜決定されればよい。例えば、脳波に関する情報を検知する脳波センサや血液成分に関する情報を検知する血液センサ等は、情報処理装置100の筐体のうち、ユーザの前頭部に接触する箇所のように、ユーザが当該情報処理装置100を装着した場合に、脳により近い位置に設けられるとよい。また、他の一例として、体温を検知する体温センサや脈拍を検知する脈拍センサ等は、情報処理装置100の筐体のうち、ユーザの耳およびその周辺に接触する箇所のように、体温や脈拍の測定がしやすい位置に設けられるとよい。
もちろん、上述した検出部の例はあくまで一例であり、ユーザの表情や感情を推定することが可能であれば、検出対象となる状態、当該状態を検出するための構成、及び当該構成の設置位置等は特に限定されない。
次いで、情報処理装置100は、表情や感情の推定結果に応じて、ユーザに関連付けられた画像(例えば、ユーザの顔の画像)に対して画像処理を施すことで、当該ユーザの表情や感情が反映された画像を生成する。なお、このとき情報処理装置100は、所定の設定(例えば、事前のユーザ入力に基づく設定)に応じて、ユーザに関連付けられた画像に対して施される画像処理の適用量(例えば、ゲイン、度合い、あるいはレベル)を制御してもよい。
そして、情報処理装置100は、画像処理に応じて生成した、ユーザの表情や感情が反映された画像を、ネットワークを介して他の情報処理装置100に送信する。なお、本説明では、ユーザUaが利用する情報処理装置100aが、ユーザUaの表情や感情が反映された画像を、ユーザUbが利用する情報処理装置100bにネットワークを介して送信するものとする。この場合には、情報処理装置100bは、情報処理装置100aから送信された画像(即ち、ユーザUaの表情や感情が反映された画像)を、出力部191を介してユーザUbに提示する。
このような構成により、ユーザが頭部装着型の装置を装着することで、当該ユーザの顔の少なくとも一部が遮蔽されているような状況下においても、当該ユーザの表情や感情が反映された画像を、ネットワークを介して他のユーザに提示することが可能となる。また、前述の通り、情報処理装置100は、所定の設定に応じて、ユーザに関連付けられた画像に対する画像処理の適用量を制御する。このような制御により、例えば、ユーザが実際にオーバーリアクションを取りづらいような状況下においても、画像処理の適用量を増加させることで、当該ユーザが意図する表情や感情が模擬された画像を、他のユーザに提示することが可能となる。
また、情報処理装置100bは、ユーザUbに対して、ユーザUaの表情や感情が反映された画像を提示する際に、ユーザUbに関連付けられた設定(例えば、ユーザUbにより指定された設定)に応じて、当該画像中のユーザUaの表情を調整してもよい。このような構成により、例えば、ユーザUaがユーザUb側の状態を鑑みて自発的に表情を調整することが困難な状況下においても、ユーザUbの状態に応じて、当該ユーザUbに提示される画像中のユーザUaの表情を情報処理装置100b側で調整することが可能となる。
以上のようにして、本実施形態に係る情報処理システムは、ネットワークを介したユーザ間において、ユーザの表情を利用した非言語コミュニケーションをより好適な態様で実現する。
以上、本実施形態に係る情報処理システムの概要について説明した。なお、以降では、本実施形態に係る情報処理システムについてさらに詳しく説明する。
<3.2.機能構成>
続いて、図3を参照して、本実施形態に係る情報処理装置100の機能構成の一例について説明する。図3は、本実施形態に係る情報処理装置100の機能構成の一例を示したブロック図である。
図3に示すように、本実施形態に係る情報処理装置100は、出力部191と、入力部197と、撮像部193と、検出部195と、通信部199と、自表情推定部101と、自表情画像制御部103と、記憶部107と、他表情推定部113と、他表情画像制御部115と、ゲイン演算部117とを含む。また、情報処理装置100は、圧縮処理部105と、伸張処理部111とを含んでもよい。
通信部199は、情報処理装置100が、所定のネットワークを介して他の装置(例えば、サーバ800や他の情報処理装置100等の外部装置)との間で各種情報の送受信を行うための構成である。通信部199は、例えば、無線のネットワークを介して他の装置との間で各種情報の送受信を行う場合には、通信アンテナ、RF(Radio Frequency)回路、ベースバンドプロセッサ等を含み得る。なお、以降の説明では、情報処理装置100の各構成が、他の装置との間で情報の送受信を行う場合には、特に説明が無い場合には、当該通信部199を介して当該情報の送受信が行われるものとする。
出力部191は、図2を参照して説明した出力部191に相当し、提示対象となる情報を、例えば、視認可能に提示された画像情報としてユーザに提示する。出力部191は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や、有機EL(OLED:Organic Light Emitting Diode)ディスプレイ等により構成され得る。
入力部197は、ユーザが情報処理装置100に対して各種情報を入力するための入力インターフェースである。入力部197は、例えば、ボタン、レバー、及びタッチパネル等のような入力デバイスを含んでもよい。
撮像部193は、ユーザの画像を撮像するための構成であり、例えば、所謂カメラ(デジタルカメラ)等により構成され得る。撮像部193は、例えば、情報処理装置100とは異なる装置として構成され、当該情報処理装置100を装着したユーザの外観の画像(例えば、静止画像や動画像)を撮像してもよい。そして、撮像部193は、撮像したユーザの画像を、自表情画像制御部103に出力する。
記憶部107は、各種データを一時的または恒常的に記憶するための記憶領域である。記憶部107には、例えば、情報処理装置100の利用者であるユーザに関連付けられた画像が記憶されている。なお、ユーザに関連付けられた画像としては、例えば、当該ユーザの顔が提示された画像が挙げられる。また、他の一例として、ユーザの表情を他のユーザに提示するための媒介として、あらかじめ設定されたキャラクタの画像(特に、キャラクタの顔の画像)が、当該ユーザに関連付けられた画像として記憶されていてもよい。具体的な一例として、ユーザに対してあらかじめ設定されたアバターの画像(特に、アバターの顔の画像)が、当該ユーザに関連付けられた画像として記憶されていてもよい。なお、上述したユーザに関連付けられた画像が、「第1の画像」の一例に相当する。
検出部195は、ユーザの各種状態や状況を検出するため構成であり、例えば、1以上の各種センサ(例えば、図3に示すセンサ195a、195b、…等)を含み得る。検出部195を構成する各種センサとしては、例えば、体温、脈拍、血液成分、発汗、脳波、脳血流、眼電位、筋電等の生体情報を検出する生体情報取得センサが挙げられる。また、他の一例として、検出部195は、音声等の音響を集音する集音部を備え、当該集音部によりユーザが発話する音声を集音することで、集音結果に基づき当該ユーザの声色や声量等を示す情報を取得してもよい。また、検出部195は、集音された音声を解析することで、ユーザの会話の内容を示す情報を取得してもよい。また、検出部195は、ユーザの眼の瞳孔の状態を示す情報や、まばたきの状態を示す情報等を取得してもよい。この場合には、例えば、検出部195は、所謂カメラ等の撮像部を備え、当該撮像部によりユーザの眼の画像を撮像し、当該画像の撮像結果を解析することで、瞳孔の状態を示す情報や、まばたきの状態を示す情報を取得してもよい。また、撮像部によりユーザの眼の画像の撮像結果に基づき、ユーザが涙を流しているか否かを検出することも可能である。
以上のようにして、検出部195は、ユーザの各種状態や状況を検出し、検出結果を示す情報を自表情推定部101に出力する。
自表情推定部101は、検出部195からユーザの各種状態や状況の検出結果を示す情報を取得し、取得した当該情報に基づき、ユーザの表情や感情(以降では、これらを総じて単に「表情」と称する)を推定する。具体的には、自表情推定部101は、喜怒哀楽等のようなあらかじめ設定された表情の種類Eと、当該表情の度合いを示す表情レベルELmrとを推定する。なお、本説明では、表情の種類Eとして、「喜び(E)」、「悲しみ(E)」、「怒り(E)」、「驚き(E)」、「不安(E)」、「嫌悪(E)」が設定されているものとして説明する。また、生体情報等のような各種状態や状況の検出結果を利用することで、表情の種類や表情レベルを推定する手法としては、既存の技術を利用することが可能であるため、当該推定の手法については詳細な説明を省略する。
そして、自表情推定部101は、表情の種類E及び表情レベルELmrの推定結果を示す情報を、自表情画像制御部103に出力する。
ゲイン演算部117は、ユーザの表情の推定結果に応じて、当該ユーザに関連付けられた画像(例えば、ユーザの顔の画像)に対して適用する画像処理の適用量を制御するためのゲインを、所定の条件に基づき決定する。具体的な一例として、ゲイン演算部117は、入力部197を介したユーザからの指定(即ち、ユーザ入力)に基づき、当該ゲインを決定してもよい。また、ゲイン演算部117は、表情の種類Eごとに個別にゲインを決定してもよい。
なお、詳細は後述するが、当該ゲインとしては、自表情画像制御部103により実行される画像処理に適用されるゲインGmと、他表情画像制御部115により実行される画像処理に適用されるゲインGoと、が設定される。具体的には、ゲインGmは、情報処理装置100を利用するユーザに関連付けられた画像に対する画像処理の適用量を制御するためのゲインである。また、ゲインGoは、他の情報処理装置100から送信される他のユーザに関連付けられた画像に対する画像処理の適用量を制御するためのゲインである。なお、以降の説明では、情報処理装置100を利用するユーザを「自ユーザ」とも称し、当該自ユーザに関連付けられた画像を「自ユーザ画像」とも称する。また、他の情報処理装置100を利用する他のユーザを「他ユーザ」とも称し、当該他ユーザに関連付けられた画像を「他ユーザ画像」とも称する。また、自表情画像制御部103により実行される画像処理に適用されるゲインGmを、「自映像に対するゲインGm」とも称する。また、他表情画像制御部115により実行される画像処理に適用されるゲインGoを、「他映像に対するゲインGo」とも称する。
例えば、図4は、表情の種類に応じて適用されるゲインの設定の一例を示した図である。図4に示す例では、「喜び(E)」、「悲しみ(E)」、「怒り(E)」、「驚き(E)」、「不安(E)」、及び「嫌悪(E)」のそれぞれに対して、自映像に対するゲインGmと、他映像に対するゲインGoと、が設定されている。
そして、ゲイン演算部117は、所定の条件に応じて決定した自映像に対するゲインGmを示す情報を、自表情画像制御部103に出力する。また、ゲイン演算部117は、所定の条件に応じて決定した他映像に対するゲインGoを示す情報を、他表情画像制御部115に出力する。
自表情画像制御部103は、自ユーザの表情の推定結果が反映された当該自ユーザの画像を生成するための構成である。
具体的には、自表情画像制御部103は、自表情推定部101から自ユーザの表情の推定結果を示す情報(即ち、表情の種類E及び表情レベルELmrの推定結果を示す情報)を取得する。また、自表情画像制御部103は、記憶部107にあらかじめ記憶された当該ユーザに関連付けられた画像(即ち、自ユーザ画像)を、当該記憶部107から読み出す。また、自表情画像制御部103は、ゲイン演算部117から、自映像に対するゲインGmを示す情報(特に、表情の種類Eの推定結果に対応するゲインGmを示す情報)を取得する。そして、自表情画像制御部103は、取得した自映像に対するゲインGmを示す情報に基づき、表情レベルELmrを調整する。例えば、調整後の表情レベルをELmaとした場合に、当該調整後の表情レベルELmaは、以下に(式1)として示す計算式により算出される。
Figure 2018135057
次いで、自表情画像制御部103は、記憶部107から読み出した自ユーザ画像に対して、表情の種類Eの推定結果に応じた画像処理を、調整後の表情レベルELmaに応じた適用量で適用することにより、自ユーザの表情の推定結果が反映された自ユーザ画像を生成する。なお、自ユーザの表情の推定結果が反映された自ユーザ画像が、「第3の画像」の一例に相当する。
また、自表情画像制御部103は、撮像部193により撮像された自ユーザの外観の画像(即ち、情報処理装置100を装着した自ユーザの画像)を、当該撮像部193から取得する。自表情画像制御部103は、取得した当該画像に対して画像解析を施すことで、当該画像中における自ユーザの顔の位置や向きを推定し、推定結果に応じて、当該画像に対して自ユーザの表情の推定結果が反映された自ユーザ画像(例えば、顔画像)を合成する。これにより、自ユーザの表情の推定結果が反映された、当該自ユーザの外観の画像が生成される。なお、以降では、当該自ユーザ画像が合成された自ユーザの外観の画像を「自映像」とも称する。そして、自表情画像制御部103は、生成した自映像のデータを圧縮処理部105に出力する。
圧縮処理部105は、自表情画像制御部103から生成された自映像のデータを取得し、取得した当該自映像のデータに対して、所定のフォーマットに基づく圧縮処理(エンコード処理)を施す。また、圧縮処理部105は、自映像のデータに対して、例えば、所定の規格に応じた符号化処理や暗号化処理等を施してもよい。そして、圧縮処理部105は、圧縮処理が施された自映像のデータを、所定のネットワークを介して他の装置(例えば、他の情報処理装置100やサーバ800等)に送信する。
伸張処理部111は、他の情報処理装置100により生成された他のユーザの外観の映像(以降では、「他映像」とも称する)のデータを、所定のネットワークを介して他の装置(例えば、当該他の情報処理装置100やサーバ800等)から取得する。伸張処理部111は、取得した他映像のデータに対して、所定のフォーマットに基づく伸張処理(デコード処理)を施すことで他映像を復元する。また、このとき伸張処理部111は、取得した当該データに対して所定の規格に応じた符号化処理や暗号化処理が施されている場合には、当該規格に応じた復調処理や復号処理を施すことで他映像を復元してもよい。そして、伸張処理部111は、復元した他映像のデータを、他表情推定部113に出力する。
他表情推定部113は、伸張処理部111から他映像のデータを取得する。他表情推定部113は、取得した当該他映像に対して画像解析処理を施すことで、他映像中における他ユーザの顔の位置や向きを推定し、推定結果に基づき当該他映像から当該他ユーザの顔画像(即ち、他ユーザ画像)を抽出する。なお、抽出された他ユーザ画像は、対応する他ユーザが利用する他の情報処理装置100において、当該他ユーザの表情の推定結果に応じて生成された他ユーザの顔画像に相当する。
また、他表情推定部113は、抽出した他ユーザ画像に対して画像解析処理を施すことで、他ユーザの表情を推定する。具体的には、他表情推定部113は、他ユーザの表情の種類Eと、当該表情の度合いを示す表情レベルELorとを推定する。なお、画像解析に基づき表情の種類や表情レベルを推定する手法としては、既存の技術を利用することが可能であるため、当該推定の手法については詳細な説明は省略する。
そして、他表情推定部113は、他の装置からネットワークを介して取得した他映像と、当該他映像に対応する他ユーザの表情の種類E及び当該表情レベルELorの推定結果を示す情報と、を他表情画像制御部115に出力する。
他表情画像制御部115は、他映像に提示された他ユーザの表情を所定の条件に基づき調整することで、自ユーザに提示する他ユーザの画像(即ち、他映像)を生成するための構成である。
他表情画像制御部115は、他の装置から取得された他映像と、当該他映像に対応する他ユーザの表情の種類E及び当該表情レベルELorの推定結果を示す情報と、を他表情推定部113から取得する。また、他表情画像制御部115は、ゲイン演算部117から、他映像に対するゲインGoを示す情報(特に、表情の種類Eの推定結果に対応するゲインGoを示す情報)を取得する。そして、他表情画像制御部115は、取得した他映像に対するゲインGoを示す情報に基づき、表情レベルELorを調整する。例えば、調整後の表情レベルをELoaとした場合に、当該調整後の表情レベルELoaは、以下に(式2)として示す計算式により算出される。
Figure 2018135057
なお、他の装置から取得された他映像の表情レベルが、自表情画像制御部103により前述した(式1)に基づく推定結果に応じて制御されていることを考慮した場合に、上記(式2)は、以下に(式3)として示す関係式で表すことも可能である。
Figure 2018135057
上記(式3)において、ELmrは、他の情報処理装置100による当該他の情報処理装置100のユーザ(即ち、他ユーザ)の表情レベルの推定結果に相当する。また、ゲインGmは、当該他の情報処理装置100が、表情レベルELmrの推定結果に対して適用したゲインに相当する。即ち、(式3)に示した調整後の表情レベルELoaには、他の情報処理装置100における表情の調整結果が反映されているとも言える。
次いで、他表情画像制御部115は、他映像中の他ユーザの顔画像(例えば、他表情推定部113により抽出された他ユーザ画像)に対して、表情の種類Eの推定結果に応じた画像処理を、調整後の表情レベルELoaに応じた適用量で適用することにより、他ユーザの表情の推定結果が反映された当該他ユーザの画像を生成する。なお、他ユーザの表情の推定結果が反映された当該他ユーザの画像が、「第2の画像」の一例に相当する。
そして、他表情画像制御部115は、他ユーザの表情の推定結果が反映された当該他ユーザの画像を、出力部191を介してユーザに提示する。なお、他表情画像制御部115による出力部191を介して他ユーザの画像の提示に係る制御が、当該自ユーザへの当該画像の提示に関する制御の一例に相当する。
以上のように、本実施形態に係る情報処理システム1では、例えば、ユーザUaが利用する情報処理装置100aは、検出部195による検出結果に基づき当該ユーザUaの表情を推定する。次いで、情報処理装置100aは、ユーザUaに関連付けられた画像に対して表情の推定結果に応じた画像処理を施すことで、当該表情の推定結果が反映されたユーザUaの画像(自映像)を生成する。また、このとき情報処理装置100aは、あらかじめ設定された自映像に対するゲインGmに応じて、当該自ユーザ画像に対する画像処理の適用量を制御してもよい。このような制御により、例えば、ユーザUaが、オーバーリアクションを取りづらい場合においても、ゲインGmの設定を調整することで、当該ユーザUaが意図する表情や感情が模擬された画像を生成することが可能となる。
また、本実施形態に係る情報処理システム1では、情報処理装置100bは、自身を利用するユーザUbに対して、情報処理装置100aから送信されたユーザUaの画像を提示する場合に、当該画像中のユーザUaの表情を制御してもよい。具体的には、情報処理装置100bは、情報処理装置100aから送信されたユーザUaの画像(他映像)を解析することで当該ユーザUaの表情を推定する。次いで、情報処理装置100bは、情報処理装置100aから送信された他映像に対して、表情の推定結果に応じた画像処理を施し、当該表情の推定結果に応じて他映像中のユーザUaの表情を調整することで、ユーザUbに提示するユーザUaの画像を生成する。また、このとき情報処理装置100bは、あらかじめ設定された他映像に対するゲインGomに応じて、当該他映像に対する画像処理の適用量を制御してもよい。このような制御により、例えば、情報処理装置100a側の設定に応じて表情が調整されたユーザUaの画像に対して、情報処理装置100b側の設定に応じて改めて表情を調整したうえで、当該調整後のユーザUaの画像がユーザUbに提示される。
ここで、図5を参照して、本実施形態に係る情報処理システム1における、ユーザの表情の推定結果が反映された画像の生成に係る制御について、より具体的な一例を挙げて説明する。図5は、本実施形態に係る情報処理システム1による制御の一例について説明するための説明図である。なお、本説明では、情報処理装置100aを利用するユーザUaの表情の推定結果が反映された当該ユーザUaの画像(顔画像)を、情報処理装置100bを利用するユーザUbに提示する場合に着目して説明する。
図5において、参照符号V0は、ユーザUaに関連付けられた画像(例えば、ユーザUaの顔画像)の一例を示している。即ち、顔画像V0に対して、ユーザUaの表情の推定結果に応じた画像処理が施されることで、当該表情の推定結果が反映されたユーザUaの顔画像が生成される。
例えば、ユーザUaが「喜び(E)」の表情を示していたものとする。この場合には、情報処理装置100aは、検出部195による検出結果に基づき、ユーザUaの表情の種類Eと、当該表情の表情レベルELmrとを推定する。また、情報処理装置100aは、表情の種類Eの推定結果に応じた自映像に対するゲインGmに基づき、表情レベルELmrを調整することで、調整後の表情レベルELmaを算出する。次いで、情報処理装置100aは、顔画像V0に対して、推定した表情の種類Eに応じた画像処理を、調整後の表情レベルELmaに応じた適用量で適用することにより、「喜び(E )」の表情の推定結果が反映されたユーザUaの顔画像V11を生成する。そして、情報処理装置100aは、生成したユーザUaの顔画像V11が反映された当該ユーザUaの外観の画像を、所定のネットワークを介して情報処理装置100bに送信する。
また、情報処理装置100bは、情報処理装置100aから送信された、顔画像V11が反映されたユーザUaの外観の画像を、所定のネットワークを介して取得する。情報処理装置100bは、取得した当該画像を解析することで、ユーザUaの表情の種類Eと、当該表情の表情レベルELorとを推定する。また、情報処理装置100bは、表情の種類Eの推定結果に応じた他映像に対するゲインGoに基づき、表情レベルELorを調整することで、調整後の表情レベルELoaを算出する。次いで、情報処理装置100aは、取得したユーザUaの外観の画像中における顔画像V11に対して、推定した表情の種類Eに応じた画像処理を、調整後の表情レベルELoaに応じた適用量で適用することにより、「喜び(E)」の表情の推定結果に応じて調整されたユーザUaの顔画像V13を生成する。そして、情報処理装置100bは、表情が調整された顔画像V13が提示されたユーザUaの外観の画像を、出力部191を介してユーザUbに提示する。
また、他の一例として、参照符号V21は、ユーザUaが「怒り(E)」の表情を示していた場合において、情報処理装置100aにより生成される当該ユーザUaの顔画像の一例を示している。この場合には、顔画像V0に対して、情報処理装置100aにより推定されたユーザUaの表情の種類E及び当該表情の表情レベルELmrと、当該表情の種類Eに応じた自映像に対するゲインGmと基づく画像処理が施されることで、顔画像V21が生成される。
また、参照符号V23は、顔画像V21に対して、情報処理装置100bにより表情の調整が施されることで生成されるユーザUaの顔画像の一例を示している。この場合には、顔画像V21に対して、情報処理装置100bにより推定されたユーザUaの表情の種類E及び当該表情の表情レベルELorと、当該表情の種類Eに応じた他映像に対するゲインGomと基づく画像処理が施されることで、顔画像V23が生成される。
このような制御により、例えば、図5に示す例では、情報処理装置100bは、ユーザUaの「喜び(E)」の表情が反映された当該ユーザUaの画像を、ユーザUbに対して提示する際に、当該ユーザUaの「喜び(E)」の表情をより強調している。また、他の一例として、情報処理装置100bは、ユーザUaの「怒り(E)」の表情が反映された当該ユーザUaの画像を、ユーザUbに対して提示する際に、当該ユーザUaの「怒り(E)」の表情をより緩和している。このように、本実施形態に係る情報処理システム1に依れば、情報処理装置100bにおいて、ユーザUaの画像をユーザUbに提示する際に、情報処理装置100b側の設定(例えば、ユーザUbにより指定された設定)に応じて、当該ユーザUaの表情を制御することも可能となる。
なお、図3を参照して説明した情報処理装置100の機能構成はあくまで一例であり、上述した情報処理装置100の各機能を実現することが可能であれば、当該情報処理装置100の機能構成は、必ずしも図3に示す例には限定されない。例えば、情報処理装置100の各構成のうち、一部の構成が当該情報処理装置100の外部に設けられていてもよい。具体的な一例として、出力部191、検出部195、入力部197等が、情報処理装置100に対して外付けされていてもよい。また、他の一例として、自表情推定部101、自表情画像制御部103、他表情推定部113、他表情画像制御部115、及びゲイン演算部117による一連の処理の流れが実現されれば、当該各構成のうち一部の構成がサーバ800等のような他の装置に設けられていてもよい。また、上記では、各ユーザの映像が情報処理装置100間で送受信される場合に、当該映像に対して圧縮処理が施される例について説明したが、圧縮処理が施されていない映像が、情報処理装置100間で送受信されてもよい。なお、この場合には、当該映像の圧縮に係る処理や、圧縮された映像の伸張に係る処理が実行されなくてもよいことは言うまでもない。
以上、図3を参照して、本実施形態に係る情報処理装置100の機能構成の一例について説明する
<3.3.処理>
続いて、本実施形態に係る情報処理装置100の一連の処理の流れの一例について説明する。
(自映像の生成及び送信)
まず、図6を参照して、情報処理装置100が自ユーザの表情を推定し、当該推定結果が反映された自映像を、他の装置(例えば、他の情報処理装置100やサーバ800等)に送信する処理について説明する。図6は、本実施形態に係る情報処理装置100の一連の処理の流れの一例を示したフローチャートである。
情報処理装置100(自表情推定部101)は、所定の検出部195からユーザの各種状態や状況の検出結果を示す情報を取得し、取得した当該情報に基づき、ユーザの表情を推定する。具体的な一例として、情報処理装置100は、自ユーザの表情について、表情の種類E及び表情レベルELmrを推定する(S101)。
次いで、情報処理装置100(自表情画像制御部103)は、自ユーザに関連付けられた画像(自ユーザ画像)に対して、推定した表情の種類E及び表情レベルELmrに応じた画像処理を施すことで、自ユーザの表情の推定結果が反映された自ユーザ画像(例えば、顔画像)を生成する。また、このとき情報処理装置100は、あらかじめ設定された自映像に対するゲインGmに応じて、当該自ユーザ画像に対する画像処理の適用量を制御してもよい(S103)。
次いで、情報処理装置100(自表情画像制御部103)は、所定の撮像部193により撮像された自ユーザの外観の画像を取得し、取得した当該画像に対して画像解析を施すことで、当該画像中における自ユーザの顔の位置や向きを推定する。そして、情報処理装置100は、当該推定結果に基づき、自ユーザの外観の画像に対して、自ユーザの表情の推定結果が反映された自ユーザ画像(例えば、顔画像)を合成する。これにより、自ユーザの表情の推定結果が反映された当該自ユーザの外観の画像(即ち、自映像)が生成される(S105)。
そして、情報処理装置100(圧縮処理部105)は、生成した自映像に対して所定のフォーマットに基づく圧縮処理(エンコード処理)を施し、圧縮処理後の当該自映像のデータを、所定のネットワークを介して他の装置(例えば、他の情報処理装置100やサーバ800等)に送信する(S107)。
以上、図6を参照して、情報処理装置100が自ユーザの表情を推定し、当該推定結果が反映された自映像を、他の装置(例えば、他の情報処理装置100やサーバ800等)に送信する処理について説明した。
(他映像の調整及び提示)
続いて、図7を参照して、情報処理装置100が、他の装置(例えば、他の情報処理装置100やサーバ800等)から送信された他映像を、当該他映像中の他ユーザの表情を調整したうえで自ユーザに提示する処理について説明する。図7は、本実施形態に係る情報処理装置100の一連の処理の流れの一例を示したフローチャートである。
情報処理装置100(伸張処理部111)は、他の情報処理装置100により生成された他のユーザの外観の映像(即ち、他映像)のデータを、所定のネットワークを介して他の装置(例えば、当該他の情報処理装置100やサーバ800等)から取得する。情報処理装置100は、取得した他映像のデータに対して、所定のフォーマットに基づく伸張処理(デコード処理)を施すことで他映像を復元する(S201)。
次いで、情報処理装置100(他表情推定部113)は、復元した他映像に対して画像解析処理を施すことで、他映像中における他ユーザの顔の位置や向きを推定し、推定結果に基づき当該他映像から当該他ユーザの顔画像(即ち、他ユーザ画像)を抽出する。また、情報処理装置100は、抽出した他ユーザ画像に対して画像解析処理を施すことで、他ユーザの表情を推定する。具体的な一例として、情報処理装置100は、他ユーザの表情について、表情の種類E及び表情レベルELorを推定する(S203)。
次いで、情報処理装置100(他表情画像制御部115)は、他映像中の他ユーザの顔画像(例えば、抽出した他ユーザ画像)に対して、推定した表情の種類E及び表情レベルELmoに応じた画像処理を施すことで、他ユーザの表情の推定結果が反映された当該他ユーザの画像を生成する(即ち、他ユーザの表情を調整する)。また、このとき情報処理装置100は、あらかじめ設定された他映像に対するゲインGoに応じて、当該他ユーザの顔画像に対する画像処理の適用量を制御してもよい(S205)。
そして、情報処理装置100(他表情画像制御部115)は、他ユーザの表情の推定結果が反映された当該他ユーザの画像を、出力部191を介してユーザに提示する(S207)。
以上、図7を参照して、情報処理装置100が、他の装置(例えば、他の情報処理装置100やサーバ800等)から送信された他映像を、当該他映像中の他ユーザの表情を調整したうえで自ユーザに提示する処理について説明した。
<3.4.変形例>
続いて、本実施形態に係る情報処理システムの変形例について説明する。
(変形例1)
まず、変形例1として、本実施形態に係る情報処理装置の構成の他の一例について説明する。なお、以降の説明では、変形例1に係る情報処理装置を、前述した実施形態に係る情報処理装置と区別するために、「情報処理装置100’」と称する場合がある。
例えば、図8は、変形例1に係る情報処理装置の機能構成の一例を示したブロック図である。なお、変形例1に係る情報処理装置100’は、ゲイン演算部117の動作が、前述した実施形態に係る情報処理装置100と異なる。そこで、本説明では、変形例1に係る情報処理装置100’の構成について、前述した実施形態に係る情報処理装置100と異なる部分に着目して説明し、当該情報処理装置100と実質的に同様の部分については、詳細な説明は省略する。
前述した実施形態に係る情報処理装置100では、ゲイン演算部117は、自映像に対するゲインGmと、他映像に対するゲインGoとを、入力部197を介したユーザ入力に基づき決定していた。これに対して、変形例1に係る情報処理装置100’では、ゲイン演算部117は、所定の状態や状況の検出結果に応じて、上記ゲインGmと上記ゲインGoとを決定してもよい。
例えば、ゲイン演算部117は、検出部195に含まれる各センサのうち少なくとも一部のセンサにより検出された所定の状態または状況に応じて、ゲインGm及びGoを決定してもよい。より具体的な一例として、ゲイン演算部117は、検出部195による検出結果に基づき、ユーザが疲労している状態を認識した場合に、ゲインGm及びGo の振れ幅がより小さくなるように制御してもよい。
また、他の一例として、ゲイン演算部117は、自ユーザの表情の推定結果に応じて、他映像に対するゲインGoを決定してもよい。同様に、ゲイン演算部117は、他ユーザの表情の推定結果に応じて、自映像に対するゲインGmを決定してもよい。また、ゲイン演算部117は、入力部197を介したユーザ入力と、所定の状態や状況の検出結果と、に応じて、ゲインGm及びGoを決定してもよい。具体的な一例として、ゲイン演算部117は、入力部197を介したユーザ入力に応じてゲインGm及びGoの初期値を決定し、所定の状態や状況の検出結果に応じて当該ゲインGm及びGoを当該初期値を基準として動的に制御してもよい。
また、ゲイン演算部117が所定の状態や状況の検出結果に応じて制御するゲインは、表情の種類Eごとに規定されたゲインGm及びGoのうち、一部のゲインであってもよいし、全部のゲインであってもよい。また、ゲイン演算部117は、表情の種類Eごとに規定されたゲインGm及びGoのうち、一部のゲインに対して他のゲインとは異なる制御を適用してもよい。
また、ゲイン演算部117は、所定の設定に応じてゲインGm及びGoを決定してもよい。例えば、文化圏の違いに応じて、表現の差異が生じる場合も想定され得る。このような状況を想定し、ゲイン演算部117は、例えば、文化圏に関する設定に応じて、少なくとも一部の表情や感情の表現がより抑制される(または、より誇張される)ように、ゲインGm及びGoを制御してもよい。所定の設定は、文化圏に加え、人種、性別、年齢および国籍のうち少なくとも1つに関するダイバーシティ情報に基づいて定義されてもよい。
もちろん、ゲイン演算部117は、前述した実施形態に係る情報処理装置100の場合と同様に、入力部197を介したユーザ入力に基づき、上記ゲインGm及びGoを決定してもよいことは言うまでもない。
以上、変形例1として、図8を参照して、本実施形態に係る情報処理装置の構成の他の一例について説明した。
(変形例2)
続いて、変形例2として、本実施形態に係る情報処理システムの構成の他の一例について説明する。なお、以降の説明では、変形例2に係る情報処理装置を、前述した実施形態や他の変形例に係る情報処理装置と区別するために、「情報処理装置200」と称する場合がある。
前述した実施形態に係る情報処理システムでは、各情報処理装置100が、他ユーザの映像(即ち、他映像)に対して画像解析を施すことで、当該他ユーザの表情の推定を行っていた。これに対して、変形例2に係る情報処理システムでは、各情報処理装置200による自ユーザの表情の推定結果をサーバ800側で管理する。このような構成に基づき、変形例2に係る情報処理システムでは、情報処理装置200が、自身で他ユーザの表情の推定を行わなくとも、当該他ユーザの表情の推定結果をサーバ800から取得可能とする。また、変形例2に係る情報処理システムでは、自映像に対するゲインGmと、他映像に対するゲインGoと、の双方をサーバ800側で管理してもよい。そこで、以下に、変形例2に係る情報処理装置200のより詳細な構成の一例について説明する。
例えば、図9は、変形例2に係る情報処理装置200の機能構成の一例を示したブロック図である。図9に示すように、変形例2に係る情報処理装置200は、出力部191と、入力部197と、撮像部193と、検出部195と、通信部199と、自表情推定部201と、自表情画像制御部203と、記憶部207と、他表情画像制御部215と、ゲイン演算部217とを含む。また、情報処理装置200は、圧縮処理部205と、伸張処理部211とを含んでもよい。
なお、出力部191と、入力部197と、撮像部193と、検出部195と、通信部199と、については、前述した実施形態に係る情報処理装置100(図3参照)と同様である。また、自表情推定部201、自表情画像制御部203、記憶部207、他表情画像制御部215、及びゲイン演算部217は、前述した実施形態に係る情報処理装置100における、自表情推定部101、自表情画像制御部103、記憶部107、他表情画像制御部115、及びゲイン演算部117にそれぞれ対応している。そこで、本説明では、変形例2に係る情報処理装置200の機能構成について、前述した実施形態に係る情報処理装置100と異なる部分に着目して説明し、当該情報処理装置100と実質的に同様の部分については、詳細な説明は省略する。
自表情推定部201は、検出部195からユーザの各種状態や状況の検出結果を示す情報を取得し、取得した当該情報に基づき、ユーザの表情を推定する。具体的な一例として、自表情推定部201は、検出部195から取得した情報に基づき、表情の種類E及び表情レベルELmrを推定する。そして、自表情推定部201は、表情の種類E及び表情レベルELmrの推定結果を示す情報を、自表情画像制御部203に出力する。また、自表情推定部201は、当該表情の種類E及び表情レベルELmrの推定結果を示す情報を、所定のネットワークを介してサーバ800に送信する。
ゲイン演算部217は、自映像に対するゲインGmと、他映像に対するゲインGoとを、所定の条件に応じて決定し、決定した当該ゲインGm及びGoを示す情報を、所定のネットワークを介してサーバ800に送信してもよい。これにより、当該ゲインGm及びGoがサーバ800で管理される。また、他の一例として、当該ゲインGm及びGoを示す情報が、各情報処理装置200(ひいては、当該情報処理装置200の利用者であるユーザ)ごとに、サーバ800にあらかじめ管理されていてもよい。
ゲイン演算部217は、サーバ800で管理されたゲインGmを示す情報を、所定のネットワークを介して当該サーバ800から取得し、取得した当該ゲインGmを示す情報を自表情画像制御部203に出力してもよい。同様に、ゲイン演算部217は、サーバ800で管理されたゲインGoを示す情報を、ネットワークを介して当該サーバ800から取得し、取得した当該ゲインGoを示す情報を他表情画像制御部215に出力してもよい。なお、このとき取得されるゲインGm及びGoは、サーバ800により、所定の条件に応じて制御されてもよい。なお、サーバ800によるゲインGm及びGoの制御の一例については、詳細を別途後述する。
自表情画像制御部203は、自ユーザの表情の推定結果が反映された自ユーザの画像(即ち、自映像)を生成するための構成である。なお、自表情画像制御部203による、自映像の生成に係る処理は、前述した実施形態に係る情報処理装置100における自表情画像制御部103と同様である。
即ち、自表情画像制御部203は、記憶部207に記憶された自ユーザ画像に対して、自表情推定部201による表情の種類E及び表情レベルELmrの推定結果と、ゲイン演算部217から出力されるゲインGmとに基づき画像処理を施すことで、自ユーザの表情の推定結果が反映された自ユーザ画像を生成する。また、自表情画像制御部203は、撮像部193により撮像された自ユーザの外観の画像に対して、自ユーザの表情の推定結果が反映された自ユーザ画像を合成することで、自ユーザの表情の推定結果が反映された、当該自ユーザの外観の画像(即ち、自映像)を生成する。そして、自表情画像制御部203は、生成した自映像のデータを圧縮処理部205に出力する。
圧縮処理部205は、前述した実施形態に係る情報処理装置100における圧縮処理部105と実質的に同様である。即ち、圧縮処理部205は、自表情画像制御部203から生成された自映像のデータを取得し、取得した当該自映像のデータに対して、所定のフォーマットに基づく圧縮処理(エンコード処理)を施す。そして、圧縮処理部205は、圧縮処理が施された自映像のデータを、所定のネットワークを介してサーバ800に送信する。なお、サーバ800に送信された当該自映像のデータは、当該サーバ800により、情報処理装置100の通信相手となる他の情報処理装置100に送信される。
伸張処理部211は、他の情報処理装置100により生成された他のユーザの外観の映像(即ち、他映像)のデータと、当該他のユーザの表情の推定結果(即ち、表情の種類E 及び表情レベルELor)を示す情報と、を所定のネットワークを介してサーバ800から取得する。伸張処理部211は、取得した他映像のデータに対して、所定のフォーマットに基づく伸張処理(デコード処理)を施すことで他映像を復元する。そして、伸張処理部211は、復元した他映像のデータと、取得した他のユーザの表情の推定結果を示す情報とを、他表情画像制御部215に出力する。
他表情画像制御部215は、他映像に提示された他ユーザの表情を所定の条件に基づき調整することで、自ユーザに提示する他ユーザの画像を生成するための構成である。なお、他表情画像制御部215による、自ユーザに提示する他ユーザの画像の生成に係る処理は、前述した実施形態に係る情報処理装置100における他表情画像制御部115と同様である。
即ち、他表情画像制御部215は、サーバ800から取得された他映像に対して、当該サーバ800から取得された他ユーザの表情の推定結果(即ち、表情の種類E及び当該表情レベルELorの推定結果)と、ゲイン演算部217から出力されるゲインGoを示す情報と、に基づき画像処理を施す。これにより、他ユーザの表情の推定結果が反映された当該他ユーザの画像(換言すると、他ユーザの表情が調整された画像)が生成される。そして、他表情画像制御部215は、他ユーザの表情の推定結果が反映された当該他ユーザの画像を、出力部191を介してユーザに提示する。
続いて、図10を参照して、変形例2に係る情報処理システムにおける、サーバ800によるゲインGm及びGoの制御の一例について説明する。図10は、変形例2に係る情報処理システムにおけるゲイン制御の一例について説明するための説明図である。
図10に示す例では、各ユーザに役割が設定されており、サーバ800は、各ユーザに設定された役割に応じて、当該ユーザについて表情の種類Eごとに設定されたゲインGm及びGoのうち少なくとも一部のゲインを制御する。具体的には、図10に示す例では、ユーザUaに対して「教師」の役割が設定されており、ユーザUbに対して「生徒」の役割が設定されている。このような構成の基で、サーバ800は、ユーザに設定された役割に応じて、当該ユーザに対応するゲインを制御してもよい。
より具体的な一例として、「教師」の役割を担うユーザUaが、「生徒」の役割が設定されたユーザUbの表情を確認する場合に、当該ユーザUbの感情の推定結果がより忠実に反映された状態(即ち、ゲインにより誇張されていない状態)で、当該ユーザUbの表情が確認できた方が望ましい場合が想定され得る。また、「教師」の役割を担うユーザUaの表情が、「生徒」の役割が設定されたユーザUbに対して提示される場合に、当該ユーザUaの感情の推定結果がより忠実に反映された状態(即ち、ゲインにより誇張されていない状態)で、当該ユーザUaの表情が提示された方が望ましい場合も想定され得る。このような状況を鑑み、サーバ800が、各ユーザに設定された役割に応じて、各ユーザについて設定されたゲインGm及びGoそれぞれを制御してもよい。
例えば、図10に示す例では、ユーザUbの利用する情報処理装置200bにおいて、ユーザUaの画像がユーザUbに対して提示される場合に、当該ユーザUaの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制限されるように、ユーザUbに対応するゲインGoが、サーバ800により制御されている(即ち、リミッタ(上限値および/または下限値)が設けられている)。例えば、ユーザUaが利用する情報処理装置200aにおいて、当該ユーザUaの画像に適用されるゲインGmのうち、「怒り(E)」に対応するゲインGmは「1.2」に設定されている。即ち、当該ゲインGm は、「怒り」の表情がより誇張されるように設定されている。そのため、ユーザUbが利用する情報処理装置200bにおいて、ユーザUaの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制御されるように(即ち、0.8≦Gm×Go≦1.1となるように)、ユーザUbに対応するゲインの設定におけるゲインGoのうち、「怒り(E)」に対応するゲインGoが「0.92」に設定されている。
同様に、図10に示す例では、ユーザUaの利用する情報処理装置200aにおいて、ユーザUbの画像がユーザUaに対して提示される場合に、当該ユーザUbの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制限されるように、ユーザUaに対応するゲインGoが、サーバ800により制御されている。例えば、ユーザUbが利用する情報処理装置200bにおいて、当該ユーザUbの画像に適用されるゲインGmのうち、「嫌悪(E)」に対応するゲインGmは「0.2」に設定されている。即ち、当該ゲインGmは、「嫌悪」の表情がより表現されにくくなるように設定されている。そのため、ユーザUaが利用する情報処理装置200aにおいて、ユーザUbの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制御されるように(即ち、0.8≦Gm×Go≦1.1となるように)、ユーザUaに対応するゲインの設定におけるゲインGoのうち、「嫌悪(E)」に対応するゲインGoが「4.0」に制御されている。
また、サーバ800は、各ユーザについて表情の種類Eごとに設定されたゲインGm 及びGoのうち少なくとも一部のゲインの設定を無効化してもよい。この場合には、サーバ800は、対応するゲインを「1.0」に設定すればよい。
また、上述したサーバ800によるゲインの制御に係る機能は、所定の条件(例えば、管理者による操作)に応じて有効化及び無効化が選択的に制御されてもよい。また、上述したサーバ800によるゲインの制御のうち、少なくとも一部の制御に関する設定が、所定の条件に応じて変更されてもよい。
なお、上記に説明した変形例2に係る情報処理システムの構成はあくまで一例であり、上述した情報処理装置200及びサーバ800の各機能が実現されれば、当該情報処理装置200及びサーバ800の構成は必ずしも上述した例のみには限定されない。例えば、情報処理装置200の各構成のうち、少なくとも一部の構成がサーバ800側に設けられていてもよい。
具体的な一例として、自表情推定部201に相当する構成が、サーバ800に設けられていてもよい。この場合には、情報処理装置200は、検出部195による検出結果を示す情報をサーバ800に送信すればよい。また、当該サーバ800は、情報処理装置200から送信される情報に基づき、当該情報処理装置200を利用するユーザの表情を推定すればよい。また、このときサーバ800は、図8を参照して説明した例と同様に、情報処理装置200から送信される情報(即ち、検出部195による検出結果を示す情報)に基づき、当該情報処理装置200のユーザに対応するゲインGm及びGoを決定してもよい。
また、自表情画像制御部203に相当する構成が、サーバ800に設けられていてもよく、当該情報処理装置200を利用するユーザに関連付けられた画像(即ち、自ユーザ画像)が当該サーバ800側に保持されていてもよい。この場合には、情報処理装置200は、撮像部193により撮像されたユーザの外観の画像をサーバ800に送信すればよい。また、当該サーバ800は、ユーザの表情の推定結果に応じて当該ユーザの表情が反映された顔画像を生成し、情報処理装置200から送信される画像に当該顔画像を合成することで、当該ユーザの表情が反映された画像(即ち、自映像に相当する画像)を生成すればよい。
同様に、他表情画像制御部215に相当する構成が、サーバ800に設けられていてもよい。この場合には、サーバ800は、送信元となる情報処理装置200のユーザに対応する自映像中の当該ユーザの表情を、送信先となる他の情報処理装置200に対応するゲインGoに応じて調整し、調整後の画像を当該他の情報処理装置200に送信すればよい。なお、この場合には、サーバ800から他の情報処理装置200への当該調整後の画像の送信に係る制御が、当該サーバ800における、当該他の情報処理装置200のユーザへの当該調整後の画像の提示に関する制御の一例に相当する。また、当該他の情報処理装置200は、サーバ800から送信される画像(即ち、調整後の他映像に相当する画像)を、出力部191を介して自ユーザに提示すればよい。この場合には、他の情報処理装置200による出力部191を介して画像の提示に係る制御が、当該他の情報処理装置200における、当該自ユーザへの当該画像の提示に関する制御の一例に相当する。
また、上記では、情報処理装置200に対して、他ユーザの画像(即ち、他映像)として、送信元となる他の情報処理装置200側に対応するゲインGmに応じた画像処理が施された画像が送信される例について説明した。一方で、当該ゲインGmに応じた画像処理が、送信先となる情報処理装置200側で実行されてもよい。この場合には、例えば、送信元となる他の情報処理装置200のユーザ(即ち、他ユーザ)に関連付けられた画像(即ち、他ユーザ画像)、当該他ユーザの表情の推定結果、及び当該他ユーザに対応するゲインGmを示す情報が、送信先となる情報処理装置200に送信されればよい。なお、このような構成とすることで、送信先となる情報処理装置200は、他ユーザの表情の推定結果が反映されていない他映像を、容易に再現することも可能となる。
以上、変形例2として、図9及び図10を参照して、本実施形態に係る情報処理システムの構成の他の一例について説明した。
(変形例3)
続いて、変形例3として、本実施形態に係る情報処理システムの構成の他の一例について説明する。変形例3では、3人以上のユーザそれぞれが相互にコミュニケーションをとる場合における、情報処理システムの構成の一例について説明する。なお、以降の説明では、変形例3に係る情報処理装置を、前述した実施形態や他の変形例に係る情報処理装置と区別するために、「情報処理装置300」と称する場合がある。また、本説明では、変形例3に係る情報処理システムは、変形例2に係る情報処理システムと同様に、各情報処理装置300による自ユーザの表情の推定結果を、サーバ800側で管理するように構成されているものとする。
例えば、図11は、変形例3に係る情報処理装置300の機能構成の一例を示したブロック図である。図11に示すように、変形例3に係る情報処理装置300は、出力部191と、入力部197と、撮像部193と、検出部195と、通信部199と、自表情推定部301と、自表情画像制御部303と、記憶部307と、複数の他表情画像制御部315と、ゲイン演算部217とを含む。例えば、図11に示す例では、情報処理装置300は、複数の他表情画像制御部315として、他表情画像制御部315a及び315bとを含んでいる。また、情報処理装置300は、圧縮処理部305と、複数の伸張処理部311とを含んでもよい。例えば、図11に示す例では、情報処理装置300は、複数の伸張処理部311として、伸張処理部311a及び311bとを含んでいる。
なお、出力部191と、入力部197と、撮像部193と、検出部195と、通信部199と、については、前述した実施形態に係る情報処理装置100(図3参照)と同様である。また、自表情推定部301、自表情画像制御部303、記憶部307、及び圧縮処理部305については、前述した変形例2に係る情報処理装置200における、自表情推定部201、自表情画像制御部203、記憶部207、及び圧縮処理部205と実質的に同様である。そこで、本説明では、変形例3に係る情報処理装置300の機能構成について、前述した変形例2に係る情報処理装置200と異なる部分に着目して説明し、当該情報処理装置200と実質的に同様の部分については、詳細な説明は省略する。
また、本説明では、変形例3に係る情報処理装置300の特徴をよりわかりやすくするために、必要に応じて、ユーザUa〜Ucそれぞれが利用する情報処理装置300a〜300c間において、各ユーザの映像が送受信される場合の例に着目して説明する。
変形例3に係る情報処理装置300では、互いに異なる他の情報処理装置300それぞれから送信された当該他の情報処理装置300を利用するユーザの画像(即ち、他映像)を、当該ユーザに対応する設定(例えば、ゲインGo等)に応じて個別に調整する。
具体的な一例として、ユーザUcが利用する情報処理装置300cが、情報処理装置300a及び300bから送信されたユーザUa及びUbに対応する他映像に対して、当該他映像中の当該ユーザの表情の調整を施し、調整後の他映像をユーザUcに提示するものとする。この場合には、例えば、伸張処理部311a及び他表情画像制御部315aが、ユーザUaに対応する他映像を処理対象とし、伸張処理部311b及び他表情画像制御部315bが、ユーザUbに対応する他映像を処理対象とする。
また、ゲイン演算部317は、サーバ800で管理されたユーザUaに対応するゲインGoを示す情報を、所定のネットワークを介して当該サーバ800から取得し、取得した当該ゲインGoを示す情報を他表情画像制御部315aに出力する。また、ゲイン演算部317は、サーバ800で管理されたユーザUbに対応するゲインGoを示す情報を、所定のネットワークを介して当該サーバ800から取得し、取得した当該ゲインGo を示す情報を他表情画像制御部315bに出力する。
伸張処理部311aは、情報処理装置300aにより生成されたユーザUaの外観の映像(即ち、ユーザUaに対応する他映像)のデータと、当該ユーザUaの表情の推定結果(即ち、表情の種類E及び当該表情レベルELorの推定結果)を示す情報と、を所定のネットワークを介してサーバ800から取得する。伸張処理部311aは、取得したユーザUaに対応する他映像のデータに対して、所定のフォーマットに基づく伸張処理(デコード処理)を施すことでユーザUaに対応する他映像を復元する。そして、伸張処理部311aは、復元したユーザUaに対応する他映像のデータと、取得したユーザUaのユーザの表情の推定結果を示す情報とを、他表情画像制御部315aに出力する。
他表情画像制御部315aは、ユーザUaに対応する他映像のデータと、当該ユーザUaの表情の推定結果を示す情報とを、伸張処理部311aから取得する。また、他表情画像制御部315aは、ユーザUaに対応するゲインGoを示す情報を、ゲイン演算部317から取得する。次いで、他表情画像制御部315aは、ユーザUaに対応する他映像に対して、当該ユーザUaの表情の推定結果を示す情報と、当該ユーザUaに対応するゲインGoを示す情報と、に基づき画像処理を施すことで、ユーザUaの表情の推定結果が反映された当該ユーザUaの画像(換言すると、ユーザUaの表情が調整された画像)を生成する。そして、他表情画像制御部315aは、生成したユーザUaの画像、即ち、ユーザUaの表情の推定結果が反映された当該ユーザUaの外観の画像を、画像合成部319に出力する。
また、伸張処理部311bは、情報処理装置300bにより生成されたユーザUbの外観の映像(即ち、ユーザUbに対応する他映像)のデータと、当該ユーザUbの表情の推定結果(即ち、表情の種類E及び当該表情レベルELorの推定結果)を示す情報と、を所定のネットワークを介してサーバ800から取得する。伸張処理部311bは、取得したユーザUbに対応する他映像のデータに対して、所定のフォーマットに基づく伸張処理(デコード処理)を施すことでユーザUbに対応する他映像を復元する。そして、伸張処理部311bは、復元したユーザUbに対応する他映像のデータと、取得したユーザUaのユーザの表情の推定結果を示す情報とを、他表情画像制御部315bに出力する。
他表情画像制御部315bは、ユーザUbに対応する他映像のデータと、当該ユーザUbの表情の推定結果を示す情報とを、伸張処理部311bから取得する。また、他表情画像制御部315bは、ユーザUbに対応するゲインGoを示す情報を、ゲイン演算部317から取得する。次いで、他表情画像制御部315bは、ユーザUbに対応する他映像に対して、当該ユーザUbの表情の推定結果を示す情報と、当該ユーザUbに対応するゲインGoを示す情報と、に基づき画像処理を施すことで、ユーザUbの表情の推定結果が反映された当該ユーザUbの画像(換言すると、ユーザUbの表情が調整された画像)を生成する。そして、他表情画像制御部315bは、生成したユーザUbの画像、即ち、ユーザUbの表情の推定結果が反映された当該ユーザUbの外観の画像を、画像合成部319に出力する。
画像合成部319は、他表情画像制御部315aから、ユーザUaの表情の推定結果が反映された当該ユーザUaの外観の画像を取得する。また、画像合成部319は、他表情画像制御部315bから、ユーザUbの表情の推定結果が反映された当該ユーザUbの外観の画像を取得する。次いで、画像合成部319は、取得したユーザUa及びUbの外観の画像それぞれを、所定の条件に基づき合成することで、ユーザUa及びUbそれぞれの外観が提示され、かつ当該ユーザUa及びUbそれぞれの表情の推定結果が反映された画像を生成する。そして、画像合成部319は、生成した画像、即ち、ユーザUa及びUbそれぞれの外観が提示された画像を、出力部191を介して自ユーザ(即ち、ユーザUc)に提示する。
なお、画像合成部319による、取得された各他ユーザの画像の合成方法は、変形例3に係る情報処理システムの利用シーンに応じて適宜設定されてもよい。例えば、仮想空間内におけるユーザUa〜Uc間のコミュニケーションを想定した場合には、画像合成部319は、仮想空間内におけるユーザUa〜Ucの位置関係に応じて、ユーザUa及びUbそれぞれの画像を仮想空間内の画像に合成することで、ユーザUcに提示する画像を生成してもよい。
また、図11は、あくまで情報処理装置300の論理的な機能構成を示したものであり、必ずしも情報処理装置300の物理的なハードウェア構成を限定するものではない。具体的には、伸張処理部311a及び他表情画像制御部315aと、伸張処理部311b及び他表情画像制御部315bと、のそれぞれについて、ICやプロセッサ等のような各種演算を行うデバイスが個別に設けられていなくてもよい。例えば、1つのプロセッサにより、伸張処理部311a及び他表情画像制御部315aによる処理と、伸張処理部311b及び他表情画像制御部315bによる処理とが実行されてもよい。
また、伸張処理部311a及び311bと、他表情画像制御部315a及び315bと、のそれぞれの論理的な構成についても限定されない。例えば、伸張処理部311a及び311bを1つの伸張処理部311として構成し、当該伸張処理部311が、複数のユーザに対応する他映像のデータそれぞれに対して伸張処理(デコード処理)を施すで、各ユーザに対応する他映像を個別に復元してもよい。同様に、他表情画像制御部315a及び315bとを1つの他表情画像制御部315として構成し、当該他表情画像制御部315が、各ユーザに対応する他映像に対して上述した画像処理を施すことで、当該ユーザの表情の推定結果が反映された画像を個別に生成してもよい。また、コミュニケーションの対象となるユーザの数に応じて、伸張処理部311及び他表情画像制御部315それぞれに相当する構成が、適宜追加で設けられてもよい。
続いて、図12を参照して、変形例3に係る情報処理システムにおける、サーバ800によるゲインGm及びGoの制御の一例について説明する。図12は、変形例3に係る情報処理システムにおけるゲイン制御の一例について説明するための説明図である。
図12に示す例では、図10を参照して前述した例と同様に、各ユーザに役割が設定されており、サーバ800は、各ユーザに設定された役割に応じて、当該ユーザについて表情の種類Eごとに設定されたゲインGm及びGoのうち少なくとも一部のゲインを制御する。より具体的には、図12に示す例では、ユーザUaに対して「教師」の役割が設定されており、ユーザUb及びUcそれぞれに対して「生徒」の役割が設定されている。このような構成の基で、サーバ800は、ユーザに設定された役割に応じて、当該ユーザに対応するゲインを制御してもよい。
なお、図12に示すように、3人以上のユーザ間におけるコミュニケーションを想定した場合には、例えば、他映像に対するゲインGoは、コミュニケーションの相手となり得るユーザごとに個別に設定されてもよい。具体的な一例として、ユーザUaに対応する設定の場合には、ユーザUbに対応するゲインGoと、ユーザUcに対応するゲインGoと、が個別に設定されていてもよい。これは、ユーザUb及びUcそれぞれに対応する設定についても同様である。
また、図10を参照して前述した例と同様に、コミュニケーションを行うユーザそれぞれの役割に応じて、当該ユーザそれぞれの画像に対して最終的に適用されるゲインが所定の範囲内に制限されるように、当該ユーザに対応するゲインGm及びGoが制御されてもよい。具体的な一例として、図12に示す例では、「教師」の役割を担うユーザUaと、「生徒」の役割を担うユーザUb及びUcのそれぞれと、の間においては、各ユーザの画像に対して適用される最終的に適用されるゲインが、0.8〜1.1の範囲に制限されるように、各ユーザに対応するゲインGoが制御されている。
例えば、ユーザUaが利用する情報処理装置200aにおいて、当該ユーザUaの画像に適用されるゲインGmのうち、「怒り(E)」に対応するゲインGmは「1.2」に設定されている。即ち、当該ゲインGmは、「怒り」の表情がより誇張されるように設定されている。そのため、ユーザUbが利用する情報処理装置200bにおいて、ユーザUaの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制御されるように(即ち、0.8≦Gm×Go≦1.1となるように)、ユーザUbに対応するゲインの設定において、ユーザUaに対して設定されたゲインGoのうち、「怒り(E )」に対応するゲインGoが「0.92」に設定されている。
また、他の一例として、ユーザUbが利用する情報処理装置200bにおいて、当該ユーザUbの画像に適用されるゲインGmのうち、「嫌悪(E)」に対応するゲインGmは「0.2」に設定されている。即ち、当該ゲインGmは、「嫌悪」の表情がより表現されにくくなるように設定されている。そのため、ユーザUaが利用する情報処理装置200aにおいて、ユーザUbの画像に対して最終的に適用されるゲインが0.8〜1.1の範囲に制御されるように(即ち、0.8≦Gm×Go≦1.1となるように)、ユーザUaに対応するゲインの設定における、ユーザUbに対して設定されたゲインGoのうち、「嫌悪(E)」に対応するゲインGoが「4.0」に制御されている。
一方で、「生徒」の役割を担うユーザUb及びUc間においては、上述したゲインの制御が行われなくてもよい。例えば、図12に示す例では、ユーザUbに対応するゲインの設定において、ユーザUcに対して設定されたゲインGoについては、サーバ800によるゲインの制御が行われず、ユーザUbにより事前に設定された値がそのまま適用されてもよい。これは、ユーザUcに対応するゲインの設定における、ユーザUbに対して設定されたゲインGoについても同様である。
なお、上記はあくまで一例であり、必ずしもサーバ800によるゲインの制御を限定するものではない。例えば、サーバ800は、上述した各ユーザに設定された役割に応じた制御に限らず、ユーザごとに個別にゲインを制御してもよい。具体的な一例として、サーバ800は、ユーザUa及びUb間のコミュニケーションと、ユーザUa及びUc間のコミュニケーションとで、ゲイン制御の内容を選択的に変更してもよい。
また、上記に説明した変形例3に係る情報処理システムの構成はあくまで一例であり、上述した情報処理装置200及びサーバ800の各機能が実現されれば、当該情報処理装置200及びサーバ800の構成は必ずしも上述した例のみには限定されない。
以上、変形例3として、図11及び図12を参照して、本実施形態に係る情報処理システムの構成の他の一例について説明した。
(変形例4)
続いて、変形例4として、本実施形態に係る情報処理システムのシステム構成の一例について説明する。
本実施形態に係る情報処理システムは、複数の情報処理装置100が所定のネットワークを介して互いに情報(例えば、各ユーザの画像)を送受信することが可能であれば、システム構成は特に限定されない。例えば、図13は、変形例4に係る情報処理システムの構成の一例を示した図である。図13に示す例では、複数の情報処理装置100(例えば、情報処理装置100a〜100d)のそれぞれが、サーバ800等の他の装置を介さずに、他の情報処理装置100それぞれとの間でネットワークを構築している。より具体的な一例として、複数の情報処理装置100が、所謂アドホックネットワークを構築している場合が挙げられる。
この場合には、各情報処理装置100が、図3を参照して説明した例と同様に、自ユーザの表情の推定及び当該自ユーザの表情の調整と、他ユーザの表情の推定及び当該他ユーザの表情の調整と、を個別に実行してもよい。
また、他の一例として、各情報処理装置100が、他の情報処理装置100に対して、自ユーザの画像(即ち、自映像)に加えて当該自ユーザの表情の推定結果を送信してもよい。この場合には、図9を参照して説明した例と同様に、各情報処理装置100は、他の情報処理装置100から送信される当該他の情報処理装置100のユーザ(即ち、他ユーザ)の表情の推定結果を、当該他ユーザの画像(即ち、他映像)の調整に利用してもよい。また、送信元となる情報処理装置100のユーザの表情の調整が、送信先となる他の情報処理装置100側で一括して実行されてもよい。この場合には、例えば、送信元となる情報処理装置100から、当該情報処理装置100のユーザに関連付けられた画像(即ち、画像処理が施される前の画像)が、当該ユーザの表情の推定結果や、当該ユーザに対応するゲインGmを示す情報とともに、送信先となる他の情報処理装置100に送信されてもよい。
また、他の一例として、複数の情報処理装置100のうち、少なくとも1以上の情報処理装置100が、図9を参照して説明した例におけるサーバ800の役割を担ってもよい。また、複数の情報処理装置100による分散処理により、図9を参照して説明した例におけるサーバ800の機能が実現されてもよい。
もちろん、上述した例はあくまで一例であり、前述した実施形態や各種変形例に係る情報処理システムの各機能が実現されれば、その構成は特に限定されない。
以上、変形例4として、図13を参照して、本実施形態に係る情報処理システムのシステム構成の一例について説明した。
<<4.ハードウェア構成の一例>>
続いて、図14を参照しながら、前述した情報処理装置100やサーバ800のように、本開示の一実施形態に係る情報処理システムを構成する情報処理装置のハードウェア構成の一例について、詳細に説明する。図14は、本開示の一実施形態に係る通信システムを構成する情報処理装置のハードウェア構成の一構成例を示す機能ブロック図である。
本実施形態に係る通信システムを構成する情報処理装置900は、主に、CPU901と、ROM903と、RAM905と、を備える。また、情報処理装置900は、更に、ホストバス907と、ブリッジ909と、外部バス911と、インターフェース913と、入力装置915と、出力装置917と、ストレージ装置919と、ドライブ921と、接続ポート923と、通信装置925とを備える。
CPU901は、演算処理装置及び制御装置として機能し、ROM903、RAM905、ストレージ装置919又はリムーバブル記録媒体927に記録された各種プログラムに従って、情報処理装置900内の動作全般又はその一部を制御する。ROM903は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM905は、CPU901が使用するプログラムや、プログラムの実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバス等の内部バスにより構成されるホストバス907により相互に接続されている。例えば、図3に示す自表情推定部101、自表情画像制御部103、圧縮処理部105、伸張処理部111、他表情推定部113、他表情画像制御部115、及びゲイン演算部117は、CPU901により構成され得る。
ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス911に接続されている。また、外部バス911には、インターフェース913を介して、入力装置915、出力装置917、ストレージ装置919、ドライブ921、接続ポート923及び通信装置925が接続される。
入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、レバー及びペダル等、ユーザが操作する操作手段である。また、入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール手段(いわゆる、リモコン)であってもよいし、情報処理装置900の操作に対応した携帯電話やPDA等の外部接続機器929であってもよい。さらに、入力装置915は、例えば、上記の操作手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置900のユーザは、この入力装置915を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。例えば、図3に示す入力部197は、入力装置915により構成され得る。
出力装置917は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で構成される。このような装置として、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置及びランプ等の表示装置や、スピーカ及びヘッドホン等の音声出力装置や、プリンタ装置等がある。出力装置917は、例えば、情報処理装置900が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置900が行った各種処理により得られた結果を、テキスト又はイメージで表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して出力する。例えば、図3に示す出力部191は、出力装置917により構成され得る。
ストレージ装置919は、情報処理装置900の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置919は、例えば、HDD(Hard Disk Drive)等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ等を格納する。例えば、図3に示す記憶部107は、ストレージ装置919により構成され得る。
ドライブ921は、記録媒体用リーダライタであり、情報処理装置900に内蔵、あるいは外付けされる。ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク又は半導体メモリ等のリムーバブル記録媒体927に記録されている情報を読み出して、RAM905に出力する。また、ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク又は半導体メモリ等のリムーバブル記録媒体927に記録を書き込むことも可能である。リムーバブル記録媒体927は、例えば、DVDメディア、HD−DVDメディア又はBlu−ray(登録商標)メディア等である。また、リムーバブル記録媒体927は、コンパクトフラッシュ(登録商標)(CF:CompactFlash)、フラッシュメモリ又はSDメモリカード(Secure Digital memory card)等であってもよい。また、リムーバブル記録媒体927は、例えば、非接触型ICチップを搭載したICカード(Integrated Circuit card)又は電子機器等であってもよい。
接続ポート923は、情報処理装置900に直接接続するためのポートである。接続ポート923の一例として、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポート等がある。接続ポート923の別の例として、RS−232Cポート、光オーディオ端子、HDMI(登録商標)(High−Definition
Multimedia Interface)ポート等がある。この接続ポート923に外部接続機器929を接続することで、情報処理装置900は、外部接続機器929から直接各種のデータを取得したり、外部接続機器929に各種のデータを提供したりする。
通信装置925は、例えば、通信網(ネットワーク)931に接続するための通信デバイス等で構成された通信インターフェースである。通信装置925は、例えば、有線若しくは無線LAN(Local Area Network)、Bluetooth(登録商標)又はWUSB(Wireless USB)用の通信カード等である。また、通信装置925は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ又は各種通信用のモデム等であってもよい。この通信装置925は、例えば、インターネットや他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。また、通信装置925に接続される通信網931は、有線又は無線によって接続されたネットワーク等により構成され、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信又は衛星通信等であってもよい。例えば、図3に示す通信部199は、通信装置925により構成され得る。
以上、本開示の実施形態に係る通信システムを構成する情報処理装置900の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。なお、図14では図示しないが、情報処理システムを構成する情報処理装置900に対応する各種の構成を当然備える。
なお、上述のような本実施形態に係る情報処理システムを構成する情報処理装置900の各機能を実現するためのコンピュータプログラムを作製し、パーソナルコンピュータ等に実装することが可能である。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリなどである。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信してもよい。また、当該コンピュータプログラムを実行させるコンピュータの数は特に限定されない。例えば、当該コンピュータプログラムを、複数のコンピュータ(例えば、複数のサーバ等)が互いに連携して実行してもよい。
<<5.むすび>>
以上説明したように、本実施形態に係る情報処理システムでは、ユーザUaに関連付けられた画像(例えば、顔画像)がユーザUbに提示される場合に、当該ユーザUaに関連付けられた画像に対して、当該ユーザUaに関連付けられた第1の設定と、ユーザUbに関連付けられた第2の設定と、に基づく画像処理が施される。ここで、ユーザUaに関連付けられた第1の設定としては、例えば、ユーザUaにより設定された、自身(即ち、ユーザUa)の感情の推定結果に基づき当該自身に関連付けられた画像に対する画像処理の適用量に関する設定(例えば、ユーザUaにより設定されたゲインGm等)が挙げられる。また、ユーザUbに関連付けられた第2の設定としては、例えば、ユーザUbにより設定された、他のユーザ(例えば、ユーザUa)の感情の推定結果に基づき当該他のユーザに関連付けられた画像に対する画像処理の適用量に関する設定(例えば、ユーザUbにより設定されたゲインGo等)が挙げられる。
このような構成により、本実施形態に係る情報処理システムに依れば、ユーザが頭部装着型の装置を装着することで、当該ユーザの顔の少なくとも一部が遮蔽されているような状況下においても、当該ユーザの表情や感情が反映された画像を、ネットワークを介して他のユーザに提示することが可能となる。また、前述の通り、本実施形態に係る情報処理装置100は、所定の設定に応じて、ユーザに関連付けられた画像に対する画像処理の適用量を制御する。このような制御により、例えば、ユーザが実際にオーバーリアクションを取りづらいような状況下においても、画像処理の適用量を増加させることで、当該ユーザが意図する表情や感情が模擬された画像を、他のユーザに提示することが可能となる。
また、例えば、情報処理装置100bは、ユーザUbに対してユーザUaの表情や感情が反映された画像を提示する際に、ユーザUbに関連付けられた設定(例えば、ユーザUbにより指定された設定)に応じて、当該画像中のユーザUaの表情を調整してもよい。このような構成により、例えば、ユーザUaがユーザUb側の状態を鑑みて自発的に表情を調整する(例えば、リアクションの大きさを調整する)ことが困難な状況下においても、ユーザUbの状態に応じて、当該ユーザUbに提示される画像中のユーザUaの表情を情報処理装置100b側で調整することも可能となる。
以上のように、本実施形態に係る情報処理システムに依れば、ネットワークを介したユーザ間において、ユーザの表情を利用した非言語コミュニケーションをより好適な態様で実現することが可能となる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
外部装置と所定のネットワークを介して通信を行う通信部と、
第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行う制御部と、
を備える、情報処理装置。
(2)
前記第1の設定及び前記第2の設定のうち少なくともいずれかは、前記第1のユーザの表情または感情の推定結果に応じて決定される、前記(1)に記載の情報処理装置。
(3)
前記第2の設定は、前記第1のユーザごとに設定される、前記(1)または(2)に記載の情報処理装置。
(4)
前記第1の設定及び前記第2の設定のそれぞれは、前記画像処理の適用量に関する情報を含む、前記(1)〜(3)のいずれかに記載の情報処理装置。
(5)
前記第1の画像に基づき前記第2の画像を生成するための前記画像処理の適用量は、前記第1の設定に基づく前記画像処理の適用量と、前記第2の設定に基づく前記画像処理の適用量と、に応じて決定される、前記(4)に記載の情報処理装置。
(6)
前記第2の設定に基づく前記画像処理の適用量は、所定の制限値に応じて制御される、前記(4)または(5)に記載の情報処理装置。
(7)
前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、当該設定に対応するユーザからのユーザ入力に応じて制御される、前記(4)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、所定の状態または状況の検出結果に応じて制御される、前記(4)〜(7)のいずれか一項に記載の情報処理装置。
(9)
前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、文化圏、人種、国籍、性別、および年齢のうち少なくとも1つに関するダイバーシティ情報に応じて制御される、前記(4)〜(8)のいずれか一項に記載の情報処理装置。
(10)
前記制御部は、前記制御として、前記第2の画像を所定の出力部を介して前記第2のユーザに提示する制御を行う、前記(1)〜(9)のいずれか一項に記載の情報処理装置。(11)
前記ネットワークを介して外部装置から送信される、前記第1の画像に対して第1の設定に基づく画像処理が施されることで生成された第3の画像に対して、前記第2の設定に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備える、前記(10)に記載の情報処理装置。
(12)
前記第3の画像に対して解析処理を施すことで、当該解析処理の結果に基づき、前記第1のユーザの表情または感情を推定する推定部を備え、
前記画像処理部は、前記第1のユーザの表情または感情の推定結果に応じて決定される前記第2の設定に基づき、前記第3の画像に対して前記画像処理を施すことで、前記第2の画像を生成する、
前記(11)に記載の情報処理装置。
(13)
前記画像処理部は、
前記第1のユーザの表情または感情の推定結果を示す情報を、前記ネットワークを介して外部装置から取得し、
当該推定結果に応じて決定される前記第2の設定に基づき、前記第3の画像に対して前記画像処理を施すことで、前記第2の画像を生成する、
前記(11)に記載の情報処理装置。
(14)
前記ネットワークを介して外部装置から送信される前記第1の画像に対して、当該外部装置から通知される情報に基づく前記第1の設定と、前記第2の設定と、に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備える、前記(10)に記載の情報処理装置。
(15)
前記制御部は、前記制御として、前記第2のユーザに関連付けられた外部装置に、前記ネットワークを介して前記第2の画像を送信する制御を行う、前記(1)〜(9)のいずれか一項に記載の情報処理装置。
(16)
前記第1の画像に対して、前記第1の設定及び前記第2の設定に基づき画像処理を施すことで前記第2の画像を生成する画像処理部を備え、
前記制御部は、生成された前記第2の画像を、前記第2のユーザに関連付けられた外部装置に送信する、
前記(15)に記載の情報処理装置。
(17)
前記第1の設定及び前記第2の設定は、前記第1のユーザに関連付けられた外部装置から前記ネットワークを介して通知される当該第1のユーザの表情または感情の推定結果を示す情報に応じて決定される、前記(16)に記載の情報処理装置。
(18)
前記第1のユーザに関連付けられた外部装置から前記ネットワークを介して通知される、所定の検出部による検出結果を示す情報に基づき、当該第1のユーザの表情または感情を推定する推定部を備え、
前記第1の設定及び前記第2の設定は、前記推定結果に応じて決定される、
前記(16)に記載の情報処理装置。
(19)
前記第1の画像に対して第1の設定に基づく画像処理が施されることで生成された第3の画像に対して、前記第2の設定に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備え、
前記制御部は、生成された前記第2の画像を、前記第2のユーザに関連付けられた外部装置に送信する、
前記(15)に記載の情報処理装置。
(20)
前記第1の画像に対して第1の設定に基づく画像処理を施すことで第3の画像を生成する画像処理部を備え、
前記制御部は、前記制御として、生成された前記第3の画像を、前記第2の画像を生成するためのデータとして、前記ネットワークを介して外部装置に送信する制御を行う、
前記(1)〜(9)のいずれか一項に記載の情報処理装置。
(21)
前記情報処理装置は、前記第1のユーザに関連付けられた装置であり、
前記制御部は、前記制御として、前記第1の画像と、前記第1の設定に関する情報と、のうち少なくともいずれかを、前記第2の画像を生成するためのデータとして、前記ネットワークを介して外部装置に送信する制御を行う、
前記(1)〜(9)のいずれか一項に記載の情報処理装置。
(22)
前記第1の画像は、前記第1のユーザの顔が提示された画像である、前記(1)〜(21)のいずれか一項に記載の情報処理装置。
(23)
コンピュータが、
外部装置と所定のネットワークを介して通信を行うことと、
第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、
を含む、情報処理方法。
(24)
コンピュータに、
外部装置と所定のネットワークを介して通信を行うことと、
第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、
を実行させる、プログラム。
1 情報処理システム
100、200、300 情報処理装置
101、201、301 自表情推定部
103、203、303 自表情画像制御部
105、205、305 圧縮処理部
107、207、307 記憶部
111、211、311 伸張処理部
113 他表情推定部
115、215、315 他表情画像制御部
117、217、317 ゲイン演算部
191 出力部
193 撮像部
195 検出部
197 入力部
199 通信部
319 画像合成部
800 サーバ

Claims (24)

  1. 外部装置と所定のネットワークを介して通信を行う通信部と、
    第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行う制御部と、
    を備える、情報処理装置。
  2. 前記第1の設定及び前記第2の設定のうち少なくともいずれかは、前記第1のユーザの表情または感情の推定結果に応じて決定される、請求項1に記載の情報処理装置。
  3. 前記第2の設定は、前記第1のユーザごとに設定される、請求項1に記載の情報処理装置。
  4. 前記第1の設定及び前記第2の設定のそれぞれは、前記画像処理の適用量に関する情報を含む、請求項1に記載の情報処理装置。
  5. 前記第1の画像に基づき前記第2の画像を生成するための前記画像処理の適用量は、前記第1の設定に基づく前記画像処理の適用量と、前記第2の設定に基づく前記画像処理の適用量と、に応じて決定される、請求項4に記載の情報処理装置。
  6. 前記第2の設定に基づく前記画像処理の適用量は、所定の制限値に応じて制御される、請求項4に記載の情報処理装置。
  7. 前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、当該設定に対応するユーザからのユーザ入力に応じて制御される、請求項4に記載の情報処理装置。
  8. 前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、所定の状態または状況の検出結果に応じて制御される、請求項4に記載の情報処理装置。
  9. 前記第1の設定及び前記第2の設定のうち少なくともいずれかの設定に基づく前記画像処理の適用量は、文化圏、人種、国籍、性別、および年齢のうち少なくとも1つに関するダイバーシティ情報に応じて制御される、請求項4に記載の情報処理装置。
  10. 前記制御部は、前記制御として、前記第2の画像を所定の出力部を介して前記第2のユーザに提示する制御を行う、請求項1に記載の情報処理装置。
  11. 前記ネットワークを介して外部装置から送信される、前記第1の画像に対して第1の設定に基づく画像処理が施されることで生成された第3の画像に対して、前記第2の設定に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備える、請求項10に記載の情報処理装置。
  12. 前記第3の画像に対して解析処理を施すことで、当該解析処理の結果に基づき、前記第1のユーザの表情または感情を推定する推定部を備え、
    前記画像処理部は、前記第1のユーザの表情または感情の推定結果に応じて決定される前記第2の設定に基づき、前記第3の画像に対して前記画像処理を施すことで、前記第2の画像を生成する、
    請求項11に記載の情報処理装置。
  13. 前記画像処理部は、
    前記第1のユーザの表情または感情の推定結果を示す情報を、前記ネットワークを介して外部装置から取得し、
    当該推定結果に応じて決定される前記第2の設定に基づき、前記第3の画像に対して前記画像処理を施すことで、前記第2の画像を生成する、
    請求項11に記載の情報処理装置。
  14. 前記ネットワークを介して外部装置から送信される前記第1の画像に対して、当該外部装置から通知される情報に基づく前記第1の設定と、前記第2の設定と、に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備える、請求項10に記載の情報処理装置。
  15. 前記制御部は、前記制御として、前記第2のユーザに関連付けられた外部装置に、前記ネットワークを介して前記第2の画像を送信する制御を行う、請求項1に記載の情報処理装置。
  16. 前記第1の画像に対して、前記第1の設定及び前記第2の設定に基づき画像処理を施すことで前記第2の画像を生成する画像処理部を備え、
    前記制御部は、生成された前記第2の画像を、前記第2のユーザに関連付けられた外部装置に送信する、
    請求項15に記載の情報処理装置。
  17. 前記第1の設定及び前記第2の設定は、前記第1のユーザに関連付けられた外部装置から前記ネットワークを介して通知される当該第1のユーザの表情または感情の推定結果を示す情報に応じて決定される、請求項16に記載の情報処理装置。
  18. 前記第1のユーザに関連付けられた外部装置から前記ネットワークを介して通知される、所定の検出部による検出結果を示す情報に基づき、当該第1のユーザの表情または感情を推定する推定部を備え、
    前記第1の設定及び前記第2の設定は、前記推定結果に応じて決定される、
    請求項16に記載の情報処理装置。
  19. 前記第1の画像に対して第1の設定に基づく画像処理が施されることで生成された第3の画像に対して、前記第2の設定に基づく画像処理を施すことで前記第2の画像を生成する画像処理部を備え、
    前記制御部は、生成された前記第2の画像を、前記第2のユーザに関連付けられた外部装置に送信する、
    請求項15に記載の情報処理装置。
  20. 前記第1の画像に対して第1の設定に基づく画像処理を施すことで第3の画像を生成する画像処理部を備え、
    前記制御部は、前記制御として、生成された前記第3の画像を、前記第2の画像を生成するためのデータとして、前記ネットワークを介して外部装置に送信する制御を行う、
    請求項1に記載の情報処理装置。
  21. 前記情報処理装置は、前記第1のユーザに関連付けられた装置であり、
    前記制御部は、前記制御として、前記第1の画像と、前記第1の設定に関する情報と、のうち少なくともいずれかを、前記第2の画像を生成するためのデータとして、前記ネットワークを介して外部装置に送信する制御を行う、
    請求項1に記載の情報処理装置。
  22. 前記第1の画像は、前記第1のユーザの顔が提示された画像である、請求項1に記載の情報処理装置。
  23. コンピュータが、
    外部装置と所定のネットワークを介して通信を行うことと、
    第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、
    を含む、情報処理方法。
  24. コンピュータに、
    外部装置と所定のネットワークを介して通信を行うことと、
    第1のユーザに関連付けられた第1の画像に対して、当該第1のユーザに関連付けられた第1の設定と、第2のユーザに関連付けられた第2の設定と、に基づく画像処理が施されることで生成された第2の画像の、前記第2のユーザへの提示に関する制御を行うことと、
    を実行させる、プログラム。
JP2018562875A 2017-01-20 2017-10-20 情報処理装置、情報処理方法、及びプログラム Active JP6969577B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017008440 2017-01-20
JP2017008440 2017-01-20
PCT/JP2017/038077 WO2018135057A1 (ja) 2017-01-20 2017-10-20 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2018135057A1 true JPWO2018135057A1 (ja) 2019-11-21
JP6969577B2 JP6969577B2 (ja) 2021-11-24

Family

ID=62908030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562875A Active JP6969577B2 (ja) 2017-01-20 2017-10-20 情報処理装置、情報処理方法、及びプログラム

Country Status (5)

Country Link
US (1) US11368664B2 (ja)
JP (1) JP6969577B2 (ja)
CN (1) CN110199244B (ja)
DE (1) DE112017006881T5 (ja)
WO (1) WO2018135057A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6754412B2 (ja) * 2018-11-07 2020-09-09 スカパーJsat株式会社 体験記録システム及び体験記録方法
JP7254346B2 (ja) * 2019-08-26 2023-04-10 株式会社Agama-X 情報処理装置及びプログラム
JP7476091B2 (ja) * 2020-12-18 2024-04-30 Lineヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035769A (ja) * 2013-08-09 2015-02-19 株式会社リコー 情報処理装置、情報処理システム及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659691A (en) * 1993-09-23 1997-08-19 Virtual Universe Corporation Virtual reality network with selective distribution and updating of data to reduce bandwidth requirements
JP2004185437A (ja) 2002-12-04 2004-07-02 Nippon Hoso Kyokai <Nhk> 身体情報反映チャット用プログラム、身体情報反映チャット用サーバ、身体情報反映チャット用クライアントおよび身体情報反映チャット方法
US20060284791A1 (en) * 2005-06-21 2006-12-21 National Applied Research Laboratories National Center For High-Performance Computing Augmented reality system and method with mobile and interactive function for multiple users
JP5621421B2 (ja) * 2010-09-06 2014-11-12 ソニー株式会社 画像処理装置、プログラム及び画像処理方法
JP5632100B2 (ja) * 2011-11-24 2014-11-26 株式会社Nttドコモ 表情出力装置及び表情出力方法
WO2013084395A1 (ja) * 2011-12-07 2013-06-13 株式会社ニコン 電子機器、情報処理方法およびプログラム
JP2013258555A (ja) 2012-06-12 2013-12-26 Sony Computer Entertainment Inc ヘッドマウントディスプレイ、生体情報管理装置、および生体情報表示方法
KR20140061620A (ko) * 2012-11-13 2014-05-22 삼성전자주식회사 증강 현실을 활용한 소셜 네트워크 서비스 제공 시스템 및 방법과, 디바이스
JP6155643B2 (ja) * 2013-01-07 2017-07-05 セイコーエプソン株式会社 表示装置、および、表示装置の制御方法
JP6122735B2 (ja) * 2013-08-28 2017-04-26 ヤフー株式会社 情報処理装置、判定方法および判定プログラム
KR102332326B1 (ko) * 2014-01-23 2021-11-30 소니그룹주식회사 화상 표시 장치 및 화상 표시 방법
GB2534580B (en) * 2015-01-28 2020-06-17 Sony Interactive Entertainment Europe Ltd Image processing
US9784976B2 (en) * 2015-02-04 2017-10-10 Seiko Epson Corporation Head mounted display, information processing apparatus, image display apparatus, image display system, method for sharing display of head mounted display, and computer program
US9910275B2 (en) * 2015-05-18 2018-03-06 Samsung Electronics Co., Ltd. Image processing for head mounted display devices
DE102016110903A1 (de) * 2015-06-14 2016-12-15 Facense Ltd. Head-Mounted-Devices zur Messung physiologischer Reaktionen
KR20170001490A (ko) * 2015-06-26 2017-01-04 삼성전자주식회사 전자 장치 및 생체 센서를 이용한 전자 장치의 기능 제어 방법
DE112016004437T5 (de) * 2015-09-29 2018-07-05 BinaryVR, Inc. Head-Mounted-Display mit Gesichtsausdruck-Erkennungsfähigkeit
US10817066B2 (en) * 2016-12-05 2020-10-27 Google Llc Information privacy in virtual reality

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035769A (ja) * 2013-08-09 2015-02-19 株式会社リコー 情報処理装置、情報処理システム及びプログラム

Also Published As

Publication number Publication date
JP6969577B2 (ja) 2021-11-24
WO2018135057A1 (ja) 2018-07-26
CN110199244B (zh) 2022-05-24
CN110199244A (zh) 2019-09-03
US20190373242A1 (en) 2019-12-05
DE112017006881T5 (de) 2019-11-14
US11368664B2 (en) 2022-06-21

Similar Documents

Publication Publication Date Title
US11398067B2 (en) Virtual reality presentation of body postures of avatars
WO2020177582A1 (zh) 视频合成的方法、模型训练的方法、设备及存储介质
US10832448B2 (en) Display control device, display control method, and program
JP5208810B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、およびネットワーク会議システム
JP6760271B2 (ja) 情報処理装置、情報処理方法およびプログラム
WO2020192465A1 (zh) 一种三维对象重建方法和装置
US20180123813A1 (en) Augmented Reality Conferencing System and Method
CN114222960A (zh) 用于计算机生成现实的多模态输入
US9541996B1 (en) Image-recognition based game
WO2017130486A1 (ja) 情報処理装置、情報処理方法およびプログラム
WO2017221492A1 (ja) 情報処理装置、情報処理方法、及びプログラム
US20210191504A1 (en) Information processing device, information processing method, and program
CN109426343B (zh) 基于虚拟现实的协作训练方法及***
JPWO2019187862A1 (ja) 情報処理装置、情報処理方法、および記録媒体
WO2021147465A1 (zh) 一种图像渲染方法、电子设备及***
WO2018135057A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN109358744A (zh) 信息共享方法、装置、存储介质及穿戴式设备
WO2019087502A1 (ja) 情報処理装置、情報処理方法およびプログラム
CN114207557A (zh) 虚拟和物理相机的位置同步
Nijholt Capturing obstructed nonverbal cues in augmented reality interactions: a short survey
JP2018507432A (ja) 個人的コンテンツの表示法
US20230336689A1 (en) Method and Device for Invoking Public or Private Interactions during a Multiuser Communication Session
WO2018198447A1 (ja) 情報処理装置および情報処理方法
CN109361727A (zh) 信息共享方法、装置、存储介质及穿戴式设备
US20230027060A1 (en) Display system and method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R151 Written notification of patent or utility model registration

Ref document number: 6969577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151