JP2022530726A - インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体 - Google Patents
インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体 Download PDFInfo
- Publication number
- JP2022530726A JP2022530726A JP2021529000A JP2021529000A JP2022530726A JP 2022530726 A JP2022530726 A JP 2022530726A JP 2021529000 A JP2021529000 A JP 2021529000A JP 2021529000 A JP2021529000 A JP 2021529000A JP 2022530726 A JP2022530726 A JP 2022530726A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic feature
- sequence
- interactive
- audio
- local area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 196
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000013598 vector Substances 0.000 claims description 109
- 230000000306 recurrent effect Effects 0.000 claims description 29
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000005070 sampling Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001747 exhibiting effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 15
- 230000008921 facial expression Effects 0.000 description 10
- 210000003414 extremity Anatomy 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04847—Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、出願日が2020年3月31日であり、出願番号が2020102472765である中国特許出願の優先権を主張し、当該中国特許出願の全ての内容が参照として本願に組み入れられる。
本発明は、コンピュータ技術の分野に関し、具体的には、インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体に関する。
Claims (16)
- インタラクティブ対象駆動方法であって、
音声セグメントに含まれている音声フレームのシーケンスを取得することと、
前記音声フレームのシーケンスに対応するインタラクティブ対象の少なくとも1つの局所エリアの制御パラメータ値を取得することと、
取得した前記制御パラメータ値に基づいて前記インタラクティブ対象の姿態を制御することと、を含む
ことを特徴とするインタラクティブ対象駆動方法。 - 前記音声セグメントに基づいて、前記インタラクティブ対象を展示する表示デバイスが、音声出力および/またはテキスト展示を実行するように、制御することをさらに含む
ことを特徴とする請求項1に記載のインタラクティブ対象駆動方法。 - 前記インタラクティブ対象の局所エリアの制御パラメータは、前記局所エリアの姿態制御ベクトルを含み、
前記音声フレームのシーケンスに対応するインタラクティブ対象の少なくとも1つの局所エリアの制御パラメータを取得することは、
前記音声フレームのシーケンスに対応する第1音響特徴シーケンスを取得することと、
前記第1音響特徴シーケンスに基づいて、少なくとも1つの音声フレームに対応する音響特徴を取得することと、
前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの姿態制御ベクトルを取得することと、を含む
ことを特徴とする請求項1または2に記載のインタラクティブ対象駆動方法。 - 前記第1音響特徴シーケンスは、前記音声フレームのシーケンス中の各音声フレームに対応する音響特徴ベクトルを含み、
前記第1音響特徴シーケンスに基づいて、少なくとも1つの音声フレームに対応する音響特徴を取得することは、
所定の長さの時間ウィンドウおよび所定の歩幅で、前記第1音響特徴シーケンスに対してスライディングウィンドウを実行して、前記時間ウィンドウ内の音響特徴ベクトルを対応する前記少なくとも1つの音声フレームの音響特徴として設定し、前記スライディングウィンドウが完成されて得られた複数の前記音響特徴に基づいて、第2音響特徴シーケンスを得ることを含み、
取得した前記制御パラメータに基づいて前記インタラクティブ対象の姿態を制御することは、
前記第2音響特徴シーケンスに対応する姿態制御ベクトルのシーケンスを取得することと、
前記姿態制御ベクトルのシーケンスに基づいて前記インタラクティブ対象の姿態を制御することと、を含む
ことを特徴とする請求項3に記載のインタラクティブ対象駆動方法。 - 前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの姿態制御ベクトルを取得することは、
前記音響特徴を事前にトレーニングされたリカレントニューラルネットワークに入力して、前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの前記姿態制御ベクトルを得ることを含む
ことを特徴とする請求項3に記載のインタラクティブ対象駆動方法。 - 前記リカレントニューラルネットワークは、音響特徴サンプルを利用してトレーニングして得られたものであり、
前記音響特徴サンプルを得ることは、
1つのキャラクターが音声を出すビデオセグメントを取得し、前記ビデオセグメントから前記キャラクターが音声を出す音声セグメントを抽出し、前記ビデオセグメントに対してサンプリングを実行して前記キャラクターを含む複数の第1画像フレームを取得し、前記音声セグメントに対してサンプリングを実行して、複数の音声フレームを得ることと、
前記第1画像フレームに対応する前記音声フレームの音響特徴を取得することと、
前記第1画像フレームを前記インタラクティブ対象を含む第2画像フレームに変換し、前記第2画像フレームに対応する少なくとも1つの局所エリアの姿態制御ベクトル値を取得することと、
前記姿態制御ベクトル値に対して、前記第1画像フレームに対応する前記音響特徴に対してラベリングを行って、前記音響特徴サンプルを得ることと、を含む
ことを特徴とする請求項5に記載のインタラクティブ対象駆動方法。 - 前記音響特徴サンプルに基づいて初期リカレントニューラルネットワークに対してトレーニングを実行して、ネットワーク損失の変化が収束条件を満たした後に前記リカレントニューラルネットワークをトレーニングして得ることをさらに含み、
前記ネットワーク損失は、前記リカレントニューラルネットワークによって予測して得られた前記少なくとも1つの局所エリアの前記姿態制御ベクトル値とラベリングした前記姿態制御ベクトル値との間の差異を含む
ことを特徴とする請求項6に記載のインタラクティブ対象駆動方法。 - インタラクティブ対象駆動装置であって、
音声セグメントに含まれている音声フレームのシーケンスを取得するための第1取得ユニットと、
前記音声フレームのシーケンスに対応するインタラクティブ対象の少なくとも1つの局所エリアの制御パラメータを取得するための第2取得ユニットと、
取得した前記制御パラメータに基づいて前記インタラクティブ対象の姿態を制御するための駆動ユニットと、を備える
ことを特徴とするインタラクティブ対象駆動装置。 - 前記音声セグメントに基づいて、前記インタラクティブ対象を展示する表示デバイスが、音声出力および/またはテキスト展示を実行するように、制御するための出力ユニットをさらに備える
ことを特徴とする請求項8に記載のインタラクティブ対象駆動装置。 - 前記インタラクティブ対象の局所エリアの制御パラメータは、前記局所エリアの姿態制御ベクトルを含み、
前記第2取得ユニットは、
前記音声フレームのシーケンスに対応する第1音響特徴シーケンスを取得し、
前記第1音響特徴シーケンスに基づいて、少なくとも1つの音声フレームに対応する音響特徴を取得し、
前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの姿態制御ベクトルを取得する
ことを特徴とする請求項8または9に記載のインタラクティブ対象駆動装置。 - 前記第1音響特徴シーケンスは、前記音声フレームのシーケンス中の各音声フレームに対応する音響特徴ベクトルを含み、
前記第1音響特徴シーケンスに基づいて少なくとも1つの音声フレームに対応する音響特徴を取得するときに、
前記第2取得ユニットは、
所定の長さの時間ウィンドウおよび所定の歩幅で、前記第1音響特徴シーケンスに対してスライディングウィンドウを実行して、前記時間ウィンドウ内の音響特徴ベクトルを対応する前記少なくとも1つの音声フレームの音響特徴として設定し、スライディングウィンドウが完成されて得られた複数の前記音響特徴に基づいて、第2音響特徴シーケンスを得、
前記駆動ユニットは、
前記第2音響特徴シーケンスに対応する姿態制御ベクトルのシーケンスを取得し、
前記姿態制御ベクトルのシーケンスに基づいて前記インタラクティブ対象の姿態を制御する
ことを特徴とする請求項10に記載のインタラクティブ対象駆動装置。 - 前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの姿態制御ベクトルを取得するときに、前記第2取得ユニットは、前記音響特徴を事前にトレーニングされたリカレントニューラルネットワークに入力して、前記音響特徴に対応する前記インタラクティブ対象の少なくとも1つの局所エリアの前記姿態制御ベクトルを得る
ことを特徴とする請求項10に記載のインタラクティブ対象駆動装置。 - 前記リカレントニューラルネットワークは、音響特徴サンプルを利用してトレーニングして得られたものであり、
前記インタラクティブ対象駆動装置は、サンプル取得ユニットをさらに備え、
当該サンプル取得ユニットは、
1つのキャラクターが音声を出すビデオセグメントを取得し、前記ビデオセグメントから該当する音声セグメントを抽出し、前記ビデオセグメントに対してサンプリングを実行して前記キャラクターを含む複数の第1画像フレームを取得し、前記音声セグメントに対してサンプリングを実行して、複数の音声フレームを得、
前記第1画像フレームに対応する前記音声フレームの音響特徴を取得し、
前記第1画像フレームを前記インタラクティブ対象を含む第2画像フレームに変換し、前記第2画像フレームに対応する少なくとも1つの局所エリアの姿態制御ベクトル値を取得し、
前記姿態制御ベクトル値に対して、前記第1画像フレームに対応する前記音響特徴に対してラベリングを行って、前記音響特徴サンプルを得る
ことを特徴とする請求項12に記載のインタラクティブ対象駆動装置。 - トレーニングユニットをさらに備え、
当該トレーニングユニットは、前記音響特徴サンプルに基づいて初期リカレントニューラルネットワークに対してトレーニングを実行して、ネットワーク損失の変化が収束条件を満たした後に前記リカレントニューラルネットワークをトレーニングして得、
前記ネットワーク損失は、前記リカレントニューラルネットワークによって予測して得られた前記少なくとも1つの局所エリアの前記姿態制御ベクトル値とラベリングした前記姿態制御ベクトル値との間の差異を含む
ことを特徴とする請求項13に記載のインタラクティブ対象駆動装置。 - 電子デバイスであって、メモリとプロセッサとを備え、
前記メモリには、プロセッサによって運行可能なコンピュータ命令が記憶されており、
前記プロセッサは、前記コンピュータ命令が実行されると、請求項1乃至7の中のいずれか1項に記載の方法を実現する
ことを特徴とする電子デバイス。 - コンピュータプログラムが記憶されているコンピュータ可読記録媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1乃至7の中のいずれか1項に記載の方法が実現される
ことを特徴とするコンピュータ可読記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010247276.5 | 2020-03-31 | ||
CN202010247276.5A CN111459454B (zh) | 2020-03-31 | 2020-03-31 | 交互对象的驱动方法、装置、设备以及存储介质 |
PCT/CN2020/129814 WO2021196646A1 (zh) | 2020-03-31 | 2020-11-18 | 交互对象的驱动方法、装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022530726A true JP2022530726A (ja) | 2022-07-01 |
Family
ID=71678881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021529000A Ceased JP2022530726A (ja) | 2020-03-31 | 2020-11-18 | インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体 |
Country Status (5)
Country | Link |
---|---|
JP (1) | JP2022530726A (ja) |
KR (1) | KR20210124182A (ja) |
CN (2) | CN111459454B (ja) |
TW (1) | TW202139052A (ja) |
WO (1) | WO2021196646A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460785B (zh) * | 2020-03-31 | 2023-02-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN111459454B (zh) * | 2020-03-31 | 2021-08-20 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN112527115B (zh) * | 2020-12-15 | 2023-08-04 | 北京百度网讯科技有限公司 | 用户形象生成方法、相关装置及计算机程序产品 |
CN113050859B (zh) * | 2021-04-19 | 2023-10-24 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN113314104B (zh) * | 2021-05-31 | 2023-06-20 | 北京市商汤科技开发有限公司 | 交互对象驱动和音素处理方法、装置、设备以及存储介质 |
CN114283227B (zh) * | 2021-11-26 | 2023-04-07 | 北京百度网讯科技有限公司 | 虚拟人物的驱动方法、装置、电子设备及可读存储介质 |
CN114330631A (zh) * | 2021-12-24 | 2022-04-12 | 上海商汤智能科技有限公司 | 数字人生成方法、装置、设备及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123977A (ja) * | 1994-10-24 | 1996-05-17 | Imeeji Rinku:Kk | アニメーションシステム |
JP2001009169A (ja) * | 1999-06-30 | 2001-01-16 | Interrobot Inc | 身体的音声反応玩具 |
JP2001034785A (ja) * | 1999-07-16 | 2001-02-09 | Atr Media Integration & Communications Res Lab | 仮想変身装置 |
JP2003248837A (ja) * | 2001-11-12 | 2003-09-05 | Mega Chips Corp | 画像作成装置、画像作成システム、音声生成装置、音声生成システム、画像作成用サーバ、プログラム、および記録媒体 |
JP2008052628A (ja) * | 2006-08-28 | 2008-03-06 | Advanced Telecommunication Research Institute International | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
JP2019024748A (ja) * | 2017-07-27 | 2019-02-21 | 株式会社バンダイナムコエンターテインメント | 画像生成装置及びプログラム |
JP2019078857A (ja) * | 2017-10-24 | 2019-05-23 | 国立研究開発法人情報通信研究機構 | 音響モデルの学習方法及びコンピュータプログラム |
US20190224853A1 (en) * | 2016-07-27 | 2019-07-25 | Warner Bros. Entertainment Inc. | Control of social robot based on prior character portrayal |
CN110136698A (zh) * | 2019-04-11 | 2019-08-16 | 北京百度网讯科技有限公司 | 用于确定嘴型的方法、装置、设备和存储介质 |
WO2019160105A1 (ja) * | 2018-02-16 | 2019-08-22 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
WO2019160104A1 (ja) * | 2018-02-16 | 2019-08-22 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
CN110288682A (zh) * | 2019-06-28 | 2019-09-27 | 北京百度网讯科技有限公司 | 用于控制三维虚拟人像口型变化的方法和装置 |
CN110929762A (zh) * | 2019-10-30 | 2020-03-27 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于深度学习的肢体语言检测与行为分析方法及*** |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9728203B2 (en) * | 2011-05-02 | 2017-08-08 | Microsoft Technology Licensing, Llc | Photo-realistic synthesis of image sequences with lip movements synchronized with speech |
CN102609969B (zh) * | 2012-02-17 | 2013-08-07 | 上海交通大学 | 基于汉语文本驱动的人脸语音同步动画的处理方法 |
JP2015166890A (ja) * | 2014-03-03 | 2015-09-24 | ソニー株式会社 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
US9818409B2 (en) * | 2015-06-19 | 2017-11-14 | Google Inc. | Context-dependent modeling of phonemes |
CN106056989B (zh) * | 2016-06-23 | 2018-10-16 | 广东小天才科技有限公司 | 一种语言学习方法及装置、终端设备 |
CN107704169B (zh) * | 2017-09-26 | 2020-11-17 | 北京光年无限科技有限公司 | 虚拟人的状态管理方法和*** |
CN107861626A (zh) * | 2017-12-06 | 2018-03-30 | 北京光年无限科技有限公司 | 一种虚拟形象被唤醒的方法及*** |
CN108942919B (zh) * | 2018-05-28 | 2021-03-30 | 北京光年无限科技有限公司 | 一种基于虚拟人的交互方法及*** |
CN110176284A (zh) * | 2019-05-21 | 2019-08-27 | 杭州师范大学 | 一种基于虚拟现实的言语失用症康复训练方法 |
CN110310662A (zh) * | 2019-05-21 | 2019-10-08 | 平安科技(深圳)有限公司 | 音节自动标注方法、装置、计算机设备及存储介质 |
CN110400251A (zh) * | 2019-06-13 | 2019-11-01 | 深圳追一科技有限公司 | 视频处理方法、装置、终端设备及存储介质 |
CN110503942A (zh) * | 2019-08-29 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的语音驱动动画方法和装置 |
CN110794964A (zh) * | 2019-10-22 | 2020-02-14 | 深圳追一科技有限公司 | 虚拟机器人的交互方法、装置、电子设备及存储介质 |
CN110815258B (zh) * | 2019-10-30 | 2023-03-31 | 华南理工大学 | 基于电磁力反馈和增强现实的机器人遥操作***和方法 |
CN111459454B (zh) * | 2020-03-31 | 2021-08-20 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
-
2020
- 2020-03-31 CN CN202010247276.5A patent/CN111459454B/zh active Active
- 2020-03-31 CN CN202110984305.0A patent/CN113672194A/zh active Pending
- 2020-11-18 KR KR1020217015867A patent/KR20210124182A/ko not_active Application Discontinuation
- 2020-11-18 JP JP2021529000A patent/JP2022530726A/ja not_active Ceased
- 2020-11-18 WO PCT/CN2020/129814 patent/WO2021196646A1/zh active Application Filing
- 2020-12-24 TW TW109145880A patent/TW202139052A/zh unknown
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123977A (ja) * | 1994-10-24 | 1996-05-17 | Imeeji Rinku:Kk | アニメーションシステム |
JP2001009169A (ja) * | 1999-06-30 | 2001-01-16 | Interrobot Inc | 身体的音声反応玩具 |
JP2001034785A (ja) * | 1999-07-16 | 2001-02-09 | Atr Media Integration & Communications Res Lab | 仮想変身装置 |
JP2003248837A (ja) * | 2001-11-12 | 2003-09-05 | Mega Chips Corp | 画像作成装置、画像作成システム、音声生成装置、音声生成システム、画像作成用サーバ、プログラム、および記録媒体 |
JP2008052628A (ja) * | 2006-08-28 | 2008-03-06 | Advanced Telecommunication Research Institute International | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
US20190224853A1 (en) * | 2016-07-27 | 2019-07-25 | Warner Bros. Entertainment Inc. | Control of social robot based on prior character portrayal |
JP2019024748A (ja) * | 2017-07-27 | 2019-02-21 | 株式会社バンダイナムコエンターテインメント | 画像生成装置及びプログラム |
JP2019078857A (ja) * | 2017-10-24 | 2019-05-23 | 国立研究開発法人情報通信研究機構 | 音響モデルの学習方法及びコンピュータプログラム |
WO2019160105A1 (ja) * | 2018-02-16 | 2019-08-22 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
WO2019160104A1 (ja) * | 2018-02-16 | 2019-08-22 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
CN110136698A (zh) * | 2019-04-11 | 2019-08-16 | 北京百度网讯科技有限公司 | 用于确定嘴型的方法、装置、设备和存储介质 |
CN110288682A (zh) * | 2019-06-28 | 2019-09-27 | 北京百度网讯科技有限公司 | 用于控制三维虚拟人像口型变化的方法和装置 |
JP2021009669A (ja) * | 2019-06-28 | 2021-01-28 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 三次元仮想ポートレートの口形の変化を制御する方法および装置 |
CN110929762A (zh) * | 2019-10-30 | 2020-03-27 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于深度学习的肢体语言检测与行为分析方法及*** |
Non-Patent Citations (1)
Title |
---|
四倉 達夫 他: "仮想人物によるサイバースペース上でのコミュニケーションシステムの構築", 電子情報通信学会技術研究報告 HIP98−52〜61 ヒューマン情報処理, vol. 第98巻, 第683号, JPN6023002075, 23 March 1999 (1999-03-23), JP, pages 39 - 46, ISSN: 0004971644 * |
Also Published As
Publication number | Publication date |
---|---|
CN113672194A (zh) | 2021-11-19 |
TW202139052A (zh) | 2021-10-16 |
CN111459454A (zh) | 2020-07-28 |
CN111459454B (zh) | 2021-08-20 |
WO2021196646A1 (zh) | 2021-10-07 |
KR20210124182A (ko) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022530726A (ja) | インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体 | |
WO2021169431A1 (zh) | 交互方法、装置、电子设备以及存储介质 | |
TWI766499B (zh) | 互動物件的驅動方法、裝置、設備以及儲存媒體 | |
JP7227395B2 (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記憶媒体 | |
US20230042654A1 (en) | Action synchronization for target object | |
JP2022530935A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 | |
JP7193015B2 (ja) | コミュニケーション支援プログラム、コミュニケーション支援方法、コミュニケーション支援システム、端末装置及び非言語表現プログラム | |
CN113299312B (zh) | 一种图像生成方法、装置、设备以及存储介质 | |
WO2023284435A1 (zh) | 生成动画的方法及装置 | |
US20230082830A1 (en) | Method and apparatus for driving digital human, and electronic device | |
JP7273901B2 (ja) | ビデオシーケンス編成方法、装置、電子設備、記憶媒体、及びプログラム | |
CN110162598A (zh) | 一种数据处理方法和装置、一种用于数据处理的装置 | |
KR20230075998A (ko) | 텍스트 기반 아바타 생성 방법 및 시스템 | |
JP2022531056A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 | |
CN115145434A (zh) | 基于虚拟形象的互动服务方法及装置 | |
CN112632262A (zh) | 一种对话方法、装置、计算机设备及存储介质 | |
CN110166844A (zh) | 一种数据处理方法和装置、一种用于数据处理的装置 | |
Gjaci | Comunicazione Non Verbale Culturalmente Competente Basata Su Generative Adversarial Networks | |
CN116958328A (zh) | 口型合成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210521 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220708 |
|
A603 | Late request for extension of time limit during examination |
Free format text: JAPANESE INTERMEDIATE CODE: A603 Effective date: 20221124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230921 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230928 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20240126 |