JP6949931B2 - 情報を生成するための方法および装置 - Google Patents
情報を生成するための方法および装置 Download PDFInfo
- Publication number
- JP6949931B2 JP6949931B2 JP2019230878A JP2019230878A JP6949931B2 JP 6949931 B2 JP6949931 B2 JP 6949931B2 JP 2019230878 A JP2019230878 A JP 2019230878A JP 2019230878 A JP2019230878 A JP 2019230878A JP 6949931 B2 JP6949931 B2 JP 6949931B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- text
- user identification
- user
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000004044 response Effects 0.000 claims description 107
- 238000004891 communication Methods 0.000 claims description 38
- 230000008921 facial expression Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000009877 rendering Methods 0.000 description 4
- 239000000835 fiber Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
- H04N7/157—Conference systems defining a virtual conference space and using avatars or agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/908—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1822—Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1827—Network arrangements for conference optimisation or adaptation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Description
Claims (13)
- クライアントによってインスタントコミュニケーションを通じて送信されたユーザーの映像と音声を受信するステップと、
前記映像と音声に基づいてユーザー識別情報とテキスト応答情報を生成するステップと、
前記ユーザー識別情報とテキスト応答情報に基づいて、3次元擬似ポートレートに対する制御パラメーターと応答音声を生成するステップと、
前記制御パラメーターと応答音声に基づいて、アニメーションエンジンを通じて前記3次元擬似ポートレートの映像を生成するステップと、
前記クライアントが前記ユーザーに提示できるように前記3次元擬似ポートレートの映像をインスタントコミュニケーションにより前記クライアントに送信するステップと、を含む情報を生成するための方法。 - 前記映像と音声に基づいてユーザー識別情報とテキスト応答情報を生成するステップは、
前記映像を識別してユーザー識別情報を取得し、前記音声を識別してテキスト情報を取得することと、
履歴ユーザー識別情報と履歴テキスト情報を含む関連情報を取得することと、
前記ユーザー識別情報、前記テキスト情報および前記関連情報に基づいてテキスト応答情報を生成することと、を含む請求項1に記載の方法。 - 前記方法は、前記ユーザー識別情報と前記テキスト情報を関連付けて、現在のセッションについて設定されたセッション情報のセットに記憶するステップをさらに含む請求項2に記載の方法。
- 前記関連情報を取得することは、前記セッション情報のセットから関連情報を取得することを含む請求項3に記載の方法。
- 前記ユーザー識別情報は、ユーザーの表情を含み、
前記ユーザー識別情報とテキスト応答情報に基づいて、3次元擬似ポートレートに対する制御パラメーターと応答音声を生成するステップは、
前記テキスト応答情報に基づいて応答音声を生成することと、
前記ユーザーの表情と前記応答音声に基づいて3次元擬似ポートレートに対する制御パラメーターを生成することと、を含む請求項1に記載の方法。 - クライアントによってインスタントコミュニケーションを通じて送信されたユーザーの映像と音声を受信するように構成された受信ユニットと、
前記映像と音声に基づいてユーザー識別情報とテキスト応答情報を生成するように構成された第1生成ユニットと、
前記ユーザー識別情報とテキスト応答情報に基づいて、3次元擬似ポートレートに対する制御パラメーターと応答音声を生成するように構成された第2生成ユニットと、
前記制御パラメーターと応答音声に基づいて、アニメーションエンジンを通じて前記3次元擬似ポートレートの映像を生成するように構成された第3生成ユニットと、
前記クライアントが前記ユーザーに提示できるように前記3次元擬似ポートレートの映像をインスタントコミュニケーションにより前記クライアントに送信するように構成された送信ユニットと、を含む情報を生成するための装置。 - 前記第1生成ユニットは、
前記映像を識別してユーザー識別情報を取得し、前記音声を識別してテキスト情報を取得するように構成された識別ユニットと、
履歴ユーザー識別情報と履歴テキスト情報を含む関連情報を取得するように構成された取得ユニットと、
前記ユーザー識別情報、前記テキスト情報および前記関連情報に基づいてテキスト応答情報を生成するように構成された情報生成ユニットと、を含む請求項6に記載の装置。 - 前記装置は、前記ユーザー識別情報と前記テキスト情報を関連付けて、現在のセッションについて設定されたセッション情報のセットに記憶するように構成された記憶ユニットをさらに含む請求項7に記載の装置。
- 前記取得ユニットはさらに前記セッション情報のセットから関連情報を取得するように構成されている請求項8に記載の装置。
- 前記ユーザー識別情報はユーザーの表情を含み、
前記第2生成ユニットはさらに、
前記テキスト応答情報に基づいて応答音声を生成し、
前記ユーザーの表情と前記応答音声に基づいて、3次元擬似ポートレートに対する制御パラメーターを生成するように構成されている請求項6に記載の装置。 - 1つまたは複数のプロセッサと、
1つまたは複数のプログラムが格納されている記憶装置と、を含み、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜5のいずれか1項に記載の方法を実施させるサーバー。 - コンピュータープログラムが格納されているコンピューター可読媒体であって、前記コンピュータープログラムがプロセッサによって実行されると、請求項1〜5のいずれか1項に記載の方法を実施するコンピューター可読媒体。
- コンピュータープログラムであって、
前記コンピュータープログラムがプロセッサにより実行されると、請求項1〜5のいずれか1項に記載の方法を実現する、コンピュータープログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910573596.7 | 2019-06-28 | ||
CN201910573596.7A CN110288683B (zh) | 2019-06-28 | 2019-06-28 | 用于生成信息的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021009670A JP2021009670A (ja) | 2021-01-28 |
JP6949931B2 true JP6949931B2 (ja) | 2021-10-13 |
Family
ID=68020013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019230878A Active JP6949931B2 (ja) | 2019-06-28 | 2019-12-20 | 情報を生成するための方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200412773A1 (ja) |
JP (1) | JP6949931B2 (ja) |
KR (1) | KR20210001856A (ja) |
CN (1) | CN110288683B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114268599A (zh) * | 2021-12-21 | 2022-04-01 | 北京青云科技股份有限公司 | 即时通信连接的建立与即时通信方法、装置、设备及介质 |
CN115187727B (zh) * | 2022-06-29 | 2023-06-13 | 北京百度网讯科技有限公司 | 一种虚拟面部图像的生成方法、装置、设备及存储介质 |
CN115225829A (zh) * | 2022-07-14 | 2022-10-21 | 北京京东尚科信息技术有限公司 | 一种视频生成方法及装置、计算机可读存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10445115B2 (en) * | 2013-04-18 | 2019-10-15 | Verint Americas Inc. | Virtual assistant focused user interfaces |
CN104461525B (zh) * | 2014-11-27 | 2018-01-23 | 韩慧健 | 一种可自定义的智能咨询平台生成*** |
CN104681023A (zh) * | 2015-02-15 | 2015-06-03 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US11373100B2 (en) * | 2016-11-29 | 2022-06-28 | Microsoft Technology Licensing, Llc | Using various artificial intelligence entities as advertising media |
US20180342095A1 (en) * | 2017-03-16 | 2018-11-29 | Motional LLC | System and method for generating virtual characters |
WO2019060889A1 (en) * | 2017-09-25 | 2019-03-28 | Ventana 3D, Llc | ARTIFICIAL INTELLIGENCE (IA) CHARACTER SYSTEM CAPABLE OF NATURAL VERBAL AND VISUAL INTERACTIONS WITH A HUMAN BEING |
CN108573053B (zh) * | 2018-04-24 | 2021-11-30 | 百度在线网络技术(北京)有限公司 | 信息推送方法、装置和*** |
-
2019
- 2019-06-28 CN CN201910573596.7A patent/CN110288683B/zh active Active
- 2019-12-13 KR KR1020190166708A patent/KR20210001856A/ko not_active IP Right Cessation
- 2019-12-19 US US16/721,769 patent/US20200412773A1/en not_active Abandoned
- 2019-12-20 JP JP2019230878A patent/JP6949931B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20200412773A1 (en) | 2020-12-31 |
CN110288683B (zh) | 2024-05-28 |
CN110288683A (zh) | 2019-09-27 |
KR20210001856A (ko) | 2021-01-06 |
JP2021009670A (ja) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7104683B2 (ja) | 情報を生成する方法および装置 | |
US11158102B2 (en) | Method and apparatus for processing information | |
US11308671B2 (en) | Method and apparatus for controlling mouth shape changes of three-dimensional virtual portrait | |
JP7208952B2 (ja) | 対話モデルを生成するための方法及び装置 | |
JP7225188B2 (ja) | ビデオを生成する方法および装置 | |
JP6949931B2 (ja) | 情報を生成するための方法および装置 | |
JP6971292B2 (ja) | 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム | |
WO2022170848A1 (zh) | 人机交互方法、装置、***、电子设备以及计算机介质 | |
CN112364144B (zh) | 交互方法、装置、设备和计算机可读介质 | |
CN114581980A (zh) | 用于生成说话人像视频和训练人脸渲染模型的方法、装置 | |
CN113850898A (zh) | 场景渲染方法及装置、存储介质及电子设备 | |
CN117632109A (zh) | 虚拟数字助手构建方法、装置、电子设备以及存储介质 | |
CN111312243B (zh) | 设备交互方法和装置 | |
CN115222857A (zh) | 生成虚拟形象的方法、装置、电子设备和计算机可读介质 | |
CN109840072A (zh) | 信息处理方法和装置 | |
CN115022328A (zh) | 服务器集群以及服务器集群的测试方法、装置和电子设备 | |
Huang et al. | Toward a Universal Platform for Integrating Embodied Conversational Agent Components | |
CN115393476A (zh) | 有声表情的生成方法、装置和设备 | |
CN116245974A (zh) | 基于语音的绘制方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200217 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6949931 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |