CN112970061A - 基于策略许可的内容 - Google Patents
基于策略许可的内容 Download PDFInfo
- Publication number
- CN112970061A CN112970061A CN201880099508.8A CN201880099508A CN112970061A CN 112970061 A CN112970061 A CN 112970061A CN 201880099508 A CN201880099508 A CN 201880099508A CN 112970061 A CN112970061 A CN 112970061A
- Authority
- CN
- China
- Prior art keywords
- audio
- policy
- content
- profile
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 70
- 230000004044 response Effects 0.000 claims description 15
- 238000000034 method Methods 0.000 abstract description 14
- 230000008569 process Effects 0.000 description 11
- 230000008520 organization Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1831—Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/06—Message adaptation to terminal or network requirements
- H04L51/066—Format adaptation, e.g. format conversion or compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
- H04L63/0442—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply asymmetric encryption, i.e. different keys for encryption and decryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/102—Entity profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/105—Multiple levels of security
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/60—Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
- H04M2203/6009—Personal information, e.g. profiles or personal directories being only provided to authorised persons
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Storage Device Security (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
示例实现涉及基于策略许可生成内容。例如,一种非暂态机器可读介质,包括由处理器可执行以进行如下的指令:基于接收的音频信号检测多个音频简档,分离多个音频简档,确定多个音频简档中的音频简档何时对应于策略许可,以及基于策略许可生成用于音频简档的内容。
Description
背景技术
音频识别***可以标识音频信号。例如,音频识别***可以标识所说出的语言中的单词和短语。在一些示例中,音频识别***可以标识说话人而不是所说出的单词和短语。
附图说明
图1图示与本公开相一致的非暂态机器可读介质的示例。
图2图示与本公开相一致的装置的示例。
图3图示与本公开相一致的包括音频传感器和计算设备的***的示例。
图4图示与本公开相一致的用于生成基于策略许可的内容的***的示例流程图。
具体实施方式
音频识别***可以包括音频传感器和用以将音频信号转换成内容的设备。如在此使用的那样,术语“音频信号”指代声音的作为用于模拟信号的电压和/或用于数字信号的二进制数值的表示。如在此使用的那样,术语“内容”指代语言的文本表示。例如,除了包含人类可读文本的其它介质之外,内容还可以是文本记录、具有人类可读文本的印刷文档、显示在计算设备上的具有人类可读文本的电子邮件。在一些示例中,内容可以包括从音频信号转换来的语言的文本表示,以提供音频信号的采用文本形式的视觉表示。在一些示例中,音频识别***可以具有有限的单词和短语的词汇表,并且如果单词和短语被清楚地说出,则音频识别***可以标识它们。其它音频识别***可以标识说话人的自然话语。如在此提及的那样,术语“话语”指代所说出的单词中的想法的交流或表达。例如,话语可以是利用可听单词表达思想的人类说话人。
在一些示例中,音频识别***可以使用说话人分类(speaker diarization)处理来标识说话人。如在此使用的那样,术语分类指代根据说话人身份将输入音频信号划分成同质分割的处理。在一些示例中,说话人分类可以是说话人分割和说话人聚合的组合。说话人分割可以基于说话人被检测为处于其中的音频分割来检测音频流中的说话人。说话人聚合可以包括基于说话人特征将话语的话语分割分组在一起。
随着广播、会议记录和收集的语音邮件数量增加,使用音频识别***标识说话人并且将话语的内容转换成文本格式是有用的。在一些示例中,设备可以包括自动分类和话语到文本特征。例如,设备可以具有内置的分类能力以及将分类的话语转换成文本格式的特征。在这样的实例中,如果话语的内容被暴露于非意图的各方,则话语内容的隐私和安全可能被损害。在一些示例中,设备的分类以及将分类的话语转换成文本格式的能力可能被禁用。然而,禁用该特征可能禁用整个会议的记录。
在一些方法中,当***接收来自多个说话人的音频数据时,***可以对音频数据执行盲分类以便区分说话人。在盲分类中,关于说话人的数量和/或其身份的信息可能是未知的。然而,这样的方法不能区分说话人和/或话语的内容。因此,这样的方法可能仍然造成暴露或禁用整个会议或广播的内容而不基于记录的内容编辑和/或修订记录。
因此,本公开描述了一种基于与音频简档对应的策略许可来生成用于音频简档的内容的***和装置。例如,***可以包括用于多个说话人的预定的规则和/或指令集。基于预定的规则,***可以生成内容以符合规则和/或指令以对应于策略许可。如在此使用的那样,术语“策略许可”指代基于与说话人相关联的安全简档而采用的设置。如在此使用的那样,术语“音频简档”指代唯一地标识与话语组合的个人的人类语音的一组可测量的特征。例如,音频简档可以包括说话人的语音特征(例如,频率、持续时间、幅度)的特有模式以及由个人说出的单词。
可以基于与用户相关联的安全简档来采用策略许可。可以基于用户的偏好来采用和/或更改策略许可。用户可以基于他/她的偏好来调整他/她的音频简档的策略许可。例如,用户可以包括加密和/或修订他/她的音频简档的策略许可,以防止未经授权的访问。类似地,用户可以在稍后的时间段解密他/她的音频简档的加密内容的部分或全部。基于每个用户的策略许可来为多个用户生成内容允许用户基于他们的偏好来生成内容并且防止非意图的各方的未经授权的访问。附加地,其为用户提供捕获他/她的音频简档或部分音频简档的灵活性,同时尊重其他用户的隐私和安全。
策略许可可以基于说话人的安全简档。例如,在给定的情况下,多个用户中的每个用户可以具有与策略许可对应的不同的安全简档(例如,高、中、低等)。具有相似的安全简档的多个用户中的每个也可以具有他/她想要生成为文本格式的内容的不同偏好,因此允许用户个性化他/她的偏好,同时尊重其他用户的偏好。
图1图示与本公开相一致的非暂态机器可读介质100的示例。非暂态机器可读介质100可以执行指令101、103、105、107。处理器(在图1中未图示)可以执行存储在非暂态机器可读介质100上的指令。非暂态机器可读介质100可以是任何类型的易失性的或非易失性的存储器或存储部,诸如随机存取存储器(RAM)、闪速存储器、只读存储器(ROM)、存储卷、硬盘或它们的组合。
示例介质100可以存储由处理器可执行以接收包括多个音频简档的音频信号的指令101。在一些示例中,音频信号可以是由音频传感器接收的。在一些示例中,音频传感器可以是音频端点设备(例如,扬声器、麦克风、记录设备)。在一些示例中,音频信号可以包括多个音频简档。可以从多于一个的说话人接收多个音频简档。在一些示例中,多个音频简档可以包括在不同的时间段接收的来自单个说话人的多个音频简档。例如,来自第一说话人的音频信号可以是从如下接收的:在第一时间段期间的第一会议、在第二时间段期间的第二会议、以及在第三时间段期间的第三会议。与在第一会议期间确定的音频简档对应的策略许可可以不同于与第二会议对应的策略许可。例如,在第一会议中(例如在执行会议期间)讨论的主题可能包括公司的投资组合的敏感信息。基于主题的敏感性质,说话人可以包括用以对会议的内容进行加密的策略许可。在一些示例中,在第二会议(例如公司的职工大会)中讨论的主题可能包括关于公司的一般信息。基于会议的一般性质,说话人可以包括用以将整个会议记录为文本格式的策略许可。附加地,响应于第一说话人的安全简档在每个会议中不同,对于第一说话人而言从每个会议生成的内容可以是不同的。
在一些示例中,音频简档可以包括针对不同说话人的多个语音特征。每个说话人可以具有可以被用于标识说话人的特定音频简档。每个说话人可以具有用户简档,用户简档描述说话人的针对要被针对多个情况(例如,所讨论的信息的类型、同一会议中的其他用户等)中的每个创建的内容的偏好。
示例介质100可以存储由处理器可执行以分离多个音频简档的指令103。如在此描述的那样,音频简档可以包括个人的独特地标识该个人的语音特征(例如,频率、持续时间、幅度)的特有模式。音频简档可以被用于标识用户和/或针对用户的用户简档。用户简档可以描述说话人的针对要被针对多个情况(例如,所讨论的信息的类型、同一会议中的其他用户等)中的每个创建的内容的偏好。
在一些示例中,介质100可以存储由处理器可执行以利用音频简档的音频信号的语音生物测定特征而基于音频简档标识说话人的指令103。如在此使用的那样,术语“语音生物测定”指代说话人的独特的语音模式的属性。在一些示例中,说话人的语音可以是实时接收的并且被与登记的音频简档进行比较。如在此使用的那样,术语“登记的音频简档”指代已经在音频简档被分离的时间段之前的时间段记录的音频简档。在一些示例中,语音生物测定可以被用于认证用户。在一些示例中,语音生物测定可以被单独地使用以分离音频简档。在一些示例中,语音生物测定可以被用作为双因素处理的一部分以分离音频简档。例如,语音生物测定认证可以与附加的认证技术(例如,密码、PIN)组合以提供用于敏感信息和金融交易的额外安全层。
示例介质100可以存储由处理器可执行以确定多个音频简档中的音频简档何时对应于策略许可的指令105。在一些示例中,策略许可可以包括用以在生成用于音频简档的内容时加密用于音频简档的内容的策略。在一些示例中,策略许可可以包括用以在生成用于音频简档的内容时解密用于音频简档的内容的策略。在一些示例中,策略许可可以包括用以在生成用于音频简档的内容时修订用于音频简档的内容的策略。在一些示例中,可以未包括针对音频简档的策略许可,并且所讨论的主题可以被记录为文本格式。
策略许可可以包括用以加密用于音频简档的内容的策略。在一些示例中,可以使用公用密钥加密来对针对音频简档转换的内容进行加密。公用密钥加密可以响应于被应用以加密音频简档的策略许可而使用公用密钥和私用密钥来对针对音频简档转换的内容进行加密。在一些示例中,策略许可可以包括加密整个内容。例如,第一会议中的说话人可能讨论敏感信息并且决定包括用以加密整个会议的策略许可。在一些示例中,策略许可可以包括对内容的一些部分进行加密。例如,在第二会议期间说话人也可能讨论一些在第一会议中讨论的敏感信息,并且可能讨论一些不敏感和/或可能在将来的会议中使用的信息。因此,说话人可以包括用以加密第二会议的敏感部分并且不将剩余部分记录为文本格式的策略许可。
在一些示例中,可以响应于基于用户简档标识特定的音频简档来加密内容。在一些示例中,可以基于在组织内的职位来标识针对用户的音频简档。在一些示例中,在确定了音频简档对应于组织的情况下的第一职位(例如执行官)的音频简档、对应于组织的情况下的第二职位(例如中层管理者)的音频简档、以及对应于组织的情况下的第三职位(例如一般雇员)的音频简档时,可以应用策略许可以加密从第一职位和第二职位的音频简档接收的内容。在这样的示例中,从第三职位接收的音频简档可以保持为未加密。未加密的内容可以被记录为从音频简档转换的文本格式。
在一些示例中,公用密钥加密可以响应于被应用以解密音频简档的策略许可而使用密钥来解密针对音频简档转换的内容。在一些示例中,策略许可可以包括在稍后的时间解密被全部加密的内容。例如,第一策略许可可以包括在第一时间段期间加密第一说话人的全部话语。基于主题和/或用户的偏好,第一策略许可可以被更改为第二策略许可。第二策略许可可以包括例如在第一时间期间解密从第一说话人接收的内容。第一策略许可可以被实时地和/或在第二时间段期间更改。在一些示例中,策略许可可以包括对内容的一些部分进行解密。例如,第一策略许可可以包括在第一时间段期间加密第一说话人的全部话语。在第二时间段期间,第二策略可以包括解密在第一时间期间从第一说话人接收的内容的一部分(例如可以使其公开的关于公司的一般信息)。在一些示例中,可以响应于识别出触发单词和/或从多个音频简档识别出音频简档而解密内容。例如,在上面描述的会议场景中,可以应用策略许可以响应于将音频简档确定为组织的情况下的第二职位的音频简档而解密组织的情况下的第二职位的音频简档。
在一些示例中,策略许可可以包括用以在生成用于音频简档的内容时修订用于音频简档的内容的策略。在一些示例中,策略许可可以包括用以实时地修订用于音频简档的内容的策略。在一些示例中,策略许可可以包括修订整个内容。例如,当标识出第一用户时,策略许可可以包括用以对来自包括第一用户的整个对话的内容进行修订的策略。在一些示例中,策略许可可以包括对内容的部分进行修订。例如,策略许可可以包括用以修订来自第一用户的内容而不修订来自第二用户的内容的策略。在一些示例中,策略许可可以包括用以修订可以使用触发单词标识的特定主题的策略。在这样的实例中,可以响应于识别出触发单词和/或识别出特定的音频简档而修订内容。例如,在上面描述的会议场景中,用户可以包括用以修订针对组织的第一职位的音频简档的整个内容的策略许可。在一些示例中,用户可以包括用以修订针对包括敏感主题(针对组织中的雇员的股份选项)的所有音频简档的内容的策略许可。
示例介质100可以存储由处理器可执行以基于策略许可生成用于音频简档的内容的指令107。在一些示例中,所生成的内容可以包括加密的内容。在一些示例中,所生成的内容可以包括解密的内容。在一些示例中,所生成的内容可以包括经修订的内容。在一些示例中,内容可以包括从音频简档转换的文本记录。
在一些示例中,在第一时间段期间针对音频简档生成的内容可以不同于在对应于策略许可的第二时间段期间生成的内容。在一些示例中,第一时间段和第二时间段的策略许可可以符合与第一时间段和第二时间段相关联的安全简档。例如,说话人可以包括在第一时间段期间的高安全简档和在第二时间段期间的中安全简档。基于此,与第一时间段的安全简档相关联的策略许可不同于第二时间段的策略许可。因此,在第一时间段期间生成的内容可以不同于符合策略许可的在第二时间段期间生成的内容。
图2图示与本公开相一致的装置202的示例。装置202可以包括处理器209和存储器资源211。虽然在图2中未图示以便不妨碍本公开的示例,但是装置202可以被包括在诸如在图3中描述的计算设备308的计算设备中。装置202的存储器资源211可以被用于存储由处理器209可执行以执行在此有关于图2描述的操作的指令215、217和219。
处理器209例如可以采用如下的形式:中央处理单元(CPU)、基于半导体的微处理器、诸如数字图像处理单元的数字信号处理器(DSP)、适于提取和执行存储在存储介质中的指令的其它硬件设备或处理元件、或者它们的合适的组合。处理器209例如可以包括芯片上的单个或多个核、跨多个芯片的多个核、跨多个设备的多个核、或者它们的合适的组合。存储器资源211例如可以是任何类型的易失性的或非易失性的存储器或存储部,诸如随机存取存储器(RAM)、闪速存储器、只读存储器(ROM)、存储卷、硬盘或者它们的组合。存储器资源211可以被用于存储指令,诸如由处理器209可执行的指令215、217、219。当由处理器209执行时,指令可以引起装置202执行特定的任务和/或功能,如在此描述的那样。
存储器资源211可以包括由处理器209可执行以从多个说话人接收音频信号的指令。在一些示例中,音频信号可以是来自多个说话人的表示语音。在一些示例中,音频信号可以基于多个说话人的音频简档来确定多个说话人的身份。在一些示例中,从多个说话人接收的音频信号可以被划分成同质分割,以通过将所接收的音频信号与先前登记的音频简档进行比较来确定说话人的身份。在一些示例中,从多个说话人接收的音频信号可以被基于音频信号的特征而聚合在各组中。
在一些示例中,来自多个说话人中的说话人的所接收的音频信号可以确定针对时间段的策略许可。例如,如果在第一会议中从多个说话人中的说话人接收的音频信号被确定为来自第一说话人,则可以基于第一说话人的身份来确定用以加密内容的策略许可。在一些示例中,来自说话人的音频信号的主题内容可以确定时间段的策略许可。例如,如果从多个说话人中的说话人接收到的音频信号被确定为包括敏感信息,则可以确定用以加密数据的策略许可。在一些示例中,策略许可可以是由关键词触发的。在一些示例中,可以将所标识的关键词通知给说话人,并且说话人可以实时地更改策略许可。例如,存储器资源211可以包括用以进行如下的指令:响应于识别出与敏感信息(例如,密码、社会安全号码等)相关联的关键词而触发策略许可。响应于识别出与敏感信息相关联的关键词,可以通知说话人选择策略许可来加密内容。
存储器资源211可以包括指令215,其是由处理器209可执行的以通过将接收的音频信号与登记的音频简档进行比较来标识多个用户中的每个用户的音频简档。在一些示例中,可以通过使用说话人分类来确定说话人的身份。在一些示例中,可以使用提供声音信号源的自动检测、分类、隔离和跟踪的外部设备来执行说话人分类。在这样的示例中,可以标识声音信号,并且可以检测声音信号中的改变。基于该改变,声音信号可以被分类(例如基于性别、带宽)并且被聚合在相同的所标识的组中。在一些示例中,可以通过使用源分类来确定说话人的身份。在这样的示例中,源分类处理可以被用于确定在给定的音频信号流中存在的不同的音频信号源的数量。例如,源分类可以被用于确定在给定的音频分割中存在多少说话人。
可以通过将从多个说话人接收的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的音频简档。登记的音频简档可以包括已经在分离音频简档的时间段之前的时间段记录的音频简档。例如,可以在第一时间段期间登记音频简档,并且在第二时间段期间将所接收的音频信号与登记的音频简档进行比较。在音频简档被实时地标识之前,该音频简档可能已被登记数年、数月、数周、数天、数小时和或数分钟。
存储器资源211可以包括由处理器209可执行以基于多个用户的音频简档来选择针对多个用户中的每个所标识的用户的策略许可的指令217。在一些示例中,策略许可可以包括用以响应于所标识的说话人音频简档而加密所生成的内容的策略。在一些示例中,策略许可可以包括用以响应于所标识的说话人音频简档而修订所生成的内容的策略。
在一些示例中,多个说话人中的每个说话人可以基于说话人的所标识的音频简档而具有不同的策略许可。在一些示例中,存储器资源211可以包括由处理器209可执行以在多个说话人当中标识不同的音频简档的指令。例如,第一音频简档、第二音频简档和第三音频简档可以是基于来自第一说话人、第二说话人和第三说话人的所接收的音频信号而标识的。基于第一用户的第一音频简档的身份,可以应用用以加密整个对话的第一策略许可。与此对比,基于第二说话人的第二音频简档的身份,可以应用用以修订从第二说话人接收的内容的第二策略许可。类似地,基于所标识的第三说话人的第三音频简档,可以应用用以将内容记录为文本格式的第三策略许可。
在一些示例中,多个说话人中的说话人可以在第一时间段内利用第一策略许可,并且在第二时间段内利用第二策略许可。例如,第一说话人可以在第一时间段内包括用以加密整个记录的第一策略许可。在一些示例中,第一用户可以在第二时间段期间包括用以对加密的数据进行解密的第二策略许可。
存储器资源211可以包括由处理器209可执行以基于应用于多个说话人中的每个的策略许可来生成与所接收的音频信号有关的内容的指令219。在一些示例中,所生成的内容可以包括加密的内容。在一些示例中,所生成的内容可以包括解密的内容。在一些示例中,所生成的内容可以包括经修订的内容。在一些示例中,内容可以包括从音频简档转换的文本记录。在一些示例中,可以响应于针对多个说话人中的每个所标识的说话人的经更改的策略许可来更改与所接收的音频信号相关地生成的内容。
图3图示与本公开相一致的包括音频传感器306和计算设备308的***304的示例。计算***308可以包括处理器309和存储器资源311。存储器资源311可以包括由处理器309可执行的指令312、315、317和319。当由处理器309执行时,指令可以引起***304执行特定的任务和/或功能,如在此描述的那样。
计算设备308的存储器资源311可以包括用以分析从音频传感器306接收的所接收的音频信号的指令312。音频信号的分析可以包括对音频信号进行分类、构造和标记的处理。在一些示例中,在对音频信号进行分类、构造和标记的处理期间,用户的身份可以保持未知。例如,音频传感器306可以从多个说话人接收音频信号(图3中未示出)。存储器资源311包括用以进行如下的指令321:基于音频信号的源来对音频信号进行分类,将它们构造为从第一说话人B接收的音频信号、从第二说话人B接收的音频信号、以及从第三说话人C接收的音频信号,并且相应地对它们进行标记。在分类、构造和标记处理期间,说话人A、B、C中的每个的身份可以保持未知。在一些示例中,进行标记可以包括将关键词或术语分配给一条信息(例如,单词、音频简档)。进行标记可以帮助描述项目并且允许其在稍后被通过浏览或搜索而再次找到。在一些示例中,说话人分类处理可以被用于通过检测、分类、隔离声音信号的源来分析所接收的音频信号。在一些示例中,音频传感器306可以是扬声器、麦克风和/或记录设备。
计算设备308的存储器资源315可以包括用以通过将接收到的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的音频简档的指令312。在一些示例中,说话人的音频简档可以包括说话人的独特的标识符。在一些示例中,可以从多于一个的说话人接收多个音频简档。在一些示例中,多个音频简档可以包括在不同的时间段接收的来自单个说话人的多个音频简档,如在此描述的那样。
计算设备308的存储器资源315可以包括用以通过将接收的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的音频简档的指令315。在一些示例中,可以通过使用说话人分类来确定说话人的身份。在一些示例中,标识说话人可以包括语音生物测定认证。在一些示例中,语音生物测定可以被用作为双因素认证处理的一部分以分离出音频简档。例如,语音生物测定认证可以与说话人知道的事物(例如,密码、PIN)或者具有的事物(例如,具有呼叫者ID的蜂窝电话、***)组合,以提供用于敏感信息的额外的安全层。
可以通过将从多个说话人接收的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的音频简档。在一些示例中,音频简档可以是在第一时间段期间登记的,并且在第二时间段期间将所接收的音频信号与所登记的音频简档进行比较。
存储器资源311可以包括由处理器309可执行以基于多个说话人的音频简档来选择用于多个说话人中的每个所标识的说话人的策略许可的指令317。策略许可可以包括用以基于所标识的音频简档来加密、修订和/或解密音频信号的指令。在一些示例中,策略许可的选择可以是动态的。在一些示例中,策略许可可以是用于计算机***308的默认设置的一部分。在一些示例中,可以实时地更改策略许可。
存储器资源311可以包括由处理器309可执行以基于应用于多个说话人中的每个的策略许可来生成与所接收的音频信号有关的内容的指令319。在一些示例中,所生成的内容可以包括加密的内容。在一些示例中,所生成的内容可以包括解密的内容。在一些示例中,所生成的内容可以包括经修订的内容。在一些示例中,内容可以包括从音频简档转换的文本记录。在一些示例中,可以响应于针对多个说话人中的每个所标识的说话人的经更改的策略许可而更改与所接收的音频信号相关地生成的内容。在一些示例中,在第一时间段期间生成的内容可以被标记以在第二时间段期间标识多个说话人中的说话人。在一些示例中,进行标记可以包括将关键词或术语分配给一条信息(例如,单词、音频简档)。进行标记可以帮助描述项目并且允许其在稍后被通过浏览或搜索而再次找到。
图4图示与本公开相一致的用于基于策略许可来生成内容的***440的示例流程图。***440可以被用于基于应用于多个说话人中的每个的策略许可来生成与所接收的音频简档有关的内容。***440可以包括类似于有关图2描述的存储器资源和处理器的存储器资源和处理器。存储器资源可以包括由处理器可执行的指令,如在此描述的那样。
在423处,***440可以包括用以使用音频传感器406从多个说话人410、412和414接收音频信号的指令。在423处,可以分离来自多个说话人410、412和414的音频信号,以标识多个说话人410(第一说话人)、412(第二说话人)和414(第三说话人)的音频简档中的每个。可以通过将在423处接收的所接收的音频信号与登记的音频简档进行比较来标识每个说话人的音频简档。
在425处,***440可以包括用以通过将所接收的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的指令。可以通过将从多个说话人接收的音频信号与登记的音频简档进行比较来标识多个说话人中的每个说话人的音频简档。在一些示例中,音频简档可以是在第一时间段期间登记的,并且在第二时间段期间将所接收的音频信号与登记的音频简档进行比较。在一些示例中,在425处,音频识别***可以使用说话人分类处理来标识说话人410、412和414中的每个。
在427处,***440可以包括用以将话语转换成第二说话人412音频简档的文本内容的指令。在427处,***440可以包括用以基于说话人412的音频简档来选择策略许可的指令。在一些示例中,可以基于与说话人相关联的安全简档来采用策略许可。例如,在427处,***440可以包括用以将第二说话人412的话语转换成文本格式的指令。
在429处,应用策略许可。可以基于与用户相关联的安全简档来采用策略许可。可以基于用户的偏好来采用和/或更改策略许可。在一些示例中,说话人可以基于他/她的偏好来调整他/她的音频简档的策略许可。例如,用户可以包括用以对他/她的音频简档进行加密和/或修订以防止未经授权的访问的策略许可。类似地,用户可以在稍后的时间段解密他/她的音频简档的被加密内容的部分或全部。例如,在429-1处,***440可以包括用以基于说话人412的偏好来选择用以加密说话人412的内容的策略许可的指令。在429-3处,***440可以包括用以选择简档策略许可以修订说话人412的内容的指令。在429-2处,***440可以包括用以基于说话人的偏好而不选择策略许可的指令。
在431处,***440可以包括用以基于在429-1处应用的策略许可来生成被选择性地加密的内容的指令。例如,第一会议中的说话人412可能讨论敏感信息并且决定包括用以加密整个会议的策略许可。在一些示例中,策略许可可以包括对内容的一些部分进行加密。例如,在第二会议期间说话人412也可能讨论在第一会议中讨论的一些敏感信息,并且可能讨论一些不敏感和/或可能在将来的会议中使用的信息。因此说话人412可以包括用以加密第二会议的敏感部分并且不将剩余部分记录为文本格式的策略许可。在一些示例中,可以使用公用密钥加密来对内容进行加密。
在433处,***440可以包括用以关于应用于429-2的策略许可而选择性地生成解密的内容的指令。在一些示例中,公用密钥加密可以响应于应用于解密音频简档的策略许可而使用密钥来解密针对音频简档转换的内容。在一些示例中,策略许可可以包括在稍后的时间解密全部被加密的内容。例如,第一策略许可可以包括在第一时间段期间加密说话人412的全部话语。在第二时间段期间第二策略可以包括对在第一时间期间从第一说话人412接收的内容进行解密。在一些示例中,策略许可可以包括对内容的部分进行解密。例如,第一策略许可可以包括在第一时间段期间加密第一说话人的全部话语。在第二时间段期间第二策略可以包括对在第一时间期间从第一说话人接收的内容的一部分(例如,可以使其公开的关于公司的一般信息)进行解密。
在435处,***440可以包括用以基于策略许可来生成所说出的内容的完整记录以将内容记录为在429-2处应用的文本格式的指令。在一些示例中,说话人412可以避免选择将说话人的话语的全部内容记录为文本格式的策略许可。
在本公开的前述的详细描述中,参照形成在此的一部分的随附附图,并且在附图中通过图示的方式示出可以如何实践本公开的示例。充分详细地描述了这些示例以使得本领域普通技术人员能够实践本公开的示例,并且要理解在不脱离本公开的范围的情况下可以利用其它示例并且可以作出处理、电气和/或结构上的改变。
在此的各图遵从编号惯例,其中第一数字对应于所绘制的图的编号并且其余的数字标识附图中的要素或组件。在此的各个图中示出的要素可以被添加、交换和/或消除,以便提供本公开的许多附加示例。此外,在各图中提供的要素的比例和相对尺度意图图示本公开的示例并且不应当是在限制的意义上取得的。
Claims (15)
1.一种非暂态机器可读介质,包括由处理器可执行以进行如下的指令:
接收包括多个音频简档的音频信号;
基于音频信号检测所述多个音频简档;
分离所述多个音频简档;
确定所述多个音频简档中的音频简档何时对应于策略许可;以及
基于策略许可生成用于音频简档的内容。
2.根据权利要求1所述的介质,其中指令引起处理器通过将音频简档转换成文本记录来生成内容。
3.根据权利要求1所述的介质,其中指令引起处理器基于策略许可对针对音频简档生成的内容进行加密。
4.根据权利要求1所述的介质,其中指令引起处理器基于策略许可来修订针对音频简档生成的内容。
5.根据权利要求1所述的介质,其中指令引起处理器通过利用音频简档的音频信号的语音生物测定特征来标识针对所述多个音频简档中的音频简档的用户。
6.根据权利要求3所述的介质,其中指令引起处理器对针对音频简档生成的被加密的内容进行解密。
7.根据权利要求1所述的介质,其中指令引起处理器在第一时间段期间生成如下的内容:该内容不同于在与策略许可对应的第二时间段期间生成的内容。
8.一种装置,包括;
处理器;以及
存储器资源,其存储机器可读指令以引起处理器:
通过将接收的音频信号与登记的音频简档进行比较来标识多个用户中的每个用户的音频简档;
基于每个被标识的用户的音频简档来选择针对所述多个用户中的每个所标识的用户的策略许可;
基于应用于所述多个用户中的每个用户的策略许可来生成与所接收的音频信号有关的内容。
9.根据权利要求8所述的装置,其中登记的音频简档是在第一时间段期间登记的,并且在第二时间段期间将接收的音频信号与登记的音频简档进行比较。
10.根据权利要求8所述的装置,其中所述多个用户中的用户在第一时间段内利用第一策略许可,并且在第二时间段内利用第二策略许可。
11.根据权利要求10所述的装置,其中第一策略许可包括在第一时间段期间对与接收的音频信号有关的第一生成内容进行加密,并且第二策略包括在第二时间段期间对第一生成内容进行解密。
12.根据权利要求8所述的装置,其中来自所述多个用户中的用户的所接收的音频信号确定在一定时间段内的策略许可。
13.根据权利要求12所述的装置,其中存储在存储器资源中的指令引起处理器响应于针对所述多个用户中的每个所标识的用户的被更改的策略许可而更改内容。
14.一种***,包括:
音频传感器,用以从多个用户接收音频信号;
计算设备,包括:
处理资源;以及
存储器资源,其存储机器可读指令以引起处理资源:
分析从音频传感器接收的所接收的音频信号;
通过将所接收的音频信号与登记的音频简档进行比较来标识所述多个用户中的每个用户;
基于所述多个用户的音频简档来选择针对所述多个用户中的每个所标识的用户的策略许可;
基于应用于所述多个用户中的每个用户的策略许可来生成与所接收的音频简档有关的内容。
15.根据权利要求14所述的***,其中在第一时间段期间生成的内容被标记以在第二时间段期间标识所述多个用户中的用户。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2018/061044 WO2020101670A1 (en) | 2018-11-14 | 2018-11-14 | Contents based on policy permissions |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112970061A true CN112970061A (zh) | 2021-06-15 |
Family
ID=70730586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880099508.8A Pending CN112970061A (zh) | 2018-11-14 | 2018-11-14 | 基于策略许可的内容 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210295851A1 (zh) |
EP (1) | EP3881318B1 (zh) |
CN (1) | CN112970061A (zh) |
WO (1) | WO2020101670A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7229821B2 (ja) * | 2019-03-15 | 2023-02-28 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 情報処理装置、情報処理方法およびプログラム |
US20210377240A1 (en) * | 2020-06-02 | 2021-12-02 | FLEX Integration LLC | System and methods for tokenized hierarchical secured asset distribution |
US11710509B1 (en) * | 2022-02-01 | 2023-07-25 | Microsoft Technology Licesning, LLC | Retroactive recording of a meeting |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060089857A1 (en) * | 2004-10-21 | 2006-04-27 | Zimmerman Roger S | Transcription data security |
CN101292282A (zh) * | 2005-08-29 | 2008-10-22 | 沃伊斯博克斯科技公司 | 支持自然语言人机交互的移动***和方法 |
US20090299743A1 (en) * | 2008-05-27 | 2009-12-03 | Rogers Sean Scott | Method and system for transcribing telephone conversation to text |
US20110173705A1 (en) * | 2010-01-08 | 2011-07-14 | Deutsche Telekom Ag | Method and system of processing annotated multimedia documents using granular and hierarchical permissions |
US20110276325A1 (en) * | 2010-05-05 | 2011-11-10 | Cisco Technology, Inc. | Training A Transcription System |
CN102355646A (zh) * | 2010-09-07 | 2012-02-15 | 微软公司 | 用于转录多方对话的移动通信设备 |
CN102436812A (zh) * | 2011-11-01 | 2012-05-02 | 展讯通信(上海)有限公司 | 会议记录装置及利用该装置对会议进行记录的方法 |
US20120259924A1 (en) * | 2011-04-05 | 2012-10-11 | Cisco Technology, Inc. | Method and apparatus for providing summary information in a live media session |
US20120323575A1 (en) * | 2011-06-17 | 2012-12-20 | At&T Intellectual Property I, L.P. | Speaker association with a visual representation of spoken content |
CN104205127A (zh) * | 2012-03-30 | 2014-12-10 | 英特尔公司 | 基于识别的安全性 |
CN104462912A (zh) * | 2013-09-18 | 2015-03-25 | 联想(新加坡)私人有限公司 | 改进的生物密码安全 |
CN104604200A (zh) * | 2012-07-16 | 2015-05-06 | 阿尔卡特朗讯 | 用于对用户兴趣简档的隐私保护聚集的方法和装置 |
CN105096937A (zh) * | 2015-05-26 | 2015-11-25 | 努比亚技术有限公司 | 语音数据处理方法及终端 |
CN105190641A (zh) * | 2013-03-15 | 2015-12-23 | 微软技术许可有限责任公司 | 管理策略和许可简档 |
US20160140956A1 (en) * | 2014-11-13 | 2016-05-19 | Microsoft Technology Licensing, Llc | Prediction-based sequence recognition |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106462832A (zh) * | 2014-06-04 | 2017-02-22 | 谷歌公司 | 响应于共同存在确定的调用动作 |
US20170125014A1 (en) * | 2015-10-30 | 2017-05-04 | Mcafee, Inc. | Trusted speech transcription |
CN107862071A (zh) * | 2017-11-22 | 2018-03-30 | 三星电子(中国)研发中心 | 生成会议记录的方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240007B2 (en) * | 2001-12-13 | 2007-07-03 | Matsushita Electric Industrial Co., Ltd. | Speaker authentication by fusion of voiceprint match attempt results with additional information |
US7533735B2 (en) * | 2002-02-15 | 2009-05-19 | Qualcomm Corporation | Digital authentication over acoustic channel |
US20130117802A1 (en) * | 2011-11-03 | 2013-05-09 | Patrick Fendt | Authorization-based redaction of data |
US9396730B2 (en) * | 2013-09-30 | 2016-07-19 | Bank Of America Corporation | Customer identification through voice biometrics |
US20180308501A1 (en) * | 2017-04-21 | 2018-10-25 | aftercode LLC | Multi speaker attribution using personal grammar detection |
-
2018
- 2018-11-14 EP EP18939893.6A patent/EP3881318B1/en active Active
- 2018-11-14 WO PCT/US2018/061044 patent/WO2020101670A1/en unknown
- 2018-11-14 US US17/265,838 patent/US20210295851A1/en active Pending
- 2018-11-14 CN CN201880099508.8A patent/CN112970061A/zh active Pending
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060089857A1 (en) * | 2004-10-21 | 2006-04-27 | Zimmerman Roger S | Transcription data security |
CN101292282A (zh) * | 2005-08-29 | 2008-10-22 | 沃伊斯博克斯科技公司 | 支持自然语言人机交互的移动***和方法 |
US20090299743A1 (en) * | 2008-05-27 | 2009-12-03 | Rogers Sean Scott | Method and system for transcribing telephone conversation to text |
CN102047647A (zh) * | 2008-05-27 | 2011-05-04 | 高通股份有限公司 | 用于将电话通话转录为文本的方法和*** |
US20110173705A1 (en) * | 2010-01-08 | 2011-07-14 | Deutsche Telekom Ag | Method and system of processing annotated multimedia documents using granular and hierarchical permissions |
US20110276325A1 (en) * | 2010-05-05 | 2011-11-10 | Cisco Technology, Inc. | Training A Transcription System |
CN102355646A (zh) * | 2010-09-07 | 2012-02-15 | 微软公司 | 用于转录多方对话的移动通信设备 |
US20120259924A1 (en) * | 2011-04-05 | 2012-10-11 | Cisco Technology, Inc. | Method and apparatus for providing summary information in a live media session |
US20150235654A1 (en) * | 2011-06-17 | 2015-08-20 | At&T Intellectual Property I, L.P. | Speaker association with a visual representation of spoken content |
US20120323575A1 (en) * | 2011-06-17 | 2012-12-20 | At&T Intellectual Property I, L.P. | Speaker association with a visual representation of spoken content |
CN102436812A (zh) * | 2011-11-01 | 2012-05-02 | 展讯通信(上海)有限公司 | 会议记录装置及利用该装置对会议进行记录的方法 |
CN104205127A (zh) * | 2012-03-30 | 2014-12-10 | 英特尔公司 | 基于识别的安全性 |
CN104604200A (zh) * | 2012-07-16 | 2015-05-06 | 阿尔卡特朗讯 | 用于对用户兴趣简档的隐私保护聚集的方法和装置 |
CN105190641A (zh) * | 2013-03-15 | 2015-12-23 | 微软技术许可有限责任公司 | 管理策略和许可简档 |
CN104462912A (zh) * | 2013-09-18 | 2015-03-25 | 联想(新加坡)私人有限公司 | 改进的生物密码安全 |
CN106462832A (zh) * | 2014-06-04 | 2017-02-22 | 谷歌公司 | 响应于共同存在确定的调用动作 |
US20160140956A1 (en) * | 2014-11-13 | 2016-05-19 | Microsoft Technology Licensing, Llc | Prediction-based sequence recognition |
CN105096937A (zh) * | 2015-05-26 | 2015-11-25 | 努比亚技术有限公司 | 语音数据处理方法及终端 |
US20170125014A1 (en) * | 2015-10-30 | 2017-05-04 | Mcafee, Inc. | Trusted speech transcription |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN107862071A (zh) * | 2017-11-22 | 2018-03-30 | 三星电子(中国)研发中心 | 生成会议记录的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3881318B1 (en) | 2024-01-03 |
US20210295851A1 (en) | 2021-09-23 |
WO2020101670A1 (en) | 2020-05-22 |
EP3881318A1 (en) | 2021-09-22 |
EP3881318A4 (en) | 2022-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7974411B2 (en) | Method for protecting audio content | |
US20180212752A1 (en) | End-To-End Secure Operations from a Natural Language Expression | |
CN107430858B (zh) | 传送标识当前说话者的元数据 | |
US11916913B2 (en) | Secure audio transcription | |
US11615169B2 (en) | Authentication using cognitive analysis | |
JP2009501942A (ja) | 音声認識技術を利用した録音した音声内の選択的セキュリティマスキング | |
KR101775461B1 (ko) | 협력적 오디오 대화 증명 | |
US20180268824A1 (en) | Communication method, and electronic device therefor | |
EP3881318B1 (en) | Contents based on policy permissions | |
US20140032219A1 (en) | Parsimonious Protection of Sensitive Data in Enterprise Dialog Systems | |
CA3092941A1 (en) | Systems and methods for privacy-enabled biometric processing | |
Khan et al. | A novel audio forensic data-set for digital multimedia forensics | |
US20130236070A1 (en) | Automatic face detection and parental approval in images and video and applications thereof | |
Korshunov et al. | Impact of score fusion on voice biometrics and presentation attack detection in cross-database evaluations | |
US11721116B2 (en) | Managing camera actions | |
Khitrov | Talking passwords: voice biometrics for data access and security | |
JP2024526696A (ja) | 音声個人情報保護技術を利用した学習データベース構築方法及びシステム | |
CN104517068A (zh) | 一种处理录音文件方法和装置 | |
CN113571068A (zh) | 用于语音数据加密的方法及装置、电子设备、可读存储介质 | |
US11556896B2 (en) | Employment recruitment method based on face recognition and terminal device using same | |
KR102129031B1 (ko) | 동영상 내의 보안정보 비식별화 방법 및 장치 | |
US7978853B2 (en) | System and computer program product for protecting audio content | |
US11418502B2 (en) | Input entry based on user identity validation | |
Nandakumar et al. | Scamblk: A voice recognition-based natural language processing approach for the detection of telecommunication fraud | |
US20220254337A1 (en) | Systems and Methods for Providing a Sociolinguistic Virtual Assistant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |