CN104509065B - 使用说话能力作为人类交互证明 - Google Patents

使用说话能力作为人类交互证明 Download PDF

Info

Publication number
CN104509065B
CN104509065B CN201380040948.3A CN201380040948A CN104509065B CN 104509065 B CN104509065 B CN 104509065B CN 201380040948 A CN201380040948 A CN 201380040948A CN 104509065 B CN104509065 B CN 104509065B
Authority
CN
China
Prior art keywords
user
human interaction
biological characteristic
interaction proof
entrance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380040948.3A
Other languages
English (en)
Other versions
CN104509065A (zh
Inventor
C.米尔斯
R.辛
S.劳菲尔
S.钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN104509065A publication Critical patent/CN104509065A/zh
Application granted granted Critical
Publication of CN104509065B publication Critical patent/CN104509065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/08Use of distortion metrics or a particular distance between probe pattern and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2133Verifying human interaction, e.g., Captcha

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Storage Device Security (AREA)

Abstract

人类交互证明入口使用生物特征输入来确定用户是标准用户还是恶意行动者。人类交互证明入口从用户设备接收对在线数据服务的访问请求并且将证明询问发送到用户设备以用于呈现给用户。人类交互证明入口从用户设备接收具有基于来自用户的生物特征输入的生物特征元数据描述的证明响应。

Description

使用说话能力作为人类交互证明
背景技术
数据服务可以在互联网上提供免费服务。恶意实体可以使用假装为人类用户的软件应用来利用这些服务。软件应用可以使得用于数据服务的服务器负担过重、劫持数据服务以用于不法使用,或者中断数据服务的正常使用。例如,软件应用可以建立伪造免费的电子邮件账户以便发出垃圾邮件、贮藏销售产品以用于不法目的,或者可以剥离挖掘(stripmine)公共数据库。
发明内容
本发明内容被提供来以简化的形式引入在下面在具体实施方式中被进一步描述的概念的选择。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,其也不旨在被用来限制所要求保护的主题的范围。
在下面所讨论的实施例涉及使用生物特征(biometric)输入来确定用户是标准用户还是恶意行动者。人类交互证明入口可以从用户设备接收对在线数据服务的访问请求。人类交互证明入口可以将证明询问(challenge)发送到用户设备以用于呈现给用户。人类交互证明入口可以从用户设备接收具有基于来自用户的生物特征输入的生物特征元数据描述的证明响应。
附图说明
为了描述能够以其获得上面记载的和其它优点及特征的方式,更特别的描述被阐述并且将通过参考被图示在附图中的其特定实施例而被呈示。理解这些附图描绘了仅典型的实施例并且因此将不被认为限制其范围,实施方案将通过使用附图利用附加的特性和细节进行描述和说明。
图1用框图图示数据网络的一个实施例。
图2用框图图示计算设备的一个实施例。
图3用流程图图示执行生物特征人类交互证明会话的一个实施例。
图4用框图图示元数据证明响应的一个实施例。
图5用流程图图示用于利用人类交互证明入口来进行人类交互证明会话的方法的一个实施例。
图6用流程图图示具有用户侧处理的用于利用人类交互证明入口来进行人类交互证明会话的方法的一个实施例。
图7用流程图图示用于分析生物特征元数据描述的方法的一个实施例。
图8用流程图图示用于利用用户设备来进行人类交互证明会话的方法的一个实施例。
图9用流程图图示具有用户侧处理的用于利用用户设备来进行人类交互证明会话的方法的一个实施例。
具体实施方式
实施例在下面被详细地讨论。虽然特定实施方案被讨论,但是应理解,这被做出仅用于图示目的。相关领域的技术人员将认识到,在不脱离本公开内容的主题的精神和范围的情况下可以使用其它组件和配置。实施方案可以是机器实施的方法、具有详述存储在其上的用于至少一个处理器的方法的一组指令的有形计算机可读存储介质,或人类交互证明入口。
人类交互证明入口可以通过将证明询问发送到用户设备来防护对在线数据服务的访问。证明询问是寻求从用户引出一组一个或多个动作中的一个以确定该用户是否是恶意行动者的一组文本、一数字图像或一组音频数据。证明响应是由用户通过施行如根据证明询问所确定的动作来解决证明询问的尝试。证明询问应答是正确地解决证明询问的用户的动作。用户设备可以从用户接收生物特征输入来创建对于证明询问的证明响应。生物特征输入是标识用户的人类产生的输入,诸如话音、指纹或面部图像。人类交互证明入口可以基于生物特征输入来确定用户是否是人类用户。
例如,人类交互证明入口可以选择要被发送到用户的证明询问以从用户引出音频响应作为证明响应。证明询问可以是供用户读取的一组文本或供用户解决的难题,诸如要求用户说出124和54的和。用户可以大声说出由证明询问引出的文本到用户设备的麦克风中。用户设备可以记录音频输入并且将该音频输入发送回到人类交互证明入口。人类交互证明入口可以处理音频记录以证实用户是人类。人类交互证明入口可以使用语音识别来验证文本被正确地说出。人类交互证明入口可以使用语音合成器检测来验证音频输入来自人类而不是生成响应的自动化***。人类交互证明入口可以创建声纹来验证单个血汗工厂(sweatshop)用户未正在创建大量账户。人类交互证明入口可以确定用户是否已成功地解决人类交互证明。音频记录以及口语文本然后可以被用于做出更好的语音识别和语音合成***。
人类交互证明入口可以将文本标识为供用户说出的证明询问。证明询问可以是从公共域作品、科学文献或文本的任何其它语料库中随机地选取的文本。可以选择文本来提供语音识别或话音合成***处理时可能具有困难的音频数据。
人类交互证明入口可以将文本作为证明询问发送到用户。文本可以被显示在网站、客户端应用、电视或其它显示屏上的控件中。替换地,可以将文本作为音频文件进行播放,从而说出所选取的文本。人类交互证明入口可以指示用户开始说出文本。对文本的记录可以是自动的或者是由用户发起的。例如,用户可以点击按钮以便使文本显示并且预期该用户立即阅读文本。替换地,证明询问可以在访问在线数据服务时存在,其中每当用户选取时该用户开始阅读。
用户设备可以将这个音频数据的记录传送回到人类交互证明入口。用户设备可以将音频记录成运动图片专家组-1音频层III格式或MP3,并且将记录作为文件发送回到人类交互证明入口。替换地,用户设备可以提取指定的特征,诸如作为时间的函数的频率或作为时间的函数的响度。用户设备可以将所指定的特征发送回到人类交互证明入口以减少带宽使用或服务器计算时间。人类交互证明入口或用户设备可以生成被称为生物特征元数据描述的所指定的特征。
人类交互证明入口可以确定所提供的音频输入或生物特征元数据描述是否表示由人类大声说出的文本。进一步地,人类交互证明入口可以确定话音是否属于正在访问过度服务容量的用户。人类交互证明入口可以通过串行地、并行地或以两者的某种组合执行话音验证来确定用户是否是恶意行动者。
人类交互证明入口可以确定证明响应中记录的语音发言是证明询问中所提供的文本的口语版本。因为正被识别的特定文本为***所知,所以闭域语音识别方法可以大大地简化语音识别组件。人类交互证明入口可以对接受可疑发言宽容以避免误报,因为附加的验证可以防止滥用。
人类交互证明入口可以验证口语文本是人类的而不是语音合成器的结果。人类交互证明入口可以使用分类器来做出这个验证。合成语音可以是非常单调的发声,使得语音与正常人类语音足够不同以致单独根据声音来标识正常人类语音是可能的。语音合成器可以频繁地使人类记录在说特定语言时使用的每个声音音素。语音合成器可以将文本译成一系列音素。语音合成器可以平滑地将相应地记录的音素级联在一起,以防止声音信号的颤动和失真以增加真实性。有限数目的记录声音和这个机器生成的平滑的存在可以帮助对合成语音的检测。
此外,分类器可以使用现有的语音合成器模型的知识。通过将语音输入对照针对要被验证的文本的来自已知合成器模型的预期输出进行比较,分类器可以检测由已知合成器中的一个所生成的输入源的类型。合成器模型的数据库可以随着新的模型被找到而被更新。多个分类方案的使用可以增加准确性。
滥用者可以解决人类交互证明的一个方式是雇佣血汗工厂来手动地解决证明询问。人类交互证明入口可以使用声纹甚至匿名的声纹来跟踪同一人类利用其来解决证明询问的频率。人类交互证明可以被用于创建账户并且用于压制对重要服务资源的访问,从而使同一用户得以被验证多次。然而,滥用者可以典型地利用对于证明询问的更多的证明响应在大得多的规模上操作。通过将通过声纹的验证的数目和频率限制到与服务的合法使用一致的数目,人类交互证明入口可以标识血汗工厂用户。
人类交互证明入口可以通过使声纹与用户账户相关联来保护免于牵涉人类发言者的血汗工厂式攻击。这样的关联可以被用于在用户账户被创建之后给出的证明询问。对于账户特定的人类交互证明会话而言,人类交互证明入口使用用户语音输入来构建表征用户声纹的用户模型。人类交互证明入口可以通过来自多个会话的聚合输入来增强用户模型。同时,人类交互证明入口可以使用该用户模型来验证每个人类交互证明输入。如果输入发言在验证期间不适合用户账户的用户模型,则人类交互证明入口可以确定发言者未能回应(fail)询问。用户模型的数据库可以被用于其它目的,诸如用户认证。人类交互证明入口可以使用来自其它话音源(诸如话音消息传送)的语音输入来扩增用户模型。
附加地,人类交互证明入口可以执行平滑度核对、音频数据库核对或声纹一致性核对来验证来自其它源的多个音频片段未被拼接在一起以生成响应。随着新的滥用技术被发明,人类交互证明入口可以添加附加的核对以缓和滥用技术或者调整话音验证以计及滥用技术。
一旦人类交互证明入口已经验证用户,人类交互证明入口就可以确定用户是否被授权访问在线数据服务或在线数据资源。人类交互证明入口可以限制被消耗资源的量。如果证明响应成功地解决证明询问,则人类交互证明入口可以验证用户。替换地,人类交互证明入口可以对生物特征元数据描述应用一系列逻辑规则。人类交互证明入口可以将置信分数分配给生物特征元数据描述的每个方面。人类交互证明入口可以对每个方面和置信分数应用机器学习分类器,并且预测用户是否是被授权访问在线数据服务的人类。
因此,在一个实施例中,人类交互证明入口可以使用生物特征输入来确定用户是标准用户还是恶意行动者。人类交互证明入口可以从用户设备接收对在线数据服务的访问请求。人类交互证明入口可以将证明询问发送到用户设备以用于呈现给用户。人类交互证明入口可以从用户设备接收具有基于来自用户的生物特征输入的生物特征元数据响应描述的证明响应。人类交互证明入口可以分析描述生物特征输入的生物特征元数据描述以标识人类血汗工厂。
图1用框图图示数据网络100的一个实施例。用户设备110可以经由数据网络连接130(诸如互联网)连接到数据服务器120。用户设备110可以访问由数据服务器120所执行的在线数据服务122。在线数据服务122可以使用人类交互证明(HIP)入口140来保护对在线数据服务122的访问。人类交互证明入口140可以由数据服务器120或者由单独的人类交互证明服务器150执行。
人类交互证明入口140可以将由证明询问数据库160提供的一个或多个证明询问发送到用户设备110。人类交互证明入口140可以生成证明询问以用于呈现给用户。证明询问可以从用户探寻生物特征输入作为证明响应。生物特征输入是标识人类的生物学上产生的输入,诸如用户的语音、指纹或图像。人类交互证明服务器150然后可以处理证明响应以验证用户是人类。人类交互证明入口140可以基于来自用户的生物特征输入进一步检查证明响应以确定该用户是否来自人类血汗工厂。
对于来自用户的音频输入,人类交互证明服务器150可以将该音频输入与证明询问应答相比较,同时处理音频输入的生物特征元数据描述以验证该音频输入不是计算机生成的或人类血汗工厂的产品。人类交互证明服务器150可以将音频输入转换为文本格式、音频格式或任何中间格式以确定与证明询问应答的匹配。生物特征元数据描述可以在人类交互证明服务器150处被从音频输入生成。替换地,人类交互证明入口可以将转换小应用程序(applet)112(小型基于web的应用)安装在用户设备110上以生成生物特征元数据描述。当网络带宽可能致使发送音频文件不切实际时可以使用转换小应用程序112。
人类交互证明服务器150可以具有语音识别模块152以将音频输入转换成文本词或其它中间格式以用于与证明询问应答相比较。人类交互输入证明服务器150可以具有合成器检测模块154以验证音频输入是由人类而非音频合成器产生的。合成器检测模块154可以分析音频输入的音调变化(被称为单调(flatness)方面)并且将音频输入与已知的音频合成器相比较。人类交互输入证明服务器150可以具有声纹分析模块156以确定同一人类是否正在产生音频输入。声纹分析模块156可以确定账户是否每次具有同一用户并且同一用户是否正在使用多个账户,这二者可以指示人类血汗工厂。
图2图示了可以作为用户设备110、数据服务器120或人类交互证明服务器150的示范性计算设备200的框图。计算设备200可以组合硬件、软件、固件以及片上***技术中的一个或多个以实施用户设备110、数据服务器120或人类交互证明服务器150。计算设备200可以包括总线210、处理器220、存储器230、数据存储装置240、输入/输出设备250以及通信接口260。总线210或其它组件互连可以准许计算设备200的组件之间的通信。
处理器220可以包括解释并且执行一组指令的至少一个常规处理器或微处理器。存储器230可以是存储信息和指令以用于由处理器220执行的随机存取存储器(RAM)或另一类型的动态数据存储装置。存储器230还可以存储在通过处理器220执行指令期间使用的临时变量或其它中间信息。
数据存储装置240可以包括为处理器220存储静态信息和指令的常规ROM设备或另一类型的静态数据存储装置。数据存储装置240可以包括任何类型的有形计算机可读存储介质,诸如例如磁或光学记录媒体(诸如数字视频盘)及其对应的驱动器。与信号相反,有形计算机可读存储介质是存储机器可读代码或指令的物理介质。使指令存储在如本文中所描述的计算可读媒体上可与使指令传播或传送区分开,因为传播将指令进行转移,与诸如能够随着具有存储在其上的指令的计算机可读介质而发生的将指令进行存储相对。因此,除非另外指出,否则以这个形式或类似形式对具有存储在其上的指令的计算机可读媒体或介质的引用引用了数据可以被存储或保持在其上的有形媒体。数据存储装置240可以存储详述方法的一组指令,所述指令当被一个或多个处理器执行时使一个或多个处理器施行所述方法。数据存储装置240还可以是用于存储证明询问的数据库或数据库接口。
输入/输出设备250可以包括准许用户将信息输入到计算设备200的一个或多个常规机构,诸如键盘、鼠标、话音识别设备、麦克风、头戴式耳机、手势识别设备、触摸屏等。输入/输出设备250可以包括将信息输出给用户的一个或多个常规机构,包括显示器、打印机、一个或多个扬声器、头戴式耳机或介质,诸如存储器或磁盘或光盘以及对应的盘驱动器。通信接口260可以包括使得计算设备200能够与其它设备或网络进行通信的任何收发机类机构。通信接口260可以包括网络接口或收发机接口。通信接口260可以是无线接口、有线接口或光学接口。
计算设备200可以响应于处理器220执行包含在计算机可读存储介质(诸如,例如,存储器230、磁盘或光盘)中的指令序列来施行这样的功能。这样的指令可以被从另一计算机可读存储介质(诸如数据存储装置240)或者经由通信接口260从单独的设备读取到存储器230中。
图3用流程图图示执行生物特征人类交互证明会话300的一个实施例。用户设备110可以将访问请求302发送到人类交互证明入口140。人类交互证明入口140可以将证明询问304返回给用户设备110。证明询问304可以是文本段或音频词。文本段可以是失真文本词、被更改成呈示不可由光学字符识别读取的文本词的文本词。音频词是被用户设备110播放以供用户聆听的音频文件。替换地,证明询问可以描述供用户施行的动作,诸如将指尖施加到印迹阅读机或为数字图像捕获而微笑。
用户设备110可以将证明响应306提供给人类交互证明入口140以解决证明询问304。证明响应306可以是生物特征输入,诸如音频输入、指纹或面部的数字图像捕获。音频输入可以产生用户说出证明询问词的音频文件。如果隐私不是问题,则指纹或数字图像捕获可以具体地标识用户。人类交互证明入口140可以进一步确定生物特征元数据描述是否指示用户是否是恶意行动者,诸如人类血汗工厂或软件应用。
带宽问题可以明显地使用户放慢。人类交互证明入口140可以将转换小应用程序112发送到用户设备110以从音频输入产生元数据证明响应,使得证明响应可以使用较少的带宽。虽然由转换小应用程序产生的元数据证明响应可以保存带宽,但是元数据证明响应可能不太安全。
图4用框图图示针对音频输入的元数据证明响应400的一个实施例。元数据证明响应400可以具有指示人类交互证明入口140接收到元数据证明响应400的人类交互证明入口地址410。元数据证明响应400可以具有响应表示420,诸如文本词、音频文件,或通过转换小应用程序112的话音识别模块从音频输入生成的其它中间格式表示。元数据证明响应可以具有基于来自用户的生物特征输入的生物特征元数据描述430。生物特征元数据描述430可以具有通过转换小应用程序112从音频输入生成的声纹432。声纹432可以标识用户。生物特征元数据描述430可以具有通过转换小应用程序112从音频输入生成的电平434。电平434描述遍及音频输入的音量。生物特征元数据描述430可以具有通过转换小应用程序112从音频输入生成的音调436。音调436描述音频输入的随着时间推移的频率。生物特征元数据描述430可以具有通过转换小应用程序112从音频输入生成的速度438。速度438可以描述用来创建音频输入的时间的长度。元数据证明响应400可以具有由转换小应用程序112附加到元数据证明响应400的数字签名440。数字签名440可以指示元数据证明响应400来自转换小应用程序112并且不是来自恶意行动者的欺骗响应。元数据证明响应400可以具有设备地址450(诸如互联网协议地址)以标识发送元数据证明响应400的用户设备110。元数据证明响应400可以具有帮助确定用户是否是恶意行动者的其它数据,诸如网络信誉数据、设备信誉数据以及帮助人类交互证明入口140标识恶意行动者的其它信息。
人类交互证明入口140可以接收生物特征输入作为证明响应306。图5用流程图图示用于利用人类交互证明入口140来进行人类交互证明会话300的方法500的一个实施例。人类交互证明入口140可以从用户设备110接收对在线数据服务122的访问请求302(块502)。人类交互证明入口140可以从证明询问数据库160中选择证明询问304(块504)。人类交互证明入口140可以将证明询问304发送到用户设备110以用于呈现给用户(块506)。例如,人类交互证明入口140可以发送音频词作为证明询问304。
人类交互证明入口140可以从用户设备110接收基于来自用户的生物特征输入的证明响应306(块508)。人类交互证明入口140可以从证明响应306生成生物特征元数据描述(块510)。人类交互证明入口140可以将生物特征输入与证明询问应答相比较(块512)。人类交互证明入口140可以根据证明响应306来分析描述生物特征输入的生物特征元数据描述以标识恶意动作者,诸如人类血汗工厂(块514)。
如果用户在不产生任何标志的情况下已通过证明询问304(块516),则人类交互证明入口140可以基于生物特征输入来许可对用户账户的访问308(块518)。如果用户在不产生任何标志的情况下尚未通过证明询问304(块516),则人类交互证明入口140可以拒绝对在线数据服务122的访问308(块520)。
人类交互证明入口140可以将由用户设备110所创建的生物特征输入的描述用作证明响应306。图6用流程图图示具有用户侧处理的用于利用人类交互证明入口140来进行人类交互证明会话300的方法600的一个实施例。人类交互证明入口140可以从用户设备110接收对在线数据服务122的访问请求302(块602)。人类交互证明入口140可以发送用于由用户设备110安装的转换小应用程序112(块604)。人类交互证明入口140可以从证明询问数据库160中选择证明询问304(块606)。人类交互证明入口140可以将证明询问304发送到用户设备110以用于呈现给用户(块608)。例如,人类交互证明入口140可以发送文本段(诸如失真文本词)作为证明询问304。
人类交互证明入口140可以从用户设备110接收具有响应表示和基于来自用户的生物特征输入的生物特征元数据描述的证明响应306(块610)。人类交互证明入口140可以将生物特征输入与证明询问应答相比较(块612)。人类交互证明入口140可以根据证明响应306来分析描述生物特征输入的生物特征元数据描述以标识恶意行动者,诸如人类血汗工厂(块614)。
如果用户在不产生任何标志的情况下已通过证明询问304(块618),则人类交互证明入口140可以基于生物特征输入许可对用户账户的访问308(块620)。如果用户在不产生任何标志的情况下尚未通过证明询问304(块618),则人类交互证明入口140可以拒绝对在线数据服务122的访问308(块622)。
对于作为生物特征输入的音频输入,人类交互证明入口140可以检查生物特征元数据描述(诸如音频元数据描述)以确定用户是否是恶意行动者。图7用流程图图示用于分析音频输入的生物特征元数据描述的方法700的一个实施例。人类交互证明入口140可以接收基于音频输入的响应表示420(块702)。人类交互证明入口140可以将音频输入与证明询问应答相比较(块704)。如果音频输入和证明询问应答不匹配(块706),则人类交互证明入口140可以将用标记为可能的恶意行动者(块708)。
人类交互证明入口140可以确定音频输入是否来自语音合成器(块710)。如果音频输入示出了来自语音合成器的迹象(块712),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。人类交互证明入口140可以测量音频输入的单调方面(块714)。单调方面描述音频输入的音调变化。如果音频输入比指定的单调门限更为单调(块716),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。人类交互证明入口140可以跟踪证明响应306的响应时间(块718)。如果响应时间指示可疑用户,诸如在响应于证明询问304或已在队列中的证明询问304时过度地实践的用户(块720),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。
人类交互证明入口140可以将音频输入的声纹与用户账户配置文件相比较(块722)。如果人类交互证明入口针对单个用户账户标识不同的用户(块724),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。人类交互证明入口140可以标识具有高于频繁使用门限的与人类交互证明入口的交互的用户,从而指示该用户正在为多个用户账户做出响应。如果人类交互证明入口140将声纹标识为属于频繁的用户(块726),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。人类交互证明入口140可以核对用户设备的网络地址,诸如互联网协议(IP)地址(块728)。如果人类交互证明入口确定用户不在享有信誉的网络地址处(块730),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。
用户设备110可以从用户接收生物特征输入,诸如音频输入,并且将该生物特征输入发送到人类交互证明入口140。图8用流程图图示用于利用用户设备110来进行人类交互证明会话300的方法800的一个实施例。用户设备110可以将对在线数据服务120的访问请求302发送到人类交互证明入口140(块802)。用户设备110可以从人类交互证明入口140接收证明询问304(诸如音频词)以用于呈现给用户(块804)。用户设备110可以将音频词作为证明询问304呈现给用户(块806)。用户设备110可以响应于证明询问304从用户接收生物特征输入。例如,用户设备110可以响应于证明询问304从用户接收音频输入(块808)。用户设备110可以将证明响应306发送到人类交互证明入口140(块810)。
用户设备110可以在传送到人类交互证明入口140之前处理生物特征输入。图9用流程图图示具有用户侧处理的用于利用用户设备110来进行人类交互证明会话300的方法900的一个实施例。用户设备110可以将对在线数据服务120的访问请求302发送到人类交互证明入口140(块902)。用户设备110可以从人类交互证明入口140接收转换小应用程序112以用于安装(块904)。用户设备110可以从人类交互入口140接收证明询问304(诸如文本段)以用于呈现给用户(块906)。用户设备110可以将文本段(诸如失真文本词)作为证明询问304呈现给用户(块908)。用户设备110可以响应于证明询问304从用户接收音频输入(块910)。用户设备110可以基于音频输入来创建响应表示420,诸如文本词、音频文件或其它中间格式表示(块912)。用户设备110可以基于要被发送到人类交互证明入口140的音频输入来创建生物特征元数据描述430(块914)。用户设备110可以使用转换小应用程序来签名于证明响应以对证明响应400进行认证(块916)。用户设备110可以将具有响应表示420和生物特征元数据描述430的证明响应306发送到人类交互证明入口140(块918)。
尽管已经用特定于结构特征和/或方法学行为的语言描述了本主题,但是应当理解,所附权利要求中的主题未必限于上面所描述的特定特征或行为。相反,上面所描述的特定特征和行为作为用于实施权利要求的示例形式被公开。
在本发明的范围内的实施例还可以包括用于承载或者具有存储在其上的计算机可执行指令或数据结构的非暂时性计算机可读存储媒体。这样的非暂时性计算机可读存储媒体可以是能够被通用计算机或专用计算机存取的任何可用的媒体。作为示例而非限制,这样的非暂时性计算机可读存储媒体能够包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁数据存储装置,或能够被用来以计算机可执行指令或数据结构的形式承载或者存储期望的程序代码构件的任何其它介质。以上所述的组合还应当被包括在非暂时性计算机可读存储媒体的范围内。
实施例还可以在其中任务由(通过硬连线链路、无线链路或通过其组合)经由通信网络而被链接的本地和远程处理设备施行的分布式计算环境中被实践。
计算机可执行指令包括例如使通用计算机、专用计算机或专用处理设备施行某个功能或一组功能的指令和数据。计算机可执行指令还包括由独立或网络环境中的计算机来执行的程序模块。一般地,程序模块包括施行特定任务或者实施特定抽象数据类型的例程、程序、对象、组件以及数据结构等。计算机可执行指令、相关联的数据结构以及程序模块表示用于执行本文中所公开的方法的步骤的程序代码装置的示例。这样的可执行指令或相关联的数据结构的特定顺序表示用于实施这样的步骤中所描述的功能的对应行为的示例。
尽管上述描述可以包含特定细节,但是它们不应当被解释为以任何方式限制权利要求。所描述的实施例的其它配置是本公开内容的范围的一部分。例如,本公开内容的原理可以被应用于每个单独的用户,其中每个用户可以单独地部署这样的***。即使大量可能的应用中的任何一个不使用本文中所描述的功能性,这也使得每个用户能够利用本公开内容的益处。电子设备的多个实例每个都可以以各种可能的方式处理内容。实施方案未必在由所有终端用户使用的一个***中。因此,所附权利要求及其法定等同物应当仅限定本发明,而不是所给出的任何特定示例。

Claims (10)

1.一种用于人类交互证明会话的、机器实施的方法,包括:
从用户设备接收对在线数据服务的访问请求;
将证明询问发送到所述用户设备以用于呈现给用户;
从所述用户设备接收证明响应,所述证明响应具有由转换小应用程序在所述用户设备处从来自所述用户的生物特征输入提取的生物特征元数据描述,所述生物特征元数据描述描述了所述生物特征输入的水平、音调和速度中的至少一个;以及
将所述生物特征输入的所述生物特征元数据描述与将来自多个会话的输入与用户账户进行聚合的用户账户配置文件的用户模型相比较。
2.根据权利要求1所述的方法,进一步包括:
发送所述转换小应用程序以用于由所述用户设备安装。
3.根据权利要求1所述的方法,进一步包括:
将所述生物特征输入与证明询问应答相比较。
4.根据权利要求1所述的方法,进一步包括:
接收基于音频输入的响应表示。
5.根据权利要求4所述的方法,进一步包括:
测量所述音频输入的单调方面。
6.根据权利要求4所述的方法,进一步包括:
将声纹标识为属于频繁的用户。
7.根据权利要求1所述的方法,进一步包括:
基于所述生物特征输入来许可对用户账户的访问。
8.一种用于人类交互证明会话的、机器实施的方法,所述方法包括:
将对在线数据服务的访问请求发送到人类交互证明入口;
从所述人类交互证明入口接收证明询问以用于呈现给用户;
响应于所述证明询问从所述用户接收音频输入;
基于要被发送到所述人类交互证明入口的所述音频输入来创建由转换小应用程序在所述用户设备处生成的生物特征元数据描述;以及
利用所述转换小应用程序对所述生物特征元数据描述进行签名以指示所述生物特征元数据描述来自于所述转换小应用程序。
9.一种人类交互证明入口,包括:
通信接口,其被配置成从用户设备接收对在线数据服务的访问请求;以及
处理器,其被配置用来生成证明询问以用于呈现给用户并且用来检查生物特征输入元数据描述以确定是否许可对所述在线数据服务的访问,生物特征描述由转换小应用程序在所述用户设备处生成并进行签名以指示生物特征元数据描述来自于所述转换小应用程序。
10.根据权利要求9所述的人类交互证明入口,其中所述处理器确定所述生物特征输入元数据描述是否描述语音合成器。
CN201380040948.3A 2012-08-02 2013-08-01 使用说话能力作为人类交互证明 Active CN104509065B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/564722 2012-08-02
US13/564,722 US9390245B2 (en) 2012-08-02 2012-08-02 Using the ability to speak as a human interactive proof
PCT/US2013/053107 WO2014022602A2 (en) 2012-08-02 2013-08-01 Using the ability to speak as a human interactive proof

Publications (2)

Publication Number Publication Date
CN104509065A CN104509065A (zh) 2015-04-08
CN104509065B true CN104509065B (zh) 2017-11-07

Family

ID=48986235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380040948.3A Active CN104509065B (zh) 2012-08-02 2013-08-01 使用说话能力作为人类交互证明

Country Status (6)

Country Link
US (2) US9390245B2 (zh)
EP (1) EP2880834B1 (zh)
JP (1) JP6697265B2 (zh)
KR (1) KR102210775B1 (zh)
CN (1) CN104509065B (zh)
WO (1) WO2014022602A2 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104104664A (zh) * 2013-04-11 2014-10-15 腾讯科技(深圳)有限公司 对验证码进行验证的方法、服务器、客户端和***
EP3608812A1 (en) * 2014-03-21 2020-02-12 Samsung Electronics Co., Ltd. System and method for executing file by using biometric information
FR3019424A1 (fr) * 2014-03-31 2015-10-02 Orange Procede de construction d'un message par un terminal
JP6369543B2 (ja) * 2014-06-19 2018-08-08 日本電気株式会社 認証装置、認証システム、認証方法およびコンピュータプログラム
US9555807B2 (en) * 2015-05-01 2017-01-31 Delphi Technologies, Inc. Automated vehicle parameter modification based on operator override
US20160381560A1 (en) * 2015-06-27 2016-12-29 Offla Selfsafe Ltd. Systems and methods for derivative fraud detection challenges in mobile device transactions
US11030618B1 (en) 2016-09-30 2021-06-08 Winkk, Inc. Authentication and personal data sharing for partner services using out-of-band optical mark recognition
CN108681934A (zh) * 2018-04-25 2018-10-19 厦门快商通信息技术有限公司 一种交易平台及其不良用户的识别方法
WO2020018454A1 (en) 2018-07-16 2020-01-23 Islamov Rustam Cryptography operations for secure post-quantum communications
RU2744063C1 (ru) 2018-12-18 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения говорящего пользователя управляемого голосом устройства
CN109801638B (zh) * 2019-01-24 2023-10-13 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备及存储介质
US11652815B2 (en) 2019-12-10 2023-05-16 Winkk, Inc. Security platform architecture
US11928193B2 (en) 2019-12-10 2024-03-12 Winkk, Inc. Multi-factor authentication using behavior and machine learning
US11936787B2 (en) * 2019-12-10 2024-03-19 Winkk, Inc. User identification proofing using a combination of user responses to system turing tests using biometric methods
US11574045B2 (en) 2019-12-10 2023-02-07 Winkk, Inc. Automated ID proofing using a random multitude of real-time behavioral biometric samplings
US11657140B2 (en) 2019-12-10 2023-05-23 Winkk, Inc. Device handoff identification proofing using behavioral analytics
US11553337B2 (en) 2019-12-10 2023-01-10 Winkk, Inc. Method and apparatus for encryption key exchange with enhanced security through opti-encryption channel
US11328042B2 (en) 2019-12-10 2022-05-10 Winkk, Inc. Automated transparent login without saved credentials or passwords
US11843943B2 (en) 2021-06-04 2023-12-12 Winkk, Inc. Dynamic key exchange for moving target
US11824999B2 (en) 2021-08-13 2023-11-21 Winkk, Inc. Chosen-plaintext secure cryptosystem and authentication
US20230142081A1 (en) * 2021-11-10 2023-05-11 Nuance Communications, Inc. Voice captcha

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106798A (ja) * 1986-10-24 1988-05-11 株式会社東芝 個人認証装置
US6266640B1 (en) * 1996-08-06 2001-07-24 Dialogic Corporation Data network with voice verification means
US6618806B1 (en) 1998-04-01 2003-09-09 Saflink Corporation System and method for authenticating users in a computer network
JP4120997B2 (ja) * 1998-10-23 2008-07-16 富士通株式会社 不正アクセス判断装置及び方法
US6978238B2 (en) * 1999-07-12 2005-12-20 Charles Schwab & Co., Inc. Method and system for identifying a user by voice
JP2001052125A (ja) * 1999-08-05 2001-02-23 Casio Comput Co Ltd 認証装置および、認証システム
JP4440414B2 (ja) * 2000-03-23 2010-03-24 富士通株式会社 話者照合装置及び方法
JP4390122B2 (ja) * 2001-03-14 2009-12-24 富士通株式会社 バイオメトリック情報を用いた利用者認証システム
US6898568B2 (en) * 2001-07-13 2005-05-24 Innomedia Pte Ltd Speaker verification utilizing compressed audio formants
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
JP2003087860A (ja) * 2001-09-10 2003-03-20 Ntt Docomo Tokai Inc 移動体通信における個人認証方法、移動体通信における個人認証システム及び個人認証装置
JP2003114617A (ja) * 2001-10-03 2003-04-18 Systemfrontier Co Ltd 音声による認証システム及び音声による認証方法
JP2004038848A (ja) * 2002-07-08 2004-02-05 Apukotto:Kk 個人認証方法とその装置、及び個人認証プログラム
JP2004133119A (ja) * 2002-10-09 2004-04-30 Matsushita Electric Ind Co Ltd 携帯端末装置
US20040199469A1 (en) * 2003-03-21 2004-10-07 Barillova Katrina A. Biometric transaction system and method
US20060047766A1 (en) 2004-08-30 2006-03-02 Squareanswer, Inc. Controlling transmission of email
US7484102B2 (en) * 2004-09-07 2009-01-27 Microsoft Corporation Securing audio-based access to application data
JP4778242B2 (ja) * 2005-01-26 2011-09-21 Necビッグローブ株式会社 個人情報通信システム及びその方法
JP4719493B2 (ja) * 2005-03-31 2011-07-06 綜合警備保障株式会社 認証システムおよび認証方法
US8036902B1 (en) * 2006-06-21 2011-10-11 Tellme Networks, Inc. Audio human verification
EP2605171B1 (en) 2007-01-23 2016-03-30 Carnegie Mellon University Controlling access to computer systems and annotating media files
CN101241572B (zh) * 2007-02-08 2015-12-09 天地融科技股份有限公司 一种电子签名工具的操作方法及电子签名工具
US20090055193A1 (en) 2007-02-22 2009-02-26 Pudding Holdings Israel Ltd. Method, apparatus and computer code for selectively providing access to a service in accordance with spoken content received from a user
US20090183247A1 (en) 2008-01-11 2009-07-16 11I Networks Inc. System and method for biometric based network security
US8140340B2 (en) * 2008-01-18 2012-03-20 International Business Machines Corporation Using voice biometrics across virtual environments in association with an avatar's movements
JP5400301B2 (ja) * 2008-01-23 2014-01-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 認証サーバ装置、認証方法、及び認証プログラム
US8536976B2 (en) 2008-06-11 2013-09-17 Veritrix, Inc. Single-channel multi-factor authentication
US8222886B2 (en) 2008-06-18 2012-07-17 Hioki Denki Kabushiki Kaisha Voltage detecting apparatus and line voltage detecting apparatus having a detection electrode disposed facing a detected object
US8494854B2 (en) 2008-06-23 2013-07-23 John Nicholas and Kristin Gross CAPTCHA using challenges optimized for distinguishing between humans and machines
US8793135B2 (en) 2008-08-25 2014-07-29 At&T Intellectual Property I, L.P. System and method for auditory captchas
US20100076770A1 (en) * 2008-09-23 2010-03-25 Veeru Ramaswamy System and Method for Improving the Performance of Voice Biometrics
US8190544B2 (en) * 2008-12-12 2012-05-29 International Business Machines Corporation Identifying and generating biometric cohorts based on biometric sensor input
EP2391053A1 (en) * 2009-01-23 2011-11-30 Vanios Consulting, S.l. Secure access control system
GB0910897D0 (en) * 2009-06-24 2009-08-05 Vierfire Software Ltd Authentication method and system
US20110029371A1 (en) 2009-07-30 2011-02-03 Devries Derek Method and system of allocation of popularity credit in a private communications network
US8312073B2 (en) * 2009-08-04 2012-11-13 Palo Alto Research Center Incorporated CAPTCHA-free throttling
JP5325746B2 (ja) * 2009-11-05 2013-10-23 エヌ・ティ・ティ・コムウェア株式会社 サービス提供システム、サービス提供方法及びプログラム
US8656486B2 (en) * 2010-02-12 2014-02-18 Authentec, Inc. Biometric sensor for human presence detection and associated methods
JPWO2011122522A1 (ja) * 2010-03-30 2013-07-08 日本電気株式会社 感性表現語選択システム、感性表現語選択方法及びプログラム
US20110320201A1 (en) * 2010-06-24 2011-12-29 Kaufman John D Sound verification system using templates
US20120232907A1 (en) * 2011-03-09 2012-09-13 Christopher Liam Ivey System and Method for Delivering a Human Interactive Proof to the Visually Impaired by Means of Semantic Association of Objects
US8522327B2 (en) * 2011-08-10 2013-08-27 Yahoo! Inc. Multi-step captcha with serial time-consuming decryption of puzzles
US20130347067A1 (en) 2012-06-21 2013-12-26 Microsoft Corporation Dynamic human interactive proof
US9965607B2 (en) * 2012-06-29 2018-05-08 Apple Inc. Expedited biometric validation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer

Also Published As

Publication number Publication date
US9390245B2 (en) 2016-07-12
US10158633B2 (en) 2018-12-18
EP2880834B1 (en) 2018-11-07
WO2014022602A2 (en) 2014-02-06
US20140039892A1 (en) 2014-02-06
US20170134376A1 (en) 2017-05-11
KR20150040892A (ko) 2015-04-15
KR102210775B1 (ko) 2021-02-01
JP6697265B2 (ja) 2020-05-20
EP2880834A2 (en) 2015-06-10
JP2015528969A (ja) 2015-10-01
WO2014022602A3 (en) 2014-03-27
CN104509065A (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
CN104509065B (zh) 使用说话能力作为人类交互证明
JP5695709B2 (ja) 生体認証および自己学習アルゴリズムを用いた個人用アカウント識別子の有効化方法およびシステム。
KR101201151B1 (ko) 사용자 인증을 위한 시스템 및 방법
TW201907330A (zh) 身份認證的方法、裝置、設備及資料處理方法
KR20170001548A (ko) 성문 인증 방법 및 장치
US20130132093A1 (en) System and Method for Generating Challenge Items for CAPTCHAs
CN104158664A (zh) 一种身份认证方法及***
CN112105297A (zh) 健康相关信息生成和存储
Turner et al. Attacking speaker recognition systems with phoneme morphing
KR102079303B1 (ko) 기계학습을 이용한 음성 인식 OTP(One Time Password)인증 방법 및 시스템
Zhang et al. Volere: Leakage resilient user authentication based on personal voice challenges
CN112397072B (zh) 语音检测方法、装置、电子设备及存储介质
US20180342240A1 (en) System and method for assessing audio files for transcription services
CN113033191A (zh) 语音数据处理方法、电子设备及计算机可读存储介质
Mubeen et al. Detection of impostor and tampered segments in audio by using an intelligent system
CN110298150B (zh) 一种基于语音识别的身份验证方法及***
US11227610B1 (en) Computer-based systems for administering patterned passphrases
Li et al. An Application-Oriented Taxonomy on Spoofing, Disguise and Countermeasures in Speaker Recognition
Turner Security and privacy in speaker recognition systems
US20240177730A1 (en) Intelligent transcription and biomarker analysis
WO2023013060A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記録媒体
CN107194686B (zh) 一种声音支付的方法及***
FI126129B (en) Audiovisual associative authentication procedure and equivalent system
Adamski A speaker recognition solution for identification and authentication
Zhang Understanding and Securing Voice Assistant Applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150713

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150713

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

GR01 Patent grant
GR01 Patent grant