CN102223367B - 移动用户访问网站的方法、设备及*** - Google Patents

移动用户访问网站的方法、设备及*** Download PDF

Info

Publication number
CN102223367B
CN102223367B CN201110156221.4A CN201110156221A CN102223367B CN 102223367 B CN102223367 B CN 102223367B CN 201110156221 A CN201110156221 A CN 201110156221A CN 102223367 B CN102223367 B CN 102223367B
Authority
CN
China
Prior art keywords
user
website
mobile device
voice signal
authentication result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110156221.4A
Other languages
English (en)
Other versions
CN102223367A (zh
Inventor
何婷婷
胡郁
胡国平
葛勇
王智国
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201110156221.4A priority Critical patent/CN102223367B/zh
Publication of CN102223367A publication Critical patent/CN102223367A/zh
Application granted granted Critical
Publication of CN102223367B publication Critical patent/CN102223367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及网站访问技术领域,公开了一种移动用户访问网站的方法、设备及***,该方法包括:接收用户访问网站的语音信号;根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。利用本发明,可以实现移动用户访问网站时的自动登录,提高访问效率。

Description

移动用户访问网站的方法、设备及***
技术领域
本发明涉及网站访问技术领域,特别涉及一种移动用户访问网站的方法、设备及***。
背景技术
近年来随着互联网应用日新月异的发展,网络资源日益丰富,给用户的信息获取带来了极大的便利。然而很多网站尤其是各类论坛对用户访问权限往往做了各种设定,需要用户登录并在身份验证有效后才支持特定功能的访问。个性订制模式保障了用户数据安全,然而多网站访问需要的频繁注册和登录也给用户带来了很大的不便。首先用户在网站注册时,由于各网站对用户名或密码的输入往往有不同规则限定或者用户常用的用户名被注册,导致用户不可能一直采用自己习惯的登录名,而在不同网站注册了不同的用户名。在后续网站登录时,对应不同网站需要记忆不同的注册信息,给用户信息管理带来了不便。其次用户在移动设备特别是在屏幕较小的手机等设备上输入账号密码往往不太方便。显然用户独立注册登录不同网站的方式在日益丰富的网络资源应用下显得过于复杂,访问效率低。
发明内容
本发明实施例提供一种移动用户访问网站的方法、设备及***,以解决现有技术中移动用户访问不同网站实现复杂的问题,实现移动用户访问网站时的自动登录,提高访问效率。
一方面,本发明实施例提供一种移动用户访问网站的方法,包括:
接收用户访问网站的语音信号;
根据所述语音信号进行用户身份有效性验证以及网站名解析;
根据用户身份验证结果向解析得到的网站发送访问请求。
优选地,所述根据所述语音信号进行用户身份有效性验证包括:
从所述语音信号中提取声纹特征;
将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
优选地,所述根据所述语音信号进行网站名解析包括:
从所述语音信号中提取声学特征;
利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
根据匹配结果,确定用户请求访问的网站。
优选地,所述方法还包括:在根据所述语音信号进行用户身份有效性验证以及网站名解析之前,对所述语音信号进行降噪处理。
优选地,所述根据用户身份验证结果向解析得到的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动设备,包括:
语音信息接收单元,用于接收用户访问网站的语音信号;
身份验证单元,用于根据所述语音信号进行用户身份有效性验证;
解析单元,用于根据所述语音信号进行网站名解析;
访问单元,用于根据所述身份验证单元得到的用户身份验证结果向所述解析单元解析得到的网站发送访问请求。
优选地,所述身份验证单元包括:
声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
优选地,所述解析单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征;
语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
优选地,所述移动设备还包括:
预处理单元,用于对所述语音信息接收单元接收的语音信号进行降噪处理。
优选地,所述访问单元包括:
判断子单元,用于在所述身份验证单元的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
注册子单元,用于在所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
第一发送子单元,用于在所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
第二发送子单元,用于在所述身份验证单元的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动用户访问网站的***,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,并将所述语音信号发送给所述服务器;
所述服务器,用于接收所述客户端发送的语音信号,并根据所述语音信号进行用户身份有效性验证以及网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
优选地,所述客户端,还用于在将所述语音信号发送给所述服务器之前,对所述语音信号进行降噪处理。
优选地,所述客户端根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动用户访问网站的***,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给所述服务器;
所述服务器,用于接收所述客户端发送的所述声纹特征和声学特征,并根据所述声纹特征进行用户身份有效性验证,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
优选地,所述客户端,还用于在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。
本发明实施例移动用户访问网站的方法、设备及***,在接收到用户访问网站的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。即无需用户通过手工方式在不同网站注册,自动实现移动用户访问网站时的自动登录,提高访问效率。
附图说明
为了更清楚地说明本发明实施的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例移动设备对网站访问的方法的流程图;
图2是本发明实施例中用户身份有效性验证的流程图;
图3是本发明实施例中网站名解析的流程图;
图4是本发明实施例移动设备的一种结构示意图;
图5是本发明实施例移动设备的另一种结构示意图;
图6是本发明实施例移动设备对网站访问的***的一种结构示意图;
图7是本发明实施例移动设备对网站访问的***的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于随着智能手机的普及和移动通讯技术的发展,移动设备的功能日益增强,更多地承担起私人助理的角色,用户在其上可实现众多个性化操作。为此,本发明实施例移动用户访问网站的方法、设备及***,在接收到用户访问网站的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。即无需用户通过手工方式在不同网站注册,自动实现移动用户访问网站时的自动注册及登录,提高访问效率。
如图1所示,是本发明实施例移动设备对网站访问的方法的流程图,包括以下步骤:
步骤101,接收用户访问网站的语音信号。
移动设备可以跟踪用户输入,记录用户输入的语音信号。在具体应用中,为了降低语音信号识别的复杂度,可以设置一个类似导航页面的界面,记录用户在该界面下输入的语音信号。
上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
在实际应用中,可以将上述语音信号采样为一系列离散能量值存入数据缓存区。
步骤102,根据所述语音信号进行用户身份有效性验证以及网站名解析。
具体地,可以预先在移动设备中载入该移动设备注册用户的声纹模型、以及声学模型。
所述声纹模型用于模拟当前移动设备支持的使用者即注册用户的发音特点,利用上述声纹模型及语音信号进行用户身份有效性验证,判断其是否为当前用户设备的合法用户。
所述声学模型用于模拟字符发音,计算用户输入的语音信号相对于不同发音模型的相似度,进而识别用户指令内容,确定用户请求登录的网站。
用户身份有效性验证及网站名解析的具体过程将在后面详细说明。
步骤103,根据用户身份验证结果向解析得到的网站发送访问请求。
具体地,如果用户身份验证结果是所述用户是当前移动设备的合法用户,则需要进一步判断所述用户是否为首次登录所述解析得到的网站;如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求。
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
考虑到移动设备很大程度上起到用户私人助理的职责,主要供用户个人使用,因而在本发明实施例中,可以提取移动设备标识IMEI(InternationalMobile Equipment Identity,国际移动设备标识)作为用户名,在上述注册过程中,可以将移动设备的IMEI信息包含在上述注册请求中,发送给网站服务器,从而自动完成注册过程。由于IMEI的唯一性和不重复性,避免了用户自行设计用户名的困难,而同时其自动检测提取也极为方便,提高了效率。
当然,本发明实施例中并不限定上述作为注册用户名的具体信息,比如还可以是手机号码,IP地址等。
可见,本发明实施例移动设备对网站访问的方法,只需用户通过语音指令的方式发出网站登录请求,在移动设备对用户身份验证后自动实现登录,无需移动设备用户输入用户名及密码,避免了小屏幕设备上输入的困难及账号管理的困扰,通过对用户身份的验证实现对访问网站的自动登录,有效地提高了访问效率。
需要说明的是,考虑到上述声纹模型以及声学模型都是在无噪声“干净”的环境中采集训练得到,而当真实测试环境中存在各种噪音干扰如背景音时,解析识别的性能会有所下降。因此,为了提高***的鲁棒性,在上述步骤101和步骤102之间还可进一步包括以下步骤:对接收的语音信号进行降噪处理。
首先通过对语音信号的短时能量和短时过零率分析,将连续的语音信号分割成独立的语音片断和非语音片断,然后对分割得到的语音片断进行语音增强处理,在进行语音增强处理时,可以通过维纳滤波等方法,将语音信号中的环境噪声进一步消除,以提高后续***对该信号的处理能力。
相应地,在后续步骤102中,则可以利用降噪处理后的语音信号进行用户身份有效性验证以及网站名解析。
下面将对本发明实施例中对用户身份有效性验证及网站名解析的过程做详细说明。
在本发明实施例中,可以采用声纹识别技术对用户身份进行有效性验证。声纹识别是一种根据语音波形中说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性。而语音识别的目的是识别出语音信号中的言语内容,并不考虑说明人是谁,它强调的是共性。一个基本的声纹识别***通常包括特征检测、模式匹配以及模式判断几部分。本发明实施例中用户身份有效性检测就是对用户输入的语音信号进行分析,判断其是否为当前移动设备的合法用户,即注册用户。
如图2所示,是本发明实施例中用户身份有效性验证的一种流程图,包括以下步骤:
步骤201,从输入的语音信号中提取声纹特征。
首先从输入的语音信号中提取唯一表现说话人身份的有效且稳定可靠的声纹特征,该声纹特征可以有效地区分不同的说话人,且对同一说话人声音的变化保持相对稳定。具体可以采用现有的一些声纹识别***完成上述声纹特征的提取。目前的声纹识别***主要依靠较低层次的声学特征进行识别,主要有谱包络参数语音特征,基音轮廓、共振峰频率带宽特征,线性预测系数,倒谱系数等。考虑到特征的可量化性、训练样本的数量和***性能的评价等问题,可以优先选用39维MFCC(Mel Frequency CepstrumCoefficient,Mel频率倒谱系数)特征用作语音识别和用户身份认证。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。MFCC则是利用它们之间的这种关系,计算得到的Hz频谱特征。
对提取的13维MFCC特征序列,分别计算这13维特征的一阶和二阶倒数,这样对每一语音帧都得到39维的特征矢量。
步骤202,将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度。
将提取的声纹特征记为X,将移动设备注册用户声纹模型记为U,则将声纹特征X与当前移动设备注册用户的声纹模型U进行匹配,得到对应的相似度得分为p(X|U),即上述第一相似度为p(X|U)。
步骤203,将所述声纹特征与背景声纹模型或仿冒者声纹模型进行匹配,得到第二相似度。
同样,将背景声纹模型或仿冒者声纹模型记为G,则将声纹特征X与背景声纹模型或仿冒者声纹模型G进行匹配,得到对应的相似度得分为p(X|G),即上述第二相似度为p(X|G)。
需要说明的是,上述步骤202和步骤203中模型匹配可以选用各种不同的方案,如模板匹配、动态时间规划、神经网络等等。比如可以采用语音识别领域常用的GMM(Gaussian Mixture Model,高斯混合模型)。在构建GMM模型时,为移动设备注册用户和通用模仿者分别建立单独的GMM发声模型,通过训练得到各高斯的均值、方差以及加权系数等参数。这里用户个人声纹模型是用户在初次使用上述移动设备时通过录制部分语音数据训练得到,而仿冒者声纹模型则是事先预置的通过采集大量不同发音人的语音数据提前训练得到。模型匹配时计算输入语音相对于用户声纹模型和仿冒者声纹模型相似度p(X|U)、p(X|G)。
在上述GMM声纹模型训练过程中,采用的模拟用户发音特点的GMM模型的主要参数包括高斯系数、高斯均值、方差等,具体可记为:
P ( X | U ) = Σ i = 1 M w i N ( m i , S i ) ;
其中,N(mi,si)是均值为mi,方差为si高斯分布,而wi是第i个高斯的加权系数,满足
Figure BDA0000067517050000092
M是高斯总数。
在本发明实施例中,可以综合考虑计算复杂度和训练数据数量受限的模型的模拟精确度,设定注册用户声纹模型的高斯数M值为32,而通用的仿冒者声纹模型的高斯数M值为1024。所有模型参数mi、si以及wi都由***利用用户声纹特征建模。
步骤204,根据得到的第一相似度和第二相似度计算似然比。
即计算上述语音信号相对于用户声纹模型及仿冒者声纹模型相似度的似然比P=p(X|U)/p(X|G)。
步骤205,如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
也就是说,上述比值P大于Pt,则可认为该语音更大可能为注册用户的语音,反之即可能为仿冒者的语音。Pt可以是一个预设的参数,主要用于控制检测的敏感度。一般来说,Pt越大则对用户发音要求更高,要求用户在后续使用中的发音尽可能接近其注册时的语音特征。Pt值的设定依赖于语音特征的提取和统计模型的选择,若选择的特征和模型较为鲁棒,则***容错能力较强,可以设置较大的Pt以提高精度。
当然,在具体应用中,还可以采用其他方式对用户身份有效性进行验证,对此本发明实施例不做限定。
在本发明实施例中,可以通过对接收到的语音信号进行语音识别,并通过关键字检索等技术判断用户当前请求登录的网站。
如图3所示,是本发明实施例中网站名解析的流程图,包括以下步骤:
步骤301,从输入的语音信号中提取声学特征。
原始的语音信号中往往含有各种冗余信息,对***运算效率和识别性能都有一定的影响。为此,在本发明实施例中,可以从原始语音信号中提取语音的声学特征。考虑到语音信号的时变特性,可以从相对平稳的短时语音帧上提取特征。具体地,可以选用语音识别领域常用的MFCC特征,按照时序顺序依次对窗长25ms帧移10ms的短帧语音做频谱变换得到M维MFCC参数(例如选择M=39),将原始的易受噪音干扰的语音信号转换为具有更高鲁棒性的声学特征。这样,可以将原本连续的语音信号表征为一系列的特征矢量O=(O1,O2,…,OT),其中T为语音段总帧数。
步骤302,利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串。
由于汉语字符过多,如果对每个字符单独建模,一方面模型参量太大,另一方面计算量也会急剧增加,因此,在实际应用中,可以考虑仅对400多个音节分别建模,对提取得到的声学特征O实现从连续语音到音节串的匹配。这样通过连续语音识别、模型匹配得到最优音节串识别结果,即得到最优的音节候选串。
步骤303,将所述音节候选串与预置的网站关键词表中的关键词进行匹配。
可以在移动设备中预置基于网站名的关键词表,建立从音节识别结果到词表内每个词的索引,将音节候选串与所述关键词选中的关键词进行匹配,得到所有可能相关的关键词。
步骤304,根据匹配结果,确定用户请求访问的网站。
比如,可以将预置的网站关键词表中的关键词扩展成拼音串序列,根据预置的拼音混淆度表(该拼音混淆度表记录了两两拼音单元之间的混淆度,如w和en的混淆度为0,en和en的混淆度为1,en和eng的混淆度为0.8等)计算上述各音节候选串与各关键词拼音串最高匹配得分。选择匹配得分最高的音节候选串对应的关键词作为用户请求访问的网站。
当然,在具体应用中,还可以采用其他方式进行网站名解析,对此本发明实施例不做限定。
需要说明的是,本发明实施例移动设备对网站访问的方法,可以单独应用于移动设备客户端,为了降低移动设备的运算压力,也可以由移动设备客户端和服务器端来共同实现。
相应地,本发明实施例还提供一种移动设备,如图4所示,是该移动设备的一种结构示意图。
在该实施例中,所述移动设备包括:
语音信息接收单元401,用于接收用户访问网站的语音信号;
身份验证单元402,用于根据所述语音信号进行用户身份有效性验证;
解析单元403,用于根据所述语音信号进行网站名解析;
访问单元404,用于根据身份验证单元402得到的用户身份验证结果向解析单元403解析得到的网站发送访问请求。
可见,本发明实施例的移动设备,只需用户通过语音指令的方式发出网站登录请求,在移动设备对用户身份验证后自动实现登录,无需移动设备用户输入用户名及密码,避免了小屏幕设备上输入的困难及账号管理的困扰,通过对用户身份的验证实现对访问网站的自动登录,有效地提高了访问效率。
在本发明实施例中,上述身份验证单元402的一种优选实施例包括:声纹特征提取子单元、第一匹配子单元、第二匹配子单元、计算子单元和第一确定子单元。其中:
所述声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
所述第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
所述第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
所述计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
所述第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
在本发明实施例中,上述解析单元403的一种优选实施例包括:声学特征提取子单元、语音识别子单元、关键词匹配子单元和第二确定子单元。其中:
所述声学特征提取子单元,用于从所述语音信号中提取声学特征;
所述语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
所述关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
所述第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
在本发明实施例中,上述访问单元404的一种优选实施例包括:判断子单元、注册子单元、第一发送子单元和第二发送子单元。其中:
所述判断子单元,用于在所述身份验证单元402的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
所述注册子单元,用于在所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
所述第一发送子单元,用于在所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
所述第二发送子单元,用于在所述身份验证单元402的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求。
需要说明的是,上述身份验证单元402、解析单元403和访问单元404还可以有其他实现方式,对此本发明实施例不做限定。
如图5所示,是本发明实施例移动设备的另一种结构示意图。
与图4所示实施例不同的是,在该实施例中,所述移动设备还进一步包括:
预处理单元501,用于对语音信息接收单元401接收的语音信号进行降噪处理。具体地,可以首先通过对语音信号的短时能量和短时过零率分析,将连续的语音信号分割成独立的语音片断和非语音片断,然后对分割得到的语音片断进行语音增强处理,在进行语音增强处理时,可以通过维纳滤波,将语音信号中的环境噪声进一步消除,以提高后续***对该信号的处理能力。
相应地,身份验证单元402和解析单元403需要分别根据预处理单元501降噪处理后的语音信号进行用户身份有效性验证和网站名解析。
通过预处理单元501对对语音信息的预处理,可以进一步提高身份验证单元402和解析单元403对用户语音信号的识别处理能力。
相应地,本发明实施例还提供一种移动设备对网站访问的***,如图6所示,是该***的一种结构示意图。
在该实施例中,所述***包括:客户端601和服务器602。其中:
客户端601设置在移动设备上,接收用户访问网站的语音信号,并将所述语音信号发送给服务器602。上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
服务器602接收到客户端601发送的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析,并将用户身份验证结果及解析得到的网站名返回给客户端601。
客户端601根据所述服务器602返回的用户身份验证结果向所述网站名对应的网站603发送访问请求。
具体地,客户端601向网站603发送访问请求可以有以下几种情况:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
可见,本发明实施例移动设备对网站访问的***,将不同功能分散到用户移动设备和服务器来分别完成。用户移动设备主要用于跟踪用户网站登录指令;而服务器实现用户注册,身份验证等运算功能和信息管理。网站响应服务器发送的验证后的用户登录请求,并向客户端发送用户个性化网页。不仅大大降低了移动设备用户网站登录的复杂性,而且也不会给移动设备增加过多的负荷。
另外,在本发明另一实施例中,上述客户端601还可进一步用于在根据所述语音信号进行网站名解析、并将所述语音信号发送给所述服务器之前对所述语音信号进行降噪处理。这样,可有效提高客户端和服务器对用户语音信号的识别处理能力,提高***的鲁棒性。
需要说明的是,上述客户端601和服务器602的上述各功能可以由相应的功能单元来实现,具体与图4和图5所示实施例中功能单元类似,在此不再详细描述。
如图7所示,是本发明实施例移动设备对网站访问的***的另一种结构示意图。
在该实施例中,所述***包括:客户端701和服务器702。其中:
客户端701设置在移动设备上,接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给服务器702。上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
服务器702接收到客户端701发送的上述声纹特征和声学特征后,根据所述声纹特征进行用户身份有效性验证,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给客户端701。
客户端701根据服务器702返回的用户身份验证结果向所述网站名对应的网站703发送访问请求。
具体地,客户端701向网站703发送访问请求可以有以下几种情况:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
可见,本发明实施例移动设备对网站访问的***,将不同功能分散到用户移动设备和服务器来分别完成。用户移动设备主要用于跟踪用户网站登录指令并完成简单的信号分析;而服务器实现用户注册,身份验证及网站名解析等运算功能和信息管理。网站响应服务器发送的验证后的用户登录请求,并向客户端发送用户个性化网页。不仅大大降低了移动设备用户网站登录的复杂性,而且也不会给移动设备增加过多的负荷。本发明实施例移动设备对网站访问的***,将所有的模型资源以及计算都放在服务器端执行,有效地减少了客户端的储存和运算压力。
另外,在本发明另一实施例中,上述客户端701还可进一步用于在在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。这样,可有效提高客户端和服务器对用户语音信号的识别处理能力,提高***的鲁棒性。
需要说明的是,上述客户端701和服务器702的上述各功能可以由相应的功能单元来实现,具体与图4和图5所示实施例中功能单元类似,在此不再详细描述。
本发明实施例移动用户访问网站的方法、设备及***,可以支持移动用户登录各类网站,包括已注册网站和未注册网站,而且在对用户登录身份有效性验证后直接向网站发出相应的登录请求,无需用户手工注册,而是由***自动检测自动注册帐号。另外,由于每次用户登录都进行了身份验证,从而可以充分保证用户个人信息的安全。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (12)

1.一种移动用户访问网站的方法,其特征在于,包括:
接收用户访问网站的语音信号;
根据所述语音信号进行用户身份有效性验证,判断所述用户是否为当前移动设备的合法用户,以及根据所述语音信号进行网站名解析;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户是首次登录所述网站,则向所述网站发送注册请求,所述注册请求中包括所述移动设备的国际移动设备标识IMEI、手机号码或IP地址,所述网站自动完成所述用户在所述网站的注册过程;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求,所述用户名为国际移动设备标识IMEI、手机号码或IP地址,以便所述移动设备用户在无需输入用户名及密码的情况下,实现对所述网站的自动登录;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求,实现匿名登录。
2.如权利要求1所述的方法,其特征在于,所述根据所述语音信号进行用户身份有效性验证包括:
从所述语音信号中提取声纹特征;
将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
3.如权利要求1所述的方法,其特征在于,所述根据所述语音信号进行网站名解析包括:
从所述语音信号中提取声学特征;
利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
根据匹配结果,确定用户请求访问的网站。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:在根据所述语音信号进行用户身份有效性验证以及网站名解析之前,对所述语音信号进行降噪处理。
5.一种移动设备,其特征在于,包括:
语音信息接收单元,用于接收用户访问网站的语音信号;
身份验证单元,用于根据所述语音信号进行用户身份有效性验证,判断所述用户是否为当前移动设备的合法用户;
解析单元,用于根据所述语音信号进行网站名解析;
访问单元,用于根据所述身份验证单元得到的用户身份验证结果向所述解析单元解析得到的网站发送访问请求;
所述访问单元包括:
判断子单元,用于在所述身份验证单元的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
注册子单元,用于在用户身份验证结果是所述用户是当前移动设备的合法用户,且所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,所述注册请求中包括所述移动设备的国际移动设备标识IMEI、手机号码或IP地址,所述网站自动完成所述用户在所述网站的注册过程;
第一发送子单元,用于在用户身份验证结果是所述用户是当前移动设备的合法用户,且所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求,所述用户名为国际移动设备标识IMEI、手机号码或IP地址,以便所述移动设备用户在无需输入用户名及密码的情况下,实现对所述网站的自动登录;
第二发送子单元,用于在所述身份验证单元的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求,实现匿名登录。
6.如权利要求5所述的移动设备,其特征在于,所述身份验证单元包括:
声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
7.如权利要求5所述的移动设备,其特征在于,所述解析单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征;
语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
8.如权利要求5所述的移动设备,其特征在于,所述移动设备还包括:
预处理单元,用于对所述语音信息接收单元接收的语音信号进行降噪处理。
9.一种移动用户访问网站的***,其特征在于,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,并将所述语音信号发送给所述服务器;
所述服务器,用于接收所述客户端发送的语音信号,并根据所述语音信号进行用户身份有效性验证,判断所述用户是否为当前移动设备的合法用户,以及根据所述语音信号进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求,具体包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户是首次登录所述网站,则向所述网站发送注册请求,所述注册请求中包括所述移动设备的国际移动设备标识IMEI、手机号码或IP地址,所述网站自动完成所述用户在所述网站的注册过程;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求,所述用户名为国际移动设备标识IMEI、手机号码或IP地址,以便所述移动设备用户在无需输入用户名及密码的情况下,实现对所述网站的自动登录;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求,实现匿名登录。
10.如权利要求9所述的***,其特征在于,
所述客户端,还用于在将所述语音信号发送给所述服务器之前,对所述语音信号进行降噪处理。
11.一种移动用户访问网站的***,其特征在于,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给所述服务器;
所述服务器,用于接收所述客户端发送的所述声纹特征和声学特征,并根据所述声纹特征进行用户身份有效性验证,判断所述用户是否为当前移动设备的合法用户,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求,具体包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户是首次登录所述网站,则向所述网站发送注册请求,所述注册请求中包括所述移动设备的国际移动设备标识IMEI、手机号码或IP地址,所述网站自动完成所述用户在所述网站的注册过程;
如果用户身份验证结果是所述用户是当前移动设备的合法用户,且所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求,所述用户名为国际移动设备标识IMEI、手机号码或IP地址,以便所述移动设备用户在无需输入用户名及密码的情况下,实现对所述网站的自动登录;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求,实现匿名登录。
12.如权利要求11所述的***,其特征在于,
所述客户端,还用于在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。
CN201110156221.4A 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及*** Active CN102223367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110156221.4A CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110156221.4A CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及***

Publications (2)

Publication Number Publication Date
CN102223367A CN102223367A (zh) 2011-10-19
CN102223367B true CN102223367B (zh) 2014-04-23

Family

ID=44779796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110156221.4A Active CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及***

Country Status (1)

Country Link
CN (1) CN102223367B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103107974B (zh) * 2011-11-09 2018-01-09 腾讯科技(深圳)有限公司 一种用户注册和登录方法和移动终端
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及***
CN103581109B (zh) * 2012-07-19 2018-03-02 北京京东尚科信息技术有限公司 声纹登录购物***和方法
CN103942230B (zh) * 2013-01-21 2017-03-29 上海智臻智能网络科技股份有限公司 一种用于进行语音网页导航的方法、装置和***
CN103943110A (zh) * 2013-01-21 2014-07-23 联想(北京)有限公司 控制方法、装置和电子设备
CN103200329A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法、移动终端装置及语音操控***
US9343068B2 (en) * 2013-09-16 2016-05-17 Qualcomm Incorporated Method and apparatus for controlling access to applications having different security levels
CN104732974B (zh) * 2013-12-19 2019-05-24 国家电网公司 智能录音识别***
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制***的方法、装置及终端
CN104485102A (zh) * 2014-12-23 2015-04-01 智慧眼(湖南)科技发展有限公司 声纹识别方法和装置
CN104821882A (zh) * 2015-05-08 2015-08-05 南京财经大学 一种基于语音生物特征的网络安全验证方法
CN107046517A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 一种语音处理方法、装置和智能终端
CN106911687B (zh) * 2017-02-20 2020-04-10 深圳国泰安教育技术有限公司 一种页面构建控制方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN101308654A (zh) * 2007-05-14 2008-11-19 华为技术有限公司 一种语音分析识别方法、***与装置
CN101464896A (zh) * 2009-01-23 2009-06-24 安徽科大讯飞信息科技股份有限公司 语音模糊检索方法及装置
CN101989299A (zh) * 2010-08-30 2011-03-23 无锡滨达工业创意设计有限公司 基于互联网的语音搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN101308654A (zh) * 2007-05-14 2008-11-19 华为技术有限公司 一种语音分析识别方法、***与装置
CN101464896A (zh) * 2009-01-23 2009-06-24 安徽科大讯飞信息科技股份有限公司 语音模糊检索方法及装置
CN101989299A (zh) * 2010-08-30 2011-03-23 无锡滨达工业创意设计有限公司 基于互联网的语音搜索方法

Also Published As

Publication number Publication date
CN102223367A (zh) 2011-10-19

Similar Documents

Publication Publication Date Title
CN102223367B (zh) 移动用户访问网站的方法、设备及***
JP7110292B2 (ja) 話者検証のためのニューラルネットワーク
CN102238189B (zh) 声纹密码认证方法及***
Liu et al. An MFCC‐based text‐independent speaker identification system for access control
Singh et al. Applications of speaker recognition
CN106373575B (zh) 一种用户声纹模型构建方法、装置及***
CN102238190B (zh) 身份认证方法及***
US20060206333A1 (en) Speaker-dependent dialog adaptation
Darabkh et al. An efficient speech recognition system for arm‐disabled students based on isolated words
CN107886957A (zh) 一种结合声纹识别的语音唤醒方法及装置
CN104104664A (zh) 对验证码进行验证的方法、服务器、客户端和***
US20030078777A1 (en) Speech recognition system for mobile Internet/Intranet communication
CN109637520A (zh) 基于语音分析的敏感内容识别方法、装置、终端及介质
US6246987B1 (en) System for permitting access to a common resource in response to speaker identification and verification
EP3989217A1 (en) Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium
CN113129867B (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
CN113823293B (zh) 一种基于语音增强的说话人识别方法及***
CN109841218A (zh) 一种针对远场环境的声纹注册方法及装置
CN112927674A (zh) 语音风格的迁移方法、装置、可读介质和电子设备
CN110782902A (zh) 音频数据确定方法、装置、设备和介质
CN115394318A (zh) 一种音频检测方法和装置
CN109273012B (zh) 一种基于说话人识别和数字语音识别的身份认证方法
CN112417412A (zh) 一种银行账户余额查询方法、装置及***
Das et al. Multi-style speaker recognition database in practical conditions
CN113012684B (zh) 一种基于语音分割的合成语音检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: IFLYTEK CO., LTD.

Free format text: FORMER NAME: ANHUI USTC IFLYTEK CO., LTD.

CP03 Change of name, title or address

Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Patentee after: Iflytek Co., Ltd.

Address before: 230088 No. 616, Mount Huangshan Road, hi tech Development Zone, Anhui, Hefei

Patentee before: Anhui USTC iFLYTEK Co., Ltd.