JP2020516935A

JP2020516935A - ユーザー登録方法、装置及び電子機器

Info

Publication number: JP2020516935A
Application number: JP2019554957A
Authority: JP
Inventors: 福祥李; 驍李; 国光李
Original assignee: Beijing Orion Star Technology Co Ltd
Current assignee: Beijing Orion Star Technology Co Ltd
Priority date: 2017-04-10
Filing date: 2018-04-10
Publication date: 2020-06-11
Anticipated expiration: 2038-04-10
Also published as: WO2018188586A1; CN107147618A; JP6956349B2; EP3611895A4; US20210110832A1; EP3611895B1; CN107147618B; EP3611895A1; US11568876B2; EP3611895C0

Abstract

本願の実施例はユーザー登録方法、装置及び電子機器を提供し、前記方法は、ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、各クラスに１つのクラス識別子を割り当てることと、各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することと、を含む。本願は実施例でユーザーの操作を簡略化し、ユーザー体験を向上させることができる。【選択図】図１

Description

関連出願の相互参照
本願は、２０１７年４月１０日に中国特許局に提出して出願番号が第２０１７１０２２９９５９．６で発明の名称が「ユーザー登録方法、装置及び電子機器」である中国特許出願に基づいて優先権を主張し、その全内容が援用により本願に取り込まれている。

技術分野
本願はスマート機器分野に関し、特にユーザー登録方法、装置及び電子機器に関する。

リアルな生活では、スマート機器は一般的にユーザー認識過程を有し、即ち、ユーザー認識機能を有する。ユーザー認識過程は指紋認識、音声認識又は顔認識等を含む。

ユーザーがスマート機器を使う前に、スマート機器において対応する指紋、音声又は顔の登録を予め行う必要があり、ユーザーが次回スマート機器を使うときに、スマート機器が対応するユーザーを認識できる。

従来、音声によるユーザー登録過程では、まず、ユーザーがスマート機器へウェイクアップ音声を連続で複数回出す必要があり、そして、スマート機器が各ウェイクアップ音声の声紋特徴を抽出して記録するとともに、ユーザーがスマート機器において該声紋特徴に対応するユーザー名を入力する必要がある。これで、登録を完成する。

ユーザーが次回ウェイクアップ音声を出した後、スマート機器がウェイクアップ音声の声紋特徴を抽出し、該声紋特徴が以前に記録したあるユーザー名に対応する声紋特徴に近い場合、該ウェイクアップ音声を出したユーザーを認識できる。

従来の音声による登録過程では、ユーザーはスマート機器へウェイクアップ音声を連続で複数回出す上、ユーザー名も入力する必要がある。登録が完了しないと、スマート機器がウェイクアップ音声を出したユーザーを認識できないため、ユーザー操作が複雑であり、ユーザー体験が悪い。

本願は、ユーザーの操作を簡略化でき、ユーザー体験を向上できるユーザー登録方法、装置及び電子機器を提供することを目的とする。

上記目的を実現するために、本願の実施例は電子機器に適用されるユーザー登録方法を提供し、前記方法は、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、
各クラスに１つのクラス識別子を割り当てることと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することと、を含む。

好ましくは、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分する前記ステップは、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算することと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分することと、を含む。

好ましくは、前記方法は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存することと、
前記サービス命令音声に対応するサービスタイプを決定することと、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶することと、を含む。

好ましくは、前記サービス命令音声に対応するサービスタイプを決定する前記ステップは、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得することと、
前記サービス命令音声認識情報に対して語意解析を行うことと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定することと、を含む。

好ましくは、前記方法は、更に、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定することと、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定することと、
前記目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断することと、
肯定の場合、記憶されているサービスタイプに対応するサービス提示情報を出力することと、を含む。

好ましくは、前記方法は、更に、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力することと、
ユーザーがフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得することと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定することと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録することと、を含む。

好ましくは、前記方法は、更に、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力し、Ｎが１より大きな整数であることと、
フィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得することと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶することと、を含む。

好ましくは、前記電子機器がスマート機器であり、前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

好ましくは、前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

本願の実施例は更に電子機器に適用されるユーザー登録装置を提供し、前記装置は、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存するための第１の抽出モジュールと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分するためのクラスタリングモジュールであって、各クラスにおける第１の声紋特徴が同じユーザーに属するクラスタリングモジュールと、
各クラスに１つのクラス識別子を割り当てるための割り当てモジュールと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶してユーザー登録を完成するための第１の記憶モジュールと、を備える。

好ましくは、前記クラスタリングモジュールは、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算するための計算ユニットと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分するための区分ユニットと、を備える。

好ましくは、前記装置は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存するための第２の抽出モジュールと、
前記サービス命令音声に対応するサービスタイプを決定するための第１の決定モジュールと、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングするための第１のマッチングモジュールと、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶するための第２の記憶モジュールと、を備える。

好ましくは、前記第１の決定モジュールは、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得するための第１の認識ユニットと、
前記サービス命令音声認識情報に対して語意解析を行うための解析ユニットと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定するための第１の決定ユニットと、を備える。

好ましくは、前記装置は、更に、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定するための第２の決定モジュールと、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングするための第２のマッチングモジュールと、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定するための第３の決定モジュールと、
前記目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断するための判断モジュールと、
前記判断モジュールの判断結果が肯定である場合、記憶されているサービスタイプに対応するサービス提示情報を出力するための第１の出力モジュールと、を備える。

好ましくは、前記装置は、更に、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールと、
ユーザーが前記第１のユーザー識別子を要求するリクエストに対してフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得するための第１の認識モジュールと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定するための第４の決定モジュールと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録するための記録モジュールと、を備える。

好ましくは、前記装置は、更に、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールであって、Ｎが１より大きな整数である第２の出力モジュールと、
ユーザーが前記第２のユーザー識別子を要求するリクエストに対してフィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得するための第２の認識モジュールと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶するための第３の記憶モジュールと、を備える。

好ましくは、前記電子機器がスマート機器であり、前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、
音声情報をリアルタイムで検出するための検出ユニットと、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定するための第２の決定ユニットと、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得するための第２の認識ユニットと、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定するための第３の決定ユニットと、を備える。

好ましくは、前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、具体的に、前記スマート機器から送信されたウェイクアップ音声を受信するためのものであり、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を認識予定音声情報として決定し、前記認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットしたウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

本願の実施例は、更に、ハウジング、プロセッサ、メモリ、回路基板及び電源回路を備える電子機器を提供し、回路基板がハウジングで囲んでなる空間内部に設置され、プロセッサ及びメモリが回路基板に設置され、電源回路が電子機器の各回路又は素子に給電することに用いられ、メモリが実行可能なプログラムコードを記憶することに用いられ、プロセッサが前記ユーザー登録方法を実行するように、メモリに記憶される実行可能なプログラムコードを読み取って実行可能なプログラムコードに対応するプログラムを実行する。

本願の実施例は、更に、コンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行されるとき、前記ユーザー登録方法を実現する。

本願の実施例は更にアプリケーションプログラムを提供し、前記アプリケーションプログラムは実行される時に前記ユーザー登録方法を実行することに用いられる。

本願の実施例に係るユーザー登録方法、装置及び電子機器において、ウェイクアップ音声を受信するたびに、声紋特徴を抽出して保存し、保存されている声紋特徴をクラスタリングし、声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、を対応して記憶し、ユーザー登録を完成する。本願の実施例は、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力する必要があり、登録を完了しなければ声紋特徴認識装置が音声を出したユーザーを認識できないような従来技術と違って、ユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

本願の実施例又は従来技術の技術案をより明確に説明するために、以下に実施例又は従来技術の記述に必要な図面を簡単に説明するが、勿論、以下に記載する図面は単に本願の実施例の一例であり、当業者であれば、創造的な労力を要することなく、これらの図面に基づいて他の図面に想到しうる。

図１は本願の実施例に係るユーザー登録方法のフローチャートである。図２は本願の実施例に係るサービス命令音声に基づいてユーザーへサービス提示情報を送信するフローチャートである。図３は本願の実施例に係るユーザー登録装置の第１の構造模式図である。図４は本願の実施例に係るユーザー登録装置の第２の構造模式図である。図５は本願の実施例に係る電子機器の構造模式図である。

以下、本願の実施例の図面を参照しながら、本願の実施例の技術案を明確且つ完全に説明する。無論、説明される実施例は本願の実施例の一部であり、実施例のすべてではない。本願の実施例に基づき、当業者が進歩性のある労働を必要とせずに得られる他の実施例は、いずれも本願の保護範囲に属する。

上記目的を実現するために、本願の実施例はユーザー登録方法を提供し、該方法は電子機器に適用されてもよく、該電子機器はスマート機器であってもよく、スマート機器と通信接続されるクラウドサーバーであってもよい。本願の実施例において、スマート機器はスマートフォン、スマートスピーカー、知能ロボット又はスマートタブレットＰＣ等の音声認識機能を有する機器であってもよい。

図１は本願の実施例に係るユーザー登録方法のフローチャートであり、前記方法は以下を含む。

Ｓ１１０で、ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存する。

本実施例において、電子機器の適用シーンをホーム環境とする。つまり、ホームに少なくとも１つのユーザーがいる。これらのユーザーが電子機器を長期間使うので、いずれのユーザーが電子機器をウェイクアップするたびに、電子機器がいずれもウェイクアップ音声を取得するとともに、電子機器がウェイクアップ音声に対応する第１の声紋特徴を抽出して保存する。そのうち、声紋特徴の抽出方法が従来技術である。

本願の実施例に係る具体的な実現形態では、前記電子機器がスマート機器であり、
スマート機器は、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を認識予定音声情報として決定し、前記認識予定音声情報に対して音声認識を行って目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

具体的に、動作状態にあるスマート機器が周りの音声情報をリアルタイムで検出する。初期に周りの音声の音量が小さいとし、この時はミュート状態にある。音声の音量があるプリセット値より大きいと突然検出すると、音声情報を入力するユーザーが現在いると確定できる。この時、音声段階に入り、スマート機器が音声段階の音声情報を収集する。音声段階で一定の時間を経てから音声の音量がプリセット値より小さくなると、再びミュート段階に入る。ミュート段階の時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報すなわちスマート機器に収集された音声情報を目標認識予定音声情報として決定する。本実施例において、プリセット音声休止時間の長さを自由に設定することができ、プリセット音声休止時間の長さが５００ミリ秒であることが好ましい。

その後、スマート機器は前記目標認識予定音声情報に対して音声認識を行って目標音声認識情報を取得し、そして目標音声認識情報をプリセットのウェイクアップワードとマッチングし、前記目標音声認識情報がプリセットのウェイクアップワードにマッチしている場合、例えば、目標音声認識情報がプリセットのウェイクアップワードと同じである場合、認識予定音声情報をウェイクアップ音声として決定することができる。

本願の実施例の他の具体的な実現形態では、電子機器はスマート機器と通信接続されるクラウドサーバーである場合、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、該ウェイクアップ音声を前記クラウドサーバーに送信する。前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

具体的に、スマート機器が周りの音声情報をリアルタイムで検出する。初期に周りの音声の音量が小さいとし、この時はミュート状態にある。音声の音量があるプリセット値より大きいと突然検出すると、音声情報を入力するユーザーが現在いると確定できる。この時、音声段階に入り、スマート機器が音声段階の音声情報を収集する。音声段階で一定の時間を経てから音声の音量がプリセット値より小さくなると、再びミュート段階に入る。ミュート段階の時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報すなわちスマート機器の収集した音声情報を目標認識予定音声情報として決定する。その後、スマート機器は前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、そして目標音声認識情報をプリセットのウェイクアップワードとマッチングし、前記目標音声認識情報がプリセットのウェイクアップワードにマッチしている場合、例えば、目標音声認識情報がプリセットのウェイクアップワードと同じである場合、認識予定音声情報をウェイクアップ音声として決定し、ウェイクアップ音声をクラウドサーバーに送信し、クラウドサーバーがユーザーのウェイクアップ音声を取得する。

Ｓ１２０で、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属する。

本願の実施例の具体的な実現形態では、ステップＳ１２０は以下を含む。

Ａ１、保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算する。

具体的に、クラスタリングアルゴリズムでマッチングする予定の各属性情報の類似重みを予め設定する。属性情報は音波スペクトルの振動周波数、振動周期及び振幅等を含んでもよく、保存されているいずれか２つの第１の声紋特徴の間のマッチング過程において、ある属性情報の類似重みが大きければ大きいほど、この２つの保存されている第１の声紋特徴の該属性情報が類似していることが示される。最後にすべての属性情報の類似重みを重ね合わせて類似度を取得する。該類似度はこの２つの保存されている第１の声紋特徴の各属性情報の類似重みの総合効果を示し、類似度が高ければ高いほど、この２つの保存されている第１の声紋特徴が同じクラスに属する可能性が高いと示される。

Ａ２、類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分する。

具体的に、１つの類似度閾値を予め設定することができる。各保存されている第１の声紋特徴の間の類似度を計算した後、類似度が該類似度閾値より高い２つの保存されている第１の声紋特徴は同じクラスとし、類似度が該類似度閾値より低い２つの保存されている第１の声紋特徴は異なるクラスとする。このように、すべての保存されている第１の声紋特徴を少なくとも１つのクラスに区分することができる。好ましくは、実際の状況に応じて類似度閾値を自由に設定する。

本実施例において、異なるユーザーの出したウェイクアップ音声の第１の声紋特徴が異なるため、保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算して、すべての保存されている第１の声紋特徴を区分することにより、保存されている第１の声紋特徴を少なくとも１つのクラスに区分することができ、各クラスにおける第１の声紋特徴が同じユーザーに属する。

Ｓ１３０で、各クラスに１つのクラス識別子を割り当てる。

Ｓ１４０で、各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成する。

具体的に、電子機器は各種類の第１の声紋特徴を取得した後、各クラスに１つのクラス識別子を割り当てる。つまり、各クラスにおける少なくとも１つの第１の声紋特徴を該クラスのクラス識別子に関連付け、そして各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶することによって、１つのユーザーの第１の声紋特徴を１つのクラス識別子に対応する。

例えば、電子機器はユーザーＹａの第１の声紋特徴ａ１、第１の声紋特徴ａ２及び第１の声紋特徴ａ３、ユーザーＹｂの第１の声紋特徴ｂ１、第１の声紋特徴ｂ２及びユーザーＹｃの第１の声紋特徴ｃ１を取得し、クラスタリングアルゴリズムで３種類の第１の声紋特徴を取得し、各クラスに割り当てたクラス識別子がそれぞれＡ、Ｂ、Ｃであり、そしてクラス識別子Ａと、第１の声紋特徴ａ１、第１の声紋特徴ａ２及び第１の声紋特徴ａ３と、を対応して記憶し、クラス識別子Ｂと、第１の声紋特徴ｂ１、第１の声紋特徴ｂ２と、を対応して記憶し、クラス識別子Ｃと、第１の声紋特徴ｃ１と、を対応して記憶する。このように、ユーザーＹａ、ユーザーＹｂ及びユーザーＹｃがそれぞれにクラス識別子Ａ、Ｂ、Ｃに対応する。

本実施例において、１つのユーザーの第１の声紋特徴を１つのクラス識別子に対応し、つまり、１つのユーザーを１つのクラス識別子に対応することができるため、ユーザーの暗証登録を実現することができる。

本願の実施例に係るユーザー登録方法において、ユーザーのウェイクアップ音声を取得するたびに、ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存し、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、を対応して記憶してユーザー登録を完成する。本願の実施例は、従来技術のように、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力し、登録を完了しなければ声紋特徴認識装置が音声を出したユーザーを認識できないと異なるので、本願の実施例はユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

好ましくは、電子機器は、更に、取得されたサービス命令音声に基づき、ユーザーへサービス提示情報を送信することができる。図２は本願の実施例に係るサービス命令音声に基づいてユーザーへサービス提示情報を送信するフローチャートであり、該ステップは以下を含む。

Ｓ２１０で、ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存する。

本実施例において、サービス命令音声はユーザーが出してサービス要求付きの命令音声である。例えば、サービス命令音声は「周杰倫の東風破を聞きたい」「天気はどうですか」「笑い話をしてください」等であってもよい。

具体的に、ユーザーが電子機器を長期間使い、いずれかのユーザーが電子機器へサービス命令音声を出すたびに、電子機器が該サービス命令音声を取得するとともに、電子機器がサービス命令音声に対応する第２の声紋特徴を抽出して保存する。

Ｓ２２０で、前記サービス命令音声に対応するサービスタイプを決定する。

本願の実施例の具体的な実現形態では、ステップＳ２２０は以下のステップを含んでもよい。

Ａ１、前記サービス命令音声を認識し、サービス命令音声認識情報を取得する。

具体的に、電子機器が受信されたサービス命令音声に対して音声認識を行って、サービス命令音声認識情報を取得する。本実施例において、具体的な音声認識過程が従来技術であり、ここで詳細な説明は省略する。

Ａ２、前記サービス命令音声認識情報に対して語意解析を行う。

具体的に、電子機器が取得されたサービス命令音声認識情報に対して語意解析を行って、解析結果を取得する。本実施例において、該語意解析過程が従来の分詞、死語をフィルタリングする等の処理過程とすることができ、ここで詳細な説明は省略する。

Ａ３、語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定する。

具体的に、電子機器は語意解析結果を予め設定された複数のサービス命令語句モデルにそれぞれにマッチングし、語意解析結果に含まれるサービスのサービスタイプを取得することができる。例えば、予め設定されたサービス命令語句モデルは「曲名＋聞きたい」、「天気」、「物語を語る」等であってもよい。

例えば、語意解析結果は「忘情水＋聞きたい」であり、該語意解析結果が所定のサービス命令語句モデル「曲名＋聞きたい」にマッチしている場合、該サービス命令音声に含まれるサービスである「忘情水」に対応するサービスタイプが歌であると決定できる。

更に、例えば、語意解析結果が「天気」であり、該語意解析結果が所定のサービス命令語句モデル「天気」にマッチしている場合、該サービス命令音声に含まれるサービスである「天気」に対応するサービスタイプが天気予報であると決定できる。

Ｓ２３０で、前記第２の声紋特徴を前記各クラスにおける各第１の声紋特徴とマッチングする。

具体的に、電子機器が第２の声紋特徴を取得した後、該第２の声紋特徴を各クラスにおける各第１の声紋特徴とそれぞれにマッチングする。本実施例において、具体的なマッチング過程は、第２の声紋特徴と各第１の声紋特徴との間の類似度を計算し、類似度が類似度閾値に達した後、それらがマッチしていると判断する。具体的な過程はステップＳ１２０に記載の過程を参照してもよい。

Ｓ２４０で、マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶する。

具体的に、第２の声紋特徴とある第１の声紋特徴とがマッチしていることによって、該第２の声紋特徴に対応するサービス命令音声を出したユーザーが第１の声紋特徴に対応するウェイクアップ音声を出したユーザーであることが分かる。この時、電子機器がマッチしている第１の声紋特徴のクラス識別子と、サービスタイプと、を対応して記憶する。ただし、同じユーザーは複数のサービスタイプ、例えば歌、ビデオ又は漫才等を要求する可能性があるので、マッチしている第１の声紋特徴のクラス識別子と、複数のサービスタイプと、を対応して記憶してもよい。

例えば、第２の声紋特徴と第１の声紋特徴ｂ２とがマッチしており、第１の声紋特徴ｂ２に対応するウェイクアップ音声を出したユーザーがＢである場合、該第２の声紋特徴に対応するサービス命令音声を出したユーザーがユーザーＹｂであり、第２の声紋特徴に対応するサービスタイプが「歌」であり、第１の声紋特徴ｂ２に対応するクラス識別子がＢである。このように、電子機器は第１の声紋特徴のクラス識別子Ｂと、サービスタイプ「歌」と、を対応して記憶することができる。

本実施例において、サービス命令音声の声紋特徴をウェイクアップ音声の声紋特徴とマッチングすることにより、クラス識別子とサービスタイプとの対応関係を決定し、更にユーザーとサービスタイプとの対応関係を取得することができる。

ただし、ステップＳ２１０〜Ｓ２２０の過程は、ユーザーのサービス命令音声を取得するたびに、１回実行することであってもよく、ユーザーのサービス命令音声を取得するたびに、それを保存するとともにユーザーのサービス命令音声を取得した回数を記録し、記録された回数が予め設定された回数に達した後、これらのサービス命令音声に基づいて上記ステップＳ２１０〜Ｓ２２０を実行することであってもよい。

Ｓ２５ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定する。

具体的に、ユーザーが電子機器を使うために再びウェイクアップ音声を出すとき、電子機器が該ウェイクアップ音声に対応する第１の声紋特徴を抽出して、それを認識予定の声紋特徴とする。

Ｓ２６０で、前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングする。

具体的に、電子機器が認識予定の声紋特徴を取得した後、該認識予定の声紋特徴を各クラスにおける各第１の声紋特徴とそれぞれにマッチングする。本実施例において、具体的なマッチング過程は、認識予定の声紋特徴と各第１の声紋特徴との類似度を計算し、類似度が類似度閾値に達した後、それらがマッチしていると判断する。具体的な過程はステップＳ１２０に記載の過程を参照してもよい。

Ｓ２７０で、マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定する。

Ｓ２８０で、前記目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断し、肯定の場合、ステップＳ２９０を実行し、否定の場合、サービス提示情報の過程がフェールしたと出力する。

具体的に、電子機器はマッチしている第１の声紋特徴に対応するクラス識別子を決定し、該クラス識別子を目標クラス識別子として決定し、該目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断する。

Ｓ２９０で、記憶されているサービスタイプに対応するサービス提示情報を出力する。

具体的に、目標クラス識別子に対応してサービスタイプ記憶されている場合、電子機器が該サービスタイプを決定し、該サービスタイプに対応するサービス提示情報を出力する。目標クラス識別子に対応してサービスタイプ記憶されていない場合、サービス提示情報のプロセスがフェールしたと出力し、この時、電子機器はユーザーにサービス提示情報のプロセスがフェールしたことを提示するようにフェール提示情報を出力し、例えば、電子機器は音声情報「対応するサービスが検索されていない」「もう一度言ってください」等を出力することができる。サービス提示情報は「歌を聴きたいですか」又は「漫才を聞きたいですか」等であってもよい。

例えば、目標クラス識別子がＢであり、それにサービスタイプ「歌」が対応して記憶されていると仮定する場合、電子機器はサービス提示情報「歌を聴きたいですか」を出力することができる。更に、例えば、目標クラス識別子に対応してサービスタイプ記憶されていない場合、電子機器はフェール提示情報「もう一度言ってください」を出力することができる。

本実施例において、ユーザーの出したサービス命令音声を取得してユーザーへサービス提示情報を送信することにより、ユーザー体験を向上させて、電子機器をよりスマートにする。

好ましくは、電子機器は更にサービス提示情報を出力することにより、ユーザーによく要求するサービスタイプのサービスをプッシュすることができる。

具体的に、各クラス識別子に対しては、それらが所定時間内、例えば一週間又は一ヶ月等内に使ったサービスのサービスタイプを記録し、使用回数の最も多いサービスのサービスタイプを、ウェイクアップされるたびにプッシュするサービスタイプとして決定し、対応するサービス提示情報を出力することができる。

例えば、ユーザーが一日中サービスタイプが歌であるサービスを１０回使ったが、サービスタイプが漫才であるサービスを１回のみ使ったため、ウェイクアップされるたびにプッシュするサービスが歌であると決定でき、対応するサービス提示情報、例えば「氷雨を聞きたいですか」を出力する。

実際には、ユーザーの使用回数の最も多いサービスタイプのサービスがユーザーの使用習慣である。本実施例において、電子機器はユーザーの使用習慣に基づいてユーザーに該サービスタイプに対応するサービスをプッシュすることができ、これにより、ユーザー体験を更に向上させる。

以上により、本実施例において、ユーザーがサービスを要求するとの習慣を取得することにより、ユーザーに対応するサービスを提供し、ユーザー体験を向上させて、電子機器をよりスマートにする。

好ましくは、電子機器はユーザーの出したウェイクアップ音声に基づいて該ウェイクアップ音声の声紋特徴のクラス識別子を決定することができる。そして、そのクラス識別子に基づいて該第１のウェイクアップ音声を出したユーザーを更に取得し、システム全体をよりスマートにするために、前記方法は更に以下を含む。

Ｂ１、認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力する。

本実施例において、第１のユーザー識別子はユーザーの名称例えば小明やユーザーのコード例えば００１など、又はユーザーの呼び方例えばパパやママ等であってもよい。

具体的に、電子機器は目標クラス識別子を認識した後、第１のユーザー識別子を要求するリクエストを出力することができ、該リクエストを音声情報によって出力することができ、例えば、該リクエストは「お名前は教えてもらえませんか」であってもよい。

好ましくは、電子機器は所定の数量で同じクラス識別子の第１の声紋特徴を取得した後、第１のユーザー識別子を要求するリクエストを出力することができる。例えば、電子機器は同じクラス識別子の第１の声紋特徴を２０回受信した後、「私たちがここまでよく知り合っていたのですが、まだお名前は知っていませんね」とのリクエストを送信することができる。

Ｂ２、ユーザーが前記第１のユーザー識別子を要求するリクエストに対してフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得する。

具体的に、ユーザーが電子機器の出力した第１のユーザーマークを要求するリクエストを聞いた後、第１のユーザー識別子を含む第１の音声情報、例えば第１のユーザーの名称を言い出し、電子機器は該第１の音声情報を受信してそれに対して音声認識を行って対応する第１の音声認識情報を取得する。

Ｂ３、前記第１の音声認識情報を前記第１のユーザー識別子として決定する。

Ｂ４、前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録する。

具体的に、電子機器が認識された第１の音声認識情報を第１のユーザー識別子として決定し、前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録する。

このように、電子機器が第１のユーザー識別子と目標クラス識別子との対応関係を確立する。目標クラス識別子が第１の声紋特徴に対応しているので、電子機器が第１のユーザー識別子と第１の声紋特徴との対応関係を確立し、更に、電子機器は再び該ユーザーのウェイクアップ音声を受信した後、そのウェイクアップ音声の第１の声紋特徴に基づき、該ユーザーの第１のユーザー識別子を決定することができる。

本実施例において、電子機器は再びユーザーのウェイクアップ音声を受信した後、該音声に対応している第１のユーザー識別子を取得して、第１のユーザー識別子付きの音声情報を出力することができる。例えば、第１のユーザー識別子が「小明」である場合、電子機器は音声情報「小明さん、こんにちは」を出力することにより、電子機器全体をよりスマートにし、ユーザー体験を向上させる。

好ましくは、異なるユーザーの使用習慣に適応するために、本願の実施例は更に他のユーザー登録プロセスを提供し、具体的に以下を含む。

Ｃ１、ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力し、Ｎが１より大きな整数である。

本実施例において、ユーザー登録命令は電子機器に予め設定されてユーザー登録プロセスを開始するための命令である。ユーザーがユーザー登録命令付きの音声を出した後、電子機器はユーザー登録の動作状態に入る。例えば、ユーザー登録命令は「登録する」「登録したい」「登録」等であってもよい。

第２のユーザー識別子はユーザーの名称例えば小明やユーザーのコード例えば００１など、又はユーザーの呼び方例えばパパ、ママ等であってもよい。Ｎは３、４又は５等の１より大きな整数であってもよい。

具体的に、ユーザー登録命令を取得した後、ユーザーが電子機器へウェイクアップ音声を連続でＮ回に出し、電子機器が受信されたＮ回のウェイクアップ音声をＮ個のウェイクアップ音声サンプルとして、ユーザーへ第２のユーザー識別子を要求するリクエストを送信する。

Ｃ２、ユーザーが前記第２のユーザー識別子を要求するリクエストに対してフィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得する。

具体的に、ユーザーが電子機器の出力した第２のユーザー識別子を要求するリクエストを聞いた後、第２のユーザー識別子を含む音声情報、例えばユーザーの名称を言い出す。電子機器が該音声情報を受信してそれに対して音声認識を行って、対応する音声認識情報を取得する。

Ｃ３、前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶する。

具体的に、電子機器が音声認識情報を第２のユーザー識別子として決定し、第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶してユーザー登録を完成する。電子機器は再びユーザーの出したウェイクアップ音声を取得した後、該ウェイクアップ音声の声紋特徴を抽出して、該声紋特徴を各ウェイクアップ音声サンプルの声紋特徴とマッチングし、マッチしている声紋特徴に対応する第２のユーザー識別子に基づいて該ウェイクアップ音声を出したユーザーを識別することができる。

つまり、本実施例において、図１に示されるプロセスを用いてユーザーの暗証登録を行うことができるだけでなく、上記Ｃ１〜Ｃ３のステップを用いて従来の登録を行うこともできる。従って、本実施例は異なるユーザーの使用習慣に適応することができ、ユーザー体験を更に向上させ、電子機器のスマート性を向上させる。

本願は方法実施例に対応して実施例で更に電子機器に適用されるユーザー登録装置を提供する。図３は本願の実施例に係るユーザー登録装置の第１の構造模式図であり、前記装置は、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存するための第１の抽出モジュール３１０と、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分するためのクラスタリングモジュールであって、各クラスにおける第１の声紋特徴が同じユーザーに属するクラスタリングモジュール３２０と、
各クラスに１つのクラス識別子を割り当てるための割り当てモジュール３３０と、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶してユーザー登録を完成するための第１の記憶モジュール３４０と、を備える。

本願の実施例に係るユーザー登録装置は、ユーザーのウェイクアップ音声を受信するたびに、ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存し、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、に対応して記憶してユーザー登録を完成する。本願の実施例は、従来技術のように、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力する必要があり、登録を完了しなければ、声紋特徴認識装置が音声を出したユーザーを認識できないことがないので、本願の実施例はユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

更に、前記クラスタリングモジュール３２０は、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算するための計算ユニットと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分するための区分ユニットと、を備える。

図４は本願の実施例に係るユーザー登録装置の第２の構造模式図であり、図３との相違点は、前記装置は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存するための第２の抽出モジュール３５０と、
前記サービス命令音声に対応するサービスタイプを決定するための第１の決定モジュール３６０と、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングするための第１のマッチングモジュール３７０と、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶するための第２の記憶モジュール３８０と、を備える。

更に、前記第１の決定モジュール３６０は、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得するための第１の認識ユニットと、
前記サービス命令音声認識情報に対して語意解析を行うための解析ユニットと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定するための第１の決定ユニットと、を備える。

更に、前記装置は、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定するための第２の決定モジュール３９０と、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングするための第２のマッチングモジュール３１００と、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定するための第３の決定モジュール３１１０と、
前記目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断するための判断モジュール３１２０と、
前記判断モジュールの判断結果が肯定である場合、記憶されているサービスタイプに対応するサービス提示情報を出力するための第１の出力モジュール３１３０と、を備える。

更に、前記装置は、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールと、
ユーザーが前記第１のユーザー識別子を要求するリクエストに対してフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得するための第１の認識モジュールと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定するための第４の決定モジュールと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録するための記録モジュールと、を備える。

更に、前記装置は、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールであって、Ｎが１より大きな整数である第２の出力モジュールと、
ユーザーが前記第２のユーザー識別子を要求するリクエストに対してフィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得するための第２の認識モジュールと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶するための第３の記憶モジュールと、を備える。

更に、前記電子機器がスマート機器であり、前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、
音声情報をリアルタイムで検出するための検出ユニットと、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定するための第２の決定ユニットと、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得するための第２の認識ユニットと、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定するための第３の決定ユニットと、を備える。

更に、前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、具体的に、前記スマート機器から送信されたウェイクアップ音声を受信するためのものであり、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

本願は上記方法実施例に対応して実施例で更に電子機器を提供する。図５は本願の実施例に係る電子機器の構造模式図であり、前記電子機器は、
ハウジング５１０、プロセッサ５２０、メモリ５３０、回路基板５４０及び電源回路５５０を備える電子機器であって、
回路基板５４０がハウジング５１０で囲んでなる空間内部に設置され、プロセッサ５２０及びメモリ５３０が回路基板に設置され、電源回路５５０が電子機器の各回路又は素子に給電することに用いられ、メモリ５３０が実行可能なプログラムコードを記憶することに用いられ、プロセッサ５２０が前記ユーザー登録方法を実行するように、メモリ５３０に記憶される実行可能なプログラムコードを読み取って実行可能なプログラムコードに対応するプログラムを実行する。

一実現形態では、上記ユーザー登録方法は、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、
各クラスに１つのクラス識別子を割り当てることと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することと、を含む。

上記ユーザー登録方法の他の実現形態は上記方法実施例部分の説明を参照し、ここで詳細な説明は省略する。

プロセッサ５２０が上記ステップ及び上記音声信号に対する処理方法の他の実現形態の具体的な実行過程及びプロセッサ５２０が実行可能なプログラムコードを実行することにより更に実行する過程は、本願の実施例の図１〜図４に示される実施例の説明を参照してもよく、ここで詳細な説明は省略する。

ただし、該電子機器は様々な形式で存在し、以下を含むが、それらに限らない。

（１）モバイル通信装置
このような装置の特徴はモバイル通信機能を有し、且つ音声、データ通信を提供することを主な目的とする。このような端末はスマートフォン（例えば、ｉＰｈｏｎｅ（登録商標））、マルチメディア携帯電話、機能的携帯電話及びローエンド携帯電話等を含む。

（２）ウルトラモバイルパーソナルコンピュータ装置
このような装置はパーソナルコンピュータ範囲に属し、計算及び処理機能を有し、一般的にモバイルインターネット特性も有する。このような端末はＰＤＡ、ＭＩＤ及びＵＭＰＣ装置等、例えばｉＰａｄ（登録商標）を含む。

（３）ポータブルエンターテイメントデバイス
このような装置はマルチメディアコンテンツを表示・再生することができる。このような装置はオーディオ、ビデオプレーヤー（例えば、ｉＰｏｄ（登録商標））、携帯ゲーム機、電子書籍、並びにスマートトイ及び携帯用カーナビゲーション装置を含む。

（４）サーバー
計算サービスを提供する装置であり、サーバーの構造はプロセッサ、ハードディスク、メモリ、システムバス等を備え、サーバーが汎用のコンピュータアーキテクチャと類似するが、高信頼性のサービスを提供する必要があるため、処理能力、安定性、信頼性、安全性、拡張性、管理性等の面での要求がより高い。

（５）他のデータ交換機能を有する電子装置

以上により、本願の実施例に係る技術案において、電子機器のプロセッサはメモリに記憶される実行可能なプログラムコードを読み取って実行可能なプログラムコードに対応するプログラムを実行し、ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存し、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶してユーザー登録を完成する。

本願の実施例において、ウェイクアップ音声を受信するたびに、声紋特徴を抽出して保存し、保存されている声紋特徴をクラスタリングし、声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、に対応して記憶してユーザー登録を完成する。本願の実施例は、従来技術のように、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力する必要があり、登録を完了しなければ、声紋特徴認識装置が音声を出したユーザーを認識できないことがないので、本願の実施例はユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

そのうち、保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分する前記ステップは、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算することと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分することと、を含む。

そのうち、前記方法は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存することと、
前記サービス命令音声に対応するサービスタイプを決定することと、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶することと、を含む。

そのうち、前記サービス命令音声に対応するサービスタイプを決定する前記ステップは、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得することと、
前記サービス命令音声認識情報に対して語意解析を行うことと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定することと、を含む。

そのうち、前記方法は、更に、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定することと、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定することと、
前記目標クラス識別子に対応してサービスタイプ記憶されているかどうかを判断することと、
肯定の場合、記憶されているサービスタイプに対応するサービス提示情報を出力することと、を含む。

そのうち、前記方法は、更に、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力することと、
ユーザーがフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得することと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定することと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録することと、を含む。

そのうち、前記方法は、更に、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力し、Ｎが１より大きな整数であることと、
フィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得することと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶することと、を含む。

そのうち、前記電子機器がスマート機器であり、前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

そのうち、前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

本発明の実施例は更にコンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行されるとき、以下のステップを実現する、即ち、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、
各クラスに１つのクラス識別子を割り当てることと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することである。

以上により、本発明の実施例に係る技術案において、コンピュータプログラムがプロセッサにより実行されるとき、ウェイクアップ音声を受信するたびに、声紋特徴を抽出して保存し、保存されている声紋特徴をクラスタリングし、声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、に対応して記憶してユーザー登録を完成する。本願の実施例は、従来技術のように、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力する必要があり、登録を完了しなければ、声紋特徴認識装置が音声を出したユーザーを認識できないことがないので、本願の実施例はユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

そのうち、前記コンピュータ可読記憶媒体がスマート機器の可読記憶媒体であり、前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

そのうち、前記コンピュータ可読記憶媒体がスマート機器と通信接続されるクラウドサーバーのコンピュータ可読記憶媒体であり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

本発明の実施例は更にアプリケーションプログラムを提供し、該アプリケーションプログラムは実行される時に本願の実施例に係るユーザー登録方法を実行することに用いられる。該アプリケーションプログラムがプロセッサにより実行されるとき、以下のステップを実現する、即ち、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、
各クラスに１つのクラス識別子を割り当てることと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することである。

以上により、本発明の実施例に係る技術案において、アプリケーションプログラムがプロセッサにより実行されるとき、ウェイクアップ音声を受信するたびに、声紋特徴を抽出して保存し、保存されている声紋特徴をクラスタリングし、声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける声紋特徴が同じユーザーに属し、各クラスに１つのクラス識別子を割り当て、各クラス識別子と、それに対応する少なくとも１つの声紋特徴と、に対応して記憶してユーザー登録を完成する。本願の実施例は、従来技術のように、ユーザーが声紋特徴認識装置へウェイクアップ音声を連続で複数回出すとともにユーザー名を入力する必要があり、登録を完了しなければ、声紋特徴認識装置が音声を出したユーザーを認識できないことがないので、本願の実施例はユーザーの操作を簡略化し、ユーザー体験を向上させることができる。

そのうち、前記アプリケーションプログラムがスマート機器に記憶されるものであり、前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する。

そのうち、前記アプリケーションプログラムがスマート機器と通信接続されるクラウドサーバーに記憶されるものであり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである。

装置、電子機器、コンピュータ可読記憶媒体及びアプリケーションプログラム実施例は基本的に方法実施例に類似するため、簡単に説明を行ったが、関連部分は方法実施例部分の説明を参照すればよい。

ただし、本明細書において、「第１の」と「第２の」のような関係用語は１つのエンティティ又は操作を他のエンティティ又は操作に区別するためのものであり、これらのエンティティ又は操作同士にこのような実際の関係又は順序があるように要求又は暗示するとは限らない。且つ、用語「包括」「包含」又はその任意の他の変形は非排他的包含を含むように意図され、それにより一連の要素を含む過程、方法、品物又は設備はそれらの要素を含むだけでなく、更に明確に列挙しない他の要素を含み、又は、更にこのような過程、方法、品物又は設備固有の要素を含む。これ以上制限しない限り、語句「○○を含む」で限定された要素は、前記要素を含む過程、方法、品物又は設備に更に他の同じ要素があることを排除しない。

本明細書の各実施例はいずれも関連方式で説明し、各実施例同士の同様又は類似する部分は互いに参照すればよく、各実施例の重点として説明した箇所はいずれも他の実施例との相違点である。特に、システム実施例は基本的に方法実施例に類似するため、簡単に説明を行ったが、関連個所は方法実施例部分の説明を参照すればよい。

以上の説明は本願の好適な実施例であって、本願の保護範囲を制限するためのものではない。本願の趣旨及び原則内に行ったいかなる修正、等価置換、改良等は、いずれも本願の保護範囲内に含まれるべきである。

Claims

電子機器に適用されるユーザー登録方法であって、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存することと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分し、各クラスにおける第１の声紋特徴が同じユーザーに属することと、
各クラスに１つのクラス識別子を割り当てることと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶し、ユーザー登録を完成することと、を含む
ことを特徴とするユーザー登録方法。
前記保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分することは、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算することと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分することと、を含む
ことを特徴とする請求項１に記載の方法。
前記方法は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存することと、
前記サービス命令音声に対応するサービスタイプを決定することと、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶することと、を含む
ことを特徴とする請求項１に記載の方法。
前記サービス命令音声に対応するサービスタイプを決定することは、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得することと、
前記サービス命令音声認識情報に対して語意解析を行うことと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定することと、を含む
ことを特徴とする請求項３に記載の方法。
前記方法は、更に、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定することと、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングすることと、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定することと、
前記目標クラス識別子に対応してサービスタイプが記憶されているかどうかを判断することと、
肯定の場合、記憶されているサービスタイプに対応するサービス提示情報を出力することと、を含む
ことを特徴とする請求項３に記載の方法。
前記方法は、更に、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力することと、
ユーザーが前記第１のユーザー識別子を要求するリクエストに対してフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得することと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定することと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録することと、を含む
ことを特徴とする請求項５に記載の方法。
前記方法は、更に、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力し、Ｎが１より大きな整数であることと、
ユーザーが前記第２のユーザー識別子を要求するリクエストに対してフィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得することと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶することと、を含む
ことを特徴とする請求項１に記載の方法。
前記電子機器がスマート機器であり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
音声情報をリアルタイムで検出し、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定する
ことを特徴とする請求項１〜７のいずれか１項に記載の方法。
前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記方法は、更に、以下のようにユーザーのウェイクアップ音声を取得する、即ち、
前記スマート機器から送信されたウェイクアップ音声を受信し、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである
ことを特徴とする請求項１〜７のいずれか１項に記載の方法。
電子機器に適用されるユーザー登録装置であって、
ユーザーのウェイクアップ音声を取得するたびに、前記ウェイクアップ音声に対応する第１の声紋特徴を抽出して保存するための第１の抽出モジュールと、
保存されている第１の声紋特徴をクラスタリングし、前記保存されている第１の声紋特徴を少なくとも１つのクラスに区分するためのクラスタリングモジュールであって、各クラスにおける第１の声紋特徴が同じユーザーに属するクラスタリングモジュールと、
各クラスに１つのクラス識別子を割り当てるための割り当てモジュールと、
各クラス識別子と、それに対応する少なくとも１つの第１の声紋特徴と、を対応して記憶してユーザー登録を完成するための第１の記憶モジュールと、を備える
ことを特徴とするユーザー登録装置。
前記クラスタリングモジュールは、
保存されている各第１の声紋特徴の間の類似度をクラスタリングアルゴリズムで計算するための計算ユニットと、
類似度に基づいてすべての第１の声紋特徴を少なくとも１つのクラスに区分するための区分ユニットと、を備える
ことを特徴とする請求項１０に記載の装置。
前記装置は、更に、
ユーザーのサービス命令音声を取得するたびに、前記サービス命令音声に対応する第２の声紋特徴を抽出して保存するための第２の抽出モジュールと、
前記サービス命令音声に対応するサービスタイプを決定するための第１の決定モジュールと、
前記第２の声紋特徴を各前記クラスにおける各第１の声紋特徴とマッチングするための第１のマッチングモジュールと、
マッチしている第１の声紋特徴のクラス識別子と、前記サービスタイプと、を対応して記憶するための第２の記憶モジュールと、を備える
ことを特徴とする請求項１０に記載の装置。
前記第１の決定モジュールは、
前記サービス命令音声を認識し、サービス命令音声認識情報を取得するための第１の認識ユニットと、
前記サービス命令音声認識情報に対して語意解析を行うための解析ユニットと、
語意解析結果に基づき、前記サービス命令音声に対応するサービスタイプを決定するための第１の決定ユニットと、を備える
ことを特徴とする請求項１２に記載の装置。
前記装置は、更に、
ウェイクアップ音声に対応する第１の声紋特徴を抽出した後、前記ウェイクアップ音声に対応する第１の声紋特徴を認識予定の声紋特徴として決定するための第２の決定モジュールと、
前記認識予定の声紋特徴を各クラスにおける第１の声紋特徴とマッチングするための第２のマッチングモジュールと、
マッチしている第１の声紋特徴に対応するクラス識別子を目標クラス識別子として決定するための第３の決定モジュールと、
前記目標クラス識別子に対応してサービスタイプが記憶されているかどうかを判断するための判断モジュールと、
前記判断モジュールの判断結果が肯定である場合、記憶されているサービスタイプに対応するサービス提示情報を出力するための第１の出力モジュールと、を備える
ことを特徴とする請求項１２に記載の装置。
前記装置は、更に、
認識された目標クラス識別子に基づき、第１のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールと、
ユーザーが前記第１のユーザー識別子を要求するリクエストに対してフィードバックした第１の音声情報を受信し、該第１の音声情報に対して音声認識を行って第１の音声認識情報を取得するための第１の認識モジュールと、
前記第１の音声認識情報を前記第１のユーザー識別子として決定するための第４の決定モジュールと、
前記第１のユーザー識別子と前記目標クラス識別子との対応関係を記録するための記録モジュールと、を備える
ことを特徴とする請求項１４に記載の装置。
前記装置は、更に、
ユーザー登録命令を取得した後、ウェイクアップ音声サンプルを連続でＮ回に取得し、第２のユーザー識別子を要求するリクエストを出力するための第２の出力モジュールであって、Ｎが１より大きな整数である第２の出力モジュールと、
ユーザーが前記第２のユーザー識別子を要求するリクエストに対してフィードバックした音声情報を受信し、該音声情報に対して音声認識を行って該音声に対応する音声認識情報を取得するための第２の認識モジュールと、
前記音声認識情報を前記第２のユーザー識別子として決定し、前記第２のユーザー識別子と、Ｎ個のウェイクアップ音声サンプルの声紋特徴と、をそれぞれに対応して記憶するための第３の記憶モジュールと、を備える
ことを特徴とする請求項１０に記載の装置。
前記電子機器がスマート機器であり、前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、
音声情報をリアルタイムで検出するための検出ユニットと、
ユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定するための第２の決定ユニットと、
前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得するための第２の認識ユニットと、
前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定するための第３の決定ユニットと、を備える
ことを特徴とする請求項１０〜１６のいずれか１項に記載の装置。
前記電子機器がスマート機器と通信接続されるクラウドサーバーであり、
前記装置は、更に、
ユーザーのウェイクアップ音声を取得するための第１の取得モジュールを備え、
前記第１の取得モジュールは、具体的に、前記スマート機器から送信されたウェイクアップ音声を受信するためのものであり、前記スマート機器から送信されたウェイクアップ音声は、前記スマート機器がユーザーが音声情報を入力したと検出した後、ミュートする時間の長さがプリセット音声休止時間の長さに達するとき、ユーザーの入力した音声情報を目標認識予定音声情報として決定し、前記目標認識予定音声情報に対して音声認識を行って、目標音声認識情報を取得し、前記目標音声認識情報がプリセットのウェイクアップワードと同じである場合、前記認識予定音声情報をウェイクアップ音声として決定し、該ウェイクアップ音声を前記クラウドサーバーに送信するものである
ことを特徴とする請求項１０〜１６のいずれか１項に記載の装置。
ハウジング、プロセッサ、メモリ、回路基板及び電源回路を備える電子機器であって、
回路基板がハウジングで囲んでなる空間内部に設置され、プロセッサ及びメモリが回路基板に設置され、電源回路が電子機器の各回路又は素子に給電することに用いられ、メモリが実行可能なプログラムコードを記憶することに用いられ、プロセッサが請求項１〜９のいずれか１項に記載のユーザー登録方法を実行するように、メモリに記憶される実行可能なプログラムコードを読み取って実行可能なプログラムコードに対応するプログラムを実行する
ことを特徴とする電子機器。
コンピュータ可読記憶媒体であって、
前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行されるとき、請求項１〜９のいずれか１項に記載のユーザー登録方法を実現する
ことを特徴とするコンピュータ可読記憶媒体。
アプリケーションプログラムであって、
前記アプリケーションプログラムは実行される時に請求項１〜９のいずれか１項に記載のユーザー登録方法を実行することに用いられる
ことを特徴とするアプリケーションプログラム。