JP7139839B2 - Information processing device, information processing method and program - Google Patents

Information processing device, information processing method and program Download PDF

Info

Publication number
JP7139839B2
JP7139839B2 JP2018181855A JP2018181855A JP7139839B2 JP 7139839 B2 JP7139839 B2 JP 7139839B2 JP 2018181855 A JP2018181855 A JP 2018181855A JP 2018181855 A JP2018181855 A JP 2018181855A JP 7139839 B2 JP7139839 B2 JP 7139839B2
Authority
JP
Japan
Prior art keywords
user
information processing
input
personal
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018181855A
Other languages
Japanese (ja)
Other versions
JP2020053859A (en
Inventor
東 坪田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2018181855A priority Critical patent/JP7139839B2/en
Publication of JP2020053859A publication Critical patent/JP2020053859A/en
Application granted granted Critical
Publication of JP7139839B2 publication Critical patent/JP7139839B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、情報処理装置、情報処理方法およびプログラムに関する。 The present invention relates to an information processing device, an information processing method, and a program.

近年、複数の個人によって共用される音声入出力端末(例えば、固定電話など)が知られている。このような複数の個人によって共用される音声入出力端末には、複数の個人それぞれが利用する情報が1台の音声入出力端末に登録されているのが一般的である。そのため、実際に複数の個人のうちの誰かが利用者として音声入出力端末を利用しようとした場合、複数の個人それぞれが利用する情報から自分が利用する情報を探し出す手間が掛かってしまう。 2. Description of the Related Art In recent years, voice input/output terminals (for example, fixed telephones, etc.) shared by a plurality of individuals are known. In such a voice input/output terminal shared by multiple individuals, information used by each of the multiple individuals is generally registered in one voice input/output terminal. Therefore, when one of a plurality of individuals actually tries to use the voice input/output terminal as a user, it takes time and effort to find the information to be used by oneself from the information used by each of the plurality of individuals.

このような手間を低減するため、音声入出力端末と利用者の個人端末(例えば、携帯電話など)とを接続する技術が開示されている(例えば、特許文献1参照)。かかる技術によれば、利用者は音声入出力端末から通話を行うときに音声入出力端末と接続されている利用者の個人端末に登録されているアドレス帳(例えば、電話帳など)を使うことが可能である。 In order to reduce such time and effort, a technique for connecting a voice input/output terminal and a user's personal terminal (for example, a mobile phone) has been disclosed (see, for example, Patent Document 1). According to this technology, the user can use the address book (for example, telephone book) registered in the user's personal terminal connected to the voice input/output terminal when making a call from the voice input/output terminal. is possible.

特開2012-213097号公報JP 2012-213097 A

しかし、音声入出力端末と利用者の個人端末とを接続する技術では、個人ごとに個人端末を異なる音声入出力端末に接続させる必要がある。すなわち、個人ごとに異なる音声入出力端末を利用する必要がある。そのため、複数の個人が1台の音声入出力端末を共用するのが困難である。 However, in the technique of connecting a voice input/output terminal and a user's personal terminal, it is necessary to connect the personal terminal to a different voice input/output terminal for each individual. That is, it is necessary to use a different voice input/output terminal for each individual. Therefore, it is difficult for a plurality of individuals to share one voice input/output terminal.

そこで、複数の個人が1台の音声入出力端末を共用することを可能しつつ、複数の個人のうちの誰かが利用者として音声入出力端末を利用する場合に自分が利用する情報を探し出す手間を低減することが可能な技術が提供されることが望まれる。 Therefore, while allowing a plurality of individuals to share one voice input/output terminal, when one of the plurality of individuals uses the voice input/output terminal as a user, it is troublesome to find the information to be used by the individual. It is desirable to provide a technique capable of reducing

上記問題を解決するために、本発明のある観点によれば、少なくとも利用者の通話に利用される情報処理装置であって、前記利用者からの第1の入力に基づく入力データを取得する取得部と、前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、を備える、情報処理装置が提供される。 In order to solve the above problem, according to one aspect of the present invention, an information processing device used at least for a user's call, comprising an acquisition device for acquiring input data based on a first input from the user. personal identification information associated with the personal authentication data when authentication of the personal authentication data registered in the personal terminal wirelessly connected between the unit and the information processing apparatus is successful, and the input data is provided as user identification information.

前記情報処理装置は、宛先機器に対して前記利用者識別情報が送信されるように制御する通信制御部を備えてもよい。 The information processing apparatus may include a communication control section that controls transmission of the user identification information to a destination device.

前記個人認証用データは、前記利用者によって登録された音声データを含んでもよい。 The personal authentication data may include voice data registered by the user.

前記第1の入力は、前記利用者から入力された通話開始のための音声を含んでもよい。 The first input may include voice for starting a call input from the user.

前記情報処理装置は、前記個人認証用データと前記入力データとの認証が成功した場合に、前記個人端末から宛先機器を識別するための宛先識別情報を取得する通信制御部を備えてもよい。 The information processing apparatus may include a communication control unit that acquires destination identification information for identifying a destination device from the personal terminal when authentication of the personal authentication data and the input data is successful.

前記通信制御部は、前記利用者からの第2の入力に基づいて宛先に関する情報が認識された場合、前記個人端末から前記宛先に関する情報に関連付けられた前記宛先識別情報を取得してもよい。 The communication control unit may acquire the destination identification information associated with the destination information from the personal terminal when the destination information is recognized based on the second input from the user.

前記情報処理装置は、前記情報処理装置と宛先機器とが接続された場合に、前記個人端末に前記情報処理装置の操作インタフェースが提供されるように制御する通信制御部を備えてもよい。 The information processing device may include a communication control unit that controls such that an operation interface of the information processing device is provided to the personal terminal when the information processing device and the destination device are connected.

前記情報処理装置は、前記情報処理装置と宛先機器とが接続された場合に、前記個人端末によって宛先に関する情報が提示されるように制御する通信制御部を備えてもよい。 The information processing device may include a communication control unit that controls so that information about the destination is presented by the personal terminal when the information processing device and the destination device are connected.

また、本発明の別の観点によれば、少なくとも利用者の通話に利用される情報処理装置による情報処理方法であって、前記利用者からの第1の入力に基づく入力データを取得することと、前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定することと、を含む、情報処理方法が提供される。 According to another aspect of the present invention, there is provided an information processing method using at least an information processing device used in a call by a user, the method comprising acquiring input data based on a first input from the user; and using personal identification information associated with the personal authentication data when personal authentication data registered in a personal terminal wirelessly connected to the information processing device and the input data are successfully authenticated. and identifying as person identification information.

また、本発明の別の観点によれば、コンピュータを、少なくとも利用者の通話に利用される情報処理装置であって、前記利用者からの第1の入力に基づく入力データを取得する取得部と、前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、を備える情報処理装置として機能させるためのプログラムが提供される。 Further, according to another aspect of the present invention, a computer is an information processing device that is used at least for a user's call, and includes an acquisition unit that acquires input data based on a first input from the user. and using personal identification information associated with the personal authentication data when personal authentication data registered in a personal terminal wirelessly connected to the information processing device and the input data are successfully authenticated. A program for functioning as an information processing apparatus is provided.

以上説明したように本発明によれば、複数の個人が1台の音声入出力端末を共用することを可能しつつ、複数の個人のうちの誰かが利用者として音声入出力端末を利用する場合に自分が利用する情報を探し出す手間を低減することが可能な技術が提供される。 As described above, according to the present invention, it is possible for a plurality of individuals to share one voice input/output terminal, and at the same time, when one of the plurality of individuals uses the voice input/output terminal as a user. To provide a technique that can reduce the trouble of searching for information to be used by oneself.

本発明の実施形態に係る通信システムの構成例を示す図である。It is a figure which shows the structural example of the communication system which concerns on embodiment of this invention. 操作パネルの例を示す図である。FIG. 3 is a diagram showing an example of an operation panel; アドレス帳の例を示す図である。FIG. 4 is a diagram showing an example of an address book; 本発明の実施形態に係る通信システムによって実行される処理例を示すしシーケンス図である。4 is a sequence diagram showing an example of processing executed by the communication system according to the embodiment of the present invention; FIG. 本発明の実施形態に係る通信システムによって実行される処理例を示すしシーケンス図である。4 is a sequence diagram showing an example of processing executed by the communication system according to the embodiment of the present invention; FIG. 本発明の実施形態に係る音声入出力端末の例としての情報処理装置のハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the information processing apparatus as an example of the audio|voice input/output terminal which concerns on embodiment of this invention.

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Preferred embodiments of the present invention will be described in detail below with reference to the accompanying drawings. In the present specification and drawings, constituent elements having substantially the same functional configuration are denoted by the same reference numerals, thereby omitting redundant description.

また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字を付して区別する場合がある。ただし、実質的に同一の機能構成を有する複数の構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。また、異なる実施形態の類似する構成要素については、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、異なる実施形態の類似する構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。 In addition, in this specification and drawings, a plurality of components having substantially the same functional configuration may be distinguished by attaching different numerals after the same reference numerals. However, when there is no particular need to distinguish between a plurality of constituent elements having substantially the same functional configuration, only the same reference numerals are used. Also, similar components in different embodiments may be distinguished by attaching different alphabets after the same reference numerals. However, when there is no particular need to distinguish between similar components of different embodiments, only the same reference numerals are used.

(0.概要)
まず、本発明の実施形態の概要を説明する。近年、複数の個人によって共用される音声入出力端末(例えば、固定電話など)が知られている。このような複数の個人によって共用される音声入出力端末には、複数の個人それぞれが利用する情報が1台の音声入出力端末に登録されているのが一般的である。そのため、実際に複数の個人のうちの誰かが利用者として音声入出力端末を利用しようとした場合、複数の個人それぞれが利用する情報から自分が利用する情報を探し出す手間が掛かってしまう。
(0. Overview)
First, an outline of an embodiment of the present invention will be described. 2. Description of the Related Art In recent years, voice input/output terminals (for example, fixed telephones, etc.) shared by a plurality of individuals are known. In such a voice input/output terminal shared by multiple individuals, information used by each of the multiple individuals is generally registered in one voice input/output terminal. Therefore, when one of a plurality of individuals actually tries to use the voice input/output terminal as a user, it takes time and effort to find the information to be used by oneself from the information used by each of the plurality of individuals.

このような手間を低減するため、音声入出力端末と利用者の個人端末(例えば、携帯電話など)とを接続する技術が開示されている。かかる技術によれば、利用者は音声入出力端末から通話を行うときに音声入出力端末と接続されている利用者の個人端末に登録されているアドレス帳(例えば、電話帳など)を使うことが可能である。 In order to reduce such time and effort, techniques for connecting a voice input/output terminal and a user's personal terminal (for example, a mobile phone) have been disclosed. According to this technology, the user can use the address book (for example, telephone book) registered in the user's personal terminal connected to the voice input/output terminal when making a call from the voice input/output terminal. is possible.

しかし、音声入出力端末と利用者の個人端末とを接続する技術では、個人ごとに個人端末を異なる音声入出力端末に接続させる必要がある。すなわち、個人ごとに異なる音声入出力端末を利用する必要がある。そのため、複数の個人が1台の音声入出力端末を共用するのが困難である。 However, in the technique of connecting a voice input/output terminal and a user's personal terminal, it is necessary to connect the personal terminal to a different voice input/output terminal for each individual. That is, it is necessary to use a different voice input/output terminal for each individual. Therefore, it is difficult for a plurality of individuals to share one voice input/output terminal.

そこで、本明細書においては、複数の個人が1台の音声入出力端末を共用することを可能しつつ、複数の個人のうちの誰かが利用者として音声入出力端末を利用する場合に自分が利用する情報を探し出す手間を低減することが可能な技術について主に説明する。 Therefore, in this specification, while allowing a plurality of individuals to share one voice input/output terminal, when one of the plurality of individuals uses the voice input/output terminal as a user, Techniques that can reduce the effort required to find information to be used will be mainly described.

さらに、音声入出力端末からの情報を受信する宛先機器には、音声入出力端末の識別情報(例えば、電話番号など)が表示されるのが一般的である。これによって、音声入出力端末の識別情報を見れば、どの音声入出力端末からの情報が受信されたのかを把握することは可能である。しかし、音声入出力端末の識別情報を見たとしても、誰からの情報が宛先機器によって受信されたのかを把握することが困難である。 Furthermore, the destination device that receives the information from the voice input/output terminal generally displays the identification information of the voice input/output terminal (for example, telephone number). Thus, by looking at the identification information of the voice input/output terminal, it is possible to grasp from which voice input/output terminal information has been received. However, even if the identification information of the voice input/output terminal is seen, it is difficult to grasp from whom the information was received by the destination device.

そこで、複数の個人が1台の音声入出力端末を共用することを可能しつつ、複数の個人のうちの誰からの情報が宛先機器によって受信されたのかを容易に把握することが可能な技術についても説明する。 Therefore, a technology that enables multiple individuals to share one voice input/output terminal and easily grasps from which of the multiple individuals the information was received by the destination device. is also explained.

以上、本発明の実施形態の概要について説明した。 The outline of the embodiment of the present invention has been described above.

(1.実施形態の詳細)
続いて、本発明の実施形態の詳細について説明する。
(1. Details of embodiment)
Next, details of embodiments of the present invention will be described.

(1-1.通信システムの構成例)
図1は、本発明の実施形態に係る通信システムの構成例を示す図である。図1に示されるように、本発明の実施形態に係る通信システム10は、音声入出力端末100、スマートフォン200、音声認識サーバ300、シグナリングサーバ400および通信機器500、アクセスポイント600を有する。ネットワーク700は、インターネットなどの広帯域のネットワークであり、ネットワーク700には、音声認識サーバ300、シグナリングサーバ400、通信機器500およびアクセスポイント600が接続されている。
(1-1. Configuration example of communication system)
FIG. 1 is a diagram showing a configuration example of a communication system according to an embodiment of the present invention. As shown in FIG. 1, the communication system 10 according to the embodiment of the present invention has a voice input/output terminal 100, a smartphone 200, a voice recognition server 300, a signaling server 400, a communication device 500, and an access point 600. Network 700 is a broadband network such as the Internet, and network 700 is connected to speech recognition server 300 , signaling server 400 , communication device 500 and access point 600 .

アクセスポイント600は、音声入出力端末100およびスマートフォン200と無線接続されており、音声入出力端末100およびスマートフォン200によるネットワーク700を介した通信を中継する。しかし、通信システム10は必ずしもアクセスポイント600を備えていなくてもよい。かかる場合、音声入出力端末100およびスマートフォン200は、ネットワーク700から仕切られた内部ネットワークに接続されており、当該内部ネットワークを介してネットワーク700に接続されていればよい。 Access point 600 is wirelessly connected to voice input/output terminal 100 and smartphone 200 and relays communication between voice input/output terminal 100 and smartphone 200 via network 700 . However, communication system 10 does not necessarily have access point 600 . In such a case, the voice input/output terminal 100 and the smart phone 200 are connected to an internal network separated from the network 700, and may be connected to the network 700 via the internal network.

音声入出力端末100は、複数の個人によって共用される端末である。音声入出力端末100は、少なくとも複数の個人によって通話に利用される。複数の個人は、典型的には家族であってよいが、どのような集合であっても構わない。また、音声入出力端末100は、AI(Artificial Intelligence)スピーカなどであってよいが、PC(Personal Computer)であってもよいし、他の機器であってもよい。 The voice input/output terminal 100 is a terminal shared by multiple individuals. The voice input/output terminal 100 is used for calls by at least a plurality of individuals. A plurality of individuals may typically be a family, but may be any collection. Also, the voice input/output terminal 100 may be an AI (Artificial Intelligence) speaker or the like, but may be a PC (Personal Computer) or other equipment.

具体的に、音声入出力端末100は、マイクロフォン(以下、単に「マイク」とも言う。)101、スピーカ102、利用者・宛先探索部104、音声データ変換部103、通信部105、通話部106およびメモリなどを有している。マイク101は、周囲の音声を収集する。スピーカ102は、音声を出力する。メモリは、演算装置を動作させるためのプログラムやデータを記憶することができる。また、メモリは、演算装置の動作の過程で必要となる各種データを一時的に記憶することもできる。 Specifically, the voice input/output terminal 100 includes a microphone (hereinafter also referred to simply as a "microphone") 101, a speaker 102, a user/destination search unit 104, a voice data conversion unit 103, a communication unit 105, a call unit 106 and It has memory, etc. Microphone 101 collects surrounding sounds. Speaker 102 outputs sound. The memory can store programs and data for operating the arithmetic device. In addition, the memory can also temporarily store various data required during the operation of the arithmetic unit.

利用者・宛先探索部104、音声データ変換部103および通話部106は、演算装置によって実現される。演算装置は、音声入出力端末100の動作全体を制御する機能を有する。演算装置は、音声入出力端末100に内蔵された演算装置がROM(Read Only Memory)に記憶されたプログラムをRAM(Random Access Memory)に展開して実行することにより実現される。かかるプログラムが提供され得る他、かかるプログラムを記憶させた記憶媒体も提供され得る。 The user/destination search unit 104, the voice data conversion unit 103, and the call unit 106 are implemented by an arithmetic unit. The computing device has a function of controlling the overall operation of the voice input/output terminal 100 . The arithmetic device is realized by the arithmetic device built in the voice input/output terminal 100 expanding a program stored in a ROM (Read Only Memory) into a RAM (Random Access Memory) and executing the program. In addition to providing such a program, a storage medium storing such a program may also be provided.

利用者・宛先探索部104は、(アクセスポイント600を介して)無線接続されたスマートフォン200に対して、音声入出力端末100の現在の利用者の識別情報(利用者識別情報)と利用者が通話を行おうとしている相手の通信機器500の識別情報(宛先識別情報)とを問い合わせる。音声データ変換部103は、音声を取得すると、取得した音声を音声データに変換する。また、音声データ変換部103は、音声データを取得すると、取得した音声データを音声に変換する。通話部106は、通信機器500との接続が完了すると、通信機器500との間で通話を送受信する。 The user/destination search unit 104 sends the current user identification information (user identification information) of the voice input/output terminal 100 to the smartphone 200 wirelessly connected (via the access point 600) and the user It inquires about the identification information (destination identification information) of the communication device 500 of the other party with whom the call is to be made. The voice data conversion unit 103, upon acquiring voice, converts the acquired voice into voice data. In addition, when acquiring the audio data, the audio data conversion unit 103 converts the acquired audio data into audio. When the connection with the communication device 500 is completed, the call unit 106 transmits and receives calls to and from the communication device 500 .

通信部105は、アンテナを含んで構成されており、アクセスポイント600に対して無線接続を行う。また、通信部105は、アクセスポイント600を介してスマートフォン200と通信を行う。また、通信部105は、アクセスポイント600およびネットワーク700を介して、音声認識サーバ300、シグナリングサーバ400および通信機器500と通信を行ったりする。 The communication unit 105 includes an antenna and wirelessly connects to the access point 600 . Also, the communication unit 105 communicates with the smartphone 200 via the access point 600 . Communication unit 105 also communicates with speech recognition server 300 , signaling server 400 and communication device 500 via access point 600 and network 700 .

スマートフォン200は、個人ごとに利用される個人端末の一例として機能する。すなわち、スマートフォン200の代わりに他の個人端末(例えば、タブレット端末、PC、携帯電話など)が用いられてもよい。本実施形態では、4人の個人それぞれが別々のスマートフォン200を持っている場合を主に想定する。すなわち、通信システム10が、4台のスマートフォン200(スマートフォン200-1~200-4)を有する場合を主に想定する。しかし、スマートフォン200の数(および個人の数)は複数であれば特に限定されない。 Smartphone 200 functions as an example of a personal terminal that is used by each individual. That is, other personal terminals (for example, a tablet terminal, a PC, a mobile phone, etc.) may be used instead of the smart phone 200 . In this embodiment, it is mainly assumed that each of the four individuals has a separate smart phone 200 . That is, it is mainly assumed that communication system 10 has four smartphones 200 (smartphones 200-1 to 200-4). However, the number of smartphones 200 (and the number of individuals) is not particularly limited as long as it is plural.

具体的に、スマートフォン200は、タッチパネル、ディスプレイ、演算装置、通信インタフェース、メモリなどを有している。タッチパネルは、入力インタフェースの一例として機能する。すなわち、タッチパネルの代わりに他の入力インタフェース(例えば、ボタン、マウス、キーボードなど)が用いられてもよい。ディスプレイには、音声入出力端末100の操作パネル203が表示され得る。 Specifically, smartphone 200 has a touch panel, a display, an arithmetic device, a communication interface, a memory, and the like. A touch panel functions as an example of an input interface. That is, other input interfaces (eg, buttons, mouse, keyboard, etc.) may be used instead of the touch panel. The operation panel 203 of the voice input/output terminal 100 can be displayed on the display.

図2は、操作パネル203の例を示す図である。図2に示されるように、操作パネル203(操作パネルG10)は、音量調整のためのオブジェクトの例としてのスライダG11、接続を切断するためのオブジェクトの例としてのボタンG12などを含んでよい。また、操作パネルG10には、宛先に関する情報(図2に示された例では、「ABCさん」)を含んでもよい。なお、図2に示された例では、利用者によって操作されるオブジェクトがスライダG11およびボタンG12である例が示されている。しかし、利用者によって操作されるオブジェクトの種類は、スライダおよびボタンに限定されず、何らかの操作可能なオブジェクトであればよい。 FIG. 2 is a diagram showing an example of the operation panel 203. As shown in FIG. As shown in FIG. 2, the operation panel 203 (operation panel G10) may include a slider G11 as an example of an object for volume adjustment, a button G12 as an example of an object for disconnecting, and the like. The operation panel G10 may also include information on the destination ("Mr. ABC" in the example shown in FIG. 2). Note that the example shown in FIG. 2 shows an example in which the objects operated by the user are the slider G11 and the button G12. However, the types of objects operated by the user are not limited to sliders and buttons, and any operable object may be used.

図1に戻って説明を続ける。スマートフォン200の演算装置は、スマートフォン200の動作全体を制御する機能を有する。演算装置は、ROM(Read Only Memory)に記憶されたプログラムをRAM(Random Access Memory)に展開して実行することにより実現される。かかるプログラムが提供され得る他、かかるプログラムを記憶させた記憶媒体も提供され得る。演算装置は、音声認証部201としても機能し得る。音声認証部201は、音声入出力端末100に対して入力を行った利用者がスマートフォン200の利用者であるかを認証する。 Returning to FIG. 1, the description continues. The computing device of smartphone 200 has a function of controlling the overall operation of smartphone 200 . The arithmetic unit is implemented by developing a program stored in a ROM (Read Only Memory) into a RAM (Random Access Memory) and executing the program. In addition to providing such a program, a storage medium storing such a program may also be provided. The computing device can also function as the voice authentication unit 201 . The voice authentication unit 201 authenticates whether the user who has made an input to the voice input/output terminal 100 is the user of the smartphone 200 .

メモリは、演算装置を動作させるためのプログラムやデータ(例えば、アドレス帳202など)を記憶することができる。また、メモリは、演算装置の動作の過程で必要となる各種データを一時的に記憶することもできる。 The memory can store programs and data (for example, the address book 202, etc.) for operating the computing device. In addition, the memory can also temporarily store various data required during the operation of the arithmetic unit.

アドレス帳202には、宛先の通信機器500(宛先機器)の宛先識別情報と宛先に関する情報とが関連付けられた情報が含まれる。宛先に関する情報は、宛先の名前(宛先名)などを含んでよい。以下では、宛先に関する情報が宛先名である場合を主に想定するが、宛先に関する情報は宛先名に限定されない。また、宛先識別情報は、電話番号を含んでもよいし、IP(Internet Protocol)電話のURI(Uniform Resource Identifier)を含んでもよい。図3は、アドレス帳202の例を示す図である。図3に示されたように、例えば、アドレス帳202は、宛先の名前(宛先名)と宛先識別情報とが関連付けられた情報が含まれてよい。 The address book 202 includes information in which the destination identification information of the destination communication device 500 (destination device) and the information related to the destination are associated with each other. The information about the destination may include the name of the destination (destination name) and the like. In the following, it is mainly assumed that the information about the destination is the name of the destination, but the information about the destination is not limited to the name of the destination. Also, the destination identification information may include a telephone number, or may include a URI (Uniform Resource Identifier) of an IP (Internet Protocol) telephone. FIG. 3 is a diagram showing an example of the address book 202. As shown in FIG. As shown in FIG. 3, for example, the address book 202 may include information in which destination names (destination names) and destination identification information are associated with each other.

図1に戻って説明を続ける。音声認識サーバ300は、音声データに対して音声認識を行い、音声認識に基づいてテキストデータを生成する。また、音声認識サーバ300は、生成したテキストデータから所定のキーワードを抽出する。なお、本実施形態では、音声入出力端末100に掛かる負荷を軽減するために、音声認識の機能を音声認識サーバ300が有する場合を主に想定する。しかし、後にも説明するように、音声認識サーバ300の音声認識の機能は、音声入出力端末100が代わりに有してもよい。 Returning to FIG. 1, the description continues. The speech recognition server 300 performs speech recognition on speech data and generates text data based on the speech recognition. Also, the speech recognition server 300 extracts a predetermined keyword from the generated text data. In addition, in this embodiment, in order to reduce the load on the voice input/output terminal 100, it is mainly assumed that the voice recognition server 300 has a voice recognition function. However, as will be explained later, the speech recognition function of the speech recognition server 300 may instead be provided by the speech input/output terminal 100 .

シグナリングサーバ400は、音声入出力端末100から呼び出しを受け付けると、呼び出しに基づいて、音声入出力端末100と宛先の通信機器500との接続を行う。 When the signaling server 400 receives a call from the voice input/output terminal 100, the signaling server 400 connects the voice input/output terminal 100 and the destination communication device 500 based on the call.

通信機器500は、音声入出力端末100の利用者と通話を行う相手によって利用される機器である。ここで、通信機器500の種類は限定されない。例えば、通信機器500は、音声入出力端末100と同種の端末であってもよいし、スマートフォンであってもよいし、通話が可能な何らかの機器であってもよい。 The communication device 500 is used by the user of the voice input/output terminal 100 and the other party of the call. Here, the type of communication device 500 is not limited. For example, the communication device 500 may be a terminal of the same type as the voice input/output terminal 100, a smart phone, or any device capable of making a call.

以上、本発明の実施形態に係る通信システムの構成例について説明した。 The configuration example of the communication system according to the embodiment of the present invention has been described above.

(1-2.通信システムの動作例)
続いて、本発明の実施形態に係る通信システム10の動作例について説明する。図4および図5は、本発明の実施形態に係る通信システム10によって実行される処理例を示すしシーケンス図である。なお、図5および図6に示されたシーケンス図は、本発明の実施形態に係る通信システム10によって実行される処理の一例を示したに過ぎない。したがって、本発明の実施形態に係る通信システム10によって実行される処理は、図4および図5に示されたフローチャートによって示される例に限定されない。
(1-2. Operation example of communication system)
Next, an operation example of the communication system 10 according to the embodiment of the invention will be described. 4 and 5 are sequence diagrams showing an example of processing performed by the communication system 10 according to the embodiment of the present invention. It should be noted that the sequence diagrams shown in FIGS. 5 and 6 merely show an example of processing executed by the communication system 10 according to the embodiment of the present invention. Accordingly, the processing performed by communication system 10 in accordance with embodiments of the present invention is not limited to the examples illustrated by the flowcharts shown in FIGS.

まず、利用者は、あらかじめ自分のスマートフォン200に個人認証用データの例として音声データを登録しておく。その後、利用者は自分のスマートフォン200を持ち歩き、音声入出力端末100の付近に移動すると、利用者のスマートフォン200は、(アクセスポイント600に接続されることによって)音声入出力端末100が接続されている内部ネットワークと同一の内部ネットワークに無線接続される。 First, the user registers voice data as an example of personal authentication data in his/her smart phone 200 in advance. After that, when the user carries his/her smartphone 200 around and moves near the voice input/output terminal 100, the user's smart phone 200 is connected to the voice input/output terminal 100 (by being connected to the access point 600). wirelessly connected to the same internal network as the one in which the

音声入出力端末100のマイク101は、周囲の音声を絶えず収集している。マイク101は、音量が閾値を超える音声を収集すると、収集した音声を音声データ変換部103に出力し(S11)、音声データ変換部103は、マイク101によって収集された音声を音声データに変換する。音声データ変換部103は、変換後の音声データを利用者・宛先探索部104に出力する(S12)。 The microphone 101 of the voice input/output terminal 100 constantly collects ambient voices. When the microphone 101 collects sound whose volume exceeds the threshold, it outputs the collected sound to the sound data conversion unit 103 (S11), and the sound data conversion unit 103 converts the sound collected by the microphone 101 into sound data. . The voice data conversion unit 103 outputs the converted voice data to the user/destination search unit 104 (S12).

利用者・宛先探索部104は、通信部105を介して音声データを音声認識サーバ300に送信する(S13)。 The user/destination search unit 104 transmits the voice data to the voice recognition server 300 via the communication unit 105 (S13).

音声認識サーバ300は、音声データを受信すると、音声データからキーワードの例として、宛先名と接続用の語句(通話開始のための音声)とを抽出する。例えば、音声データが「ABCさんと通話」である場合、接続用の語句は、「と通話」に該当し、宛先名は、「と通話」の前の「ABCさん」に該当する。音声認識サーバ300は、音声データから宛先名と接続用の語句とが抽出された場合には、通話開始指示があったことと宛先名とを音声入出力端末100に返信する(S14)。 Upon receiving the voice data, the voice recognition server 300 extracts the destination name and the phrase for connection (speech for starting a call) from the voice data as examples of keywords. For example, if the voice data is "call with Mr. ABC", the phrase for connection corresponds to "call with", and the destination name corresponds to "Mr. ABC" before "call with". When the destination name and the connection phrase are extracted from the voice data, the voice recognition server 300 replies to the voice input/output terminal 100 with the destination name and the call start instruction (S14).

音声入出力端末100の利用者・宛先探索部104は、通信部105によって受信された通話開始指示があったことと宛先名とを取得する。音声入出力端末100の利用者・宛先探索部104は、通話開始指示があったことが受信されると、音声入出力端末100の周囲に存在する内部ネットワークに接続されたすべてのスマートフォン200に対して、音声データを、通信部105を介して送信する(S15)。 The user/destination searching unit 104 of the voice input/output terminal 100 acquires the call start instruction received by the communication unit 105 and the destination name. When the user/destination searching unit 104 of the voice input/output terminal 100 receives the instruction to start a call, the user/destination searching unit 104 sends a Then, the voice data is transmitted via the communication unit 105 (S15).

(音声入出力端末100から音声データを受信した)スマートフォン200の音声認証部201は、受信した音声データとあらかじめ登録された音声データとの認証(照合)を行い、あらかじめ登録された音声データに関連付けられた個人識別情報と認証結果とを音声入出力端末100に返信する(S16)。例えば、認証処理は、双方の音声データから特徴データを抽出し、特徴データ同士の一致度が閾値を超えるか否かを判断することによって、認証成功か否かが判断されてよい。しかし、認証処理の具体的な手法は限定されない。 The voice authentication unit 201 of the smartphone 200 (which has received the voice data from the voice input/output terminal 100) authenticates (matches) the received voice data with pre-registered voice data, and associates the received voice data with the pre-registered voice data. The received personal identification information and authentication result are returned to the voice input/output terminal 100 (S16). For example, in the authentication process, it may be determined whether or not the authentication is successful by extracting feature data from both voice data and determining whether or not the degree of matching between the feature data exceeds a threshold. However, a specific method of authentication processing is not limited.

音声入出力端末100の利用者・宛先探索部104は、通信部105によって個人識別情報と認証成功を示す認証結果とが受信された場合には、受信された個人識別情報を利用者識別情報として特定する。利用者のスマートフォン200に対して、通信部105を介して宛先名を送信する(S17)。 When the communication unit 105 receives the personal identification information and the authentication result indicating the authentication success, the user/destination searching unit 104 of the voice input/output terminal 100 uses the received personal identification information as the user identification information. Identify. The destination name is transmitted to the smartphone 200 of the user via the communication unit 105 (S17).

利用者のスマートフォン200は、宛先名が自身のアドレス帳202に登録されているかを判定する。利用者のスマートフォン200は、アドレス帳202に宛先名が登録されている場合、宛先名に関連付けられた宛先識別情報をアドレス帳202から取得し、取得した宛先識別情報を音声入出力端末100に返信する(S18)。 The user's smartphone 200 determines whether the destination name is registered in its own address book 202 . When the destination name is registered in the address book 202, the user's smartphone 200 acquires the destination identification information associated with the destination name from the address book 202, and returns the acquired destination identification information to the voice input/output terminal 100. (S18).

利用者・宛先探索部104は、利用者のスマートフォン200に対しては操作パネルG10(図2)の表示要求を、通信部105を介して送信する(S21)。これによって、音声入出力端末100の操作インタフェースが利用者のスマートフォン200に提供されるように制御される。 The user/destination search unit 104 transmits a request to display the operation panel G10 (FIG. 2) to the smartphone 200 of the user via the communication unit 105 (S21). Thereby, the operation interface of the voice input/output terminal 100 is controlled to be provided to the smartphone 200 of the user.

利用者のスマートフォン200は、操作パネルG10の表示要求を受信すると、操作パネルを表示する(S22)。これによって、利用者は、スマートフォン200によって表示された操作パネルに対して操作を行うことによって(例えば、音声入出力端末100がディスプレイを有していない場合であっても)音声入出力端末100を操作することが可能となる。 Upon receiving the request to display the operation panel G10, the user's smartphone 200 displays the operation panel (S22). Accordingly, the user can operate the voice input/output terminal 100 by operating the operation panel displayed by the smartphone 200 (for example, even when the voice input/output terminal 100 does not have a display). It is possible to operate.

音声入出力端末100の利用者・宛先探索部104は、通信部105によって宛先識別情報が受信されると、宛先識別情報を取得し、シグナリングサーバ400に対して、宛先識別情報と利用者識別情報とを含む接続要求を、通信部105を介して送信する(S23)。これによって、通信機器500に対する利用者識別情報の送信が制御される。 When the communication unit 105 receives the destination identification information, the user/destination search unit 104 of the voice input/output terminal 100 acquires the destination identification information, and sends the destination identification information and the user identification information to the signaling server 400. is transmitted via the communication unit 105 (S23). Transmission of the user identification information to the communication device 500 is thereby controlled.

一方、シグナリングサーバ400は、接続要求を受信すると、接続要求に含まれる宛先識別情報によって識別される宛先の通信機器500と音声入出力端末100の通話部106とを接続させる。すなわち、シグナリングサーバ400は、宛先識別情報と利用者識別情報とを含む接続要求を通信機器500に送信する(S24)。 On the other hand, when the signaling server 400 receives the connection request, the signaling server 400 connects the destination communication device 500 identified by the destination identification information included in the connection request to the call unit 106 of the voice input/output terminal 100 . Specifically, the signaling server 400 transmits a connection request including the destination identification information and the user identification information to the communication device 500 (S24).

通信機器500は、接続要求を受信すると、接続要求に含まれる利用者識別情報を取得し、利用者識別情報または利用者識別情報に関連付けられている利用者に関する情報(例えば、利用者名など)を表示する。これによって、相手は誰からの呼び出しがあったかを把握することが可能となる。 When the communication device 500 receives the connection request, it acquires the user identification information included in the connection request, and obtains the user identification information or information related to the user associated with the user identification information (for example, user name). display. This makes it possible for the other party to grasp from whom the call was made.

利用者・宛先探索部104は、通話部106が通信機器500と接続されたことを確認すると(S25)、接続完了通知を音声データ変換部103に出力し(S26)、音声データ変換部103は、接続完了通知を受け取ると、接続完了を示す音声を生成してスピーカ102に出力し(S27)、スピーカ102は、接続完了を示す音声を出力する。 When the user/destination search unit 104 confirms that the call unit 106 is connected to the communication device 500 (S25), it outputs a connection completion notification to the voice data conversion unit 103 (S26), and the voice data conversion unit 103 , when receiving the connection completion notification, it generates a sound indicating the connection completion and outputs it to the speaker 102 (S27), and the speaker 102 outputs the sound indicating the connection completion.

このとき、利用者・宛先探索部104は、接続されたことを確認した場合に、利用者のスマートフォン200に対して宛先名の表示指示を、通信部105を介して送信してもよい。これによって、利用者のスマートフォン200による宛先名の表示が制御される。利用者は、スマートフォン200によって表示された宛先名を見ることによって(例えば、音声入出力端末100がディスプレイを有していない場合であっても)、誰との通話が可能になったかを確認することができる。宛先名は、利用者のスマートフォン200のどこに表示されてもよいが、例えば、図2に示されたように、操作パネルG10に表示されてもよい。 At this time, the user/destination search unit 104 may transmit an instruction to display the destination name to the smartphone 200 of the user via the communication unit 105 when confirming the connection. This controls the display of the destination name on the smartphone 200 of the user. By looking at the destination name displayed on the smartphone 200 (for example, even if the voice input/output terminal 100 does not have a display), the user can confirm with whom the call is possible. be able to. The destination name may be displayed anywhere on the user's smartphone 200, but may be displayed on the operation panel G10 as shown in FIG. 2, for example.

利用者は接続完了を示す音声を聞くと、相手との通話を開始する。具体的に、利用者によって音声が入力されると、音声入出力端末100のマイク101を介して通話部106に利用者の音声が入力される。通話部106は、通信部105を介して通信機器500に利用者の音声を送信する。一方、通信機器500は、利用者の音声が受信されると、利用者の音声を出力する。相手が利用者の音声を聞き、音声を入力すると、相手の音声が通信機器500から、通信部105を介して通話部106に入力され、スピーカ102によって出力される。利用者は相手の音声を聞くことができる。 When the user hears the voice indicating the completion of connection, he/she starts talking with the other party. Specifically, when the user inputs voice, the user's voice is input to the calling unit 106 via the microphone 101 of the voice input/output terminal 100 . The call unit 106 transmits the user's voice to the communication device 500 via the communication unit 105 . On the other hand, when the user's voice is received, the communication device 500 outputs the user's voice. When the other party hears the user's voice and inputs the voice, the other party's voice is input from the communication device 500 to the call section 106 via the communication section 105 and output by the speaker 102 . The user can hear the other party's voice.

利用者は相手との通話を終了したい場合には、スマートフォン200に表示されている操作パネルG10(図2)のボタンG12を押下または音声入出力端末100に対しての音声による切断操作(例えば「さようなら」と話しかける等)すればよい。操作パネルG10の操作による切断では、スマートフォン200から切断要求が音声入出力端末100に送信される。音声入出力端末100に対しての音声による切断では、音声入出力端末100は会話中の音声を常に音声認識サーバ300へ送信し、音声認識サーバ300が切断処理用音声を認識すると切断処理が開始される。音声入出力端末100の利用者・宛先探索部104は、スマートフォン200から切断要求を受信・または音声認識サーバ300で切断操作音声を認識すると、宛先識別情報を含む切断要求を、通信部105を介してシグナリングサーバ400に送信する。シグナリングサーバ400は、宛先識別情報を含む切断要求を受信すると、音声入出力端末100と宛先識別情報によって識別される通信機器500との接続を切断する。 When the user wants to end the call with the other party, the user presses the button G12 on the operation panel G10 (FIG. 2) displayed on the smartphone 200 or disconnects the voice input/output terminal 100 by voice (for example, " Say goodbye, etc.). In disconnection by operating the operation panel G10, the smartphone 200 transmits a disconnection request to the voice input/output terminal 100. FIG. When disconnecting by voice to the voice input/output terminal 100, the voice input/output terminal 100 always transmits voice during conversation to the voice recognition server 300, and when the voice recognition server 300 recognizes the voice for disconnection processing, disconnection processing is started. be done. When the user/destination search unit 104 of the voice input/output terminal 100 receives the disconnection request from the smartphone 200 or recognizes the disconnection operation voice by the voice recognition server 300, the user/destination search unit 104 transmits the disconnection request including the destination identification information via the communication unit 105. to the signaling server 400. When the signaling server 400 receives the disconnection request including the destination identification information, the signaling server 400 disconnects the voice input/output terminal 100 and the communication device 500 identified by the destination identification information.

以上、本発明の実施形態に係る通信システム10の動作例について説明した。 An operation example of the communication system 10 according to the embodiment of the present invention has been described above.

(2.ハードウェア構成例)
続いて、本発明の実施形態に係る音声入出力端末100のハードウェア構成例について説明する。以下では、本発明の実施形態に係る音声入出力端末100のハードウェア構成例として、情報処理装置900のハードウェア構成例について説明する。なお、以下に説明する情報処理装置900のハードウェア構成例は、音声入出力端末100のハードウェア構成の一例に過ぎない。したがって、音声入出力端末100のハードウェア構成は、以下に説明する情報処理装置900のハードウェア構成から不要な構成が削除されてもよいし、新たな構成が追加されてもよい。
(2. Hardware configuration example)
Next, a hardware configuration example of the voice input/output terminal 100 according to the embodiment of the present invention will be described. A hardware configuration example of the information processing device 900 will be described below as a hardware configuration example of the audio input/output terminal 100 according to the embodiment of the present invention. Note that the hardware configuration example of the information processing device 900 described below is merely an example of the hardware configuration of the audio input/output terminal 100 . Therefore, in the hardware configuration of the voice input/output terminal 100, unnecessary configurations may be deleted from the hardware configuration of the information processing device 900 described below, or new configurations may be added.

また、通信システム10が有する各種装置のうち、音声入出力端末100以外の装置(例えば、スマートフォン200、音声認識サーバ300、シグナリングサーバ400、通信機器500、アクセスポイント600など)のハードウェア構成も、音声入出力端末100のハードウェア構成と同様に実現され得る。 Further, among the various devices included in the communication system 10, the hardware configuration of devices other than the voice input/output terminal 100 (for example, the smartphone 200, the voice recognition server 300, the signaling server 400, the communication device 500, the access point 600, etc.) It can be implemented similarly to the hardware configuration of the voice input/output terminal 100 .

図6は、本発明の実施形態に係る音声入出力端末100の例としての情報処理装置900のハードウェア構成を示す図である。情報処理装置900は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ホストバス904と、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置910と、通信装置911と、を備える。 FIG. 6 is a diagram showing the hardware configuration of an information processing device 900 as an example of the voice input/output terminal 100 according to the embodiment of the present invention. The information processing device 900 includes a CPU (Central Processing Unit) 901, a ROM (Read Only Memory) 902, a RAM (Random Access Memory) 903, a host bus 904, a bridge 905, an external bus 906, and an interface 907. , an input device 908 , an output device 909 , a storage device 910 and a communication device 911 .

CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバス等から構成されるホストバス904により相互に接続されている。 The CPU 901 functions as an arithmetic processing device and a control device, and controls general operations within the information processing device 900 according to various programs. Alternatively, the CPU 901 may be a microprocessor. The ROM 902 stores programs, calculation parameters, and the like used by the CPU 901 . The RAM 903 temporarily stores programs used in the execution of the CPU 901, parameters that change as appropriate during the execution, and the like. These are interconnected by a host bus 904 comprising a CPU bus or the like.

ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905および外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。 The host bus 904 is connected via a bridge 905 to an external bus 906 such as a PCI (Peripheral Component Interconnect/Interface) bus. Note that the host bus 904, the bridge 905 and the external bus 906 do not necessarily have to be configured separately, and these functions may be implemented in one bus.

入力装置908は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等利用者が情報を入力するための入力手段と、利用者による入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路等から構成されている。情報処理装置900を操作する利用者は、この入力装置908を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。 The input device 908 includes input means for the user to input information, such as a mouse, keyboard, touch panel, button, microphone, switch, and lever, and an input signal that is generated based on the user's input and output to the CPU 901. It is composed of a control circuit and the like. A user who operates the information processing apparatus 900 can input various data to the information processing apparatus 900 and instruct processing operations by operating the input device 908 .

出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。 The output device 909 includes, for example, a CRT (Cathode Ray Tube) display device, a liquid crystal display (LCD) device, an OLED (Organic Light Emitting Diode) device, a display device such as a lamp, and an audio output device such as a speaker.

ストレージ装置910は、データ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置910は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置910は、ハードディスクを駆動し、CPU901が実行するプログラムや各種データを格納する。 The storage device 910 is a device for data storage. The storage device 910 may include a storage medium, a recording device that records data on the storage medium, a reading device that reads data from the storage medium, a deletion device that deletes data recorded on the storage medium, and the like. The storage device 910 is configured by, for example, an HDD (Hard Disk Drive). The storage device 910 drives a hard disk and stores programs executed by the CPU 901 and various data.

通信装置911は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置911は、無線通信または有線通信のどちらに対応してもよい。 The communication device 911 is, for example, a communication interface configured with a communication device or the like for connecting to a network. Also, the communication device 911 may support either wireless communication or wired communication.

以上、本発明の実施形態に係る音声入出力端末100のハードウェア構成例について説明した。 The hardware configuration example of the voice input/output terminal 100 according to the embodiment of the present invention has been described above.

(3.まとめ)
以上に説明したように、本発明の実施形態によれば、少なくとも利用者の通話に利用される情報処理装置であって、前記利用者からの第1の入力に基づく入力データを取得する取得部と、前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、を備える、情報処理装置が提供される。
(3. Summary)
As described above, according to the embodiment of the present invention, an information processing device that is used at least for a call by a user, and which acquires input data based on a first input from the user. and when authentication between the personal authentication data registered in the personal terminal wirelessly connected to the information processing device and the input data is successful, personal identification information associated with the personal authentication data and a specifying unit for specifying as user identification information.

かかる構成によれば、複数の個人が1台の情報処理装置を共用することを可能しつつ、複数の個人のうちの誰かが利用者として情報処理装置を利用する場合に自分が利用する情報を探し出す手間を低減することが可能となる。 According to this configuration, while allowing a plurality of individuals to share one information processing apparatus, when one of the plurality of individuals uses the information processing apparatus as a user, the information to be used by the individual can be shared. It is possible to reduce the trouble of searching.

また、前記情報処理装置は、宛先機器に対して前記利用者識別情報が送信されるように制御する通信制御部を備えてもよい。これによって、宛先機器に対する利用者識別情報の送信が制御され、宛先機器において利用者識別情報または利用者識別情報に関連付けられている利用者に関する情報(例えば、利用者名など)が表示されれば、相手は誰からの呼び出しがあったかを把握することが可能となる。 Further, the information processing apparatus may include a communication control section that controls transmission of the user identification information to a destination device. This controls the transmission of the user identification information to the destination device, and if the destination device displays the user identification information or information about the user associated with the user identification information (for example, the user name, etc.) , it becomes possible for the other party to grasp from whom the call was made.

前記情報処理装置は、前記情報処理装置と宛先機器とが接続された場合に、前記個人端末に前記情報処理装置の操作インタフェースが提供されるように制御する通信制御部を備えてもよい。これによって、利用者は、前記個人端末によって表示された操作パネルに対して操作を行うことによって(例えば、情報処理装置がディスプレイを有していない場合であっても)、情報処理装置を操作することが可能となる。 The information processing device may include a communication control unit that controls such that an operation interface of the information processing device is provided to the personal terminal when the information processing device and the destination device are connected. Thereby, the user can operate the information processing device by operating the operation panel displayed by the personal terminal (for example, even if the information processing device does not have a display). becomes possible.

前記情報処理装置は、前記情報処理装置と宛先機器とが接続された場合に、前記個人端末によって前記宛先に関する情報が提示されるように制御する通信制御部を備えてもよい。これによって、利用者は、個人端末によって表示された前記宛先に関する情報を見ることによって(例えば、情報処理装置がディスプレイを有していない場合であっても)、誰との通話が可能になったかを確認することができる。 The information processing device may include a communication control unit that controls so that the personal terminal presents information about the destination when the information processing device and the destination device are connected. This allows the user to see with whom the call is possible by viewing the information on the destination displayed by the personal terminal (for example, even if the information processing device does not have a display). can be confirmed.

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。 Although the preferred embodiments of the present invention have been described in detail above with reference to the accompanying drawings, the present invention is not limited to such examples. It is obvious that a person having ordinary knowledge in the technical field to which the present invention belongs can conceive of various modifications or modifications within the scope of the technical idea described in the claims. It is understood that these also naturally belong to the technical scope of the present invention.

上記では、本発明の実施形態では、利用者によって個人認証用データの例として音声データがあらかじめスマートフォン200に登録される例について主に説明した。しかし、音声データの代わりに他の個人認証用データがあらかじめスマートフォン200に登録されてもよい。例えば、利用者の顔画像が個人認証用データとしてスマートフォン200にあらかじめ登録されてもよいし、利用者の指紋データが個人認証用データとしてスマートフォン200にあらかじめ登録されてもよい。このとき、利用者からの入力も音声に限定されない。 In the above embodiments of the present invention, an example in which voice data is registered in advance in the smartphone 200 by the user as an example of personal authentication data has been mainly described. However, other personal authentication data may be registered in smartphone 200 in advance instead of voice data. For example, the user's face image may be registered in advance in the smartphone 200 as personal authentication data, or the user's fingerprint data may be registered in advance in the smartphone 200 as personal authentication data. At this time, the input from the user is not limited to voice.

例えば、利用者によって入力される認証に利用される音声は、スマートフォン200に登録される個人認証用データの種類に応じて適宜に他の入力に変更されてよい。 For example, the voice input by the user and used for authentication may be appropriately changed to another input according to the type of personal authentication data registered in the smartphone 200 .

例えば、個人認識用データが利用者の顔画像である場合には、認証に利用される音声は、音声入出力端末100に備えられたカメラによって撮像された顔画像に置き換えられてもよい。あるいは、個人認識用データが利用者の指紋データである場合には、認証に利用される音声は、音声入出力端末100に備えられた指紋センサによって検出された指紋データに置き換えられてもよい。すなわち、認証に利用される音声は、第1の入力に置き換えられてよい。このとき、認証に利用される音声から認識される音声データの代わりに、第1の入力に基づいて認識される第1の入力データが利用されればよい。 For example, if the personal recognition data is a user's face image, the voice used for authentication may be replaced with a face image captured by a camera provided in the voice input/output terminal 100 . Alternatively, if the personal recognition data is the user's fingerprint data, the voice used for authentication may be replaced with the fingerprint data detected by the fingerprint sensor provided in the voice input/output terminal 100 . That is, the voice used for authentication may be replaced with the first input. At this time, the first input data recognized based on the first input may be used instead of the voice data recognized from the voice used for authentication.

また、利用者によって入力される宛先認識に利用される音声も、適宜に他の入力に変更されてよい。例えば、宛先認識に利用される音声は、他の入力インタフェース(例えば、ボタン押下など)を介して利用者によって入力される宛先選択操作に置き換えられてもよい。すなわち、宛先認識に利用される音声は、第2の入力に置き換えられてよい。このとき、宛先認識に利用される音声から認識される音声データの代わりに、第2の入力に基づいて認識される第2の入力データが利用されればよい。 Also, the voice input by the user and used for address recognition may be appropriately changed to another input. For example, the voice used for destination recognition may be replaced with a destination selection operation input by the user via another input interface (eg, button presses, etc.). That is, the voice used for destination recognition may be replaced with the second input. At this time, the second input data recognized based on the second input may be used instead of the voice data recognized from the voice used for destination recognition.

また、上記では、認証に利用される音声と宛先認識に利用される音声とが、結合された一つの音声として、音声入出力端末100から音声認識サーバ300に送信される例を説明した。しかし、認証に利用される音声と宛先認識に利用される音声とは、異なるタイミングで音声入出力端末100から音声認識サーバ300に送信されてもよい。ただし、利用者によって入力される認証に利用される音声は、少なくとも接続用の語句を含んでいるのが望ましい。これによって、通話開始のために利用者から発せられた音声が認証にも利用され得るため、利用者による入力の手間が低減され得る。 Also, in the above description, an example has been described in which the voice used for authentication and the voice used for destination recognition are transmitted from the voice input/output terminal 100 to the voice recognition server 300 as one combined voice. However, the voice used for authentication and the voice used for destination recognition may be transmitted from the voice input/output terminal 100 to the voice recognition server 300 at different timings. However, it is desirable that the voice input by the user and used for authentication include at least a phrase for connection. As a result, since the voice uttered by the user for starting a call can be used for authentication, the user's input effort can be reduced.

また、上記では、サーバにおける各種処理が、音声認識サーバ300およびシグナリングサーバ400に分散されて実行される例を主に説明した。しかし、サーバにおける各種処理は、必ずしも上記の通りに分散されて実行されなくてもよい。例えば、上記において音声認識サーバ300によって実行されるとした処理の一部が、音声認識サーバ300とは異なるサーバによって実行されてもよい。あるいは、上記において音声認識サーバ300によって実行されるとした処理の一部が、端末側(例えば、音声入出力端末100など)によって実行されてもよい。 Also, in the above description, an example in which various processes in the server are distributed to the speech recognition server 300 and the signaling server 400 and executed has been mainly described. However, various processes in the server do not necessarily have to be distributed and executed as described above. For example, part of the processing performed by the speech recognition server 300 in the above description may be performed by a server other than the speech recognition server 300 . Alternatively, part of the processing performed by the voice recognition server 300 in the above description may be performed by the terminal side (for example, the voice input/output terminal 100, etc.).

10 通信システム
100 音声入出力端末
101 マイク
102 スピーカ
103 音声データ変換部
104 利用者・宛先探索部
105 通信部
106 通話部
200 スマートフォン
201 音声認証部
202 アドレス帳
300 音声認識サーバ
400 シグナリングサーバ
500 通信機器
600 アクセスポイント
700 ネットワーク
10 communication system 100 voice input/output terminal 101 microphone 102 speaker 103 voice data conversion unit 104 user/destination search unit 105 communication unit 106 call unit 200 smartphone 201 voice authentication unit 202 address book 300 voice recognition server 400 signaling server 500 communication device 600 Access point 700 network

Claims (12)

少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
を備え
前記個人認証用データは、前記利用者によって登録された音声データを含む、
情報処理装置。
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
with
The personal authentication data includes voice data registered by the user,
Information processing equipment.
少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
を備え
前記第1の入力は、前記利用者から入力された通話開始のための音声を含む、
情報処理装置。
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
with
The first input includes voice input from the user for starting a call,
Information processing equipment.
少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
前記個人認証用データと前記入力データとの認証が成功した場合、かつ、前記利用者からの第2の入力に基づいて宛先に関する情報が認識された場合、前記個人端末から前記宛先に関する情報に関連付けられた、宛先機器を識別するための宛先識別情報を取得する通信制御部と、
を備える、情報処理装置。
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
When the authentication of the personal authentication data and the input data is successful, and when the destination information is recognized based on the second input from the user, the personal terminal is associated with the destination information. a communication control unit that acquires destination identification information for identifying the destination device;
An information processing device.
前記情報処理装置は、
宛先機器に対して前記利用者識別情報が送信されるように制御する通信制御部を備える、
請求項1または2に記載の情報処理装置。
The information processing device is
A communication control unit that controls so that the user identification information is transmitted to the destination device;
The information processing apparatus according to claim 1 or 2 .
前記情報処理装置は、
前記情報処理装置と宛先機器とが接続された場合に、前記個人端末に前記情報処理装置の操作インタフェースが提供されるように制御する通信制御部を備える、
請求項1または2に記載の情報処理装置。
The information processing device is
a communication control unit that controls such that an operation interface of the information processing device is provided to the personal terminal when the information processing device and the destination device are connected;
The information processing apparatus according to claim 1 or 2 .
前記情報処理装置は、
前記情報処理装置と宛先機器とが接続された場合に、前記個人端末によって宛先に関する情報が提示されるように制御する通信制御部を備える、
請求項1または2に記載の情報処理装置。
The information processing device is
a communication control unit configured to control so that information about a destination is presented by the personal terminal when the information processing device and the destination device are connected;
The information processing apparatus according to claim 1 or 2 .
少なくとも利用者の通話に利用される情報処理装置による情報処理方法であって、
前記利用者からの第1の入力に基づく入力データを取得することと、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定することと、
を含み、
前記個人認証用データは、前記利用者によって登録された音声データを含む、
情報処理方法。
An information processing method by an information processing device used at least for a user's call,
obtaining input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. Identifying as identifying information;
including
The personal authentication data includes voice data registered by the user,
Information processing methods.
少なくとも利用者の通話に利用される情報処理装置による情報処理方法であって、
前記利用者からの第1の入力に基づく入力データを取得することと、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定することと、
を含み、
前記第1の入力は、前記利用者から入力された通話開始のための音声を含む、
情報処理方法。
An information processing method by an information processing device used at least for a user's call,
obtaining input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. Identifying as identifying information;
including
The first input includes voice input from the user for starting a call,
Information processing methods.
少なくとも利用者の通話に利用される情報処理装置による情報処理方法であって、
前記利用者からの第1の入力に基づく入力データを取得することと、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定することと、
前記個人認証用データと前記入力データとの認証が成功した場合、かつ、前記利用者からの第2の入力に基づいて宛先に関する情報が認識された場合、前記個人端末から前記宛先に関する情報に関連付けられた、宛先機器を識別するための宛先識別情報を取得することと、
を含む情報処理方法。
An information processing method by an information processing device used at least for a user's call,
obtaining input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. Identifying as identifying information;
When the authentication of the personal authentication data and the input data is successful, and when the destination information is recognized based on the second input from the user, the personal terminal is associated with the destination information. obtaining destination identification information for identifying the destination device;
A method of processing information, comprising:
コンピュータを、
少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
を備え
前記個人認証用データは、前記利用者によって登録された音声データを含む、
情報処理装置として機能させるためのプログラム。
the computer,
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
with
The personal authentication data includes voice data registered by the user,
A program for functioning as an information processing device.
コンピュータを、
少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
を備え
前記第1の入力は、前記利用者から入力された通話開始のための音声を含む、
情報処理装置として機能させるためのプログラム。
the computer,
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
with
The first input includes voice input from the user for starting a call,
A program for functioning as an information processing device.
コンピュータを、
少なくとも利用者の通話に利用される情報処理装置であって、
前記利用者からの第1の入力に基づく入力データを取得する取得部と、
前記情報処理装置との間で無線接続された個人端末に登録された個人認証用データと前記入力データとの認証が成功した場合に、前記個人認証用データに関連付けられた個人識別情報を利用者識別情報として特定する特定部と、
前記個人認証用データと前記入力データとの認証が成功した場合、かつ、前記利用者からの第2の入力に基づいて宛先に関する情報が認識された場合、前記個人端末から前記宛先に関する情報に関連付けられた、宛先機器を識別するための宛先識別情報を取得する通信制御部と、
を備える情報処理装置として機能させるためのプログラム。
the computer,
An information processing device that is used at least for a user's call,
an acquisition unit that acquires input data based on a first input from the user;
When personal authentication data registered in a personal terminal wirelessly connected to the information processing apparatus and the input data are authenticated successfully, the user can obtain the personal identification information associated with the personal authentication data. a specifying part for specifying as identification information;
When the authentication of the personal authentication data and the input data is successful, and when the destination information is recognized based on the second input from the user, the personal terminal is associated with the destination information. a communication control unit that acquires destination identification information for identifying the destination device;
A program for functioning as an information processing device comprising
JP2018181855A 2018-09-27 2018-09-27 Information processing device, information processing method and program Active JP7139839B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018181855A JP7139839B2 (en) 2018-09-27 2018-09-27 Information processing device, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018181855A JP7139839B2 (en) 2018-09-27 2018-09-27 Information processing device, information processing method and program

Publications (2)

Publication Number Publication Date
JP2020053859A JP2020053859A (en) 2020-04-02
JP7139839B2 true JP7139839B2 (en) 2022-09-21

Family

ID=69994135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018181855A Active JP7139839B2 (en) 2018-09-27 2018-09-27 Information processing device, information processing method and program

Country Status (1)

Country Link
JP (1) JP7139839B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244773A (en) 2002-02-21 2003-08-29 Denso Corp Phone system
JP2010249580A (en) 2009-04-13 2010-11-04 Clarion Co Ltd Navigation device
WO2013088560A1 (en) 2011-12-15 2013-06-20 トヨタ自動車株式会社 Portable terminal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244773A (en) 2002-02-21 2003-08-29 Denso Corp Phone system
JP2010249580A (en) 2009-04-13 2010-11-04 Clarion Co Ltd Navigation device
WO2013088560A1 (en) 2011-12-15 2013-06-20 トヨタ自動車株式会社 Portable terminal

Also Published As

Publication number Publication date
JP2020053859A (en) 2020-04-02

Similar Documents

Publication Publication Date Title
US8649776B2 (en) Systems and methods to provide personal information assistance
JP6110503B2 (en) TV call equipment
WO2015066949A1 (en) Human-machine interaction system, method and device thereof
US20210209210A1 (en) Methods and Systems for Fingerprint Sensor Triggered Voice Interaction in an Electronic Device
KR101170612B1 (en) Method and system for providing speech recognition by using user images
JP6432177B2 (en) Interactive communication system, terminal device and program
CN108763475B (en) Recording method, recording device and terminal equipment
JP4469867B2 (en) Apparatus, method and program for managing communication status
CN110188364B (en) Translation method, device and computer readable storage medium based on intelligent glasses
US20200162617A1 (en) Communication system, non-transitory computer-readable medium, and terminal apparatus
KR100484245B1 (en) Apparatus for automatic seaching and managementing a image phone book of mobile phone and method there of
JP7139839B2 (en) Information processing device, information processing method and program
JP2011205238A (en) Communication terminal and information retrieval method
US20160133243A1 (en) Musical performance system, musical performance method and musical performance program
JP7347043B2 (en) Information processing device, information processing method and program
JP2019135609A (en) Character input support system, character input support control device, and character input support program
KR101264797B1 (en) Method for searching photo by facial recognition in mobile terminal
JP2006222856A (en) Voice communication system
JP7484138B2 (en) Search terminal device, search system, and search method
WO2024093471A1 (en) Prompting method for information, and electronic device and readable medium
CN115514843B (en) Alarm method and device, equipment and storage medium
JP7508787B2 (en) Information processing device, information processing method, information processing program, instruction execution server, instruction execution method, instruction execution program, data server, data processing method, and data processing program
JP2022015268A (en) Communication terminal device, control device, communication control method, and control program
KR20110103232A (en) Image display method and apparatus thereof
KR100844494B1 (en) Method and apparatus for data management of particular person in mobile communication terminal

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220822

R150 Certificate of patent or registration of utility model

Ref document number: 7139839

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150