JP7438447B1 - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP7438447B1
JP7438447B1 JP2023205426A JP2023205426A JP7438447B1 JP 7438447 B1 JP7438447 B1 JP 7438447B1 JP 2023205426 A JP2023205426 A JP 2023205426A JP 2023205426 A JP2023205426 A JP 2023205426A JP 7438447 B1 JP7438447 B1 JP 7438447B1
Authority
JP
Japan
Prior art keywords
voice
dialect
response
information processing
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023205426A
Other languages
Japanese (ja)
Other versions
JP2024054865A (en
Inventor
巧 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone East Corp
Priority to JP2023205426A priority Critical patent/JP7438447B1/en
Application granted granted Critical
Publication of JP7438447B1 publication Critical patent/JP7438447B1/en
Publication of JP2024054865A publication Critical patent/JP2024054865A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供する。【解決手段】情報処理装置10は、電話番号と配信情報を受け付ける受付部101と、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部103と、前記音声応答を記憶する記憶部102と、前記音声応答に基づく応答結果を出力する出力部104と、を備える。【選択図】図1An object of the present invention is to provide a technology that enables automatic and bidirectional communication of information in a conventional auto call. [Solution] An information processing device 10 includes a reception unit 101 that receives a telephone number and distribution information, and a reception unit 101 that automatically calls telephone terminals of each telephone number to simultaneously distribute the distribution information by voice, and from which the telephone terminals that respond receive the voice. The transmitting unit 103 includes a transmitting unit 103 that receives a voice response to the distribution information, a storage unit 102 that stores the voice response, and an output unit 104 that outputs a response result based on the voice response. [Selection diagram] Figure 1

Description

特許法第30条第2項適用 1.鈴木巧が、 ウェブサイトの掲載日 令和4年6月30日ウェブサイトアドレスhttps://qiita.com/TA-933/items//b9cc7f924fcb5914c89fで公開されているQiita株式会社のウェブサイトにて、鈴木巧が発明した音声の一斉配信方法を、「Amazon Connectで音声をふきこみ、ふきこんだ音声で一斉発信してみた」のタイトルで、公開した。 2.日本放送協会が、令和4年7月20日に放送したおはよう日本という番組にて、鈴木巧が発明した災害時の高齢者支援方法について公開した。 3.鈴木巧は、開催日令和4年9月14日-令和4年9月30日デジタル社会実現ツアー2022 地域が創る「デジタル田園都市」のベストプラクティスにて、鈴木巧が発明したシン・オートコールを公開した。Application of Article 30, Paragraph 2 of the Patent Act 1. Takumi Suzuki, Website publication date: June 30, 2020 Website address: https://qiita. com/TA-933/items//b9cc7f924fcb5914c89f On the website of Qiita Co., Ltd., which is published at It was released under the title ``I tried to send it all at once.'' 2. On the program Good Morning Japan, which was broadcast on July 20, 2020, the Japan Broadcasting Corporation revealed the method invented by Takumi Suzuki to support the elderly during disasters. 3. Takumi Suzuki will introduce the Thin Auto system invented by Takumi Suzuki at the Digital Society Realization Tour 2022 Best Practices for a “Digital Garden City” Created by the Region, which will be held from September 14, 2020 to September 30, 2020. The call was made public.

本発明は、情報処理装置、情報処理方法、及び、情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

従来、電話連絡は個別に行われていた。例えば、地域コミュニティにおける防災、防犯、みまもり等の連絡手段として電話は重要な位置を占めており、防災訓練において参加者は自ら電話をかけて安否情報を連絡していた(非特許文献1参照)。 Traditionally, telephone calls were made individually. For example, telephones play an important role as a means of communication for disaster prevention, crime prevention, protection, etc. in local communities, and during disaster prevention drills, participants call themselves to report their safety information (see Non-Patent Document 1). .

人が電話をかける場合はその行為に人手がかかるので、自動で電話をかける仕組みとしてオートコールというシステムが存在する。例えば、ユーザへの案内等を行うための、自動音声によるメッセージサービスと、SMS(Short Message Service)等の電話番号を宛先とするメッセージサービスと、を組み合わせたシステムであって、通話終了後に、呼出し時間、通話時間、切断理由(通話切断、無応答等)といった自動メッセージ実行結果のデータが記録されるシステムが、従来、知られていた(特許文献1参照)。 When a person makes a phone call, it requires human effort, so there is a system called autocall that automatically makes calls. For example, a system that combines an automated voice message service to provide guidance to the user, and a message service such as SMS (Short Message Service) that sends a phone number as the destination. BACKGROUND ART Conventionally, a system has been known in which data of automatic message execution results such as time, call duration, and disconnection reason (call disconnection, no response, etc.) are recorded (see Patent Document 1).

特開2020-88491号公報JP2020-88491A

“川崎市総合防災訓練・防災フェアで171認知啓発活動を実施”、公益財団法人日本公衆電話会、[online]、[令和4年9月8日検索]、<URL: https://www.pcom.or.jp/topics/ntt/kana2022-23.html>“171 Awareness Awareness Activities Conducted at Kawasaki City Comprehensive Disaster Prevention Drill and Disaster Prevention Fair”, Japan Public Telephone Association, [online], [Retrieved September 8, 2020], <URL: https://www .pcom.or.jp/topics/ntt/kana2022-23.html>

しかしながら、従来のオートコールは、自動で電話をかけるインターフェースがウェブブラウザ等であり、ウェブブラウザの画面操作等に習熟を要するため、オートコールの使用者は自治体等職員に限定されていた。また、電話を受ける側は、ダイヤル操作が中心であるため、スマートフォン等の機器操作や画面操作等が苦手な人(高齢者等)や指先等が不自由な人には不便であった。 However, in the conventional autocall system, the interface for making automatic calls is a web browser, etc., and because it requires skill to operate the web browser screen, the users of the autocall system are limited to local government employees. In addition, since the person receiving the call must mainly operate a dial, it is inconvenient for people (such as the elderly) who are not good at operating devices such as smartphones or screen operations, or for people with limited fingertips.

本発明は、上記に鑑みてなされたものであり、従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供することを目的とする。 The present invention has been made in view of the above, and an object of the present invention is to provide a technology that enables automatic and bidirectional communication of information in a conventional auto call.

本発明の一態様の情報処理装置は、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する発信部と、前記方言の音声応答を記憶する前記記憶部と、前記方言の音声応答に基づく応答結果を出力する出力部と、を備え、前記発信部は、前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換する。
本発明の一態様の情報処理装置は、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する発信部と、前記音声応答を記憶する前記記憶部と、前記音声応答に基づく応答結果を出力する出力部と、前記音声応答を管理する管理部と、を備え、前記発信部は、前記音声応答をテキストデータに変換し、前記音声応答のテキストデータを変更可能に前記記憶部に記憶させ、前記管理部は、前記テキストデータを、再生された前記音声応答の内容に一致するように入力されたテキストデータに変更する。
本発明の一態様の情報処理装置は、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する発信部と、前記方言の音声応答を記憶する前記記憶部と、前記方言の音声応答に基づく応答結果を出力する出力部と、前記方言の音声応答を管理する管理部と、を備え、前記発信部は、前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換し、前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、前記管理部は、前記テキストデータを、再生された前記方言の音声応答の内容に一致するように前記発信命令の発信者により入力されたテキストデータに変更する。
The information processing device according to one aspect of the present invention automatically makes a call to a destination telephone terminal of a telephone number stored in advance in a storage unit based on a voice call command, and delivers the voice message stored in advance in the storage unit. a transmitting unit that simultaneously distributes information in voice and receives a voice response in a dialect to the distributed information from a responding destination telephone terminal; a storage unit that stores the voice response in the dialect; and a voice response based on the voice response in the dialect. an output unit that outputs a response result, and the transmission unit converts the voice response in the dialect into a fixed response of a type that matches the content of the voice response in the dialect.
The information processing device according to one aspect of the present invention automatically makes a call to a destination telephone terminal of a telephone number stored in advance in a storage unit based on a voice call command, and delivers the voice message stored in advance in the storage unit. a transmitting unit that simultaneously distributes information in voice and receives a voice response to the distributed information from a responding destination telephone terminal; the storage unit that stores the voice response; and an output that outputs a response result based on the voice response. and a management unit that manages the voice response, the transmission unit converts the voice response into text data, stores the text data of the voice response in the storage unit in a changeable manner, and the transmission unit The unit changes the text data to the input text data to match the content of the reproduced voice response.
The information processing device according to one aspect of the present invention automatically makes a call to a destination telephone terminal of a telephone number stored in advance in a storage unit based on a voice call command, and delivers the voice message stored in advance in the storage unit. a transmitting unit that simultaneously distributes information in voice and receives a voice response in a dialect to the distributed information from a responding destination telephone terminal; a storage unit that stores the voice response in the dialect; and a voice response based on the voice response in the dialect. an output unit that outputs a response result; and a management unit that manages voice responses in the dialect; converting the voice response in the dialect into text data, storing the text data of the voice response in the dialect in the storage unit in a changeable manner, and the management unit converts the text data into text data in the reproduced dialect. The text data input by the originator of the transmission command is changed to match the content of the voice response.

本発明の一態様の情報処理方法は、情報処理装置で行う情報処理方法において、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する第1のステップと、前記方言の音声応答を前記記憶部に記憶する第2のステップと、前記方言の音声応答に基づく応答結果を出力する第3のステップと、を行い、前記第1のステップでは、前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換する。
本発明の一態様の情報処理方法は、情報処理装置で行う情報処理方法において、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する第1のステップと、前記音声応答を前記記憶部に記憶する第2のステップと、前記音声応答に基づく応答結果を出力する第3のステップと、前記音声応答を管理する第4のステップと、を行い、前記第1のステップでは、前記音声応答をテキストデータに変換し、前記音声応答のテキストデータを変更可能に前記記憶部に記憶させ、前記第4のステップでは、前記テキストデータを、再生された前記音声応答の内容に一致するように入力されたテキストデータに変更する。
本発明の一態様の情報処理方法は、情報処理装置で行う情報処理方法において、音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する第1のステップと、前記方言の音声応答を前記記憶部に記憶する第2のステップと、前記方言の音声応答に基づく応答結果を出力する第3のステップと、前記方言の音声応答を管理する第4のステップと、を行い、前記第1のステップでは、前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換するとともに、前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、前記第4のステップでは、前記テキストデータを、再生された前記方言の音声応答の内容に一致するように前記発信命令の発信者により入力されたテキストデータに変更する。
An information processing method according to one aspect of the present invention is an information processing method performed by an information processing apparatus, in which a call is automatically made to a destination telephone terminal having a telephone number stored in advance in a storage unit based on a voice call command. a first step of distributing voice distribution information stored in advance in the unit in voice, and receiving a voice response in a dialect to the distribution information from a responding destination telephone terminal; and a step of storing the voice response in the dialect. and a third step of outputting a response result based on the voice response of the dialect, and in the first step, the voice response of the dialect is stored in the voice response of the dialect. Convert to a canned response that matches the content.
An information processing method according to one aspect of the present invention is an information processing method performed by an information processing apparatus, in which a call is automatically made to a destination telephone terminal having a telephone number stored in advance in a storage unit based on a voice call command. A first step of distributing the voice distribution information stored in advance in the unit in voice all at once, receiving a voice response to the distribution information from the responding destination telephone terminal, and storing the voice response in the storage unit. a second step, a third step of outputting a response result based on the voice response, and a fourth step of managing the voice response, and in the first step, the voice response is converted into text data. and storing the text data of the voice response in a changeable manner in the storage unit, and in the fourth step, the text data is converted into the input text so as to match the content of the reproduced voice response. Change to data.
An information processing method according to one aspect of the present invention is an information processing method performed by an information processing apparatus, in which a call is automatically made to a destination telephone terminal having a telephone number stored in advance in a storage unit based on a voice call command. a first step of distributing voice distribution information stored in advance in the unit in voice, and receiving a voice response in a dialect to the distribution information from a responding destination telephone terminal; and a step of storing the voice response in the dialect. a second step of storing the response result in the dialect, a third step of outputting a response result based on the voice response of the dialect, and a fourth step of managing the voice response of the dialect; Then, the voice response in the dialect is converted into a fixed response of a type that matches the content of the voice response in the dialect, and the voice response in the dialect is converted into text data, so that the text data of the voice response in the dialect can be changed. in the storage unit, and in the fourth step, the text data is changed to the text data input by the caller of the call command so as to match the content of the reproduced voice response in the dialect. .

本発明の一態様の情報処理プログラムは、上記情報処理装置としてコンピュータを機能させる。 An information processing program according to one embodiment of the present invention causes a computer to function as the above information processing apparatus.

本発明によれば、従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供できる。 According to the present invention, it is possible to provide a technology that allows automatic and bidirectional communication of information in a conventional auto call.

図1は、シン・オートコールシステムの構成を示す図である。FIG. 1 is a diagram showing the configuration of a thin auto call system. 図2は、シン・オートコールシステムの全体処理の流れの例を示すシーケンス図である。FIG. 2 is a sequence diagram showing an example of the overall processing flow of the thin auto call system. 図3は、情報処理装置の実装例を示す図である。FIG. 3 is a diagram showing an example of implementation of the information processing device. 図4は、定型発話により応答できる仕組みを説明するための参照図である。FIG. 4 is a reference diagram for explaining a mechanism that allows responses using standard utterances. 図5は、自由発話により応答できる仕組みを説明するための参照図である。FIG. 5 is a reference diagram for explaining a mechanism that allows responses by free speech. 図6は、肉声を一斉配信できる仕組みを説明するための参照図である。FIG. 6 is a reference diagram for explaining a mechanism by which real voices can be distributed all at once. 図7は、電話で一斉発信/結果確認できる仕組みを説明するための参照図である。FIG. 7 is a reference diagram for explaining a mechanism for simultaneously calling and checking results by telephone. 図8は、管理画面の例を示す図である。FIG. 8 is a diagram showing an example of a management screen. 図9は、架電状況タブの画面例を示す図である。FIG. 9 is a diagram showing a screen example of the call status tab. 図10は、情報処理装置のハードウェア構成例を示す図である。FIG. 10 is a diagram illustrating an example of the hardware configuration of the information processing device.

以下、本発明を実施する一実施形態について図面を用いて説明する。 DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

[発明の概要]
上記課題欄で説明した通り、従来のオートコールは、ウェブブラウザ等のインターフェースを介していたため、ダイヤル操作を行う人には不向きであった。
[Summary of the invention]
As explained in the issue section above, conventional autocalls were made via an interface such as a web browser, which was unsuitable for people who dial.

そこで、本発明は、ウェブブラウザ等のインターフェースを介するオートコールにおいて、発信者、受信者ともに、ウェブブラウザ等のインターフェースを介さずとも、電話で情報の受発信を行う技術を開示する。 Therefore, the present invention discloses a technology in which both the caller and the receiver can receive and send information over the telephone without using an interface such as a web browser in an auto call via an interface such as a web browser.

すなわち、本発明は、(1)電話=“声”を使った連絡手段を「ユニバーサルなインターフェース」として位置付け、声にこだわり機能実装を行う。また、(2)自動で電話をかけることにのみ力点を置かず、人手で行う部分と自動化する部分を整理した機能実装を行う。また、(3)電話をかける、結果を確認する手段として、従来のウェブブラウザに加え、電話=“声”により確認可能な仕組みを実装する。 That is, the present invention positions (1) a means of communication using telephone = "voice" as a "universal interface" and implements functions with particular attention to voice. In addition, (2) we will implement functions that organize the parts that need to be done manually and the parts that will be automated, rather than focusing only on making automatic phone calls. In addition, (3) as a means of making a call and confirming the result, in addition to the conventional web browser, we will implement a mechanism that allows confirmation by telephone = "voice".

また、上記課題欄で説明した課題以外に、従来のオートコールは、電話に出たか否かに関するログを取得するに留まり、電話を受けた人が能動的に切断したことや最後まで聞いたこと等を判別できない、という課題もあった。 In addition to the issues explained in the issue column above, conventional autocall only collects logs regarding whether or not the call was answered, and only logs indicating whether the person who received the call actively disconnected or listened to the end of the call. There was also the problem that it was not possible to distinguish between

そこで、本発明は、(4)ダイヤル操作に加え、「はい」、「いいえ」等の定型発話、「私は無事です」等の自由発話で応答できる仕組みを実装する。また、(5)電話応答した際の挙動(応答、切断、n問目の質問まで回答等)を詳細に取得する仕組みを実装する。 Therefore, the present invention implements (4) a mechanism that can respond with fixed utterances such as "yes" and "no" and free utterances such as "I'm safe" in addition to the dial operation. Also, (5) implement a mechanism to obtain detailed behavior when answering the phone (response, disconnection, answers up to the nth question, etc.).

上記のコンセプトに則り、本発明では、“令和の自動電話”として、新たなオートコールとして、「シン・オートコール」を開示する。具体的には、シン・オートコールシステムにおいて、音声一斉配信、並びに、音声による応答及びその応答のテキスト化を行う技術を開示する。 Based on the above concept, the present invention discloses "Shin Autocall" as a new autocall as a "Reiwa automatic telephone". Specifically, the present invention discloses a technology for simultaneously distributing voice, responding by voice, and converting the response into text in a thin auto call system.

一例として、防災対策と訓練、特殊詐欺対策と訓練等において、電話による音声でのコミュニケーションにより避難等の情報通知や安否確認等の登録を行い、レポートにより登録情報の確認を行う。 As an example, in disaster prevention measures and training, special fraud measures and training, etc., information notifications such as evacuation, safety confirmation, etc. are registered by voice communication by telephone, and registered information is confirmed by reports.

応答する側もダイヤル操作に限らず、声(「はい」、「いいえ」等の定型発話、自由発話等)で応答を登録し、その音声応答の結果を可視聴化することで、声にフォーカスしてデジタル化を実現する。 Responders can also register their responses not only by dialing, but also by voice (standard utterances such as "yes", "no", free speech, etc.), and by visualizing the results of the voice responses, the focus is on the voice. and realize digitalization.

また、音声に限らず、SMS、電子メール、チャット、SNS(Social Networking Service)等によるテキストでのコミュニケーションを音声と組み合わせて行い、テキストで応答を登録し、そのテキスト応答の結果を可視化する。 In addition to voice communication, text communication such as SMS, e-mail, chat, SNS (Social Networking Service), etc. is performed in combination with voice, a response is registered in text, and the result of the text response is visualized.

なお、シン・オートコールのシンは、「新時代の」「親しみやすい」「真の課題解決をめざし」「お客さまと共に(シンクロし)」「信念をもって内製する取り組み」を意味する。シン・オートコールは、従来と同様に単に「オートコール」と表現してもよい。 The word "Shin" in Shin Autocall stands for "new-age," "friendly," "aiming to solve real problems," "synchronizing with customers," and "in-house manufacturing with conviction." Shin autocall may be simply expressed as "autocall" as in the past.

[シン・オートコールシステムの構成]
図1は、本実施形態に係るシン・オートコールシステム1の構成を示す図である。シン・オートコールシステム1は、情報処理装置10と、端末装置20と、複数の電話端末30と、を備える。
[Syn auto call system configuration]
FIG. 1 is a diagram showing the configuration of a thin auto call system 1 according to the present embodiment. The thin auto call system 1 includes an information processing device 10, a terminal device 20, and a plurality of telephone terminals 30.

端末装置20とは、汎用パソコンであるが、電話機能を備えた黒電話と呼ばれる固定電話機、携帯電話機、スマートフォン等を含む。電話端末30とは、固定電話機31、スマートフォン32等である。以降、シン・オートコールシステム1を防災訓練に適用した場合を例に説明する。 The terminal device 20 is a general-purpose personal computer, and includes a landline telephone equipped with a telephone function called a black telephone, a mobile telephone, a smartphone, and the like. The telephone terminal 30 is a fixed telephone 31, a smartphone 32, etc. Hereinafter, a case where the Shin Auto Call System 1 is applied to disaster prevention training will be explained as an example.

[情報処理装置の機能]
情報処理装置10は、従来のオートコール装置を改良したシン・オートコール装置であり、例えばクラウド上のサーバ装置である。情報処理装置10は、図1に示したように、受付部101と、記憶部102と、発信部103と、出力部104と、を備える。
[Function of information processing device]
The information processing device 10 is a thin autocall device that is an improved version of a conventional autocall device, and is, for example, a server device on a cloud. As shown in FIG. 1, the information processing device 10 includes a reception section 101, a storage section 102, a transmission section 103, and an output section 104.

受付部101は、宛先の電話番号を受け付ける宛先番号受付機能と、宛先への配信情報を受け付ける配信情報受付機能と、を備える。例えば、受付部101は、端末装置20から、訓練参加者が備える固定電話機31やスマートフォン32の電話番号を受け付け、訓練で配信する配信内容を示したテキストデータや音声データを受け付ける。 The reception unit 101 includes a destination number reception function that accepts a destination telephone number, and a distribution information reception function that accepts distribution information to the destination. For example, the receiving unit 101 receives the telephone numbers of the fixed telephones 31 and smartphones 32 of the training participants from the terminal device 20, and receives text data and audio data indicating the contents to be distributed in the training.

記憶部102は、受付部101が受け付けた宛先電話番号と配信情報を記憶する機能を備える。また、記憶部102は、発信部103が電話端末から受信した配信情報に対する応答を記憶する機能を備える。例えば、記憶部102は、固定電話機31から受信した音声データに対する音声応答を記憶し、スマートフォン32から受信した音声データに対する音声応答やテキストデータに対するテキスト応答を記憶する。 The storage unit 102 has a function of storing the destination telephone number and distribution information received by the reception unit 101. Furthermore, the storage unit 102 has a function of storing a response to the distribution information that the transmission unit 103 receives from the telephone terminal. For example, the storage unit 102 stores voice responses to voice data received from the fixed telephone 31, and stores voice responses to voice data and text responses to text data received from the smartphone 32.

発信部103は、電話端末30に対して自動発信する自動発信機能と、複数の電話端末30に対して配信情報を音声(例えば、模擬音声、肉声音声)やテキストで一斉配信する一斉配信機能と、音声の配信情報に対する音声応答を音声認識する音声認識機能と、音声応答をテキストに変換する音声変換機能と、を備える。 The transmitting unit 103 has an automatic dialing function that automatically dials a call to the telephone terminal 30, and a simultaneous distribution function that simultaneously distributes distribution information to a plurality of telephone terminals 30 in the form of voice (for example, simulated voice, real voice voice) or text. , a voice recognition function that recognizes a voice response to voice distribution information, and a voice conversion function that converts the voice response into text.

具体的には、発信部103は、複数の固定電話機31や複数のスマートフォン32に自動発信して配信情報を音声で一斉配信し、応答した固定電話機31又はスマートフォン32から音声の配信情報に対する音声応答を受信して記憶部102に登録する。 Specifically, the transmitting unit 103 automatically calls a plurality of landline telephones 31 and a plurality of smartphones 32 to simultaneously distribute distribution information by voice, and receives a voice response to the voice distribution information from the responding landline telephones 31 or smartphones 32. is received and registered in the storage unit 102.

また、具体的には、発信部103は、複数のスマートフォン32に自動発信して配信情報をテキスト(文字)で一斉配信し、応答したスマートフォン32からテキストの配信情報に対するテキスト応答(文字応答)を受信して記憶部102に登録する。 Specifically, the transmitting unit 103 automatically calls a plurality of smartphones 32 to simultaneously distribute distribution information in text (characters), and receives a text response (character response) from the responding smartphones 32 to the text distribution information. It is received and registered in the storage unit 102.

出力部104は、発信部103が電話端末30から受信した応答に基づく応答結果を出力する機能を備える。例えば、出力部104は、固定電話機31やスマートフォン32からの音声応答を端末装置20で再生したり、その音声応答をテキストに変換したテキスト応答に基づく応答結果を端末装置20のモニタ(表示装置)に出力したりする。また、出力部104は、スマートフォン32からのテキスト応答に基づく応答結果を端末装置20のモニタに表示する。 The output unit 104 has a function of outputting a response result based on the response received by the transmitting unit 103 from the telephone terminal 30. For example, the output unit 104 plays back a voice response from the landline telephone 31 or the smartphone 32 on the terminal device 20, or displays a response result based on a text response obtained by converting the voice response into text on the monitor (display device) of the terminal device 20. or output to . Further, the output unit 104 displays a response result based on the text response from the smartphone 32 on the monitor of the terminal device 20.

なお、出力部104は、電話端末30から受信した応答をそのまま応答結果として出力してもよいし、その応答を加工処理したものを応答結果として出力してもよい。例えば、出力部104は、応答内容が「はい」や「いいえ」である場合には、それぞれの総人数を算出して出力し、応答内容が自由発話や自由文章である場合には、その自由発話や自由文章をそのまま出力する。 Note that the output unit 104 may output the response received from the telephone terminal 30 as it is as the response result, or may process the response and output it as the response result. For example, if the response content is "yes" or "no", the output unit 104 calculates and outputs the total number of people for each, and if the response content is free speech or free text, the output unit 104 outputs the total number of people for each response. Outputs speech and free text as is.

[シン・オートコールシステムの全体動作]
次に、図2を参照してシン・オートコールシステム1の全体動作を説明する。図2は、シン・オートコールシステム1の全体処理の流れの例を示すシーケンス図である。この動作例は、市区村町の町単位で行うリモート型の防災訓練である。
[Overall operation of Shin Auto Call System]
Next, the overall operation of the thin auto call system 1 will be explained with reference to FIG. FIG. 2 is a sequence diagram showing an example of the overall processing flow of the thin auto call system 1. An example of this operation is a remote-type disaster prevention drill conducted on a city, ward, village, or town level.

ステップS1;
まず、訓練設定者は、端末装置20を用いて、訓練参加者の固定電話機31やスマートフォン32の電話番号を情報処理装置10に登録する。また、訓練設定者は、端末装置20を用いて、配信用のテキスト文や読み上げ文を作成して情報処理装置10に登録する。
Step S1;
First, the training setter uses the terminal device 20 to register the telephone number of the training participant's landline telephone 31 or smartphone 32 in the information processing device 10 . Further, the training setter uses the terminal device 20 to create a text sentence or a read-aloud sentence for distribution and registers it in the information processing device 10.

このとき、訓練設定者は、固定電話機31やスマートフォン32の電話番号に、訓練参加者の居住地域若しくは居所を関連付けて情報処理装置10に登録してもよい。その場合、情報処理装置10は、発信を行う訓練対象となる電話番号の選択を、居住地域若しくは居所に基づいて受け付けることができる。 At this time, the training setter may associate the telephone number of the fixed telephone 31 or the smartphone 32 with the training participant's residential area or place of residence and register it in the information processing device 10 . In that case, the information processing device 10 can accept the selection of a telephone number to be trained to make a call based on the region of residence or place of residence.

一例として、電話番号に「A町」「B町」等の住所を関連付けて登録し、情報処理装置10が「A町」を入力として受け付けたときに、住所が「A町」と関連付けられている電話番号を発信の対象として選択し登録してよい。 As an example, when a telephone number is registered in association with an address such as "Town A" or "Town B", and when the information processing device 10 receives "Town A" as input, the address is associated with "Town A", etc. You can select and register the phone number you want to call.

また、訓練設定者は、その読み上げ文を端末装置20のマイクに発声し、発声による肉声音声を情報処理装置10に録音してもよい。さらに、情報処理装置10は、録音された肉声音声の音声認識処理を行ってテキスト化し、テキスト化した肉声音声のテキストデータを情報処理装置10に登録してもよい。 Further, the training setter may speak the read-aloud sentence into the microphone of the terminal device 20 and record the real voice of the utterance in the information processing device 10. Further, the information processing device 10 may perform speech recognition processing on the recorded real voice to convert it into text, and register the text data of the converted real voice in the information processing device 10.

一例として、自治体等の職員の他、自治会の長、消防団等のコミュニティのリーダーが訓練設定者として、スマートフォン若しくは固定電話を端末装置20として用い、配信する肉声音声を情報処理装置10に録音してよい。この例では、訓練設定者のシステム操作の習熟度が低くても配信する音声を簡便に登録できる。 As an example, in addition to local government officials, community leaders such as the head of a neighborhood association and a fire brigade can act as training planners and use a smartphone or landline phone as the terminal device 20 to record real-world audio to be distributed on the information processing device 10. You may do so. In this example, even if the training setter has a low level of proficiency in operating the system, the audio to be distributed can be easily registered.

また、訓練設定者は、情報処理装置10に、電話番号、配信文、若しくは、配信音声を登録するのに先だって、ユーザ名若しくはパスワードによる認証処理を行ってもよい。当該認証処理は、訓練設定者の固定電話の電話番号若しくはスマートフォンの電話番号が、情報処理装置10に予め登録された電話番号と一致するかどうかを、情報処理装置10が判定することで行ってもよい。当該認証処理において、ユーザ名若しくはパスワードの不一致、又は、予め登録された電話番号との不一致により失敗した場合に、端末装置20と情報処理装置10との間の通信接続を中止してもよい。 Further, the training setter may perform authentication processing using a user name or password before registering a telephone number, a distributed message, or a distributed voice in the information processing device 10. The authentication process is performed by the information processing device 10 determining whether the training setter's landline phone number or smartphone phone number matches the phone number registered in the information processing device 10 in advance. Good too. If the authentication process fails due to a mismatch in the user name or password, or a mismatch with a pre-registered telephone number, the communication connection between the terminal device 20 and the information processing device 10 may be canceled.

ステップS2;
次に、情報処理装置10の受付部101は、端末装置20から送信された訓練参加者の固定電話機31やスマートフォン40の電話番号、配信用のテキスト文、読み上げ文、読み上げ文の肉声音声を訓練参加者の町IDに関連付けて記憶部102に記憶させる。
Step S2;
Next, the reception unit 101 of the information processing device 10 receives the telephone number of the fixed telephone 31 or smartphone 40 of the training participant sent from the terminal device 20, the text for distribution, the readout text, and the real voice of the readout text. It is stored in the storage unit 102 in association with the participant's town ID.

配信用のテキスト文等は、全ての町で共通していてもよいし、各町に固有の事情(例えば、避難所が町毎に異なる)があることを考慮して1つ又は複数の町毎に異なっていてもよい。 The text for distribution may be the same for all towns, or it may be written for one or more towns, taking into account that each town has unique circumstances (e.g., evacuation shelters vary from town to town). It may be different for each.

訓練参加者等の配信の対象者を複数の区分に分類することが望ましいことがある。情報処理装置10は、訓練参加者等の配信の対象者を認識する情報に、複数の分類の区分を示す識別情報に関連付けて記憶部102に記憶させてもよい。一例として、対象者を識別する情報は固定電話機31若しくはスマートフォン32の電話番号であり、分類の区分は、対象者の居住地域若しくは所在地域毎の警戒レベルである。 It may be desirable to classify distribution targets, such as training participants, into multiple categories. The information processing device 10 may cause the storage unit 102 to store information for recognizing a distribution target such as a training participant in association with identification information indicating a plurality of classifications. As an example, the information for identifying the target person is the telephone number of the fixed telephone 31 or the smartphone 32, and the classification is the vigilance level for each area of residence or location of the target person.

ステップS3;
次に、A町で訓練を開始する。
Step S3;
Next, training begins in A town.

訓練の開始は、例えば、端末装置20から情報処理装置10に訓練開始に対応する信号を送信することで行ってもよい。当該信号の送信は、端末装置20に表示された「発信」等の表示を備えたボタン型のインターフェース表示をクリックすることに対応して、端末装置20から情報処理装置10に送信することができる。 The training may be started, for example, by transmitting a signal corresponding to the start of training from the terminal device 20 to the information processing device 10. The signal can be transmitted from the terminal device 20 to the information processing device 10 in response to clicking a button-shaped interface display with a display such as “Call” displayed on the terminal device 20. .

また、訓練設定者の端末装置20(スマートフォン、固定電話等)と情報処理装置10との間の音声通話を介して、配信する肉声音声の情報処理装置10への録音に続けて、訓練設定者の音声を情報処理装置10で受信し、受信した音声を認識して訓練開始を示す「訓練開始」等の予め定めた言葉であると情報処理装置10が判定したときに訓練を開始することができる。 Further, following the recording of the real voice to be delivered to the information processing device 10 via a voice call between the training setter's terminal device 20 (smartphone, landline telephone, etc.) and the information processing device 10, the training setter The training may be started when the information processing device 10 receives the voice of the user and recognizes the received voice and determines that the received voice is a predetermined word such as “training start” indicating the start of training. can.

また、訓練設定者の端末装置20(スマートフォン、固定電話等)と情報処理装置10との間の音声通話を介して、配信する肉声音声の情報処理装置10への録音に続けて、情報処理装置10が「訓練を開始しますか」「発信しますか」等の音声を端末装置20に送信し、訓練設定者の応答を情報処理装置10が受信し、受信した音声を認識して「はい」その他の肯定を示す予め定めた言葉であると情報処理装置10が判定したときに訓練を開始することができる。 In addition, following the recording of the real voice to be delivered to the information processing device 10 via a voice call between the training setter's terminal device 20 (smartphone, landline telephone, etc.) and the information processing device 10, the information processing device 10 sends a voice such as "Do you want to start the training" or "Do you want to make a call" to the terminal device 20, the information processing device 10 receives the response from the person who set up the training, recognizes the received voice and says "Yes". ” When the information processing device 10 determines that the word is another predetermined word indicating affirmation, training can be started.

A町で訓練が開始されると、情報処理装置10の発信部103は、A町に対応する全ての電話番号を記憶部102から読み出し、読み出した電話番号の各固定電話機31や各スマートフォン32に対して自動発信を行う。 When the training starts in town A, the transmitting unit 103 of the information processing device 10 reads all phone numbers corresponding to town A from the storage unit 102, and sends messages to each landline phone 31 and each smartphone 32 of the read phone number. Make an automatic call to the person.

続いて、情報処理装置10の発信部103は、A町に対応する配信用の読み上げ文をAI(Artificial Intellignece)により読み上げ、そのAIによる模擬音声を自動発信先の固定電話機31やスマートフォン32に一斉配信する。 Next, the transmission unit 103 of the information processing device 10 uses AI (Artificial Intelligence) to read out the text for distribution corresponding to town A, and simultaneously sends the simulated voice generated by the AI to the landline telephones 31 and smartphones 32 that are automatically called destinations. To deliver.

例えば、情報処理装置10の発信部103は、「避難指示が出ています。避難できますか?」という模擬音声を一斉配信する。このとき、発信部103は、読み上げ文の模擬音声に代えて、読み上げ文の肉声音声を再生してもよい。また、発信部103は、模擬音声を再生するか、肉声音声を再生するかを、情報処理装置10に予め登録しておき選択してもよい。このような再生音声の種別登録は、通知先の電話番号毎に登録してもよい。これにより訓練者等の特性に応じた案内が可能となる。 For example, the transmitting unit 103 of the information processing device 10 simultaneously broadcasts a simulated voice saying, "Evacuation orders have been issued. Can you evacuate?" At this time, the transmitting unit 103 may reproduce the real voice of the read-aloud sentence instead of the simulated voice of the read-aloud sentence. Further, the transmitting unit 103 may register in advance in the information processing device 10 and select whether to reproduce the simulated voice or the real voice. Such type of playback audio may be registered for each telephone number of the notification destination. This makes it possible to provide guidance according to the characteristics of the trainee, etc.

ステップS4;
次に、各訓練参加者は、情報処理装置10からの模擬音声又は肉声音声に対し、固定電話機31やスマートフォン32のボタン操作ではなく、それぞれの固定電話機31の電話口で発話することで応答する。例えば、訓練参加者は、「はい」、「いいえ」、自由発話(「もう一度」、「私は〇〇に避難しています」等)といった音声により応答する。
Step S4;
Next, each training participant responds to the simulated voice or real voice from the information processing device 10 by speaking through the mouthpiece of the respective landline telephone 31, rather than by operating buttons on the landline telephone 31 or smartphone 32. . For example, the training participant responds by voice such as "yes", "no", or free speech ("again", "I am evacuating to ___", etc.).

ステップS5;
次に、情報処理装置10の発信部103は、各固定電話機31や各スマートフォン32から各訓練参加者の音声応答をそれぞれ受信して記憶部102に記憶させる。また、発信部103は、音声認識機能により各訓練参加者の音声応答をそれぞれ認識し、認識した音声応答を音声変換機能によりテキストに変換して記憶部102に記憶させる。
Step S5;
Next, the transmitting unit 103 of the information processing device 10 receives the voice responses of each training participant from each fixed telephone 31 and each smartphone 32, and stores them in the storage unit 102. Further, the transmitting unit 103 recognizes the voice responses of each training participant using the voice recognition function, converts the recognized voice responses into text using the voice conversion function, and stores the text in the storage unit 102.

発信部103は、受信した音声応答が予め登録された応答と一致していると判断したときに、応答結果に対応する識別コードその他の情報を記憶部102に記憶させてもよい。これにより、予め、肯定に対する「はい」「はいはい」「わかった」「できる」「んだ」その他の応答等を、予め登録しておくことができるので、方言を含めた自然な発話に対応することができる。 When the transmitting unit 103 determines that the received voice response matches a pre-registered response, the transmitting unit 103 may cause the storage unit 102 to store the identification code and other information corresponding to the response result. This allows you to pre-register responses such as "Yes", "Yes", "Okay", "I can", "Da", etc. to affirmations, so you can respond to natural speech, including dialects. be able to.

以上説明した電話による音声でのコミュニケーションにより、各訓練参加者の音声応答(テキストに変換した音声応答を含む)が情報処理装置10内に登録される。 Through the voice communication over the telephone described above, the voice responses (including voice responses converted into text) of each training participant are registered in the information processing device 10 .

ステップS6;
次に、情報処理装置10の発信部103は、ステップS3で読み出していた電話番号のスマートフォン32に対して自動発信を行う。続いて、発信部103は、A町に対応する配信用のテキスト文をSMSで自動発信先のスマートフォン32の訓練参加者に一斉配信する。例えば、発信部103は、「避難所はこちらです。http://***//***」というテキスト文を一斉配信する。
Step S6;
Next, the calling unit 103 of the information processing device 10 automatically makes a call to the smartphone 32 having the phone number read out in step S3. Subsequently, the transmitting unit 103 simultaneously distributes the text for distribution corresponding to Town A to the training participants using the smartphones 32 that are automatic destinations via SMS. For example, the transmission unit 103 simultaneously broadcasts a text sentence such as "Here is the evacuation center. http://***//***".

ここで、発信部103は、テキスト文の一斉配信の結果を受領し、スマートフォン40による受領が確認できない「未達」等の結果を判定し、受領が確認できない電話番号を抽出し、抽出した電話番号に対してステップS3~ステップS5の発信、応答の受領、登録を行ってもよい。 Here, the transmission unit 103 receives the results of the simultaneous text distribution, determines the result such as "undelivered" where the receipt by the smartphone 40 cannot be confirmed, extracts the telephone number for which the receipt cannot be confirmed, and It is also possible to make a call, receive a response, and register the number in steps S3 to S5.

ステップS7;
次に、各訓練参加者は、情報処理装置10からのSMSによるテキスト文に対し、それぞれのスマートフォン32のSMS用のテキスト文で応答する。例えば、訓練参加者は、「はい」、「いいえ」、自由文章(「指定先の避難所に避難しました」等)といったテキストにより応答する。
Step S7;
Next, each training participant responds to the SMS text from the information processing device 10 with an SMS text from their respective smartphones 32. For example, a training participant may respond with text such as "yes,""no," or free text (such as "I evacuated to a designated evacuation center").

ステップS8;
次に、情報処理装置10の発信部103は、各スマートフォン32から各訓練参加者のテキスト応答をそれぞれ受信して記憶部102に記憶させる。また、発信部103は、一斉配信していたテキスト文に対する開封通知の有無も記憶部102に記憶させる。
Step S8;
Next, the transmission unit 103 of the information processing device 10 receives the text responses of each training participant from each smartphone 32 and stores them in the storage unit 102. The sending unit 103 also causes the storage unit 102 to store whether or not there is an opening notification for the text that was distributed all at once.

ここで、発信部103は、スマートフォン32からの応答を受信していない電話番号を抽出し、抽出した電話番号に対してステップS3~ステップS5の発信、応答の受領、登録を行ってもよい。 Here, the transmitting unit 103 may extract a telephone number that has not received a response from the smartphone 32, and perform the transmission, response reception, and registration in steps S3 to S5 for the extracted telephone number.

以上説明したSMSによるテキストでのコミュニケーションにより、各訓練参加者のテキスト応答や開封通知の有無が情報処理装置10内に登録される。なお、ステップS6~ステップS8は、ステップS3~ステップS5よりも前又は同時に実行してもよい。また、ステップS3~ステップS8は、B町やC町等、他の町で訓練が開始される毎に繰り返し実行される。 Through the text communication via SMS described above, the text responses of each training participant and the presence or absence of an opening notification are registered in the information processing device 10. Note that steps S6 to S8 may be executed before or simultaneously with steps S3 to S5. Further, steps S3 to S8 are repeatedly executed each time training is started in another town, such as B town or C town.

ステップS9;
最後に、A町で訓練が終了すると、情報処理装置10の出力部104は、固定電話機31及びスマートフォン32による各訓練参加者の音声応答(テキストに変換した音声応答を含む)、テキスト応答、開封通知の有無に基づく応答結果を端末装置20に出力する。
Step S9;
Finally, when the training ends in town A, the output unit 104 of the information processing device 10 outputs the voice responses (including voice responses converted to text) of each training participant via the landline telephone 31 and smartphone 32, the text responses, and the opening of the package. A response result based on the presence or absence of notification is output to the terminal device 20.

例えば、情報処理装置10の出力部104は、町毎に、訓練参加者数の参加者数、訓練の処理状況、訓練参加者の応答状況を含む応答結果レポートを出力する。応答状況については、出力部104は、練参加者数が「はい」又は「いいえ」と応答したそれぞれの総人数、未応答であった総人数を算出する。 For example, the output unit 104 of the information processing device 10 outputs a response result report including the number of training participants, training processing status, and response status of training participants for each town. Regarding the response status, the output unit 104 calculates the total number of practice participants who responded "yes" or "no" and the total number of participants who did not respond.

出力部104が出力する応答結果レポートは、警戒レベル等の訓練参加者の分類の区分毎に、訓練参加者数の参加者数、訓練の処理状況、訓練参加者の応答状況その他の結果を表示してもよい。 The response result report output by the output unit 104 displays the number of training participants, training processing status, response status of training participants, and other results for each classification of training participants such as alert level. You may.

端末装置20に対する応答結果レポートは、情報処理装置10と端末装置20との間の音声通話を介して、情報処理装置10がAIにより音声で読み上げてもよい。読み上げる項目、順序、その他の条件は、予め情報処理装置10に登録しておいてもよい。情報処理装置10による読み上げは、情報処理装置10と端末装置20との間の音声通話を介して、端末装置20から「結果教えて」その他の音声を、情報処理装置10が受信することに基づいてもよい。 The response result report to the terminal device 20 may be read aloud by the information processing device 10 using AI via a voice call between the information processing device 10 and the terminal device 20. The items to be read out, the order, and other conditions may be registered in the information processing device 10 in advance. The reading by the information processing device 10 is based on the information processing device 10 receiving “Tell me the results” and other voices from the terminal device 20 via a voice call between the information processing device 10 and the terminal device 20. You can.

また、情報処理装置10の出力部104は、音声応答をテキストに変換した自由発話やテキスト応答の自由文章をそのまま訓練参加者IDに関連付けて端末装置20のモニタに出力してもよい。これらにより、訓練設定者は、各町で実施したそれぞれの訓練結果を確認できる。 Further, the output unit 104 of the information processing device 10 may output the free speech or free sentences of the text response obtained by converting the voice response into text to the monitor of the terminal device 20 in association with the training participant ID. Through these, training setters can check the results of each training conducted in each town.

また、情報処理装置10の出力部104は、各訓練参加者の音声応答を端末装置20で再生してもよい。このとき、出力部104が出力する応答結果レポートにおいて、自由発話が音声応答をテキスト変換したものであることを表示してもよい。また、当該表示に隣接して訓練参加者の音声応答を端末装置20で再生するためのアイコンその他のインターフェースを配置してもよい。また、情報処理装置10は、訓練設定者の入力を受け付けて、自由発話を変換したテキストを修正してもよい。 Further, the output unit 104 of the information processing device 10 may reproduce the voice responses of each training participant on the terminal device 20. At this time, in the response result report output by the output unit 104, it may be displayed that the free speech is a voice response converted into text. Further, an icon or other interface for reproducing the training participant's voice response on the terminal device 20 may be placed adjacent to the display. Further, the information processing device 10 may receive input from the training setter and modify the text obtained by converting the free speech.

これにより、訓練設定者は、各訓練参加者の録音音声を聞き直すことができ、訓練参加者の音声応答、特に音声認識を行いテキストに変換した音声応答を正しく編集できる。この処理は、音声の誤認識に対応するために有用である。 Thereby, the training setter can listen again to the recorded voices of each training participant, and can correctly edit the training participant's voice responses, especially the voice responses that have been subjected to voice recognition and converted into text. This processing is useful for dealing with misrecognition of speech.

[情報処理装置の実装例]
次に、図3を参照して情報処理装置10の実装例を説明する。図3は、情報処理装置10の実装例を示す図である。
[Implementation example of information processing device]
Next, an implementation example of the information processing device 10 will be described with reference to FIG. 3. FIG. 3 is a diagram illustrating an implementation example of the information processing device 10.

情報処理装置10を利用する関係者は、「情報の発信者」と「情報の受信者」とに大別される。情報の発信者は、自治体等の職員、自治会の長、消防団等のコミュニティのリーダー等がなり得る。情報の受信者は、主には地域住民であるが、情報の発信者たる自治体等の職員、自治会長、消防団等もなり得る。 The parties who use the information processing device 10 are broadly classified into "information senders" and "information receivers." The sender of information can be an employee of a local government, the head of a neighborhood association, a community leader such as a fire brigade, etc. The recipients of the information are mainly local residents, but they can also be the employees of the local government, the president of the local community, the fire brigade, etc. who are the senders of the information.

本実施形態は、発信者、受信者ともに、ウェブブラウザ等のインターフェースを介さずとも、電話のみで情報の受発信ができることが特徴である。図3では、ウェブブラウザ等のインターフェースに係る従来の機能はやや省略し、主には電話のみで情報を受発信する実装例を示している。なお、電話の受発信等の基本的な機能は、既存するクラウドの諸機能を組み合わせ、それらを制御するためのプログラムを開発した。 This embodiment is characterized in that both the sender and the receiver can receive and send information only by telephone, without using an interface such as a web browser. In FIG. 3, conventional functions related to interfaces such as a web browser are slightly omitted, and an implementation example is mainly shown in which information is received and sent only by telephone. For basic functions such as making and receiving calls, we combined existing cloud functions and developed a program to control them.

例えば、受付部101及び出力部104は、ウェブブラウザ等のテキストベースで情報の一斉配信及び応答の結果確認を行うため、テキスト受付部41と、ユーザ認証部42と、テキスト保存部43と、テキスト処理部44と、を備える。 For example, the reception unit 101 and the output unit 104 are configured to include a text reception unit 41, a user authentication unit 42, a text storage unit 43, a text A processing section 44 is provided.

また、受付部101及び出力部104は、音声ベースで情報の一斉配信及び応答の結果確認を行うため、音声受付部45と、音声処理部46と、を備える。 In addition, the reception unit 101 and the output unit 104 include a voice reception unit 45 and a voice processing unit 46 in order to simultaneously distribute information on a voice basis and check the results of responses.

また、受付部101及び出力部104は、音声ベースで情報の一斉配信及び応答の結果確認を行うため、特に肉声音声を配信するため、音声受付部47と、音声処理部48と、を備える。 In addition, the reception unit 101 and the output unit 104 include a voice reception unit 47 and a voice processing unit 48 in order to simultaneously distribute information on a voice basis and check the results of responses, and in particular to distribute real voices.

例えば、記憶部102は、データ管理部51と、音声保存部52と、を備える。 For example, the storage unit 102 includes a data management unit 51 and an audio storage unit 52.

例えば、発信部103は、データ処理部61と、音声対話AI部62と、音声テキスト変換部63と、音声処理部64と、音声発信部65と、を備える。 For example, the transmission unit 103 includes a data processing unit 61, a voice dialogue AI unit 62, a voice text conversion unit 63, a voice processing unit 64, and a voice transmission unit 65.

[定型発話により応答できる仕組み]
次に、「はい」「いいえ」等の定型発話により応答できる仕組みを説明する。図4は、定型発話により応答できる仕組みを説明するための参照図である。定型発話を認識させる仕組みは、図3に示した発信部103の音声対話AI部62を活用して実現する。
[Mechanism that allows responses using standard utterances]
Next, a mechanism that allows responses to be made using standard utterances such as "yes" and "no" will be explained. FIG. 4 is a reference diagram for explaining a mechanism that allows responses using standard utterances. The mechanism for recognizing standard utterances is realized by utilizing the voice dialogue AI section 62 of the transmitting section 103 shown in FIG.

まず、音声発信部65は、固定電話機31に電話をかける(ステップS101)。 First, the voice transmitter 65 makes a call to the fixed telephone 31 (step S101).

次に、固定電話機31の受信者は、例えば「んだ」と発話する(ステップS102)。 Next, the recipient of the fixed telephone 31 utters, for example, "nada" (step S102).

次に、音声発信部65は、受信者の発話を受信すると、音声対話AI部62が、受信者の発話内容を認識する(ステップS103)。 Next, when the voice transmission unit 65 receives the recipient's utterance, the voice dialogue AI unit 62 recognizes the content of the recipient's utterance (step S103).

このとき、音声対話AI部62は、プログラム上で‘yes’となる値を、「はい」「はいはい」「わかった」「できる」「んだ」等の発話されるであろう言葉と紐付けている。同様に、音声対話AI部62は、プログラム上で‘no’となる値を、「いいえ」「ちがう」「わからなかった」「ちゃう」等の発話されるであろう言葉と紐付けている。それ故、音声対話AI部62は、「んだ」という発話を‘yes’に定型化する。なお、これら許容される定型発話は、自由に定義可能である。 At this time, the voice dialogue AI unit 62 associates the value 'yes' on the program with words that are likely to be uttered, such as 'yes', 'yes yes', 'understood', 'can do', 'da', etc. ing. Similarly, the voice dialogue AI unit 62 associates the value 'no' on the program with words that are likely to be uttered, such as 'no', 'no', 'I don't understand', and 'cha'. Therefore, the voice dialogue AI unit 62 stylizes the utterance "da" to "yes". Note that these permissible fixed utterances can be freely defined.

その後、音声対話AI部62は、‘yes’=「はい」と認識しました等、定型発話の認識結果を音声発信部65に返答し(ステップS104)、その認識結果をデータ処理部61に渡す(ステップS105)。 Thereafter, the voice dialogue AI unit 62 replies to the voice transmission unit 65 with the recognition result of the standard utterance, such as recognizing 'yes' = 'yes' (step S104), and passes the recognition result to the data processing unit 61. (Step S105).

最後に、データ処理部61は、渡された定型発話の認識結果をデータ管理部51に書き込む(ステップS106)。このとき、音声発信部65は、音声処理部64を介して、受信者の発話内容をそのままデータ管理部51に登録してもよい。 Finally, the data processing unit 61 writes the recognition result of the passed standard utterance into the data management unit 51 (step S106). At this time, the voice transmitting section 65 may register the content of the recipient's utterance as is in the data management section 51 via the voice processing section 64 .

その結果、データ管理部51には、受信者の名前、連絡手段(電話、SMS等)、回答の有無、定型発話内容、折り返しの有無、SMS発信の有無、最終処理時刻等が書き込まれる。情報の発信者は、これら受信者による定型発話等の応答結果を端末装置20の管理画面上で確認することができる。 As a result, the data management unit 51 is written with the recipient's name, means of contact (telephone, SMS, etc.), presence or absence of a response, content of standard utterances, presence or absence of a callback, presence or absence of an SMS transmission, final processing time, and the like. The sender of the information can check the response results of the recipients' fixed utterances and the like on the management screen of the terminal device 20.

以上より、受信者の発話内容を定型化するので、方言を含めた自然な発話に対応することができ、受信者はダイヤル操作なしで応答することができる。 As described above, since the content of the recipient's utterance is standardized, it is possible to respond to natural utterances including dialects, and the recipient can respond without dialing.

[自由発話により応答できる仕組み]
次に、自由発話により応答できる仕組みを説明する。図5は、自由発話により応答できる仕組みを説明するための参照図である。自由発話を認識させる仕組みは、図3に示した発信部103の音声テキスト変換部63を活用して実現する。
[Mechanism that allows responses by free speech]
Next, a mechanism that allows responses by free speech will be explained. FIG. 5 is a reference diagram for explaining a mechanism that allows responses by free speech. The mechanism for recognizing free speech is realized by utilizing the speech-to-text converter 63 of the transmitter 103 shown in FIG.

まず、音声発信部65は、固定電話機31に電話をかける(ステップS201)。 First, the voice transmitter 65 makes a call to the fixed telephone 31 (step S201).

次に、固定電話機31の受信者は、例えば「今私は家にいます。特に怪我はしていません。大丈夫です」と発話する(ステップS202)。 Next, the receiver of the landline telephone 31 utters, for example, "I'm at home now. I'm not particularly injured. I'm fine" (step S202).

次に、音声発信部65は、受信者の発話を受信すると、音声テキスト変換部63が、受信者の発話内容を認識してテキストに変換する(ステップS203)。 Next, when the voice transmitter 65 receives the recipient's utterance, the voice-to-text converter 63 recognizes the recipient's utterance and converts it into text (step S203).

最後に、音声テキスト変換部63は、テキスト化された受信者の自由発話をデータ処理部61に渡し(ステップS204)、データ処理部61は、そのテキスト化された自由発話をデータ管理部51に書き込む(ステップS205)。その結果、データ管理部51には、テキスト化された受信者の自由発話が書き込まれる。 Finally, the speech-to-text conversion unit 63 passes the recipient's free speech converted into text to the data processing unit 61 (step S204), and the data processing unit 61 passes the free speech converted into text to the data management unit 51. Write (step S205). As a result, the recipient's free speech converted into text is written into the data management unit 51.

このとき、音声テキスト変換部63による自由発話の認識精度が100%でなく、受信者による音声の発話内容とテキストの発話内容とが一致しない可能性がある。そこで、音声処理部64は、受信者の自由発話を再生可能にデータ管理部51に録音する。また、データ管理部51は、書き込まれたテキストの発話内容を手動で事後的に補正可能・変更可能に記憶する。これにより、情報の発信者は、録音された受信者の発話内容を元に正しい発話内容のテキスト文に修正することができる。 At this time, the recognition accuracy of free speech by the speech-to-text conversion unit 63 is not 100%, and there is a possibility that the contents of the voice utterance by the recipient and the contents of the text utterance do not match. Therefore, the voice processing unit 64 records the recipient's free speech in the data management unit 51 so that it can be reproduced. Further, the data management unit 51 stores the utterance content of the written text so that it can be corrected and changed manually after the fact. Thereby, the sender of the information can correct the text to the correct utterance based on the recorded utterance of the recipient.

以上より、受信者の発話をテキストに変換するので、受信者は自由発話により応答できる。また、避難者名簿等に基づき人手で所在確認等行なっていた業務を自動化・省力化することができる。 As described above, since the recipient's utterance is converted into text, the recipient can respond by freely speaking. In addition, it is possible to automate and save labor on tasks that used to be performed manually, such as checking the location of evacuees based on the list of evacuees.

[肉声を一斉配信できる仕組み]
次に、肉声を一斉配信できる仕組みを説明する。図6は、肉声を一斉配信できる仕組みを説明するための参照図である。肉声を一斉配信できる仕組みは、図3に示した受付部101及び出力部104の音声受付部47等を活用して実現する。
[Mechanism that allows simultaneous distribution of real voices]
Next, we will explain the mechanism that allows simultaneous distribution of real voices. FIG. 6 is a reference diagram for explaining a mechanism by which real voices can be distributed all at once. A mechanism that can simultaneously distribute real voices is realized by utilizing the reception section 101 and the voice reception section 47 of the output section 104 shown in FIG. 3.

まず、情報の発信者は、情報処理装置10に電話機で電話をかけ、ガイダンスに従って一斉配信したい音声をふきこむ(ステップS301)。 First, a sender of information calls the information processing device 10 using a telephone, and according to the guidance, voices that he or she wishes to broadcast all at once are voiced (step S301).

次に、音声受付部47は、発信者の肉声音声を受信する(ステップS302)。 Next, the voice reception unit 47 receives the caller's real voice (step S302).

次に、音声処理部48は、受信した肉声音声を音声ファイルに加工し(ステップS303)、加工した音声ファイルを音声保存部52に保存する(ステップS304)。例えば、音声処理部48は、パーサーライブラリとしてEBMLを使用し、μ-law変換ライブラリとしてFFmpegを使用して、音声ファイルを保存する。 Next, the audio processing unit 48 processes the received real voice into an audio file (step S303), and stores the processed audio file in the audio storage unit 52 (step S304). For example, the audio processing unit 48 uses EBML as a parser library and FFmpeg as a μ-law conversion library to save audio files.

次に、音声発信部65は、固定電話機31に電話をかける(ステップS305)。このとき、音声発信部65は、発信者による音声のふきこみ後に電話を即座にかけるか、一定時間経過後にかけるか、所定の契機をタイミングにかけるかどうかを、選択可能である。他例えば、音声発信部65は、音声のふきこみ後、情報発信者との間で「発信しますか?」→「はい」等の音声でのやりとりと通じて一斉発信する。ウェブブラウザは介さない。 Next, the voice transmitter 65 makes a call to the fixed telephone 31 (step S305). At this time, the voice transmitter 65 can select whether to make a call immediately after the caller speaks, to make a call after a certain period of time has elapsed, or to make a call based on a predetermined timing. For example, after recording the voice, the voice transmitter 65 transmits the information all at once through a voice exchange such as "Do you want to transmit?" → "Yes" with the information transmitter. No web browser involved.

次に、音声発信部65は、音声保存部52から肉声音声の音声ファイルを取得し(ステップS306)、取得した音声ファイルを再生することで、ふきこまれた肉声を再生する(ステップS307)。 Next, the audio transmitting unit 65 acquires the audio file of the real voice from the audio storage unit 52 (step S306), and reproduces the recorded real voice by reproducing the acquired audio file (step S307).

最後に、音声発信部65は、音声処理部64を介して、固定電話機31の受信者による応答結果をデータ管理部51に書き込む(ステップS308)。 Finally, the voice transmitting unit 65 writes the response result by the recipient of the fixed telephone 31 into the data management unit 51 via the voice processing unit 64 (step S308).

以上より、情報発信者の電話機を通じて肉声を受信し、受信した肉声の音声ファイルを保存し、保存した音声ファイルを情報受信者の電話機に対して再生するので、自治会長等が自身の地区の住民に対して、電話機のみで、肉声を一斉発信することができる。特に、緊急時に、AIにより疑似音声で読み上げるよりも、緊迫感をもたせて情報伝達する際に有効である。 As described above, since the real voice is received through the phone of the information sender, the audio file of the received real voice is saved, and the saved audio file is played back on the phone of the information recipient, the president of the local community can On the other hand, it is possible to make a real voice call all at once using just a telephone. This is particularly effective in conveying information with a sense of urgency, rather than reading out aloud using artificial voices using AI, in an emergency.

[電話で一斉発信/結果確認できる仕組み]
次に、電話で一斉発信/結果確認できる仕組みを説明する。図7は、電話で一斉発信/結果確認できる仕組みを説明するための参照図である。電話で一斉発信/結果確認できる仕組みは、図3に示した受付部101及び出力部104の音声受付部45等を活用して実現する。
[Mechanism that allows all calls to be made/results to be confirmed by phone]
Next, we will explain how to make simultaneous calls and check results over the phone. FIG. 7 is a reference diagram for explaining a mechanism for simultaneously calling and checking results by telephone. The mechanism that allows all calls/results to be confirmed by telephone is realized by utilizing the voice reception section 45 of the reception section 101 and output section 104 shown in FIG. 3.

まず、自治会長等一定の権限のある者等、情報発信者は、情報処理装置10に電話機で電話をかける(ステップS401)。 First, an information sender, such as a person with a certain authority such as the president of the neighborhood, calls the information processing device 10 using a telephone (step S401).

次に、音声受付部45は、情報発信者からの電話を受け付け(ステップS402)、音声処理部46が、情報発信者との間で行う「応答結果を見たい」「一斉配信したい」等の音声でのやりとりに基づき、情報受信者の応答結果を確認するか、新たに情報を一斉発信するか等の処理分岐を行う(ステップS403)。 Next, the voice reception unit 45 receives a call from the information sender (step S402), and the voice processing unit 46 sends messages such as "I want to see the response results" and "I want to distribute all at once" with the information sender. Based on the voice exchange, processing branches such as checking the response results of the information recipients or transmitting new information all at once (step S403).

情報受信者の応答結果を確認する場合には、音声処理部46は、データ管理部51から過去の応答結果を取得し(ステップS404)、音声受付部45を介して、取得した過去の応答結果をAIにより音声で読み上げる(ステップS405)。例えば、「1丁目の応答状況をお伝えします…」等と読み上げる。 When confirming the response results of the information receiver, the voice processing unit 46 acquires the past response results from the data management unit 51 (step S404), and via the voice reception unit 45, the voice processing unit 46 acquires the past response results from the data management unit 51. is read aloud by AI (step S405). For example, "I would like to inform you of the response status of 1-chome..." is read aloud.

情報を一斉発信する場合には、音声処理部46は、情報発信者の音声データを音声発信部65に渡し(ステップS406)、音声発信部65は、固定電話機31に電話をかけて当該音声データを一斉配信する(ステップS407)。その後、音声発信部65は、音声処理部64を介して、固定電話機31の受信者による応答結果をデータ管理部51に書き込む(ステップS408)。 When transmitting information all at once, the voice processing section 46 passes the voice data of the information sender to the voice transmitting section 65 (step S406), and the voice transmitting section 65 calls the landline telephone 31 and transmits the voice data. is distributed all at once (step S407). Thereafter, the voice transmitting unit 65 writes the response result by the recipient of the fixed telephone 31 into the data management unit 51 via the voice processing unit 64 (step S408).

なお、ステップS404とステップS406は、共に実行してもよいし、いずれか一方のみを実行してもよい。各ステップを共に実行する場合には、その処理順は、同時に実行してもよいし、所定の一方を先に実行してよい。 Note that step S404 and step S406 may be executed together, or only one of them may be executed. When the steps are executed together, the processing order may be such that they may be executed simultaneously, or a predetermined one may be executed first.

以上より、データ管理部51に蓄積された応答結果を音声で読み上げるので、パソコンやスマートフォン等の習熟不要で結果確認を行うことができる。また、上記定型発話認識の仕組みで説明した音声対話AI部62やその他の音声対話AIを活用すれば、「結果教えて」「未応答者に発信して」等、声で操作指示することができる。 As described above, since the response results stored in the data management unit 51 are read out aloud, the results can be confirmed without the need for proficiency in using a personal computer, smartphone, or the like. In addition, if you use the voice dialogue AI section 62 explained in the above-mentioned standardized speech recognition mechanism or other voice dialogue AI, you can give operational instructions by voice, such as "tell me the results" or "call the person who has not responded." can.

その結果、自治会長等が情報処理装置10を簡便に利用でき、自助・共助の一助として活用することが期待できる。また、端末装置20の管理画面等に何らかのトラブルがあった場合(インターネットの不具合等)でも、情報を一斉発信することができる。 As a result, the information processing device 10 can be easily used by the president of the local community, etc., and can be expected to be used for self-help and mutual assistance. Further, even if there is some kind of trouble with the management screen of the terminal device 20 (such as a problem with the Internet), information can be sent all at once.

[管理画面]
図8は、端末装置20に表示される管理画面の例を示す図である。管理画面21には、発信タブ、架電状況タブ、電話番号タブ、スクリプトタブ、その他スクリプトタブ、結果一覧タブ、応答状況クリアタブが、いずれかのタブを選択可能に表示される。
[Management screen]
FIG. 8 is a diagram showing an example of a management screen displayed on the terminal device 20. The management screen 21 displays a call tab, a call status tab, a telephone number tab, a script tab, an other script tab, a result list tab, and a response status clear tab, any one of which can be selected.

図8では、発信タブT1の画面例が示されている。発信タブT1の画面には、情報発信可否欄C11、情報発信ボタンC12、発信対象者等選択欄C13、地図表示欄C14が表示される。 FIG. 8 shows an example screen of the call tab T1. On the screen of the transmission tab T1, an information transmission possibility field C11, an information transmission button C12, a transmission target person selection field C13, and a map display field C14 are displayed.

情報発信可否欄C11内には、情報発信を行うか否かを指定するためのスライドボタンが表示される。初期表示は「停止」の位置にある。情報発信者は、情報発信を行う場合にはスライドボタンを「発信」位置にスライドさせ、全ての処理が終了した後には「停止」位置にスライドさせる。 A slide button for specifying whether or not to transmit information is displayed in the information transmission possibility column C11. The initial display is in the "stop" position. The information transmitter slides the slide button to the "send" position when transmitting information, and slides it to the "stop" position after all processing is completed.

情報発信ボタンC12は、登録した電話番号宛に対して情報を一斉発信するためのボタンである。情報発信ボタンC12が押されると「発信してよろしいですか?」の確認画面がポップアップされ、その確認画面内で「はい」を押すことで情報が一斉配信される。 The information transmission button C12 is a button for simultaneously transmitting information to registered telephone numbers. When the information transmission button C12 is pressed, a confirmation screen ``Are you sure you want to send the message?'' pops up, and by pressing ``Yes'' on the confirmation screen, the information is distributed all at once.

発信対象者等選択欄C13は、警戒レベル(レベル1、レベル2、レベル3等)、地区(1区(雪沢)、2区(嶋部)、3区(越戸内、寺前、中島)等)、発信対象者(一般住民、要支援者、支援者、区長、職員等)を選択するための欄である。 The selection field C13 for recipients of calls, etc. is the alert level (level 1, level 2, level 3, etc.), district (1st ward (Yukisawa), 2nd ward (Shimabe), 3rd ward (Koshitonai, Teramae, Nakajima), etc.) , This is a column for selecting the recipient of the message (general residents, support recipients, supporters, ward mayor, staff, etc.).

警戒レベルは選択必須であり、地区及び発信対象者はそれぞれ1つ以上選択される。地区や発信対象者が複数選択された場合、架電の優先順は任意である。例えば、1区の区長を最優先に架電してもよいし、2区の一般住民を最優先に架電してもよい。 It is mandatory to select the alert level, and one or more areas and one or more recipients are selected. If multiple areas or recipients are selected, the order of priority for calls is arbitrary. For example, a call may be given to the mayor of the first ward with the highest priority, or a call may be given with the highest priority to the general residents of the second ward.

地図表示欄C14には、発信対象エリアの地図が表示される。発信対象者等選択欄C13で所望の地区が選択されると、選択された地区が発信対象地区として丸印(〇印)Mで囲われる。 A map of the transmission target area is displayed in the map display column C14. When a desired district is selected in the call destination selection field C13, the selected district is surrounded by a circle (〇) M as the call target area.

図9は、架電状況タブT2の画面例を示す図である。架電状況タブT2の画面には、登録者数欄C21、処理状況欄C22、応答状況欄C23、更新ボタンC24が表示される。 FIG. 9 is a diagram showing a screen example of the call status tab T2. On the screen of the call status tab T2, a number of registrants column C21, a processing status column C22, a response status column C23, and an update button C24 are displayed.

登録者数欄C21には、各区の登録者数(登録番号数)が表示される。 The number of registrants column C21 displays the number of registrants (number of registration numbers) for each ward.

処理状況欄C22には、各区の処理状況が表示される。例えば、初期状態を示す「未発報」、発信処理中を示す「架電中」、発信処理完了を示す「完了」、発信処理中断を示す「緊急停止」が表示される。 The processing status column C22 displays the processing status of each ward. For example, "Not alerted" indicating the initial state, "Calling in progress" indicating that the call processing is in progress, "Complete" indicating the completion of the call processing, and "Emergency stop" indicating the interruption of the call processing are displayed.

応答状況欄C23には、各区の警戒レベル毎の応答状況が一覧表示される。具体的には、未発信の処理数、未応答数、「はい」の応答数、「いいえ」の応答数が表示される。時間経過とともに図9右上のように推移する。未発数が、未応、はい、いいえのいずれかに振り分けられるように推移する。また、応答状況にはリンク先が付与されており、応答状況を押すとリンク先で詳細状況の画面が表示される。 The response status column C23 displays a list of response statuses for each alert level in each ward. Specifically, the number of unprocessed calls, the number of unanswered calls, the number of "yes" responses, and the number of "no" responses are displayed. As time passes, it changes as shown in the upper right corner of FIG. The number of unreleased items changes so that they can be classified as unreceived, yes, or no. In addition, a link destination is attached to the response status, and when the response status is pressed, a detailed status screen is displayed at the link destination.

更新ボタンC24は、画面の情報を最新に更新するためのボタンである。更新ボタンC24を随時押すことで、ほぼリアルタイムに処理状況、応答状況が表示される。 The update button C24 is a button for updating the information on the screen to the latest information. By pressing the update button C24 at any time, the processing status and response status are displayed almost in real time.

(変形例)
本実施形態に係るシン・オートコールシステム1は、電話やSMS以外に、電子メール、チャット、SNS等にも適応可能である。
(Modified example)
The thin auto call system 1 according to the present embodiment is applicable not only to telephone calls and SMS, but also to e-mail, chat, SNS, and the like.

(変形例)
本実施形態に係るシン・オートコールシステム1は、防災訓練以外に、特殊詐欺対策訓練等にも適用可能である。また、訓練以外に、防災や特殊詐欺等が実際に発生した時にも適用可能である。防災訓練には、防護訓練、避難誘導訓練、救急救命訓練等が含まれる。シン・オートコールシステム1が配信する配信情報とは、安否確認情報、避難誘導情報、詐欺発生警告情報等である。
(Modified example)
The thin auto call system 1 according to this embodiment is applicable not only to disaster prevention training but also to special anti-fraud training and the like. In addition to training, it can also be applied when disaster prevention or special fraud actually occurs. Disaster prevention training includes protection training, evacuation guidance training, first aid training, etc. The distributed information distributed by the Shin Auto Call System 1 includes safety confirmation information, evacuation guidance information, fraud warning information, and the like.

[実施形態の効果]
本実施形態によれば、情報処理装置10が、電話番号と配信情報を受け付ける受付部101と、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部103と、前記音声応答を記憶する記憶部102と、前記音声応答に基づく応答結果を出力する出力部104と、を備えるので、電話での情報連絡を自動かつ双方向で簡便に実施可能な技術を提供できる。
[Effects of embodiment]
According to the present embodiment, the information processing device 10 automatically calls the reception unit 101 that receives a telephone number and distribution information, and simultaneously transmits the distribution information by voice to the telephone terminals of each telephone number, and the telephone terminals that responded. Since it is provided with a transmitting unit 103 that receives a voice response to the voice distribution information from a telephone, a storage unit 102 that stores the voice response, and an output unit 104 that outputs a response result based on the voice response, It is possible to provide technology that allows information communication to be carried out automatically and easily in both directions.

本実施形態により、音声というユニバーサルなインターフェースを用いた機能を実装した情報処理装置10により、メッセージを音声で伝えたり結果を音声で確認したりすることの可能な「令和の自動電話」(シン・オートコール)を提供することができる。 According to the present embodiment, an information processing device 10 equipped with a function using a universal interface called voice is used to create a "Reiwa automatic telephone" (synthesizer) that is capable of transmitting messages by voice and confirming results by voice.・Auto call) can be provided.

[その他]
本発明は、上記実施形態に限定されない。本発明は、本発明の要旨の範囲内で数々の変形が可能である。
[others]
The present invention is not limited to the above embodiments. The present invention is capable of numerous modifications within the scope of the invention.

上記説明した本実施形態の情報処理装置10は、例えば、図10に示すように、CPU901と、メモリ902と、ストレージ903と、通信装置904と、入力装置905と、出力装置906と、を備えた汎用的なコンピュータシステムを用いて実現できる。メモリ902及びストレージ903は、記憶装置である。当該コンピュータシステムにおいて、CPU901がメモリ902上にロードされた所定のプログラムを実行することにより、情報処理装置10の各機能が実現される。 The information processing device 10 of this embodiment described above includes, for example, a CPU 901, a memory 902, a storage 903, a communication device 904, an input device 905, and an output device 906, as shown in FIG. It can be realized using a general-purpose computer system. Memory 902 and storage 903 are storage devices. In the computer system, each function of the information processing device 10 is realized by the CPU 901 executing a predetermined program loaded onto the memory 902.

情報処理装置10は、1つのコンピュータで実装されてもよい。情報処理装置10は、複数のコンピュータで実装されてもよい。情報処理装置10は、コンピュータに実装される仮想マシンであってもよい。情報処理装置10用のプログラムは、HDD、SSD、USBメモリ、CD、DVD等のコンピュータ読取り可能な記録媒体に記憶できる。コンピュータ読取り可能な記録媒体とは、例えば、非一時的な記録媒体である。情報処理装置10用のプログラムは、通信ネットワークを介して配信することもできる。 The information processing device 10 may be implemented by one computer. The information processing device 10 may be implemented with multiple computers. The information processing device 10 may be a virtual machine implemented in a computer. A program for the information processing device 10 can be stored in a computer-readable recording medium such as an HDD, SSD, USB memory, CD, or DVD. The computer-readable recording medium is, for example, a non-transitory recording medium. The program for the information processing device 10 can also be distributed via a communication network.

1:シン・オートコールシステム
10:情報処理装置(シン・オートコール装置)
20:端末装置
30:電話端末
31:固定電話機
32:スマートフォン
101:受付部
102:記憶部
103:発信部
104:出力部
41:テキスト受付部
42:ユーザ認証部
43:テキスト保存部
44:テキスト処理部
45:音声受付部
46:音声処理部
47:音声受付部
48:音声処理部
51:データ管理部
52:音声保存部
61:データ処理部
62:音声対話AI部
63:音声テキスト変換部
64:音声処理部
65:音声発信部
901:CPU
902:メモリ
903:ストレージ
904:通信装置
905:入力装置
906:出力装置
1: Shin auto call system 10: Information processing device (shin auto call device)
20: Terminal device 30: Telephone terminal 31: Fixed telephone 32: Smartphone 101: Reception section 102: Storage section 103: Transmission section 104: Output section 41: Text reception section 42: User authentication section 43: Text storage section 44: Text processing Section 45: Voice reception section 46: Voice processing section 47: Voice reception section 48: Voice processing section 51: Data management section 52: Voice storage section 61: Data processing section 62: Voice dialogue AI section 63: Voice text conversion section 64: Audio processing unit 65: Audio transmitting unit 901: CPU
902: Memory 903: Storage 904: Communication device 905: Input device 906: Output device

Claims (7)

音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する発信部と、
前記方言の音声応答を記憶する前記記憶部と、
前記方言の音声応答に基づく応答結果を出力する出力部と、を備え、
前記発信部は、
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換する情報処理装置。
Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and voice distribution information that is pre-stored in the storage unit is simultaneously distributed by voice, and the call is made in response. a transmitting unit that receives a voice response in a dialect to the distributed information from a destination telephone terminal;
the storage unit that stores voice responses in the dialect;
an output unit that outputs a response result based on the voice response of the dialect,
The transmitter is
An information processing device that converts a voice response in the dialect into a standardized response that is compatible with the content of the voice response in the dialect.
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する発信部と、 Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and voice distribution information that is pre-stored in the storage unit is simultaneously distributed by voice, and the call is made in response. a transmitting unit that receives a voice response in a dialect to the distributed information from a destination telephone terminal;
前記方言の音声応答を記憶する前記記憶部と、 the storage unit that stores voice responses in the dialect;
前記方言の音声応答に基づく応答結果を出力する出力部と、 an output unit that outputs a response result based on the voice response of the dialect;
前記方言の音声応答を管理する管理部と、を備え、 a management unit that manages voice responses in the dialect,
前記発信部は、 The transmitter is
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換し、 converting the voice response in the dialect into a canned response of a type that matches the content of the voice response in the dialect;
前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、 converting the voice response in the dialect into text data, and storing the text data of the voice response in the dialect in the storage unit in a changeable manner;
前記管理部は、 The management department is
前記テキストデータを、再生された前記方言の音声応答の内容に一致するように入力されたテキストデータに変更する情報処理装置。 An information processing device that changes the text data to input text data that matches the content of the reproduced audio response in the dialect.
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する発信部と、
前記方言の音声応答を記憶する前記記憶部と、
前記方言の音声応答に基づく応答結果を出力する出力部と、
前記方言の音声応答を管理する管理部と、を備え、
前記発信部は、
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換し、
前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、
前記管理部は、
前記テキストデータを、再生された前記方言の音声応答の内容に一致するように前記発信命令の発信者により入力されたテキストデータに変更する情報処理装置。
Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and voice distribution information that is pre-stored in the storage unit is simultaneously distributed by voice, and the call is made in response. a transmitting unit that receives a voice response in a dialect to the distributed information from a destination telephone terminal;
the storage unit that stores voice responses in the dialect;
an output unit that outputs a response result based on the voice response of the dialect;
a management unit that manages voice responses in the dialect,
The transmitter is
converting the voice response in the dialect into a canned response of a type that matches the content of the voice response in the dialect;
converting the voice response in the dialect into text data, and storing the text data of the voice response in the dialect in the storage unit in a changeable manner;
The management department is
An information processing device that changes the text data to text data input by a sender of the call command so as to match the content of the reproduced voice response in the dialect.
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する第1のステップと、
前記方言の音声応答を前記記憶部に記憶する第2のステップと、
前記方言の音声応答に基づく応答結果を出力する第3のステップと、を行い、
前記第1のステップでは、
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換する情報処理方法。
In an information processing method performed by an information processing device,
Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and the voice distribution information stored in advance in the storage unit is simultaneously distributed by voice, and the call is made in response. a first step of receiving a voice response in a dialect to the distribution information from a destination telephone terminal;
a second step of storing the voice response in the dialect in the storage unit;
a third step of outputting a response result based on the voice response of the dialect;
In the first step,
An information processing method for converting a voice response in the dialect into a standardized response that is compatible with the content of the voice response in the dialect.
情報処理装置で行う情報処理方法において、 In an information processing method performed by an information processing device,
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する第1のステップと、 Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and the voice distribution information stored in advance in the storage unit is simultaneously distributed by voice, and the call is made in response. a first step of receiving a voice response in a dialect to the distribution information from a destination telephone terminal;
前記方言の音声応答を前記記憶部に記憶する第2のステップと、 a second step of storing the voice response in the dialect in the storage unit;
前記方言の音声応答に基づく応答結果を出力する第3のステップと、 a third step of outputting a response result based on the voice response of the dialect;
前記方言の音声応答を管理する第4のステップと、を行い、 a fourth step of managing voice responses in the dialect;
前記第1のステップでは、 In the first step,
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換するとともに、前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、 Converting the voice response in the dialect into a standardized response that matches the content of the voice response in the dialect, converting the voice response in the dialect into text data, and making the text data of the voice response in the dialect changeable. Store it in the memory unit,
前記第4のステップでは、 In the fourth step,
前記テキストデータを、再生された前記方言の音声応答の内容に一致するように入力されたテキストデータに変更する情報処理方法。 An information processing method for changing the text data into text data input so as to match the content of the reproduced voice response in the dialect.
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する方言の音声応答を受信する第1のステップと、
前記方言の音声応答を前記記憶部に記憶する第2のステップと、
前記方言の音声応答に基づく応答結果を出力する第3のステップと、
前記方言の音声応答を管理する第4のステップと、を行い、
前記第1のステップでは、
前記方言の音声応答を前記方言の音声応答の内容に適合する型の定型応答に変換するとともに、前記方言の音声応答をテキストデータに変換し、前記方言の音声応答のテキストデータを変更可能に前記記憶部に記憶させ、
前記第4のステップでは、
前記テキストデータを、再生された前記方言の音声応答の内容に一致するように前記発信命令の発信者により入力されたテキストデータに変更する情報処理方法。
In an information processing method performed by an information processing device,
Based on a voice call command, a call is automatically made to a destination phone terminal whose phone number is pre-stored in a storage unit, and voice distribution information that is pre-stored in the storage unit is simultaneously distributed by voice, and the call is made in response. a first step of receiving a voice response in a dialect to the distribution information from a destination telephone terminal;
a second step of storing the voice response in the dialect in the storage unit;
a third step of outputting a response result based on the voice response of the dialect;
a fourth step of managing voice responses in the dialect;
In the first step,
Converting the voice response in the dialect into a standardized response that matches the content of the voice response in the dialect, converting the voice response in the dialect into text data, and making the text data of the voice response in the dialect changeable. Store it in the memory unit,
In the fourth step,
An information processing method for changing the text data into text data input by the caller of the call command so as to match the content of the reproduced voice response in the dialect.
請求項1乃至のいずれかに記載の情報処理装置としてコンピュータを機能させる情報処理プログラム。 An information processing program that causes a computer to function as the information processing apparatus according to any one of claims 1 to 3 .
JP2023205426A 2022-10-05 2023-12-05 Information processing device, information processing method, and information processing program Active JP7438447B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023205426A JP7438447B1 (en) 2022-10-05 2023-12-05 Information processing device, information processing method, and information processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022161046A JP7419472B1 (en) 2022-10-05 2022-10-05 Information processing device, information processing method, and information processing program
JP2023205426A JP7438447B1 (en) 2022-10-05 2023-12-05 Information processing device, information processing method, and information processing program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022161046A Division JP7419472B1 (en) 2022-10-05 2022-10-05 Information processing device, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP7438447B1 true JP7438447B1 (en) 2024-02-26
JP2024054865A JP2024054865A (en) 2024-04-17

Family

ID=89616086

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022161046A Active JP7419472B1 (en) 2022-10-05 2022-10-05 Information processing device, information processing method, and information processing program
JP2023205426A Active JP7438447B1 (en) 2022-10-05 2023-12-05 Information processing device, information processing method, and information processing program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2022161046A Active JP7419472B1 (en) 2022-10-05 2022-10-05 Information processing device, information processing method, and information processing program

Country Status (1)

Country Link
JP (2) JP7419472B1 (en)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001168990A (en) 1999-12-08 2001-06-22 Yamaha Corp Safety confirmation system and method on occurrence of disaster
JP2001257775A (en) 2000-03-10 2001-09-21 Mitsubishi Electric Corp Information service system
JP2002297189A (en) 2001-03-30 2002-10-11 Omron Corp Device, method, and program for transcription, and recording medium where the program is recorded
JP2003078653A (en) 2001-09-04 2003-03-14 Mitsubishi Space Software Kk Voice information transmission/reception system and voice information transmission/reception method
JP2004040691A (en) 2002-07-08 2004-02-05 Image Partner:Kk Emergency communication system
JP2006267319A (en) 2005-03-23 2006-10-05 Nec Corp Support system for converting voice to writing, method thereof, and system for determination of correction part
JP2009217470A (en) 2008-03-10 2009-09-24 Fujitsu Ltd E-mail transmission system and method
JP2009288567A (en) 2008-05-29 2009-12-10 Ricoh Co Ltd Device, method, program and system for preparing minutes
JP2014022938A (en) 2012-07-18 2014-02-03 Ntt Communications Corp Communication system, terminal, program, and communication method
JP2020156065A (en) 2019-03-22 2020-09-24 株式会社ナカヨ Main device and extension allocation method
JP2021117563A (en) 2020-01-23 2021-08-10 株式会社ケアコム Recording management system and input terminal

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001168990A (en) 1999-12-08 2001-06-22 Yamaha Corp Safety confirmation system and method on occurrence of disaster
JP2001257775A (en) 2000-03-10 2001-09-21 Mitsubishi Electric Corp Information service system
JP2002297189A (en) 2001-03-30 2002-10-11 Omron Corp Device, method, and program for transcription, and recording medium where the program is recorded
JP2003078653A (en) 2001-09-04 2003-03-14 Mitsubishi Space Software Kk Voice information transmission/reception system and voice information transmission/reception method
JP2004040691A (en) 2002-07-08 2004-02-05 Image Partner:Kk Emergency communication system
JP2006267319A (en) 2005-03-23 2006-10-05 Nec Corp Support system for converting voice to writing, method thereof, and system for determination of correction part
JP2009217470A (en) 2008-03-10 2009-09-24 Fujitsu Ltd E-mail transmission system and method
JP2009288567A (en) 2008-05-29 2009-12-10 Ricoh Co Ltd Device, method, program and system for preparing minutes
JP2014022938A (en) 2012-07-18 2014-02-03 Ntt Communications Corp Communication system, terminal, program, and communication method
JP2020156065A (en) 2019-03-22 2020-09-24 株式会社ナカヨ Main device and extension allocation method
JP2021117563A (en) 2020-01-23 2021-08-10 株式会社ケアコム Recording management system and input terminal

Also Published As

Publication number Publication date
JP2024054666A (en) 2024-04-17
JP2024054865A (en) 2024-04-17
JP7419472B1 (en) 2024-01-22

Similar Documents

Publication Publication Date Title
EP2156652B1 (en) Method and system for notification and telecommunications management
US8166126B2 (en) System and method for distributing notifications to a group of recipients
US7177402B2 (en) Voice-activated interactive multimedia information processing system
US9537993B1 (en) Identifying recorded call data segments of interest
KR20190107106A (en) Call handling on shared voice activated devices
US8594290B2 (en) Descriptive audio channel for use with multimedia conferencing
CN111683175B (en) Method, device, equipment and storage medium for automatically answering incoming call
US10511713B1 (en) Identifying recorded call data segments of interest
US8477913B2 (en) Voicemail with data content
US20080167028A1 (en) Personal Communications Processing System
US20140278404A1 (en) Audio merge tags
JP7438447B1 (en) Information processing device, information processing method, and information processing program
US9571620B1 (en) Identifying recorded call data segments of interest
JP2009005350A (en) Method for operating voice mail system
US12015730B2 (en) Systems and methods for cellular and landline text-to-audio and audio-to-text conversion
JP7229043B2 (en) Return home notification service providing method, server system and program
JP5326539B2 (en) Answering Machine, Answering Machine Service Server, and Answering Machine Service Method
JP2007006238A (en) Telephone contact method and recording medium
KR20220147454A (en) Apparatus and method for providing ringtone of message
JP2008252279A (en) Broadcast information providing system
JP5076929B2 (en) Message transmission device, message transmission method, and message transmission program
KR100826177B1 (en) Expression method and apparatus for caller identification
JP2005311831A (en) Information system, information terminal device, control method and its program
JP2006091734A (en) Learning process, learning system, learning method and learning program
JP2003069718A (en) System for supporting remote interaction between person handicapped in hearing and person having no difficulty in hearing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231205

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240213

R150 Certificate of patent or registration of utility model

Ref document number: 7438447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150