CN110291769A - 信号处理装置、通信***、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序 - Google Patents
信号处理装置、通信***、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序 Download PDFInfo
- Publication number
- CN110291769A CN110291769A CN201880011278.5A CN201880011278A CN110291769A CN 110291769 A CN110291769 A CN 110291769A CN 201880011278 A CN201880011278 A CN 201880011278A CN 110291769 A CN110291769 A CN 110291769A
- Authority
- CN
- China
- Prior art keywords
- text data
- communication terminal
- data
- communication
- textual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 663
- 238000012545 processing Methods 0.000 title claims abstract description 322
- 238000000034 method Methods 0.000 title claims description 27
- 230000005540 biological transmission Effects 0.000 claims abstract description 130
- 230000015654 memory Effects 0.000 claims description 130
- 238000013519 translation Methods 0.000 claims description 121
- 230000004048 modification Effects 0.000 claims description 37
- 238000012986 modification Methods 0.000 claims description 37
- 230000008901 benefit Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims 1
- 238000003860 storage Methods 0.000 description 115
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 241001269238 Data Species 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 5
- 206010034719 Personality change Diseases 0.000 description 4
- 238000012508 change request Methods 0.000 description 4
- 238000000151 deposition Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000037230 mobility Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011191 terminal modification Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/563—User guidance or feature selection
- H04M3/566—User guidance or feature selection relating to a participants right to speak
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1822—Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/06—Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
- H04W4/08—User group management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/06—Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
- H04W4/10—Push-to-Talk [PTT] or Push-On-Call services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L5/00—Arrangements affording multiple use of the transmission path
- H04L5/14—Two-way operation using the same type of signal, i.e. duplex
- H04L5/16—Half-duplex systems; Simplex/duplex switching; Transmission of break signals non-automatically inverting the direction of transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/20—Aspects of automatic or semi-automatic exchanges related to features of supplementary services
- H04M2203/2061—Language aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/18—Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Mobile Radio Communication Systems (AREA)
- Time-Division Multiplex Systems (AREA)
- Communication Control (AREA)
Abstract
信号处理装置将多个通信终端进行关联而作为集合,并提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信。信号处理装置具有发送权赋予部、文本化处理部、以及通信控制部。发送权赋予部对属于所述集合的多个通信终端的任意一个提供发送权。文本化处理部基于从具有所述发送权的通信终端发送的语音数据生成文本数据。通信控制部将生成的文本数据发送给属于所述集合的多个通信终端的至少一个。
Description
技术领域
本发明涉及信号处理装置、通信***、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序。
背景技术
作为实现一对多的组同步语音通信的技术,已知作为半双工语音通信方式的PTT(一键通:Push To Talk)通信。在PTT通信中,例如,作为终端而利用收发器、以及对讲机等。在PTT通信中,在由用户按压设置在终端中的通话用的按钮的期间,用户能够对构成成组的对方发送语音。
此外,近年来,随着智能手机等能够支持多个用途的通信终端的普及,将包含语音数据的分组以广播方式向多个装置发送的PoC(即按即说(Push-to-Talk over Cellular))引起了关注。在PoC中,由构成组的多台通信终端中的1台通信终端取得用于发送语音数据的发送权。然后,由取得了发送权的通信终端向其他的通信终端以广播方式发送语音数据。
发明内容
在实现一对多的组同步语音通信的通信***中,可能会产生由于语音数据的接收者听错等而引起的信息的传递错误。因此,在这种通信***中,期待能够降低信息的传递错误的技术。
因此,本发明的目的在于,提供一种实现一对多的组同步语音通信且能够降低信息的传递错误的通信***、在该通信***中利用的信号处理装置、在该信号处理装置中实施的方法、在该信号处理装置中执行的程序、在该***中利用的通信终端中实施的方法、以及在该通信终端中执行的程序。
本发明涉及的信号处理装置将多个通信终端进行关联而作为集合,提供从属于所述集合的任一个通信终端向属于所述集合的其他通信终端的一对多通信。信号处理装置具有发送权赋予部、文本化处理部、以及通信控制部。发送权赋予部对属于所述集合的多个通信终端中的任一个提供作为对数据进行发送的权利的发送权。文本化处理部基于从具有所述发送权的通信终端发送的语音数据而生成文本数据,若生成所述文本数据则将文本化已完成之意通知给属于所述集合的多个通信终端。在所述文本化已完成之意的通知后,通信控制部将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个。
此外,本发明涉及的通信***具有多个通信终端、以及信号处理装置。信号处理装置将所述多个通信终端进行关联而作为集合,并提供从属于所述集合的任意一个通信终端向属于所述集合的其他通信终端的一对多通信。信号处理装置具有发送权赋予部、文本化处理部、以及通信控制部。发送权赋予部对属于所述集合的多个通信终端的任意一个提供作为发送数据的权利的发送权。文本化处理部基于从具有所述发送权的通信终端发送的语音数据而生成文本数据,若生成所述文本数据则将文本化已完成之意,通知给属于所述集合的多个通信终端。通信控制部在所述文本化已完成之意的通知后,将所述生成的文本数据发送给属于所述集合的多个通信终端的至少一个。
此外,本发明涉及的通信方法在信号处理装置中实施,所述信号处理装置将多个通信终端进行关联而作为集合,提供从属于所述集合的任意一个通信终端向属于所述集合的其他通信终端的一对多通信。通信方法具有:基于从属于所述集合的多个通信终端中的、被提供了作为发送数据的权利的发送权的通信终端发送的语音数据,生成文本数据的步骤;若生成所述文本数据则将文本化已完成之意通知给属于所述集合的多个通信终端的步骤;以及在所述文本化已完成之意的通知后,将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个的步骤。
此外,本发明涉及的通信方法是在属于通过多个通信终端进行了关联的集合多个通信终端间,实施一对多通信的通信终端中被实施。通信方法具有:接收从所述多个通信终端的其中一个发送的语音数据的文本化已完成之意的文本化完成通知的步骤;根据接收到的所述文本化完成通知,发送用于请求发送通过所述文本化而被生成的文本数据的请求信号的步骤;接收根据所述请求信号而被返回的文本数据的步骤;以及将基于接收到的所述文本数据的字符显示在显示部上的步骤。
附图说明
图1是表示本实施方式涉及的通信***的功能结构的块图。
图2是表示图1所示的处理服务器的功能结构的块图。
图3是表示图1所示的通信终端的功能结构的块图。
图4是用于说明在图1所示的通信***中实施语音通信时的、处理服务器以及通信终端的动作的图。
图5是示出在图1所示的存储部中存储的管理表的图。
图6是表示在图1所示的存储部中存储的利用者管理表的图。
图7是示出由图3所示的处理部生成的语音数据的结构的图。
图8是用于说明在图1所示的处理服务器生成文本数据、以及翻译文本数据时的动作的图。
图9是示出由图2所示的存储控制部生成的通话数据的结构的示意图。
图10是示出由图2所示的文本化处理部生成的文本数据的结构的图。
图11是示出由图2所示的翻译处理部生成的翻译文本数据的结构的图。
图12是用于说明在图1所示的通信终端使与语音对应的字符显示在显示器上时的处理服务器、以及通信终端的动作的图。
图13是示出通过图12所示的处理而被显示的字符的图。
图14是用于说明在图1所示的通信终端使显示器显示基于文本数据以及翻译文本数据的字符时的处理服务器、以及通信终端的动作的图。
图15是示出通过图14所示的处理而被显示在通信终端的字符的图。
图16是用于说明在图1所示的通信终端使显示器显示与语音对应的字符时的处理服务器、以及通信终端的动作的图。
图17是示出被显示在图1所示的通信终端的文本化完成通知的图。
图18是用于说明在图1所示的通信终端使显示器显示基于文本数据以及翻译文本数据的字符时的处理服务器、以及通信终端的动作的图。
图19是用于说明在图1所示的通信终端使与显示在显示器上的字符对应的语音被播放时的处理服务器、以及通信终端的动作的图。
图20是用于说明在图1所示的通信终端对显示在显示器上的字符进行修改时的处理服务器、以及通信终端的动作的图。
图21是用于说明在图1所示的通信终端使显示器显示被修改后的字符时的处理服务器、以及通信终端的动作的图。
图22是用于说明在图1所示的通信终端使显示器显示修改后被翻译的字符时的处理服务器、以及通信终端的动作的图。
具体实施方式
以下,参考附图说明实施方式。
图1是表示本实施方式涉及的通信***1的功能结构的例子的块图。图1所示的通信***1例如利用PoC(Push-to-Talk over Cellular)来实现以组为单位的一对多语音通信。图1所示的通信***1例如具有处理服务器10、通信终端20-1~20-m、以及基站30-1~30-n。
处理服务器10以及基站30-1~30-n经由互联网、以及由通信运营商提供的通信网等网络而连接。通信终端20-1~20-m与基站30-1~30-n中的、包含当前所在的位置而形成无线区域的基站进行无线连接。
处理服务器10是实施如下控制的信号处理装置,该控制用于将例如从通信终端20-1~20-m中的、具有发送权的通信终端发送的语音数据,以广播方式向与发送源的利用者参加同一谈话组的多个利用者所持的通信终端发送。在本实施方式中,所谓发送权是指,在PoC中,能够发送语音数据的权利。
图2是表示图1所示的处理服务器10的功能结构的例子的块图。图2所示的处理服务器10例如具有处理部11、存储部12、以及通信接口13。处理部11、存储部12、以及通信接口13例如经由总线以互相能够通信的方式被连接。
处理部11例如具有CPU(中央处理单元:Central Processing Unit)、在CPU执行处理时利用的第1存储器、以及设置在CPU与第1存储器之间的第2存储器。第1存储器是所谓的主存储装置,例如由DRAM(动态随机存取存储器:Dynamic Random Access Memory)构成。第2存储器是所谓的高速缓存存储器,例如由SRAM(静态随机存取存储器:Static RAM)构成。
CPU将例如存储在存储部12中的应用程序读入到第1存储器、以及第2存储器。CPU执行被读入到第1存储器、以及第2存储器的应用程序。由此,处理部11实现与应用程序对应的各种功能。
存储部12是用于存储各种信息的HDD(硬盘驱动器:hard disk drive)、以及SSD(固态驱动器:solid state drive)等具有非易失性的存储电路的、所谓的辅助存储装置。另外,存储部12也可以是在与CD-ROM、DVD、以及闪速存储器等可移动性存储介质之间读写各种信息的驱动装置等。存储部12存储本实施方式涉及的应用程序。
此外,存储部12按照来自处理部11的控制,存储与参加谈话组的利用者有关的利用者信息。此外,存储部12按照来自处理部11的控制,存储基于从具有发送权的通信终端发送的语音数据而生成的通话数据。此外,存储部12按照来自处理部11的控制,存储对通话数据进行文本化而获得的文本数据、以及由具有发送权的通信终端进行了修改的文本数据。此外,存储部12按照来自处理部11的控制,存储对文本数据进行了翻译而获得的翻译文本数据。
通信接口13是与网络连接的电路。通信接口13经由网络,向与基站30-1~30-n无线连接着的通信终端20-1~20-m中的至少任一个发送数据。此外,通信接口13经由网络,接收从与基站30-1~30-n无线连接着的通信终端20-1~20-m中的至少任一个发送的数据。
图2所示的处理部11通过执行被存储在存储部12的应用程序,实现与该应用程序对应的功能。例如,处理部11通过执行应用程序,实现注册处理部111、发送权赋予部112、通信控制部113、存储控制部114、文本化处理部115、以及翻译处理部116的功能。
图2所示的处理部11也可以组合多个CPU而形成。即,图2所示的注册处理部111、发送权赋予部112、通信控制部113、存储控制部114、文本化处理部115、以及翻译处理部116也可以通过例如由各CPU执行应用程序而实现。
此外,处理部11也可以由分别具有注册处理部111、发送权赋予部112、通信控制部113、存储控制部114、文本化处理部115、以及翻译处理部116的功能的专用硬件结构形成。此外,处理部11也可以由将分别具有注册处理部111、发送权赋予部112、通信控制部113、存储控制部114、文本化处理部115、以及翻译处理部116的功能的专用硬件电路进行了组合的专用集成电路(Application Specific Integrated Circuit:ASIC)、现场可编程门阵列(Field Programmable Gate Array:FPGA)、其他复合可编程逻辑器件(ComplexProgrammable Logic Device:CPLD)、或简单可编程逻辑器件(Simple ProgrammableLogic Device:SPLD)形成。
注册处理部111对参加实施一对多语音通信的谈话组的利用者进行册。具体地,例如注册处理部111基于来自通信终端20-1~20-m的请求,取得与参加规定的谈话组的利用者有关的信息即利用者信息。注册处理部111将所取得的利用者信息与要参加的谈话组进行关联而存储于存储部12、以及第1存储器。
利用者信息中,例如包含谈话组的ID、参加谈话组的利用者的ID、利用者所持的通信终端的IP地址、有关利用者所设定的语言的语言代码、利用者的登录状态、以及利用者所持的通信终端的位置信息等。注册处理部111在存储部12中存储表示哪个谈话组中参加哪个用户的定义信息,即,例如谈话组的ID、以及参加谈话组的利用者的ID。此外,注册处理部111向第一存储器存储根据通信终端20的状态而动态改变的信息,即,在第1存储器存储例如IP地址、语言代码、登录状态、以及位置信息等。
发送权赋予部112向参加了规定的谈话组的利用者所持的通信终端中的任一个提供发送权。
通信控制部113控制通信,以使在参加谈话组的利用者所持的通信终端间实现一对多语音通信。具体来说,例如,通信控制部113将从被提供了发送权的通信终端发送的语音数据向参加了同一谈话组的利用者所持的通信终端发送。
此外,通信控制部113控制通信,以使向参加谈话组的利用者所持的通信终端,发送从语音数据变换的文本数据。具体来说,例如,若语音数据被变换为文本数据,则通信控制部113将文本化已完成之意向参加了谈话组的利用者所持的通信终端发送。若从通信终端被请求发送文本数据,则通信控制部113将文本数据向请求源的通信终端发送。
此外,通信控制部113控制通信,以使向需要翻译的通信终端,发送将文本数据翻译为规定的语言的翻译文本数据。具体来说,例如,若文本数据的翻译完成,则通信控制部113将翻译已完成之意向参加了谈话组的利用者所持的通信终端发送。若被通信终端请求发送翻译文本数据,则通信控制部113向请求源的通信终端发送翻译文本数据。
此外,通信控制部113控制通信,以使在由具有发送权的通信终端修改了文本数据的情况下,向参加谈话组的利用者所持的通信终端发送被修改后的文本数据。具体来说,例如,若文本数据被具有发送权的通信终端修改,则通信控制部113向参加了谈话组的利用者所持的通信终端发送表示要更新显示之意。若从通信终端被请求发送修改后的文本数据,则通信控制部113向请求源的通信终端发送被修改后的文本数据。
此外,通信控制部113控制通信,以使向请求播放通话数据的通信终端发送通话数据。具体来说,例如,若被参加了谈话组的利用者请求播放通话数据,则通信控制部113向请求源的通信终端发送被存储于存储部12的通话数据。
存储控制部114对接收到的语音数据、以及被生成的各种数据的存储处理进行控制。具体来说,例如,存储控制部114将从具有发送权的通信终端发送来的语音数据保持在高速缓存存储器。此外,例如,存储控制部114将保持于高速缓存存储器中的规定所定容量的语音数据汇集,并将其作为通话数据而存储于存储部12。此外,例如,存储控制部114将从文本化处理部115取得的文本数据、以及被具有发送权的通信终端修改后的文本数据存储于存储部12。此外,例如,存储控制部114将由翻译处理部116生成的翻译文本数据存储于存储部12。此外,例如,存储控制部114根据请求而读取存储在存储部12中的通话数据、文本数据、以及翻译文本数据,并向请求源发送。
文本化处理部115将从具有发送权的通信终端发送来的语音数据向文本数据变换。具体来说,例如,文本化处理部115将保持在高速缓存存储器中的规定容量的语音数据,基于与语法相关的信息、与语言结构相关的信息、与语音数据的构成相关的信息、以及存储着的词汇信息等,变换为文本数据。另外,被文本化处理部115采用的语音-文本变换处理可以利用现有的技术。
翻译处理部116通过对被文本化处理部115变换后的文本数据实施翻译处理,生成翻译文本数据。具体来说,例如,翻译处理部116将被文本化处理部115变换后的文本数据,翻译为与和参加了谈话组的利用者进行了关联的语言代码对应的语言的文本数据。另外,被翻译处理部116采用的翻译处理可以利用统计机器翻译、以及神经网络机器翻译等现有的技术。
另外,处理服务器10也可以具有输入接口。就输入接口而言,例如通过鼠标、键盘、以及对操作面触摸从而被输入指示的触摸面板等实现。输入接口将来自操作者的输入指示变换为电信号,并将电信号向处理部11输出。另外,输入接口并不限于鼠标、以及键盘等物理性的操作设备。输入接口中,例如也可以包含用于受理从外部的输入设备输入的电信号的接收端口。
此外,处理服务器10也可以具有输出接口。输出接口例如通过显示设备、以及印刷设备等实现。作为显示设备,例如能够利用CRT显示器、液晶显示器、有机EL显示器、LED显示器、以及等离子显示器等任意的显示器。显示设备显示关于显示对象的图像数据。印刷设备例如是打印机。印刷设备将关于印刷对象的图像数据印刷于规定纸张。另外,输出接口并不限于显示设备、以及印刷设备等物理性的输出装置。输出接口中例如可以包含向外部的输出装置发送图像数据的发送端口。
基站30-1~30-n被设置于每个所定尺寸的区域,形成规定的无线区域。基站30-1~30-n与处于本自装置形成的无线区域内的通信终端20-1~20-m进行无线连接。
通信终端20-1~20-m是利用者所持的终端,例如是便携电话、智能手机、平板PC、以及规定的专用终端等。通信终端20-1~20-m经由处理服务器10,实施利用了PoC的一对多语音通信。例如,通信终端20-1~20-m按照来自利用者的操作,参加组谈话。通信终端20-1~20-m的任一个按照来自利用者的操作而取得发送权。取得了发送权的通信终端接受从利用者输入的语音,并将基于接受到的语音的语音数据,经由处理服务器10向参加同一组谈话的其他的通信终端发送。此外,通信终端20-1~20-m接收在处理服务器10中基于语音而生成的文本数据,并将基于文本数据的字符显示在本装置的显示器。
图3是表示图1所示的通信终端20的功能结构的例子的框图。图3所示的通信终端20例如具有处理部21、存储部22、输入接口23、输出接口24、通信接口25、以及GPS接收器26。另外,通信终端20-1~20-m的结构分别相同,因此在图3的说明中作为通信终端20进行说明。
处理部21例如具有CPU、以及作为在CPU执行处理时利用的主存储装置的、例如RAM(随机存取存储器:Random Access Memory)等易失性存储器。CPU将例如被存储在存储部22中的应用程序读取到RAM。CPU执行被读入到RAM的应用程序。由此,处理部21实现与应用程序对应的各种功能。
存储部22是NAND型、或者NOR型闪存存储器等具有非易失性存储电路的、所谓的辅助存储装置。另外,存储部22也可以是在与SD卡、以及微SD卡等可移动存储介质之间读写各种信息的驱动装置等。存储部22存储着本实施方式涉及的应用程序。此外,存储部22中存储有与本终端能够参加的组谈话有关的信息。
输入接口23例如通过按钮、对操作面进行触摸从而被输入指示的触摸面板、以及用于输入语音的麦克风等实现。输入接口23将来自操作者的输入指示变换为电信号,并将电信号向处理部21输出。
输出接口24例如通过显示设备、以及扬声器实现。作为显示设备,例如是液晶显示器、以及有机EL显示器等。显示设备对关于显示对象的图像数据进行显示。扬声器对伴随语音通信的语音数据进行播放。
通信接口25是与基站30-1~30-n进行无线连接的电路。通信接口25例如通过天线、以及无线部实现。天线接收所到达的无线信号。此外,发送从无线部输出的无线信号。无线部将通过天线接收到的无线信号按照预先设定的解调方式进行变换,将变换后的数据向处理部21输出。此外,无线部将在处理部21中生成的数据按照预先设定的调制方式变换为无线信号,并将变换后的无线信号向天线输出。
GPS接收器26接收从GPS卫星发送的信号,基于接收到的信号生成位置信息。
图3所示的处理部21通过执行存储于存储部22中的应用程序,实现与该应用程序对应的功能。例如,处理部21通过执行应用程序,实现通信控制部211、存储控制部212、显示控制部213、播放控制部214、朗读控制部215、以及修改控制部216的功能。
通信控制部211对与处理服务器10的通信进行控制。具体来说,例如,具有发送权的通信终端20的通信控制部211将从麦克风输入的语音,按照基于TCP/IP的专有协议进行变换。通信控制部211经由网络以及基站30向处理服务器10发送变换后的语音数据。此外,具有发送权的通信终端20的通信控制部211经由网络以及基站30接收从处理服务器10发送的文本数据。
此外,例如不具有发送权的通信终端20的通信控制部211接收从处理服务器10发送的语音数据、以及该语音数据被文本化后的文本数据。此外,在对不具有发送权的通信终端20设定的语言不同于对具有发送权的通信终端20设定的语言的情况下,通信控制部211从处理服务器10接收文本数据被翻译成被设定的语言的翻译文本数据。
存储控制部212对接收到的各种通知、文本数据、以及翻译文本数据的存储处理进行控制。具体来说,例如,若接收各种通知、文本数据、以及翻译文本数据,则存储控制部212使各种通知、文本数据、以及翻译文本数据存储于RAM等易失性存储器。在结束了用于执行利用了PoC的一对多语音通信的应用程序的执行时、以及关断了通信终端20的电源时等,易失性存储器中被存储的各种通知、文本数据、以及翻译文本数据从易失性存储器被消除。由此,能够避免信息泄露等危险。
显示控制部213控制对作为输出接口24的显示器的显示处理。具体来说,例如显示控制部213控制显示器,以使接收到的各种通知、以及基于接收到的文本数据以及翻译文本数据的字符显示在显示器。
播放控制部214对与在显示器上显示着的、基于文本数据的字符对应的语音的播放进行控制。具体来说,例如播放控制部214控制作为输出接口24的扬声器,以使其播放与在显示器上显示着的、基于文本数据的字符对应的通话数据。
朗读控制部215对在显示器上显示着的、基于翻译文本数据的字符的朗读进行控制。具体来说,例如在有对于在显示器上显示着的、基于翻译文本数据的字符的朗读请求的情况下,朗读控制部215将成为请求的对象的字符变换为语音数据。然后,朗读控制部215控制作为输出接口24的扬声器,以使其播放变换后的语音数据。另外,朗读控制部215可以通过例如由OS(操作***:Operating System)提供的API(应用程序接口:ApplicationProgram Interface)来实现。
修改控制部216对在显示器上显示着的字符的修改处理进行控制。具体来说,例如修改控制部216根据对于在显示器上显示着的字符的修改请求,对显示着的字符进行修改,并将修改后的文本数据发送给处理服务器10。
接着,说明如以上构成的通信***1中的处理服务器10、以及通信终端20-1~20-m的动作。另外,以下,以通信终端20-1~20-3参加谈话组G1并利用语音通信的情况为例进行说明。
图4是用于说明在图1所示的通信***1中实施语音通信时的、处理服务器10、以及通信终端20-1~20-3的动作的例的图。另外,在图4的说明中,在通信终端20-1~20-3的存储部22中,存储着有关谈话组G1的信息。即,通信终端20-1~20-3成为能够参加谈话组G1的状态。
首先,通信终端20-1~20-3的利用者操作通信终端20-1~20-3,启动用于执行利用了PoC的一对多语音通信的应用程序(步骤S41)。通信终端20-1~20-3的显示控制部213在作为输出接口24的显示器例如显示谈话组G1作为可选择的谈话组(步骤S42)。另外,显示器上也可以显示有可参加的多个谈话组。
通信终端20-1~20-3的利用者选择在显示器上被显示的谈话组G1。另外,也可以基于参加频度以及利用者的设定等,由通信终端20-1~20-3的处理部21自动选择要参加的谈话组G1。若谈话组G1被选择,则通信终端20-1~20-3的显示控制部213使显示器显示在本服务中能够使用的语言的列表。通信终端20-1~20-3的利用者在显示器上被显示的多个语言中,选择期望使用的语言(步骤S43)。此外,若谈话组G1被选择,则通信终端20-1~20-3的处理部21使GPS接收器26生成在谈话组被选择时的位置信息。
若谈话组以及使用语言被选择,则通信终端20-1~20-3的通信控制部211生成包含如下信息的信息数据:被选择的谈话组的ID(以下,称为谈话组ID)、对本终端设定的ID(以下,称为用户ID)、有关被选择的语言的信息(以下,称为语言代码)、以及所取得的位置信息等。信息数据例如具有分组结构。通信终端20-1、20-2经由基站30-1、以及网络NW,将所生成的信息数据向处理服务器10发送(步骤S44)。此外,通信终端20-3将所生成的信息数据经由基站30-2、以及网络NW向处理服务器10发送(步骤S44)。
处理服务器10的注册处理部111基于从通信终端20-1~20-3发送来的信息数据,将参加谈话组的利用者与参加的谈话组进行关联而存储在存储部12、以及处理部11的第1存储器(步骤S45)。具体来说,例如,注册处理部111基于信息数据,更新在存储部12中存储的、用于对参加谈话组的利用者进行管理的管理表。图5是表示在图1所示的存储部12中存储的管理表的例的图。在图5所示的管理表中,正在管理三个谈话组。例如,存储着在谈话组ID:组01(Group01)的谈话组G1中参加了作为通信终端20-1~20-3的利用者的、用户ID:用户01~03(User01~03)的情况。
此外,注册处理部111基于从通信终端20-1~20-3发送来的信息数据,将与参加谈话组的利用者有关的信息存储在处理部11的第1存储器。具体来说,例如,注册处理部111基于信息数据,对存储在第1存储器中的、用于管理动态地变化的利用者的信息的利用者管理表。图6是表示图1所示的处理部11的第1存储器中存储着的利用者管理表的例的图。在图6所示的利用者管理表中,正在管理与参加于谈话组的利用者有关的信息。例如,用户01与通信终端20-1的IP地址01、例如表示日语的语言代码01、以及位置信息01关联。此外,用户02与通信终端20-2的IP地址02、语言代码01,以及、以及位置信息02关联。此外,用户03与通信终端20-3的IP地址03、例如表示英语的语言代码02、以及位置信息03关联。
另外,处理服务器10没必要一定取得通信终端20-1~20-3的位置信息。此时,通信终端20-1~20-3也可以不生成位置信息。此外,从通信终端20-1~20-3向处理服务器10发送的信息数据中,也可以不包含位置信息。
若谈话组、以及使用语言被选择,则通信终端20-1~20-3的显示控制部213在显示器上显示PTT通话开始请求按钮(步骤S46)。通信终端20-1的利用者例如按下在通信终端20-1的显示器上被显示的PTT通话开始请求按钮(步骤S47)。若利用者按下PTT通话开始请求按钮,则通信终端20-1的通信控制部211对用于请求取得发送权的发送权取得请求通知赋予用户ID,经由基站30-1、以及网络NW向处理服务器10发送(步骤S48)。另外,PTT通话开始请求按钮并不限于显示在显示器上。PTT通话开始请求按钮也可以是例如设置于以通信终端20-1的输入接口23作为连接器而连接的操作设备的物理按钮。
若接收从通信终端20-1发送的发送权取得请求通知,则处理服务器10的发送权赋予部112向通信终端20-1赋予发送权(步骤S49)。若取得发送权,则通信终端20-1的利用者从通信终端20-1的麦克风输入语音(步骤S410)。通信终端20-1的通信控制部211基于从麦克风输入的语音生成语音数据(步骤S411)。语音数据具有例如遵照基于TCP/IP的专有协议的分组结构。
图7是表示图3所示的处理部21生成的语音数据的结构的例子的示意图。图7所示的语音数据具有存储谈话组ID的区域、存储发言者ID的区域、存储时间戳的区域、存储数据长度的区域、以及存储实际数据的区域。通信终端20-1的通信控制部211例如在存储谈话组ID的区域存储组01,在存储发言者ID的区域存储用户01,在存储时间戳的区域存储发言开始时刻,在存储实际数据的区域存储与规定的帧数量相应的语音的数字数据,在存储数据长度的区域存储语音的数字数据的数据长度。发言开始时刻表示开始了通话的时刻。具体来说,通信控制部211例如设定利用者按下PTT通话开始请求按钮的时刻作为通话开始时刻。
通信终端20-1将所生成的语音数据经由基站30-1、以及网络NW向处理服务器10发送(步骤S412)。
若接收从具有发送权的通信终端20-1发送的语音数据,则处理服务器10的通信控制部113实施用于将语音数据向参加组谈话G1的通信终端20-2、20-3转发的控制(步骤S413)。具体来说,例如若接收从通信终端20-1发送的语音数据,则通信控制部113判断在语音数据中被存储的发言者ID:用户01与赋予了发送权的用户ID:用户01是否一致。由于在语音数据中被存储的发言者ID与赋予了发送权的用户ID一致为用户01,因此通信控制部113将语音数据复制与参加组谈话G1的利用者的人数相应的数量。通信控制部113参考通信终端20-2、20-3的IP地址而发送所复制的语音数据(步骤S414)。
若接收从处理服务器10发送的语音数据,则通信终端20-2、20-3的通信控制部211播放所接收的语音数据,并将其作为语音从扬声器输出(步骤S415)。由此,建立PTT通话即PoC通信。
图8是用于说明在图1所示的处理服务器10生成文本数据、以及翻译文本数据时的动作的例子的图。
若接收从通信终端20-1发送的语音数据,则处理服务器10在图4的步骤S413中执行通信控制,并执行图8所示的处理。具体来说,若接收从信终端20-1发送的语音数据,则处理服务器10的存储控制部114将接收到的语音数据保持于高速缓存存储器(步骤S81)。存储控制部114将从通信终端20-1发送的语音数据依次保持于高速缓存存储器。
若在高速缓存存储器中保持预先设定的容量的语音数据,或者通话在预先设定的容量到达前结束,则存储控制部114基于在高速缓存存储器中保持着的多个语音数据而生成通话数据(步骤S82)。在本实施方式中,预先设定的容量例如是相当于约20秒的语音程度的容量。
图9是表示图2所示的存储控制部114生成的通话数据的结构的例子的示意图。图9所示的通话数据具有存储谈话组ID的区域、存储发言者ID的区域、存储语音ID的区域、存储通话ID的区域、存储时间戳的区域、存储数据长度的区域、以及存储实际数据的区域。语音ID是用于识别发言者所发起的通话的特定的ID。通话ID是在发言者所发起的通话跨越多个通话数据的情况下,用于识别构成一个通话的多个通话数据中的第几个通话数据的特定的ID。对通话ID,按照其生成早的通话数据的顺序,例如被设定0、1、2、…。时间戳包括发言开始时刻、以及发言结束时刻。发言结束时刻表示发言者所发起的通话结束的时刻。在发言者发起的通话跨越多个通话数据的情况下,时间戳中包含通话数据生成时刻而替代发言结束时刻。通话数据生成时刻表示分隔了通话时的时刻,例如表示基于多个语音数据而生成通话数据时的时刻。
具体来说,例如,若高速缓存存储器中保持着的、谈话组ID为组01且发言者ID为用户01的语音数据的容量达到预先设定的容量,则存储控制部114设定语音ID:谈话01(Talk01)。此外,存储控制部114设定表示是针对谈话01的最初的通话数据的通话ID:0。此外,存储控制部114基于在语音数据中包含的、表示发言开始时刻的时间戳,设定时间戳:时间S1(TimeS1)。此外,存储控制部114基于生成通话数据时的时刻,设定时间戳:时间E1(TimeE1)。存储控制部114通过将对应的数据存储在规定的区域而生成通话数据。即,存储控制部114通过将组01、用户01、谈话01、0、时间S1、时间E1、以及在高速缓存存储器中保持着的规定容量的多个语音数据中包含的数据长度以及实际数据存储在对应的各区域,从而生成通话数据。存储控制部114将所生成的通话数据存储在存储部12。
此外,若在高速缓存存储器中保持着的、谈话组ID为组01且发言者ID为用户01的语音数据的容量达到预先设定的容量之前发送权被释放,则存储控制部114设定语音ID、通话ID、以及时间戳。发送权的释放通过在具有发送权的通信终端20-1中由利用者例如从PTT通话开始请求按钮拿开手指而实现。例如,若利用者从PTT通话开始请求按钮拿开手指,则从通信终端20-1向处理服务器10发送发送权释放请求通知。若接收发送权释放请求通知,则处理服务器10的发送权赋予部112释放通信终端20-1所具有的发送权。另外,用于取得或者释放发送权的动作并不限于按下PTT通话开始请求按钮、或者放开PTT通话开始请求按钮。
例如若接收发送权释放请求通知,则处理服务器10的存储控制部114将接收到发送权释放请求通知的时刻作为发言结束时刻来设定。存储控制部114基于所设定的发言结束时刻,设定时间戳:时间E1。存储控制部114从高速缓存存储器读取谈话组ID为组01且发言者ID为用户01的多个语音数据。存储控制部114通过在用于存储谈话组ID、发言者ID、语音ID、通话ID、以及时间戳的区域分别存储数据,并将所读取的语音数据中包含的数据长度以及实际数据存储在规定的区域,从而生成通话数据。存储控制部114将所生成的通话数据存储在存储部12。由于通话数据被附加包含发言开始时刻、以及发言结束时刻等的时间戳而被存储,因此利用者能够将发言开始时刻、以及发言结束时刻等时刻信息作为检索通话数据时的检索关键词来利用。
若在高速缓存存储器中保持预先设定的容量的语音数据,或者通话在到达预先设定的容量前结束,则处理服务器10的文本化处理部115基于在高速缓存存储器中保持着的多个语音数据,生成文本数据(步骤S83)。
图10是表示图2所示的文本化处理部115生成的文本数据的结构的例子的示意图。图10所示的文本数据具有用于存储谈话组ID的区域、存储文本ID的区域、存储语音ID的区域、存储通话ID的区域、以及存储文本实际数据的区域。语音ID被设定与被实施了文本化处理的通话数据相同的ID。通话ID被设定与被实施了文本化处理的通话数据相同的ID。
具体来说,例如若高速缓存存储器中保持着的、谈话组ID为组01且发言者ID为用户01的语音数据的容量达到预先设定的容量,则文本化处理部115读取这些语音数据。文本化处理部115基于针对在图6中与用户01进行了关联的语言代码01即日语的、与语法有关的信息、与语言结构有关的信息、与语音数据的组成有关的信息、以及存储着的单词信息等,将所读取的语音数据中包含的实际数据变换为文本实际数据。若将实际数据变换为文本实际数据,则文本化处理部115设定文本ID:文本01(Text01)。文本化处理部115通过将对应的数据存储在规定的区域,生成文本数据。即,文本化处理部115通过将组01、文本01、谈话(Talk)01、以及文本实际数据存储到对应的各区域,从而生成文本数据。
此外,若在高速缓存存储器中保持着的、谈话组ID为组01且发言者ID为用户01的语音数据的容量达到预先设定的容量前发送权被释放,则文本化处理部115从高速缓存存储器读取谈话组ID为组01且发言者ID为用户01的多个语音数据。文本化处理部115基于在读取到的语音数据中包含的实际数据,生成文本数据。
若生成文本数据,则文本化处理部115将文本化已完成之意通知给通信控制部113(步骤S84)。在文本化已完成之意的通知中,例如包含有所生成的文本数据的文本ID。若接受到语音数据集合的文本化已完成之意的通知,则通信控制部113经由网络NW、以及基站30-1,向参加谈话组G1的通信终端20-1~20-3发送文本化已完成之意的通知(步骤S85)。另外,通信控制部113向被设定了与用户01不同的语言代码的用户03所持的通信终端20-3,也可以将文本化已完成之意的通知与后述的翻译已完成之意的通知一并发送。此外,通信控制部113向通信终端20-3,也可以不发送文本化已完成之意的通知。
另外,在图8的例子中,说明向参加了谈话组G1的通信终端20-1~20-3发送文本化完成通知的情况下的处理。但是,并不限于此。文本化完成通知还可以向虽然未参加谈话组G1但能够参加谈话组G1的通信终端发送。此时,处理服务器10的存储部12例如存储每个谈话组的能够参加的利用者的列表。处理服务器10的通信控制部113参考在存储部12中存储着的列表,向能够参加谈话组G1的利用者发送文本化完成通知。
此外,文本化完成通知也可以被发送给在能够参加谈话组G1的通信终端中的、满足规定的条件的通信终端。规定的条件例如是,基于在存储部12中存储着的通信终端的位置信息,位于离具有发送权的通信终端规定的距离内、以及被赋予规定的标记等。
所生成的文本数据被输出到存储控制部114、以及翻译处理部116(步骤S86)。存储控制部114将在文本化处理部115中生成的文本数据存储在存储部12(步骤S87)。
翻译处理部116通过对在文本化处理部115中生成的文本数据实施翻译处理,从而生成翻译文本数据(步骤S88)。
图11是表示图2所示的翻译处理部116生成的翻译文本数据的结构的例子的示意图。图11所示的翻译文本数据具有用于存储文本ID的区域、存储语言代码的区域、以及存储翻译文本实际数据的区域。语言代码表示与翻译文本实际数据对应的语言。文本ID针对翻译源的文本数据和翻译文本数据被设定同一ID。
具体来说,例如,翻译处理部116从在文本化处理部115中生成的文本数据读取文本实际数据。翻译处理部116将读取到的文本实际数据,翻译为与不同于用户01的语言代码的所有的语言代码即在图6中为语言代码02对应的语言、即英语的文本实际数据。翻译处理部116通过将对应的数据存储在规定的区域,从而生成翻译文本数据。即,翻译处理部116通过将文本01、语言代码02、以及翻译文本实际数据存储在对应的各区域,从而生成翻译文本数据。
若生成翻译文本数据,则翻译处理部116将翻译已完成之意通知给通信控制部113(步骤S89)。在翻译已完成之意的通知中,例如包含有所生成的翻译文本数据的文本ID、以及语言代码。若接受到翻译已完成之意的通知,则通信控制部113经由网络NW、以及基站30-3,向被设定了不同于用户01的语言代码的用户03所持的通信终端20-3发送翻译已完成之意的通知(步骤S810)。另外,在步骤S85中,在文本化完成通知未被发送给通信终端20-3的情况下,也可以与翻译完成通知一并将文本化完成通知发送给通信终端20-3。所生成的翻译文本数据被输出到存储控制部114(步骤S811)。存储控制部114将在翻译处理部116中生成的翻译文本数据存储在存储部12(步骤S812)。步骤S81~步骤S812所示的处理被反复进行,直到通话结束。
另外,在图8所示的例子中,说明了在每次文本化处理完成时,文本化完成通知被发送给通信终端的情况。但是,并不限于此。向虽然没有参加谈话组但能够参加该谈话组的通信终端,也可以在通话结束后,仅发送一次文本化完成通知。由此,利用者能够识别存在与通话对应的文本数据。
接着,说明通信终端20-1~20-3中的文本数据以及翻译文本数据的显示。在本实施方式中,通信终端20-1~20-3的显示形式中,例如有第1显示形式和第2显示形式。第1显示形式是PTT通话开始请求按钮以及与被派送的语音对应的字符一并被显示的形式。第2显示形式是,PTT通话开始请求按钮被显示,另一方面与语音对应的字符不被显示的形式。就显示形式是第1显示形式还是第2显示形式而言,基于利用者的设定。以下,首先说明第1显示形式,之后说明第2显示形式。
图12是用于说明在图1所示的通信终端20-1、20-2使与语音对应的字符显示于显示器时的处理服务器10、以及通信终端20-1、20-2的动作的例子的图。另外,在图12中,以被设定了第1显示形式的情况为例进行说明。
具有发送权的通信终端20-1、以及被设定与通信终端20-1相同的语言代码的通信终端20-2从处理服务器10接收文本化完成通知(步骤S121)。此时,在文本化完成通知中,包含与文本化已完成的文本数据有关的文本ID。在图12的说明中,接着图8的说明,设文本ID:文本01被包含在文本化完成通知中。
若接收文本化完成通知,则通信终端20-1的通信控制部211经由基站30-1、以及网络NW向处理服务器10发送用于请求包含了文本ID:文本01的文本数据之意的文本数据请求通知(步骤S122)。此时,对文本数据请求通知,附加作为请求源的通信终端20-1的用户ID:用户01。此外,通信终端20-2的通信控制部211针对用于请求包含有文本ID:文本01的文本数据之意的文本数据请求通知,附加通信终端20-2的用户ID:用户02而发送给处理服务器10(步骤S122)。
若接收文本数据请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本01的文本数据(步骤S123)。处理服务器10的通信控制部113将从存储部12读取到的文本数据变换为分组形式的数据(步骤S124)。通信控制部113将被变换为分组形式数据复制与在文本数据请求通知中被附加的用户ID相应的数量。通信控制部113向利用用户ID而确定的IP地址发送所复制的数据(步骤S125)。由此,被变换为分组形式的文本数据被发送给通信终端20-1、20-2。
若接收从处理服务器10发送的文本数据,则通信终端20-1、20-2的存储控制部212将接收到的文本数据存储于RAM。通信终端20-1、20-2的显示控制部213从在RAM中存储着的文本数据读取文本实际数据。显示控制部213在与由谈话组ID:组01识别的谈话组G1有关的显示画面,显示基于读取到的文本实际数据的字符作为与语音ID:谈话01对应的字符(步骤S126)。
此时,通信终端20-1的显示控制部213基于语音ID:谈话01,识别本通话是本装置发起的通话。显示控制部213以能够识别是本装置发起的通话的方式,将字符显示于显示器。作为能够识别是本装置发起的通话方式,可以采用例如改变显示位置、改变显示颜色、以及改变字体等任意的方法。
图13是表示经过图12所示的处理而被显示的字符的例子的示意图。图13的左图是表示具有发送权的通信终端20-1的显示器的显示例的示意图。图13的右图是表示作为接收者终端的通信终端20-2的显示器的显示例的示意图。在图13中,在通信终端20-1中,字符L1被显示在显示器的右端。另一方面,在通信终端20-2,字符L2被显示在显示器的左端。另外,在图13中,以PTT通话开始请求按钮B1被显示在显示器的左下侧的情况为例而示出,但PTT通话开始请求按钮B1的显示位置并不限于此。只要是利用者能够容易触摸的位置,则不受限制。
图14是用于说明图1所示的通信终端20-3使基于文本数据以及翻译文本数据的字符显示在显示器时的处理服务器10、以及通信终端20-3的动作的例子的图。另外,在图14中,以被设定第1显示形式的情况为例进行说明。
与通信终端20-1相比被设定了不同的语言代码的通信终端20-3从处理服务器10接收文本化完成通知、以及翻译完成通知(步骤S141)。此时,在文本化完成通知中包含有与文本化已完成的文本数据有关的文本ID。此外,在翻译完成通知中,包含有与翻译已完成的翻译文本数据有关的文本ID、以及在翻译中所利用的语言代码。在图14的说明中,接着图8中的说明,设文本ID:文本01被包含在文本化完成通知中。此外,设文本ID:文本01、以及语言代码:语言代码02被包含在翻译完成通知中。
若接收文本化完成通知、以及翻译完成通知,则通信终端20-3的通信控制部211经由基站30-2、以及网络NW向处理服务器10发送用于请求包含了文本ID:文本01的文本数据、以及、包含了文本ID:文本01和语言代码:语言代码02的翻译文本数据之意的请求通知(步骤S142)。此时,对请求通知,附加有作为请求源的通信终端20-3的用户ID:用户03。
若接收请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本01的文本数据、以及包含有文本ID:文本01和语言代码:语言代码02的翻译文本数据(步骤S143)。处理服务器10的通信控制部113将从存储部12读取到的文本数据以及翻译文本数据变换为分组形式的数据(步骤S144)。通信控制部113将变换为分组形式的数据复制与对文本数据请求通知附加的用户ID相应的量。通信控制部113向利用用户ID而确定的IP地址发送所复制的数据(步骤S145)。由此,向通信终端20-3发送变换为分组形式的文本数据以及翻译文本数据。
若接收从处理服务器10发送的文本数据以及翻译文本数据,则通信终端20-3的存储控制部212将所接收到的文本数据以及翻译文本数据存储于RAM。通信终端20-3的显示控制部213从在RAM中存储着的文本数据以及翻译文本数据分别读取文本实际数据以及翻译文本实际数据。显示控制部213在与由谈话组ID:组01识别的谈话组G1有关的显示画面上显示基于文本实际数据以及翻译文本实际数据的字符作为与语音ID:谈话01对应的字符(步骤S146)。
图15是表示经过图14所示的处理被显示在通信终端20-3的字符的例子的示意图。在图15中,在作为接收者终端的通信终端20-3,字符L3被显示在显示器的左端。此外,字符L3中,包含有基于文本实际数据的字符、以及基于翻译文本实际数据的字符。另外,基于文本实际数据的字符、以及基于翻译文本实际数据的字符的显示也可以不显示在一个区域。例如,这些字符也可以显示在不同的区域。
另外,在图14中,以通信终端20-3同时接收文本化完成通知、以及翻译完成通知的情况为例进行了说明。但是,如在图8的例子中所说明,有时翻译完成通知迟于文本化完成通知而发送。这样的情况下,通信终端20-3的通信控制部211也可以在文本化完成通知的接收中将文本数据的请求通知不发送给处理服务器10,等待接收了翻译完成通知后发送文本数据、以及翻译文本数据的请求通知。
此外,在翻译完成通知迟于文本化完成通知而发送的情况下,通信终端20-3的通信控制部211也可以根据文本化完成通知的接收而向处理服务器10发送文本数据的请求通知,根据翻译完成通知的接收而向处理服务器10发送翻译文本数据的请求通知。
接着,说明被设定了第2显示形式的情况下的动作。图16是用于说明图1所示的通信终端20-1、20-2使与语音对应的字符显示在显示器时的处理服务器10、以及通信终端20-1、20-2的动作的例子的图。
具有发送权的通信终端20-1、以及被设定了与通信终端20-1相同的语言代码的通信终端20-2从处理服务器10接收文本化完成通知(步骤S161)。在图16的说明中,设文本ID:文本06被包含在文本化完成通知中。
若接收文本化完成通知,则通信终端20-1、20-2的显示控制部213在显示器上显示文本化已完成之意,以便其与显示在显示器上的PTT通话开始请求按钮不重叠(步骤S162)。图17是表示在图1所示的通信终端20-1、20-2上的文本化完成通知的例子的示意图。根据图17,文本化已完成之意作为“有未读文本。”而被通知。另外,文本化已完成之意也可以通过记号等来表示。另外,在图17中,以PTT通话开始请求按钮B2被显示在显示器的中央的情况为例而示出,但PTT通话开始请求按钮B2的显示位置并不限于此。只要是利用者能够容易触摸的位置,则不受限制。
若观看到在显示器上显示的文本化完成通知,则通信终端20-1、20-2的利用者判断是否需要显示与语音对应的字符。在判断为需要显示字符的情况下,利用者从输入接口23输入字符的显示请求(步骤S163)。例如,利用者触摸在显示器上被显示的文本化完成通知的显示区域。
若从利用者被输入字符显示请求,则通信终端20-1的通信控制部211经由基站30-1、以及网络NW向处理服务器10发送从包含有文本ID:文本06的文本数据起请求开始字符显示之意的显示开始请求通知。此时,对显示开始请求通知,附加有作为请求源的通信终端20-1的用户ID:用户01。此外,若从利用者输入字符显示请求,则通信终端20-2的通信控制部211对用于从包含有文本ID:文本06的文本数据起开始字符显示之意的显示开始请求通知附加通信终端20-2的用户ID:用户02而发送给处理服务器10(步骤S164)。
若接收显示开始请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本06的文本数据,并取得在所读取到的文本数据中包含着的例如谈话组ID。存储控制部114从存储部12读取与预先设定的数据相应量的、包含有与所取得的谈话组ID相同的谈话组ID的文本数据(步骤S165)。此时,与预先设定的数据相应量是指,例如,包含有文本ID:文本06的文本数据以前被存储了的、预先设定的个数的文本数据。即,例如,从存储部12,读取包含有文本ID:文本01~文本06的文本数据。
处理服务器10的通信控制部113将从存储部12读取到的多个文本数据依次变换为分组形式的数据(步骤S166)。通信控制部113将变换为分组形式的数据,复制与对显示开始请求通知附加的用户ID相应的数量。通信控制部113向利用用户ID而确定的IP地址发送所复制的数据(步骤S167)。由此,向通信终端20-1、20-2发送被变换为分组形式的多个文本数据。
若接收从处理服务器10发送的多个文本数据,则通信终端20-1、20-2的存储控制部212将接收到的文本数据依次存储于RAM。若在RAM存储文本数据,则通信终端20-1、20-2的显示控制部213从文本数据读取文本实际数据。显示控制部213将基于读取到的文本实际数据的字符显示在与由规定的谈话组ID识别的谈话组有关的显示画面(步骤S168)。
另外,在图16的例子中,说明了参加了谈话组G1的通信终端20-1、20-2接收了文本化完成通知时的处理。但是,并不限于此。文本化完成通知还可被发送给虽然没有参加谈话组G1但能够参加谈话组G1的通信终端。在文本化完成通知被发送给虽然能够参加谈话组G1但实际没有参加的通信终端的情况下,在通信终端中,在谈话组G1中文本化已完成之意可以被显示为例如“谈话组G1中有未读的文本。”。另外,在谈话组G1中文本化已完成之意也可以通过记号等示于通信终端的显示器上的、与谈话组G1对应的位置。由此,即使在没有参加谈话组的情况下,利用者也能够通过字符来确认能够参加的谈话组中的通话。另外,在没有参加谈话组G1的利用者通过字符来确认谈话组G1的通话内容的情况下,也可以使该利用者参加谈话组G1。
图18是用于说明图1所示的通信终端20-3使基于文本数据以及翻译文本数据的字符显示在显示器时的处理服务器10、以及通信终端20-3的动作的例子的图。
在图18中,被设定了与通信终端20-1不同的语言代码的通信终端20-3从处理服务器10接收文本化完成通知、以及翻译完成通知(步骤S181)。在图18的说明中,设文本ID:文本06被包含在文本化完成通知中。此外,设文本ID:文本06、以及语言代码:语言代码02被包含在翻译完成通知中。
若接收文本化完成通知、以及翻译完成通知,则通信终端20-3的显示控制部213将文本化、以及翻译处理已完成之意以不与显示在显示器上的PTT通话开始请求按钮重叠的方式显示在显示器上(步骤S182)。
另外,如在图8所示的例子中说明,通信终端20-3有同时接收文本化完成通知以及翻译完成通知的情况、以及翻译完成通知迟于文本化完成通知接收的情况。在同时接收文本化完成通知以及翻译完成通知的情况下,通信终端20-3的显示控制部213根据文本化完成通知以及翻译完成通知的接收,显示文本化已完成之意、以及翻译处理已完成之意。此时,显示控制部213也可以仅通过文本化已完成之意的显示,还表示翻译处理已完成。
此外,在翻译完成通知迟于文本化完成通知而被接收的情况下,通信终端20-3的显示控制部213根据文本化完成通知的接收而显示文本化已完成之意,并根据翻译完成通知的接收而显示翻译处理已完成之意。此外,显示控制部213也可以在文本化完成通知的接收中不显示文本化已完成之意,而根据翻译完成通知的接收而显示文本化已完成之意、以及翻译处理已完成之意。此时,显示控制部213也可以仅通过文本化已完成之意的显示,还表示翻译处理已完成。
若看到在显示器上显示的文本化完成通知、以及翻译完成通知,则通信终端20-3的利用者判断是否需要显示与语音对应的字符、以及该字符的翻译。在判断为需要显示字符以及翻译的情况下,利用者从输入接口23输入字符以及翻译的显示请求(步骤S183)。例如,利用者触摸在显示器上显示的文本化完成通知、以及翻译完成通知的显示区域。
若由利用者输入字符以及翻译的显示请求,则通信终端20-3的通信控制部211经由基站30-1、以及网络NW向处理服务器10发送从包含有文本ID:文本06的文本数据、以及包含有文本ID:文本06和语言代码:语言代码02的翻译文本数据起请求开始字符显示之意的显示开始请求通知(步骤S184)。此时,显示开始请求通知被附加了作为请求源的通信终端20-3的用户ID:用户03。
若接收显示开始请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本06的文本数据,取得所读取到的文本数据中所包含的、例如谈话组ID。存储控制部114从存储部12读取与预先设定的数据相应量的、包含有与所取得的谈话组ID相同的谈话组ID的文本数据。此时,与预先设定的数据相应量表示例如包含有文本ID:文本06的文本数据以前被存储的、预先设定的个数的文本数据。即,例如从存储部12读取包含有文本ID:文本01~文本06的文本数据。此外,存储控制部114从存储器12读取包含与在所读取到的多个文本数据中包含的文本ID相同的文本ID、以及语言代码:语言代码02的翻译文本数据(步骤S185)。也就是说,例如,从存储部12,读取包含有文本ID:文本01~文本06、以及语言代码:语言代码02的翻译文本数据。
处理服务器10的通信控制部113将从存储部12读取到的文本数据以及翻译文本数据依次变换为分组形式的数据(步骤S186)。通信控制部113将变换为分组形式的数据复制与对显示开始请求通知附加的用户ID相应的数量。通信控制部113向利用用户ID而确定的IP地址发送所复制的数据(步骤S187)。由此,向通信终端20-3发送被变换为分组形式的多个文本数据以及翻译文本数据。
若接收从处理服务器10发送的多个文本数据以及翻译文本数据,则通信终端20-3的存储控制部212将接收到的文本数据以及翻译文本数据依次存储于RAM。通信终端20-3的显示控制部213从在RAM存储着的、被附加了同一文本ID的文本数据以及翻译文本数据,分别读取文本实际数据以及翻译文本实际数据。显示控制部213将基于读取到的文本实际数据以及翻译文本实际数据的字符显示在与由规定的谈话组ID识别的谈话组有关的显示画面(步骤S188)。
另外,在图14以及图18以从处理服务器10向被设定了与具有发送权的通信终端20-1不同的语言的通信终端20-3发送文本化完成通知以及翻译完成通知的情况为例进行了说明。但是,并不限于此。有时从处理服务器10向通信终端20-3仅发送翻译完成通知。在这样的情况下,在通信终端20-3的显示器仅显示基于翻译文本数据的字符。
接着,说明与在通信终端20-1、20-2的显示器显示的字符对应的语音的播放。
图19是用于说明图1所示的通信终端20-1、20-2播放与在显示器显示着的字符对应的语音时的处理服务器10、以及通信终端20-1、20-2的动作的例子的图。
首先,在通信终端20-1、20-2的显示器显示有字符(步骤S191)。在图19的说明中,设在与显示器显示着的字符有关的文本数据中包含有语音ID:谈话01、以及通话ID:0。通信终端20-1、20-2的利用者在想要播放在显示器显示着的字符对应的语音的情况下,从输入接口23输入字符的播放请求(步骤S192)。例如,利用者触摸在显示器显示的字符的显示区域。
若从利用者输入与字符对应的语音的播放请求,则通信终端20-1的通信控制部211经由基站30-1、以及网络NW向处理服务器10发送用于请求播放包含有语音ID:谈话01、通话ID:0的通话数据之意的播放请求通知。此时,播放请求通知被附加了作为请求源的通信终端20-1的用户ID:用户01。此外,若从利用者输入与字符对应的语音的播放请求,则通信终端20-2的通信控制部211对请求播放包含有语音ID:谈话01、通话ID:0的通话数据之意的播放请求通知附加通信终端20-2的用户ID:用户02,从而将其发送给处理服务器10(步骤S193)。
若接收播放请求通知,则处理服务器10的存储控制部114从存储部12读取包含有语音ID:谈话01、通话ID:0的通话数据。处理服务器10的通信控制部113根据需要,将从存储部12读取到的通话数据变更其结构,并变换为分组形式的数据(步骤S195)。通信控制部113将变换为分组形式的数据复制与请求源对应的数量。通信控制部113向利用用户ID确定的IP地址发送所复制的数据(步骤S196)。由此,变换为分组形式的通话数据被发送给通信终端20-1、20-2。
若接收从处理服务器10发送的通话数据,则通信终端20-1、20-2的存储控制部212将接收到的通话数据存储于RAM。通信终端20-1、20-2的播放控制部214从存储在RAM中的通话数据读取实际数据,基于读取到的实际数据来控制扬声器(步骤S197)。
接着,说明具有发送权的通信终端20-1修改与语音对应的字符时的处理。
图20是用于说明在图1所示的通信终端20-1修改在显示器上显示的字符时的处理服务器10、以及通信终端20-1的动作的例子的图。
首先,在具有发送权的通信终端20-1、以及与通信终端20-1参加同一谈话组G1的通信终端20-2、20-3的显示器上显示有字符(步骤S201)。在图20的说明中,设字符基于包含谈话组ID:组01、文本ID:文本01的文本数据而被显示。
通信终端20-1的利用者观看在显示器上显示的字符,判断是否需要修改。在判断为需要修改字符的情况下,利用者从输入接口23输入字符的修改请求(步骤S202)。例如,利用者触摸在显示器上显示的字符的显示区域。
若从利用者输入字符修改请求,则通信终端20-1的修改控制部216生成修改了文本实际数据的文本数据(步骤S203)。具体来说,例如,若从利用者输入字符修改请求,则修改控制部216基于在文本数据中包含的谈话组ID,判断被输入了字符修改请求的字符是否是属于本终端具有发送权的通话的字符。在被输入了字符修改请求的字符是属于本终端具有发送权的通话的字符的情况下,修改控制部216使字符的修改表格(form)显示在显示器。修改控制部216根据按照修改表格的输入,修改在显示器上显示着的字符。修改控制部216将修改后的文本实际数据存储在具有和与修改前的字符有关的文本数据相同的谈话组ID、文本ID、语音ID、以及通话ID的文本数据。通信终端20-1的通信控制部211根据需要对包含了修改后的文本实际数据的文本数据变更其结构,变换为分组形式的数据从而将其发送给处理服务器10(步骤S204)。
若接收从通信终端20-1发送的文本数据,则处理服务器10的通信控制部113读取在接收到的文本数据中包含的谈话组ID:组01、以及文本ID:文本01。通信控制部113向通过读取到的谈话组ID:组01来识别的谈话组G1中参加的用户02以及用户03分别持有的通信终端20-2、20-3,通知更新基于包含文本ID:文本01的文本数据的字符的显示之意(步骤S205)。
此外,若接收从通信终端20-1发送的文本数据,则处理服务器10的存储控制部114读取在接收到的文本数据中包含的文本ID:文本01。存储控制部114从存储器12删除包含文本ID:文本01的已存储的文本数据,并将接收到的文本数据存储在存储部12(步骤S206)。
此外,若接收从通信终端20-1发送的文本数据,则处理服务器10的翻译处理部116通过对接收到的文本数据例如以与语言代码02对应的语言实施翻译处理,生成翻译文本数据(步骤S207)。若生成翻译文本数据,则翻译处理部116向通信控制部113通知翻译已完成之意(步骤S208)。若接受翻译已完成之意的通知,则通信控制部113向被设定了与用户01不同的语言代码的用户03持有的通信终端20-3,发送翻译已完成之意的通知(步骤S209)。所生成的翻译文本数据被输出到存储控制部114(步骤S2010)。存储控制部114从存储器12删除包含文本ID:文本01、以及语言代码:语言代码02的已存储的翻译文本数据,并将在翻译处理部116中生成的翻译文本数据存储在存储部12(步骤S2011)。
图21是用于说明图1所示的通信终端20-2使被通信终端20-1修改后的字符显示在显示器上时的处理服务器10、以及通信终端20-2的动作的例子的图。另外,在图21中,以设定了第1显示形式的情况为例进行说明。
被设定了与通信终端20-1相同的语言代码的通信终端20-2从处理服务器10接收更新通知(步骤S211)。此时,更新通知中,包含有与修改后的文本数据有关的文本ID。在图21的说明中,接着图20中的说明,设文本ID:文本01被包含在文本化完成通知中。若接收更新通知,则通信终端20-2的通信控制部211向处理服务器10发送请求包含有文本ID:文本01的文本数据之意的文本数据请求通知(步骤S212)。此时,文本数据请求通知被附加有作为请求源的通信终端20-2的用户ID:用户02。
若接收文本数据请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本01的文本数据(步骤S213)。处理服务器10的通信控制部113将从存储部12读取到的文本数据变换为分组形式的数据(步骤S214)。通信控制部113将变换为分组形式的数据复制与被附加于文本数据请求通知的用户ID相应的数量。通信控制部113向利用用户ID确定的IP地址发送所复制的数据(步骤S215)。由此,被变换为分组形式的文本数据被发送给通信终端20-2。
若接收从处理服务器10发送的文本数据,则通信终端20-2的存储控制部212将接收到的文本数据存储于RAM。若文本数据被存储于RAM,则存储控制部212从被存储的文本数据读取文本ID:文本01。存储控制部212参照所读取到的文本ID:文本01,删除过去被存储在RAM的、包含文本ID:文本01的文本数据。由此,修改前的文本数据被从RAM删除。通信终端20-2的显示控制部213从在RAM新存储的文本数据读取文本实际数据。显示控制部213将基于读取到的文本实际数据的字符作为与语音ID:谈话01对应的字符,显示在与由谈话组ID:组01识别的谈话组G1有关的显示画面上(步骤S216)。由此,基于修改前的文本数据而被显示的字符被改写为基于接收到的文本数据的字符。
图22是用于说明图1所示的通信终端20-3使被通信终端20-1修改后的字符显示在显示器上时的处理服务器10、以及通信终端20-3的动作的例子的图。另外,在图22中,以被设定了第1显示形式的情况为例进行说明。
被设定了与通信终端20-1不同的语言代码的通信终端20-3从处理服务器10接收更新通知、以及翻译完成通知(步骤S221)。此时,更新通知中,包含有与被修改的文本数据有关的文本ID。此外,翻译完成通知中,包含有与翻译已完成的翻译文本数据有关的文本ID、以及语言代码。在图22的说明中,接着图20中的说明,设文本ID:文本01被包含在文本化完成通知。此外,设文本ID:文本01、以及语言代码:语言代码02被包含在翻译完成通知。
若接收更新通知、以及翻译完成通知,则通信终端20-3的通信控制部211向处理服务器10发送请求包含有文本ID:文本01的文本数据、以及包含有文本ID:文本01和语言代码:语言代码02的翻译文本数据之意的请求通知(步骤S222)。此时,请求通知被附加了作为请求源的通信终端20-3的用户ID:用户03。
若接收请求通知,则处理服务器10的存储控制部114从存储部12读取包含有文本ID:文本01的文本数据、以及包含有文本ID:文本01和语言代码:语言代码02的翻译文本数据(步骤S223)。处理服务器10的通信控制部113将从存储部12读取到的文本数据以及翻译文本数据变换为分组形式的数据(步骤S224)。通信控制部113将变换为分组形式的数据复制与被附加于文本数据请求通知的用户ID相应的数量。通信控制部113向利用用户ID而确定的IP地址发送所复制的数据(步骤S225)。由此,被变换为分组形式的文本数据以及翻译文本数据被发送给通信终端20-3。
若接收从处理服务器10发送的文本数据以及翻译文本数据,则通信终端20-3的存储控制部212将接收到的文本数据以及翻译文本数据存储在RAM。若文本数据以及翻译文本数据被存储在RAM,则存储控制部212从被存储的文本数据以及翻译文本数据读取文本ID:文本01、以及语言代码:语言代码02。存储控制部212参照所读取的文本ID:文本01、以及语言代码:语言代码02,删除过去被存储于RAM的、包含文本ID:文本01的文本数据、以及包含文本ID:文本01和语言代码:语言代码02的翻译文本数据。由此,修改前的文本数据以及有关修改前的文本数据的翻译文本数据会从RAM被删除。通信终端20-3的显示控制部213从在RAM中新存储的文本数据以及翻译文本数据分别读取文本实际数据以及翻译文本实际数据。显示控制部213将基于文本实际数据以及翻译文本实际数据的字符作为与语音ID:谈话01对应的字符显示在与由谈话组ID:组01识别的谈话组G1有关的显示画面(步骤S226)。由此,基于修改前的文本数据以及翻译文本数据而被显示的字符会被改写为基于接收到的文本数据以及翻译文本数据的字符。
如上所述,在本实施方式中,处理服务器10的文本化处理部115基于从具有发送权的通信终端20-1发送的语音数据而生成文本数据。然后,处理服务器10的通信控制部113以使将所生成的文本数据发送给参加谈话组G1的通信终端20-1~20-3。由此,参加谈话组的通信终端20-1~20-m的利用者通过将通话进行了文本化的字符显示,能够确认通话的内容。此外,即使在难以听到语音的环境下、以及即使是难以听到语音的人,也能够确认通话的内容。
从而,根据本实施方式涉及的通信***1、以及处理服务器10,能够降低信息的传递错误。
此外,在本实施方式中,处理服务器10的文本化处理部115基于在高速缓存存储器中保持的多个语音数据而生成文本数据。由此,处理服务器10能够以维持语音通信的质量的状态生成文本数据。
此外,在本实施方式中,在高速缓存存储器中保持预先设定的容量的语音数据、或者通信终端20-1的发送权在达到该容量之前被释放,则处理服务器10的文本化处理部115基于在高速缓存存储器中保持的多个语音数据而生成文本数据。即,长时间的通话按每一定时间被划分而被文本化。由此,处理服务器10能够使与语音数据的延迟最小化,并生成文本数据。此外,即使在发言者长时间发言的情况下,也能够逐次将语音数据进行文本化。
此外,在本实施方式中,处理服务器10的存储控制部114将被生成的文本数据存储在存储部12。若生成文本数据,则文本化处理部115将文本化已完成之意通知给参加谈话组G1的通信终端20-1~20-3。然后,若从通知了文本化已完成之意的通信终端有请求文本数据之意的通知,则通信控制部113将在存储部12中被存储的文本数据发送给请求源的通信终端。由此,处理服务器10即使不使通信终端20-1~20-m的存储部22存储文本数据,也能够使基于文本数据的字符显示在显示器上。这样,通信终端20-1~20-m中未存储文本数据,因此能够防止信息的泄露。
此外,在本实施方式中,处理服务器10的通信控制部113在从通知了文本化已完成之意的通信终端,有请求基于文本数据的字符的显示开始的通知的情况下,将在存储部12中被存储的过去的多个文本数据发送给请求源的通信终端。由此,即使在中途参加了谈话组的情况下以及从通话的中途开始了语音的字符显示的情况下,通信终端20-1~20-m的利用者也能够通过字符来确认通话的趋势。
此外,在本实施方式中,处理服务器10的存储控制部114将生成文本数据时所利用的语音数据作为通话数据存储在存储部12。若从发送了文本数据的通信终端20有与文本数据对应的语音的播放请求,则通信控制部113将被存储在存储部12中的通话数据中的、与被请求了播放的文本数据对应的通话数据发送给有播放请求的通信终端。由此,通信终端20-1~20-m的利用者能够在任意的定时听取与在显示器上显示的字符对应的实际的通话。此外,即使在显示器上显示的字符中有误,也能够确认正确的内容。
此外,本实施方式中,在具有发送权的通信终端20-1中文本数据被修改了的情况下,处理服务器10的通信控制部113将被修改后的文本数据发送给参加谈话组G1的通信终端20-2、20-3。由此,即使在文本化处理部115进行的通话数据的文本化中有错误转换的情况下,发言者修改在通话终端显示的字符,并能够向其他的通信终端反映修改后的字符。
此外,在本实施方式中,若在具有发送权的通信终端20-1中文本数据被修改,则处理服务器10的通信控制部113将更新显示之意通知给参加谈话组G1的通信终端20-2、20-3。若从通知了更新的通信终端20被请求发送被修改后的文本数据,则通信控制部113将在存储部12中被存储的被修改后的文本数据发送给请求源的通信终端20。由此,即使使通信终端20-1~20-m的存储部22不存储被修改后的文本数据,处理服务器10也能够使基于修改后的文本数据的字符显示在显示器上。
此外,在本实施方式中,处理服务器10的翻译处理部116通过对在文本化处理部115中被生成的文本数据实施翻译处理,生成翻译文本数据。通信控制部113将被生成的翻译文本数据,发送给在参加谈话组G1的通信终端20-1~20-3中的、被设定了与具有发送权的通信终端20-1不同的语言的通信终端20-3。由此,即使在谈话组中有使用不同的语言的利用者,该利用者也能够理解通话的内容。即,能够实现多语言之间的交流。
此外,在本实施方式中,处理服务器10的存储控制部114将在翻译处理部116中被生成的翻译文本数据存储在存储部12中。若生成翻译文本数据,则翻译处理部116将翻译处理已完成之意发送给参加谈话组G1的通信终端20-1~20-3中的、被设定了与具有发送权的通信终端20-1不同的语言的通信终端20-3。然后,若从发送了翻译完成通知的通信终端20-3被请求发送翻译文本数据,则通信控制部113从存储部12读取被请求的翻译文本数据,并将读取到的翻译文本数据发送给请求源的通信终端20-3。由此,即使使翻译文本数据不存储在通信终端20-1~20-m的存储部22,处理服务器10也能够使基于翻译文本数据的字符显示在显示器上。这样,由于在通信终端20-1~20-m中没有存储翻译文本数据,因此能够防止信息的泄露。
此外,在本实施方式中,在从通知了翻译处理已完成之意的通信终端20-3有请求基于翻译文本数据的字符的显示开始的通知的情况下,处理服务器10的通信控制部113将在存储部12中被存储的过去的多个翻译文本数据发送给请求源的通信终端20-3。由此,即使在中途参加了谈话组的情况下、以及从通话的中途开始了语音的字符显示的情况下,通信终端20-1~20-m的利用者也能够通过翻译的字符来确认通话的趋势。
此外,在本实施方式中,处理服务器10的翻译处理部116通过对在具有发送权的通信终端中被修改了的文本数据实施翻译处理,生成翻译文本数据。通信控制部113将与被修改后的文本数据有关的翻译文本数据,发送给参加谈话组G1的通信终端20-1~20-3中的、被设定了与具有发送权的通信终端20-1不同的语言的通信终端20-3。由此,处理服务器10能够自动翻译被修改后的文本数据,并将反映了修改的翻译文本数据配送给被设定了与具有发送权的通信终端20不同的语言的通信终端20。
此外,在本实施方式中,若与具有发送权的通信终端20-1中被修改的文本数据有关的翻译文本数据被生成,则处理服务器10的存储控制部114从存储部12删除与修改前的文本数据有关的翻译文本数据,并将与修改后的文本数据有关的翻译文本数据存储到存储部12。若生成与在通信终端20-1中被修改后的文本数据有关的翻译文本数据,则翻译处理部116将翻译处理已完成之意发送给参加谈话组G1的通信终端20-1~20-3中的、被设定了与具有发送权的通信终端20-1不同的语言的通信终端20-3。然后,若从发送了翻译完成通知的通信终端20-3被请求发送翻译文本数据,则通信控制部113从存储部12读取被请求的翻译文本数据,并将读取到的翻译文本数据发送给请求源的通信终端20-3。由此,处理服务器10即使不使通信终端20-1~20-m的存储部22存储与被修改后的文本数据有关的翻译文本数据,也能够使基于翻译文本数据的字符显示在显示器。
此外,在本实施方式中,通信终端20-1~20-3的通信控制部211接收从具有发送权的通信终端20-1发送的语音数据的文本化已完成之意的文本化完成通知。通信控制部211向处理服务器10请求发送通过接收到的文本化完成通知而被通知了文本化完成的文本数据。通信控制部211接收从处理服务器10根据请求而返回的文本数据。然后,显示控制部213将基于接收到的文本数据的字符显示在作为输出接口24的显示器。由此,参加谈话组的通信终端20-1~20-m的利用者通过将通话进行了文本化的字符显示,能够确认通话的内容。此外,即使在难以听到语音的环境下、以及即使是难以听到语音的人,也能够确认通话的内容。
此外,在本实施方式中,通信终端20-1~20-3的存储控制部212将接收到的文本数据存储于作为非易失性存储器的RAM。然后,显示控制部213将基于存储在RAM中的文本数据的字符显示在显示器。由此,通信终端20-1~20-m即使在存储部22中不存储文本数据,也能够使基于文本数据的字符显示在显示器。
此外,在本实施方式中,通信终端20-1~20-3的显示控制部213将接收到的文本化完成通知显示在显示器。然后,在对文本化完成通知的显示有字符的显示请求的情况下,通信控制部211向处理服务器10请求发送被通知了文本化完成的文本数据。由此,通信终端20-1~20-m能够仅在需要与语音对应的字符显示的情况下,向显示器显示字符。
此外,在本实施方式中,在有与显示于显示器上的字符对应的语音的播放请求的情况下,通信终端20-1~20-3的通信控制部211向处理服务器10请求发送在生成文本数据时所利用的语音数据。通信控制部211接收从处理服务器10根据请求而返回的语音数据。然后,播放控制部214从扬声器播放基于接收到的语音数据的语音。由此,通信终端20-1~20-m的利用者能够在任意的定时听取与显示于显示器上的字符对应的实际的通话。此外,即使显示于显示器上的字符有误也能够确认正确的内容。
此外,在本实施方式中,在对显示于显示器上的字符有修改请求的情况下,通信终端20-1的修改控制部216判断被请求了修改的字符是否为属于本终端具有发送权的通话的字符。在被请求了修改的字符是属于本终端具有发送权的通话的字符的情况下,修改控制部216将用于输入对于文本数据的修改的修改表格显示在显示器上,基于经由修改表格输入的修改而生成文本数据。然后,修改控制部216将所生成的文本数据发送给处理服务器10。由此,在文本化处理中有错误变换的情况下,发言者能够修改在通话终端中显示的字符。
此外,在本实施方式中,若具有发送权的通信终端20-1修改文本数据,则通信终端20-2、20-3的通信控制部211接收要更新显示之意的更新通知。通信控制部211根据接收到的更新通知,向处理服务器10请求发送修改后的文本数据。通信控制部211接收从处理服务器10根据请求被返回的文本数据。然后,显示控制部213使在显示器上正在显示的基于修改前的文本数据的字符改写为基于接收到的修改后的文本数据的字符。由此,通信终端20-1~20-m能够在本终端的显示器的显示上反映由具有发送权的通信终端进行的文本数据的修改。此外,通信终端20-1~20-m即使使文本数据不存储于存储部22,也能够使基于修改后的文本数据的字符显示在显示器上。
此外,在本实施方式中,若被设定在终端使用的语言,则通信终端20-1~20-3的通信控制部211将与被设定的语言有关的信息发送给处理服务器10。通信控制部211接收对文本数据完成了翻译处理之意的翻译完成通知。通信控制部211根据接收到的翻译完成通知,向处理服务器10请求发送翻译文本数据。通信控制部211接收从处理服务器10返回的翻译文本数据。然后,显示控制部213将基于接收到的翻译文本数据的字符显示在显示器上。由此,在利用者使用的语言与具有发送权的通信终端的语言不同的情况下,通信终端20-1~20-m能够将语音被自动翻译的字符显示在显示器上。
此外,在本实施方式中,通信终端20-3的存储控制部212将接收到的翻译文本数据存储在作为易失性存储器的RAM。此外,显示控制部213使基于存储在易失性存储器中的翻译文本数据的字符显示在显示器上。由此,通信终端20-1~20-m即使不使存储部22存储文本数据,也能够使基于翻译文本数据的字符显示在显示器上。
此外,在本实施方式中,通信终端20-3的显示控制部213将接收到的翻译完成通知显示在显示器上。然后,在对翻译完成通知的显示有基于翻译文本数据的字符的显示请求的情况下,通信控制部211向处理服务器10请求发送被通知了翻译完成的翻译文本数据。由此,通信终端20-1~20-m能够仅在需要显示基于翻译文本数据的字符的情况下,向显示器显示字符。
此外,在本实施方式中,在对显示器上显示的、基于翻译文本数据的字符有朗读请求的情况下,通信终端20的朗读控制部215将基于翻译文本数据的字符变换为语音数据。然后,朗读控制部215使基于变换后的语音数据的语音从扬声器播放。由此,通信终端20-1~20-m利用其它的语言也能够播放通话的内容。
此外,在本实施方式中,通信终端20-3的通信控制部211接收与被修改后的文本数据有关的翻译文本数据。然后,显示控制部213将基于与显示在显示器上的修改前的文本数据有关的翻译文本数据的字符,通过基于与而接收到的修改后的文本数据有关的翻译文本数据的字符而改写。由此,通信终端20-1~20-m能够使由具有发送权的通信终端进行的文本数据的修改反映到基于翻译文本数据的字符。
另外,在上述实施方式中,以若在高速缓存存储器中保持预先设定的容量的语音数据,或者在达到预先设定的容量之前发送权被释放,则存储控制部114基于在高速缓存存储器中保持着的多个语音数据生成通话数据的情况为例进行了说明。但是,并不限于此。例如,存储控制部114将从具有发送权的通信终端发送的语音数据依次保持在高速缓存存储器中。此外,若发送权被释放,则存储控制部114也可以基于在高速缓存存储器中保持着的相当于一个通话的多个语音数据生成通话数据。由此,不会出现一个通话被分割为多个的情况下,因此更准确地进行文本化。
另外,在通话数据基于发送权的释放通知而生成的情况下,由于不会出现相当于一个通话量的数据被分割的情况,因此在通话数据中,不需要确保如图9所示的用于存储通话ID的区域。因此,即使在文本数据中,也不需要确保图10所示的用于存储通话ID的区域。
此外,在上述实施方式中,通信终端20-1~20-m的利用者还能够变更被设定的语言。被设定的语言例如通过重新参加谈话组而改变。例如,通信终端20-1~20-m的利用者还可以在正在参加着谈话组的途中,切换被设定的语言。若语言在正在参加着谈话组的途中被切换,则通信终端20-1~20-m向处理服务器10通知配送与至今接收到的文本数据对应的、利用切换后的语言翻译后的翻译文本数据之意的请求。该请求通知中,例如包含作为请求源的通信终端的用户ID、与切换后的语言有关的语言代码、以及与需要显示的字符有关的文本代码的文本ID。
若接收用于请求与切换后的语言对应的翻译文本数据的通知,则处理服务器10的存储控制部114从存储器12读取包含期望的文本ID、以及语言代码的翻译文本数据。处理服务器10的通信控制部113将从存储部12读取到的翻译文本数据发送给请求源的通信终端。
通信终端20-1~20-m的存储控制部212若接收被以切换后的语言翻译后的翻译文本数据,则将接收到的翻译文本数据存储在RAM。若翻译文本数据被存储在RAM中,则存储控制部212从被存储的翻译文本数据读取文本ID。存储控制部212参照所读取的文本ID,删除在RAM中过去存储了的、包含相同的文本ID的翻译文本数据。通信终端20-1~20-m的显示控制部213从在RAM中新存储的翻译文本数据读取翻译文本实际数据。显示控制部213将基于所读取的翻译文本实际数据的字符与基于对应的文本实际数据的字符一并显示。由此,基于切换语言前的翻译文本数据的字符被改写为基于接收到的翻译文本数据的字符。
另外,通信终端20-1~20-m的存储控制部212也可以不从RAM删除包含相同文本ID的翻译文本数据。通信终端20-1~20-m的显示控制部213从在RAM中被存储的翻译文本数据读取翻译文本实际数据。显示控制部213将基于所读取的翻译文本实际数据的字符与基于对应的文本实际数据的字符一并显示。由此,与切换语言之前的显示一并显示基于切换后的翻译文本数据的字符。
以上,说明了本发明涉及的实施方式,但该实施方式是作为例子来提示的实施方式,不试图限定发明的范围。
Claims (42)
1.一种信号处理装置,将多个通信终端进行关联而作为集合,并提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,所述信号处理装置具有:
发送权赋予部,对属于所述组合的多个通信终端的任意一个,提供作为发送数据的权利的发送权;
文本化处理部,基于从具有所述发送权的通信终端发送的语音数据生成文本数据,且若生成所述文本数据则将文本化已完成之意,通知给属于所述集合的多个通信终端;以及
通信控制部,在所述文本化已完成之意的通知后,将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个。
2.一种信号处理装置,将多个通信终端进行关联而作为集合,并提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,所述信号处理装置具有:
发送权赋予部,对属于所述组合的多个通信终端的任意一个,提供作为发送数据的权利的发送权;
文本化处理部,基于从具有所述发送权的通信终端发送的语音数据生成文本数据;以及
通信控制部,将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个,
若所述发送权被释放,则所述文本化处理部生成所述文本数据。
3.如权利要求1或2所述的信号处理装置,进一步具有:
存储器,保持所述语音数据,
所述文本化处理部基于保持在所述存储器中的语音数据,生成所述文本数据。
4.如权利要求1所述的信号处理装置,进一步具有:
存储器,保持所述语音数据,
若在所述存储器保持预先设定的容量的语音数据,或者若在达到所述容量前所述发送权被释放,则所述文本化处理部基于保持在所述存储器中的语音数据而生成所述文本数据。
5.如权利要求1所述的信号处理装置,
若所述发送权被释放,则所述文本化处理部生成所述文本数据。
6.如权利要求1所述的信号处理装置,
所述文本化处理部将所述文本化已完成之意还通知给能够属于所述集合的通信终端。
7.如权利要求1或6所述的信号处理装置,
所述通信控制部根据从通知了所述文本化已完成之意的通信终端的至少一个发送的、开始基于所述文本数据的字符的显示的开始请求,向发送了所述开始请求的通信终端发送所述文本数据。
8.如权利要求1至7的任一项所述的信号处理装置,
所述通信控制部根据从发送了所述文本数据的通信终端的至少一个发送的、与所述文本数据对应的语音的播放请求,将与所述文本数据对应的通话数据发送给发送了所述播放请求的通信终端。
9.如权利要求1至8的任一项所述的信号处理装置,
若接收在具有所述发送权的通信终端中被修改后的文本数据,则所述通信控制部向属于所述集合的多个通信终端通知要更新显示之意,在所述要更新显示之意的通知后,将所述修改后的文本数据发送给属于所述集合的多个通信终端的至少一个。
10.如权利要求1至9的任一项所述的信号处理装置,
进一步具有翻译处理部,对通过所述文本化处理部而被生成的文本数据,通过实施基于被设定的语言的翻译处理而生成翻译文本数据,若生成所述翻译文本数据则将翻译处理已完成之意通知给属于所述集合的多个通信终端中的、被设定了所述语言的通信终端,
在所述翻译处理已完成之意的通知后,所述通信控制部发送所述翻译文本数据。
11.如权利要求10所述的信号处理装置,
所述通信控制部根据从通知了所述翻译处理已完成之意的通信终端的至少一个发送的、用于开始基于所述翻译文本数据的字符的显示的开始请求,向发送了所述开始请求的通信终端发送所述翻译文本数据。
12.如权利要求10或11所述的信号处理装置,
所述翻译处理部通过对在具有所述发送权的通信终端中被修改的文本数据,实施基于被设定的语言的翻译处理,从而生成翻译文本数据,若生成所述翻译文本数据,则将翻译处理已完成之意通知给属于所述集合的多个通信终端中的、被设定了所述语言的通信终端。
13.如权利要求10至12的任一项所述的信号处理装置,
若在属于所述集合的多个通信终端的至少一个中,被设定的语言被切换,则所述通信控制部向所述语言被切换的通信终端,发送与切换后的所述语言有关的翻译文本数据。
14.一种通信***,具有:
多个通信终端;以及
信号处理装置,将所述多个通信终端进行关联而作为集合,提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,
所述信号处理装置具有:
发送权赋予部,对属于所述集合的多个通信终端的任意一个,提供作为发送数据的权利的发送权;
文本化处理部,基于从具有所述发送权的通信终端发送的语音数据生成文本数据,若生成所述文本数据则将文本化已完成之意通知给属于所述集合的多个通信终端;以及
通信控制部,在所述文本化已完成之意的通知后,将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个。
15.一种通信***,具有:
多个通信终端;
信号处理装置,将所述多个通信终端进行关联而作为集合,提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,
所述信号处理装置具有:
发送权赋予部,对属于所述集合的多个通信终端的任意一个,提供作为发送数据的权利的发送权;
文本化处理部,基于从具有所述发送权的通信终端发送的语音数据生成文本数据;以及
通信控制部,将所述生成的文本数据发送给属于所述集合的多个通信终端的至少一个,
若所述发送权被释放,则所述文本化处理部生成所述文本数据。
16.一种通信方法,是在信号处理装置中实施的方法,所述信号处理装置将多个通信终端进行关联而作为集合,提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,其中,
基于从属于所述集合的多个通信终端中的、被提供了作为发送数据的权利的发送权的通信终端发送的语音数据,生成文本数据,
若生成所述文本数据则将文本化已完成之意通知给属于所述集合的多个通信终端,
在所述文本化已完成之意的通知后,将生成的所述文本数据发送给属于所述集合的多个通信终端的至少一个。
17.一种通信方法,是在信号处理装置中实施的方法,所述信号处理装置将多个通信终端进行关联而作为集合,提供从属于所述集合的任意一个通信终端向属于所述集合的其他的通信终端的一对多通信,其中,
接收从属于所述集合的多个通信终端中的、被提供了作为发送数据的权利的发送权的通信终端发送的语音数据,
若所述发送权被释放,则基于接收到的所述语音数据生成文本数据,
将所述生成的文本数据发送给属于所述集合的多个通信终端的至少一个。
18.如权利要求16或17所述的通信方法,
将从具有所述发送权的通信终端发送的语音数据保持于存储器,
基于保持在所述存储器中的语音数据,生成所述文本数据。
19.如权利要求16所述的通信方法,
将从具有所述发送权的通信终端发送的语音数据保持于存储器,
若在所述存储器中保持预先设定的容量的语音数据、或者若在达到所述容量之前所述发送权被释放,则基于保持在所述存储器中的语音数据而生成所述文本数据。
20.如权利要求16所述的通信方法,
若所述发送权被释放,则生成所述文本数据。
21.如权利要求16所述的通信方法,
将所述文本化已完成之意,还通知给能够属于所述集合的通信终端。
22.如权利要求16或21所述的通信方法,
根据从通知了所述文本化已完成之意的通信终端的至少一个发送的、开始基于所述文本数据的字符的显示的开始请求,向发送了所述开始请求的通信终端,发送所述文本数据。
23.如权利要求16至22的任一项所述的通信方法,
根据从发送了所述文本数据的通信终端的至少一个发送的、与所述文本数据对应的语音的播放请求,将与所述文本数据对应的通话数据发送给发送了所述播放请求的通信终端。
24.如权利要求16至23的任一项所述的通信方法,
若接收在具有所述发送权的通信终端中被修改的文本数据,则向属于所述集合的多个通信终端通知更新其显示之意,
在所述更新其显示之意的通知后,将所述修改后的文本数据发送给属于所述集合的多个通信终端的至少一个。
25.如权利要求16至24的任一项所述的通信方法,
通过对生成的所述文本数据,实施基于被设定的语言的翻译处理,从而生成翻译文本数据,
若生成所述翻译文本数据,则将翻译处理已完成之意通知给属于所述集合的多个通信终端中的、被设定了所述语言的通信终端,
在所述翻译处理已完成之意的通知后,发送所述翻译文本数据。
26.如权利要求25所述的通信方法,
根据从通知了所述翻译处理已完成之意的通信终端的至少一个发送的、开始基于所述翻译文本数据的字符的显示的开始请求,向发送了所述开始请求的通信终端,发送所述翻译文本数据。
27.如权利要求25或26所述的通信方法,
通过对在具有所述发送权的通信终端中被修改的文本数据,实施基于被设定的语言的翻译处理,从而生成翻译文本数据,
若生成所述翻译文本数据,则将翻译处理已完成之意通知给属于所述集合的多个通信终端中的、被设定了所述语言的通信终端。
28.如权利要求25至27的任一项所述的通信方法,
若在属于所述集合的多个通信终端的至少一个中,被设定的语言被切换,则向所述语言被切换的通信终端,发送与切换后的所述语言有关的翻译文本数据。
29.一种程序,使计算机起到权利要求1至权利要求13的任一项所述的信号处理装置所具有的所述各部的作用。
30.一种通信方法,是在通信终端中实施的方法,在属于通过多个通信终端进行了关联的集合的多个通信终端间,实施一对多通信,
接收从所述多个通信终端的任一个发送的语音数据的文本化已完成之意的文本化完成通知,
根据所述接收到的文本化完成通知,发送用于请求发送通过所述文本化而被生成的文本数据的请求信号,
接收根据所述请求信号而被返回的文本数据,
在显示部显示基于接收到的所述文本数据的字符。
31.如权利要求30所述的通信方法,
将接收到的所述文本数据存储到易失性存储器中,
在所述显示部显示基于在所述易失性存储器中存储了的文本数据的字符。
32.如权利要求30或31所述的通信方法,
将接收到的所述文本化完成通知显示在所述显示部,
受理对于所述文本化完成通知的显示的、基于通过所述文本化而被生成的文本数据的字符的显示请求,
在有了所述显示请求的情况下,发送所述请求信号。
33.如权利要求30至32的任一项所述的通信方法,
受理对于在所述显示部中被显示的字符的、与所述字符对应的语音的播放请求,
在有了所述播放请求的情况下,发送用于请求发送在生成所述文本数据时利用的语音数据的语音请求信号,
接收根据所述语音请求信号而被返回的语音数据,
从扬声器播放基于接收到的所述语音数据的语音。
34.如权利要求30至33的任一项所述的通信方法,
受理对于所述显示部中被显示的字符的修改请求,
判断被输入了所述修改请求的字符是否为属于本终端具有作为发送数据的权利的发送权的通话的字符,
在被输入了所述修改请求的字符是属于本终端具有所述发送权的通话的字符的情况下,在所述显示部显示用于输入对于所述文本数据的修改的修改表格,
基于输入的所述修改,生成文本数据,
发送生成的所述文本数据。
35.如权利要求30至34的任一项所述的通信方法,
若所述文本数据被所述多个通信终端中的任一个修改,则接收用于更新与所述文本数据有关的显示之意的更新通知,
根据所述接收到的更新通知,发送用于请求发送被修改后的所述文本数据的请求信号,
接收根据所述请求信号而被返回的文本数据,
将显示在所述显示部上的基于修改前的文本数据的字符,利用基于接收到的所述被修改后的文本数据的字符来改写。
36.如权利要求30至35的任一项所述的通信方法,
受理要使用的语言的设定,
发送与设定了的所述语言有关的信息,
接收与被生成的所述文本数据有关的基于所述语言的翻译处理已完成之意的翻译完成通知,
根据接收到的所述翻译完成通知,发送用于请求发送通过所述翻译处理而被生成的翻译文本数据的翻译请求信号,
接收根据所述翻译请求信号而被返回的翻译文本数据,
将基于接收到的所述翻译文本数据的字符显示在所述显示部上。
37.如权利要求36所述的通信方法,
将接收到的所述翻译文本数据存储在易失性存储器中,
将基于在所述易失性存储器中存储了的翻译文本数据的字符显示在所述显示部上。
38.如权利要求36或37所述的通信方法,
将接收到的所述翻译完成通知显示在所述显示部上,
受理对于所述翻译完成通知的显示的、基于通过所述翻译处理而被生成的翻译文本数据的字符的显示请求,
在有了所述显示请求的情况下,发送所述翻译请求信号。
39.如权利要求36至38的任一项所述的通信方法,
受理对于在所述显示部上显示的、基于所述翻译文本数据的字符的朗读请求,
在有了所述朗读请求的情况下,将基于所述翻译文本数据的字符变换为语音数据,
从扬声器播放基于变换后的所述语音数据的语音。
40.如权利要求36至39的任一项所述的通信方法,
接收与被修改后的文本数据有关的翻译文本数据,
将在所述显示部上被显示的基于与修改前的文本数据有关的翻译文本数据的字符,利用基于接收到的与所述被修改后的文本数据有关的翻译文本数据的字符来改写。
41.一种权利要求36至40的任一项所述的通信方法,
受理使用的语言的设定的切换,
发送用于请求发送通过切换后的语言被翻译后的翻译文本数据的请求信号,
接收根据所述请求信号而被返回的翻译文本数据,
与在所述显示部上被显示的基于语言切换前的翻译文本数据的字符一并,将基于接收到的语言切换后的所述翻译文本数据的字符显示在所述显示部,或者将与在所述显示部上被显示的基于语言切换前的翻译文本数据的字符,改写为基于接收到的语言切换后的所述翻译文本数据的字符而显示在所述显示部。
42.一种程序,使计算机实施权利要求30至41的任一项所述的处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017119046A JP6318292B1 (ja) | 2017-06-16 | 2017-06-16 | 信号処理装置、通信システム、信号処理装置で実施される方法、信号処理装置で実行されるプログラム、通信端末で実施される方法、及び通信端末で実行されるプログラム |
JP2017-119046 | 2017-06-16 | ||
PCT/JP2018/021725 WO2018230414A1 (ja) | 2017-06-16 | 2018-06-06 | 信号処理装置、通信システム、信号処理装置で実施される方法、信号処理装置で実行されるプログラム、通信端末で実施される方法、及び通信端末で実行されるプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110291769A true CN110291769A (zh) | 2019-09-27 |
CN110291769B CN110291769B (zh) | 2021-04-20 |
Family
ID=62069465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880011278.5A Active CN110291769B (zh) | 2017-06-16 | 2018-06-06 | 通信***及方法、信号处理装置、以及可读存储介质 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11568154B2 (zh) |
EP (2) | EP4089994A1 (zh) |
JP (1) | JP6318292B1 (zh) |
KR (1) | KR102168913B1 (zh) |
CN (1) | CN110291769B (zh) |
SG (1) | SG11201906536QA (zh) |
WO (1) | WO2018230414A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028837A (zh) * | 2019-12-16 | 2020-04-17 | 深圳云之家网络有限公司 | 语音会话方法、语音识别***及计算机存储介质 |
CN112272361A (zh) * | 2020-10-29 | 2021-01-26 | 哈尔滨海能达科技有限公司 | 语音处理方法及*** |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6950708B2 (ja) * | 2016-12-05 | 2021-10-13 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、および情報処理システム |
JP6318292B1 (ja) * | 2017-06-16 | 2018-04-25 | 株式会社シアンス・アール | 信号処理装置、通信システム、信号処理装置で実施される方法、信号処理装置で実行されるプログラム、通信端末で実施される方法、及び通信端末で実行されるプログラム |
US11397600B2 (en) * | 2019-05-23 | 2022-07-26 | HCL Technologies Italy S.p.A | Dynamic catalog translation system |
JP7284400B2 (ja) * | 2019-08-29 | 2023-05-31 | アイコム株式会社 | 音声通信システム、中継装置および音声中継方法 |
JP2021086264A (ja) * | 2019-11-26 | 2021-06-03 | 凸版印刷株式会社 | 翻訳管理システム |
US20230388758A1 (en) * | 2022-05-31 | 2023-11-30 | Weavix, Inc. | Smart field communication devices with blind user interfaces |
JP7396758B1 (ja) * | 2023-06-27 | 2023-12-12 | 株式会社サイエンスアーツ | 情報処理装置、情報処理方法および情報処理プログラム |
JP7488625B1 (ja) | 2023-11-15 | 2024-05-22 | テレネット株式会社 | 情報処理システム、情報処理方法及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083990A (ja) * | 1999-09-09 | 2001-03-30 | Toshiba Corp | 音声認識装置および方法 |
CN1636384A (zh) * | 2002-02-20 | 2005-07-06 | 思科技术公司 | 进行带可选语音到文本转换的电话会议的方法和*** |
JP2007165951A (ja) * | 2005-12-09 | 2007-06-28 | Mitsubishi Electric Corp | 無線端末制御システムおよび無線端末 |
CN101632316A (zh) * | 2007-02-28 | 2010-01-20 | 索尼爱立信移动通讯股份有限公司 | 音频别名标签 |
CN104285428A (zh) * | 2012-05-08 | 2015-01-14 | 三星电子株式会社 | 用于运行通信服务的方法和*** |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2364850B (en) * | 2000-06-02 | 2004-12-29 | Ibm | System and method for automatic voice message processing |
US9710819B2 (en) * | 2003-05-05 | 2017-07-18 | Interactions Llc | Real-time transcription system utilizing divided audio chunks |
US20050144012A1 (en) * | 2003-11-06 | 2005-06-30 | Alireza Afrashteh | One button push to translate languages over a wireless cellular radio |
US20070088553A1 (en) * | 2004-05-27 | 2007-04-19 | Johnson Richard G | Synthesized interoperable communications |
JP2006050500A (ja) * | 2004-08-09 | 2006-02-16 | Jfe Systems Inc | 会議支援システム |
JP3938379B2 (ja) * | 2004-08-10 | 2007-06-27 | 富士通株式会社 | 電子音声会議における話者権についての情報処理方法及びプログラム、並びに無線通信携帯端末 |
US8660244B2 (en) * | 2006-02-17 | 2014-02-25 | Microsoft Corporation | Machine translation instant messaging applications |
EP1928189A1 (en) * | 2006-12-01 | 2008-06-04 | Siemens Networks GmbH & Co. KG | Signalling for push-to-translate-speech (PTTS) service |
JP2008219297A (ja) | 2007-03-01 | 2008-09-18 | Sharp Corp | 1対多通信システム、送信権管理装置、送信権管理装置の制御方法、制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体 |
JP5020663B2 (ja) | 2007-03-08 | 2012-09-05 | 京セラ株式会社 | 移動体通信機、通信システム、及び通信方法 |
US20090135741A1 (en) * | 2007-11-28 | 2009-05-28 | Say2Go, Inc. | Regulated voice conferencing with optional distributed speech-to-text recognition |
US8244221B2 (en) * | 2008-12-19 | 2012-08-14 | Cox Communications, Inc. | Visual voicemail messages and unique directory number assigned to each for accessing corresponding audio voicemail message |
JP5374629B2 (ja) * | 2011-05-24 | 2013-12-25 | 株式会社エヌ・ティ・ティ・ドコモ | サービスサーバ装置、サービス提供方法、サービス提供プログラム |
JP5243646B2 (ja) | 2011-05-24 | 2013-07-24 | 株式会社エヌ・ティ・ティ・ドコモ | サービスサーバ装置、サービス提供方法、サービス提供プログラム |
US8886169B2 (en) * | 2011-10-25 | 2014-11-11 | At&T Intellectual Property I, Lp | Apparatus and method for providing enhanced telephonic communications |
US10875525B2 (en) * | 2011-12-01 | 2020-12-29 | Microsoft Technology Licensing Llc | Ability enhancement |
US9110891B2 (en) * | 2011-12-12 | 2015-08-18 | Google Inc. | Auto-translation for multi user audio and video |
US8838459B2 (en) * | 2012-02-29 | 2014-09-16 | Google Inc. | Virtual participant-based real-time translation and transcription system for audio and video teleconferences |
JP6318292B1 (ja) * | 2017-06-16 | 2018-04-25 | 株式会社シアンス・アール | 信号処理装置、通信システム、信号処理装置で実施される方法、信号処理装置で実行されるプログラム、通信端末で実施される方法、及び通信端末で実行されるプログラム |
-
2017
- 2017-06-16 JP JP2017119046A patent/JP6318292B1/ja active Active
-
2018
- 2018-06-06 SG SG11201906536QA patent/SG11201906536QA/en unknown
- 2018-06-06 CN CN201880011278.5A patent/CN110291769B/zh active Active
- 2018-06-06 WO PCT/JP2018/021725 patent/WO2018230414A1/ja active Application Filing
- 2018-06-06 EP EP22167127.4A patent/EP4089994A1/en active Pending
- 2018-06-06 KR KR1020197023457A patent/KR102168913B1/ko active IP Right Grant
- 2018-06-06 EP EP18817755.4A patent/EP3641287B1/en active Active
-
2019
- 2019-07-23 US US16/520,105 patent/US11568154B2/en active Active
-
2022
- 2022-12-29 US US18/090,618 patent/US11836457B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083990A (ja) * | 1999-09-09 | 2001-03-30 | Toshiba Corp | 音声認識装置および方法 |
CN1636384A (zh) * | 2002-02-20 | 2005-07-06 | 思科技术公司 | 进行带可选语音到文本转换的电话会议的方法和*** |
JP2007165951A (ja) * | 2005-12-09 | 2007-06-28 | Mitsubishi Electric Corp | 無線端末制御システムおよび無線端末 |
CN101632316A (zh) * | 2007-02-28 | 2010-01-20 | 索尼爱立信移动通讯股份有限公司 | 音频别名标签 |
CN104285428A (zh) * | 2012-05-08 | 2015-01-14 | 三星电子株式会社 | 用于运行通信服务的方法和*** |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028837A (zh) * | 2019-12-16 | 2020-04-17 | 深圳云之家网络有限公司 | 语音会话方法、语音识别***及计算机存储介质 |
CN112272361A (zh) * | 2020-10-29 | 2021-01-26 | 哈尔滨海能达科技有限公司 | 语音处理方法及*** |
CN112272361B (zh) * | 2020-10-29 | 2022-05-31 | 哈尔滨海能达科技有限公司 | 语音处理方法及*** |
Also Published As
Publication number | Publication date |
---|---|
SG11201906536QA (en) | 2019-08-27 |
EP3641287A4 (en) | 2021-06-23 |
KR102168913B1 (ko) | 2020-10-22 |
US11568154B2 (en) | 2023-01-31 |
JP2019004392A (ja) | 2019-01-10 |
EP4089994A1 (en) | 2022-11-16 |
US11836457B2 (en) | 2023-12-05 |
US20190347332A1 (en) | 2019-11-14 |
EP3641287B1 (en) | 2022-07-27 |
US20230153549A1 (en) | 2023-05-18 |
JP6318292B1 (ja) | 2018-04-25 |
CN110291769B (zh) | 2021-04-20 |
EP3641287A1 (en) | 2020-04-22 |
WO2018230414A1 (ja) | 2018-12-20 |
KR20190105622A (ko) | 2019-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110291769A (zh) | 信号处理装置、通信***、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序 | |
CN106024014B (zh) | 一种语音转换方法、装置及移动终端 | |
CN101510125A (zh) | 一种通过蓝牙实现手机控制计算机键盘鼠标操作的方法 | |
CN101406028B (zh) | 动态快速拨叫号码映射 | |
CN103035240A (zh) | 用于使用上下文信息的语音识别修复的方法和*** | |
CN109543200A (zh) | 一种文本翻译方法及装置 | |
KR102178176B1 (ko) | 사용자 단말, 화상 통화 장치, 화상 통화 시스템 및 그 제어방법 | |
CN108347720A (zh) | 通信连接方法、装置、终端及存储介质 | |
CN109840318A (zh) | 一种表单项的填写方法及*** | |
CN103677585A (zh) | 在用户设备中使用输入字符来提供智能服务的方法和装置 | |
CN106991106A (zh) | 减少由切换输入模态所引起的延迟 | |
KR101813826B1 (ko) | 문자를 입력하기 위한 방법, 장치 및 시스템 | |
CN111554280A (zh) | 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务*** | |
US20180239582A1 (en) | Mobile Virtual Assistant Device | |
CN108132717A (zh) | 候选词的推荐方法、装置、存储介质及移动终端 | |
KR102446676B1 (ko) | AI와 IoT 기능을 융합하여 음성인식과 원격제어를 처리하는 스마트테이블 및 그 동작방법 | |
CN101765064A (zh) | PoC通信服务器装置、终端装置和PoC通信方法 | |
CN109243424A (zh) | 一种一键语音翻译终端及翻译方法 | |
CN111132089B (zh) | 一种车内通话接听方法及*** | |
CN106303084A (zh) | 一种信息记录的方法及装置 | |
CN114138943A (zh) | 对话消息生成方法、装置、电子设备及存储介质 | |
CN106791158A (zh) | 短信发送方法、装置和移动终端 | |
CN106791213A (zh) | 在移动终端本地拨号盘实现QChat业务的方法及装置 | |
CN117131191A (zh) | 互动账号评论方法及装置 | |
CN117076627A (zh) | 一种信息交互方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: Shibuya ku, Tokyo, Japan Patentee after: SCIENCE ARTS, Inc. Country or region after: Japan Address before: Shinjuku, Tokyo, Japan Patentee before: SCIENCE ARTS, Inc. Country or region before: Japan |