TWI690814B

TWI690814B - 文字資訊處理裝置及方法、電腦存儲介質及移動終端

Info

Publication number: TWI690814B
Application number: TW106144287A
Authority: TW
Inventors: 林忠億
Original assignee: 鴻海精密工業股份有限公司
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2020-04-11
Also published as: US20190189108A1; TW201928714A

Abstract

一種文字資訊處理方法，應用於一文字資訊處理裝置中，所述文字資訊處理裝置存儲有語音合成資料庫，該方法包括：接收一文字資訊並記錄發信者；在所述語音合成資料庫中查找所述發信者的個人語音資料；根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放所述語音資訊。本發明還提供一種實現上述文字資訊處理方法的文字資訊處理裝置、電腦存儲介質及移動終端。

Description

文字資訊處理裝置及方法、電腦存儲介質及移動終端

本發明涉及一種資料處理技術，具體涉及一種文字資訊處理裝置、文字資訊處理裝置方法、電腦存儲介質及移動終端。

現有的社交軟體，例如微信、QQ，都僅能接收文字資訊或語音資訊，而且需要隨時查看文字資訊或點擊語音資訊來收聽才能知道資訊內容。當資訊發送者發送文字資訊時而接收者不方便查看，例如開車的時候，可能就會錯過一些重要的資訊。有些軟體能通過文字轉語音(TTS)的方式將文字播出，但語音由本地合成，接受者需要根據語音內容先確認發送者身份再確認發送內容資訊，影響資訊接收的效率。

鑒於上述內容，有必要提供一種可以在不方便查看資訊時快速獲取資訊的文字資訊處理裝置、方法及電腦存儲介質。

一種文字資訊處理方法，應用於一文字資訊處理裝置中，所述文字資訊處理裝置存儲有語音合成資料庫，該方法包括：接收一文字資訊並記錄發信者；在所述語音合成資料庫中查找所述發信者的個人語音資料；根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放所述語音資訊。

優選地，所述方法還包括以下步驟：判斷是否有所述發信者的個人語音資料；及記錄所述發信者的個人語音資料。

優選地，所述記錄所述發信者的個人語音資料包括：識別所述發信者；記錄一指定文字的語音資訊；及提取聲音特性並存入所述發信者的個人語音資料。

優選地，所述提取聲音特性包括：將聲音特性與裝置預設的預設語音的聲音特性做比對；及利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音。

優選地，所述記錄所述發信者的個人語音資料包括：記錄發信者對聲母、韻母及聲調的讀音數據；及儲存所述讀音資料為所述發信者的個人語音。

一種文字資訊處理裝置，存儲有語音合成資料庫，該文字資訊處理裝置包括：接收模組，用以接收一文字資訊並記錄發信者；查找模組，用以在所述語音合成資料庫中查找所述發信者的個人語音資料；轉換模組，用以根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放模組，用以播放所述語音資訊。

優選地，所述文字資訊處理裝置還包括：識別模組，用以識別所述發信者；記錄模組，用以記錄一指定文字的語音資訊；提取模組，用以提取聲音特性並存入所述發信者的個人語音資料；及處理模組，用以將聲音特性與裝置預設的預設語音的聲音特性做比對，及利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音資料。

優選地，所述記錄模組還用以記錄發信者針對對應語言基本讀音單元的讀音資料；所述文字資訊處理裝置還包括儲存模組，所述儲存模組用以儲存所述讀音資料為對應的個人語音至所述語音合成資料庫中。

一種電腦存儲介質，該電腦存儲介質存儲多條指令，所述多條指令適於由處理器載入並執行上述文字資訊處理方法。

一種移動終端，包括：語音合成資料庫，用以儲存個人語音資料；處理器，用以實現一條或一條以上指令；及電腦存儲介質，用以存儲多條指令，所述多條指令適於由處理器載入並執行上述文字資訊處理方法。

上述文字資訊處理裝置及方法，能夠在收到資訊時直接播放出來供使用者知道，不需要打開手機查看，就能知道資訊內容，防止在不方便查看手機的時候錯過資訊。

10:發送終端

100:文字資訊處理裝置

200:接收終端

300:伺服器

31:資料庫

51:接收模組

52:查找模組

53:判斷模組

54:記錄模組

55:轉換模組

56:播放模組

57:識別模組

58:提取模組

59:比對模組

61:生成模組

63:存儲模組

71:處理器

72:顯示幕

73:電腦存儲介質

74:通信介面

75:匯流排

圖1為本發明一實施方式中文字資訊處理裝置與一發送終端的模組連接框圖。

圖2為本發明一實施方式中文字資訊處理方法的步驟流程圖。

圖3為圖2文字資訊處理方法的一實施方式的一記錄發信者的個人語音資料的步驟流程圖。

圖4為圖3文字資訊處理方法的另一實施方式的記錄發信者的個人語音資料的步驟流程圖。

圖5為圖1中文字資訊處理裝置的模組連接框圖。

圖6為圖1中文字資訊處理裝置的內部結構連接框圖。

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都屬於本發明保護的範圍。

需要說明的是，當一個元件被認為是“連接”另一個元件，它可以是直接連接到另一個元件或者可能同時存在居中設置的元件。當一個元件被認為是“設置於”另一個元件，它可以是直接設置在另一個元件上或者可能同時存在居中設置的元件。

除非另有定義，本文所使用的所有的技術和科學術語與屬於本發明的技術領域的技術人員通常理解的含義相同。本文中在本發明的說明書中所使用的術語只是為了描述具體的實施例的目的，不是旨在于限制本發明。本文所使用的術語“及/或”包括一個或多個相關的所列項目的任意的和所有的組合。

請參閱圖1，本發明提供一實施方式中的一種文字資訊處理方法可將文字資訊轉換為個人語音資訊並播出。該方法應用於一文字資訊處理裝置100中。本發明一實施方式中的文字資訊處理系統包括一發送終端10及所述文字資訊處理裝置100。所述發送終端10用以向所述文字資訊處理裝置100發送文字資訊。所述文字資訊處理裝置100存儲有語音合成資料庫31。

請同時參閱圖2，該文字資訊處理方法包括以下步驟：步驟S201：接收一文字資訊並記錄發信者，所述發信者包括發信者名稱及頭像等；步驟S202：在語音合成資料庫中查找所述發信者的個人語音資料；步驟S203：判斷是否有所述發信者的個人語音資料，如果否，則執行步驟S204；如果是，執行步驟S205；步驟S204：記錄發信者的個人語音資料，在一實施方式中，所述個人語音資料包括對應語言的基本單元讀音，例如中文為21個聲母、37韻母、5個聲調組合成的多個讀音；步驟S205：根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及步驟S206：播放語音資訊。

請參閱圖3，具體實現中，所述步驟S204包括：步驟S301：識別所述發信者；步驟S302：記錄一指定文字的語音資訊；步驟S303：提取聲音特性，所述聲音特徵包括音高、音色及音調等；步驟S304：將聲音特性與裝置預設的預設語音的聲音特性做比對；及步驟S305：利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音。

請參閱圖4，為了達到更好的個人語音效果，所述步驟S204還可以包括：步驟S401：記錄發信者對聲母、韻母及聲調組合成的多個讀音資料；及步驟S402：儲存這些讀音資料為對應的個人語音。

所述文字資訊處理方法還包括：設置播放方式。設置播放方式包括打開或關閉自動播放語音開關及選擇合成語音的物件。

當打開自動播放語音開關時，才會自動播放語音資訊，否則需點擊語音資訊才可播放。

所述選擇合成語音的物件包括選擇發信者個人語音及系統預設語音。所述系統預設語音存儲在所述語音合成資料庫31中，當設置以預設語音播放時，則語音合成時，僅需要調取所述預設語音。所述預設語音包括以一特定聲音特性朗讀的21個聲母、37韻母、5個聲調組合成的多個讀音。當語音合成時，將與各個文字對應的讀音連貫起來形成語音資訊，再配以特定的語速。系統預設語音物件可以是機器語音、動畫人物或名人等。

所述文字資訊處理方法還包括存儲文字資訊及語音資訊，以及顯示文字資訊和語音資訊在聊天介面上。

請同時參閱圖5，所述發送終端10可為手機或平板電腦。所述文字資訊處理裝置100包括：接收模組51，用以接收來自所述發送終端10的文字資訊並記錄發信者；查找模組52：用以在語音合成資料庫中查找所述發信者的個人語音資料；判斷模組53：用以判斷語音合成資料庫中是否有所述發信者的個人語音資料；記錄模組54：用以在沒有所述發信者的個人語音資料時記錄發信者的個人語音資料；轉換模組55：用以根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放模組56：用以播放語音資訊。

所述文字資訊處理裝置100還包括：識別模組57：用以識別所述發信者；記錄模組54還用以記錄一指定文字的語音資訊；提取模組58：用以提取聲音特性，所述聲音特徵包括音色及音調等；比對模組59：用以將聲音特性與裝置預設的預設語音的聲音特性做比對；及生成模組61：用以利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音。

為了達到更好的個人語音效果，所述記錄模組54還用以記錄發信者對應語言的基本讀音單元的讀音資料，所述文字資訊處理裝置100還包括存儲模組63，用以儲存這些讀音資料為對應的個人語音至語音合成資料庫31中。

所述文字資訊處理裝置100還包括設置模組65，用以設置播放方式包括打開或關閉自動播放語音開關及選擇合成語音的物件。

所述選擇合成語音的物件包括選擇發信者個人語音及系統預設語音。所述系統預設語音存儲在所述語音合成資料庫31中，當設置以預設語音播放時，則語音合成時，僅需要調取所述預設語音。所述預設語音包括以一特定聲音特性朗讀的基本讀音單元的多個讀音。當語音合成時，將與各個文字對應的讀音連貫起來形成語音資訊，再配以特定的語速。系統預設語音物件可以是機器語音、動畫人物或名人等。

所述存儲模組63還用以存儲文字資訊及語音資訊，以及顯示文字資訊和語音資訊在聊天介面上。

請同時參閱圖6，所述文字資訊處理裝置100的內部結構可包括至少一個處理器(processor)71(圖中以一個處理器71為例)；顯示幕72；以及電腦存儲介質(memory)73，還可以包括通信介面(Communications Interface)74和匯流排75。其中，處理器71、顯示幕72、電腦存儲介質73和通信介面74可以通過匯流排75完成相互間的通信。顯示幕72設置為顯示初始設置模式中預設的使用者引導介面。通信介面74可以傳輸資訊。處理器71可以調用電腦存儲介質73中的邏輯指令，以執行上述實施例中的方法。

此外，上述的電腦存儲介質73中的邏輯指令可以通過軟體功能單元的形式實現並作為獨立的產品銷售或使用時，可以存儲在一個電腦存儲介質中。

電腦存儲介質73可設置為存儲軟體程式、電腦可執行程式，如本公開實施例中的方法對應的程式指令或模組。處理器71通過運行存儲在電腦存儲介質73中的軟體程式、指令或模組，從而執行功能應用以及資料處理，即實現上述實施例中的方法。

電腦存儲介質73可包括存儲程式區和存儲資料區，其中，存儲程式區可存儲作業系統、至少一個功能所需的應用程式；存儲資料區可存儲根據終端設備的使用所創建的資料等。此外，電腦存儲介質73可以包括高速隨機存取電腦存儲介質，還可以包括非易失性電腦存儲介質。例如，U盤、移動硬碟、唯讀電腦存儲介質(Read-Only Memory，ROM)、隨機存取電腦存儲介質(Random Access Memory，RAM)、磁碟或者光碟等多種可以存儲程式碼的介質，也可以是暫態存儲介質。

此外，上述存儲介質以及移動終端中的多條指令處理器載入並執行的具體過程在

上述方法中已經詳細說明，在這裡就不再一一陳述。

在一實施方式中，所述文字資訊處理裝置100包括一移動終端及一伺服器。所述伺服器包括所述處理器及電腦存儲介質。所述移動終端可以是手機或者平板電腦。

所述處理器載入並執行電腦存儲介質中存放的一條或一條以上指令，以實現上述圖2-圖4所示方法流程的相應步驟；具體實現中，電腦存儲介質中的一條或一條以上指令由處理器載入並執行如下步驟：步驟S201：接收一文字資訊並記錄發信者；步驟S202：在語音合成資料庫中查找所述發信者的個人語音資料；步驟S203：判斷是否有所述發信者的個人語音資料，如果否，則執行步驟S204；如果是，執行步驟S205；步驟S204：記錄發信者的個人語音資料；步驟S205：根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及發送語音資訊至接收終端。

所述接收終端200接收語音資訊並播放語音資訊。

所述電腦存儲介質中的一條或一條以上指令由處理器載入並進一步執行所述步驟S204所包括的：步驟S301：識別所述發信者；步驟S302：記錄一指定文字的語音資訊；步驟S303：提取聲音特性，所述聲音特徵包括音色及音調等；步驟S304：將聲音特性與裝置預設的預設語音的聲音特性做比對；及步驟S305：利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音。

電腦存儲介質中的一條或一條以上指令由處理器載入並進一步執行所述步驟S204包括的：步驟S401：記錄發信者對應語言的基本讀音單元的多個讀音資料；及步驟S402：儲存這些讀音資料為對應的個人語音。

所述接收終端200包括終端處理器及終端電腦存儲介質，所述終端電腦存儲介質的一條或一條以上指令由終端處理器載入並執行步驟：設置播放方式。設置播放方式包括打開或關閉自動播放語音開關及選擇合成語音的物件。

所述選擇合成語音的物件包括選擇發信者個人語音及系統預設語音。所述系統預設語音存儲在所述語音合成資料庫31中，當設置以預設語音播放時，則語音合成時，僅需要調取所述預設語音。所述預設語音包括以一特定聲音特性朗讀的對應語言的基本讀音單元的多個讀音。當語音合成時，將與各個文字對應的讀音連貫起來形成語音資訊，再配以特定的語速。系統預設語音物件可以是機器語音、動畫人物或名人等。

在另一實施方式中，所述文字資訊處理裝置100僅為一移動終端。該移動終端可以是手機或者平板電腦。所述移動終端包括處理器71及電腦存儲介質73。

所述處理器載入並執行電腦存儲介質中存放的一條或一條以上指令，以實現上述圖2-圖4所示方法流程的相應步驟；具體實現中，電腦存儲介質中的一條或一條以上指令由處理器載入並執行如下步驟：步驟S201：接收一文字資訊並記錄發信者；步驟S202：在語音合成資料庫中查找所述發信者的個人語音資料；步驟S203：判斷是否有所述發信者的個人語音資料，如果否，則執行步驟S204；如果是，執行步驟S205；步驟S204：記錄發信者的個人語音資料；步驟S205：根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及步驟S206：播放語音資訊。

電腦存儲介質中的一條或一條以上指令由處理器還載入並執行步驟：設置播放方式。設置播放方式包括打開或關閉自動播放語音開關及選擇合成語音的物件。

最後應說明的是，以上實施例僅用以說明本發明的技術方案而非限制。本領域的普通技術人員應當理解，可以對本發明的技術方案進行修改或等同替換，而不脫離本發明技術方案的精神和範圍。基於本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都將屬於本發明保護的範圍。

綜上所述，本發明確已符合發明專利之要件，遂依法提出專利申請。惟，以上所述者僅為本發明之較佳實施方式，自不能以此限制本案之申請專利範圍。舉凡熟悉本案技藝之人士爰依本發明之精神所作之等效修飾或變化，皆應涵蓋於以下申請專利範圍內。

Claims

一種文字資訊處理方法，應用於一文字資訊處理裝置中，所述文字資訊處理裝置存儲有語音合成資料庫，其中該方法包括：接收一文字資訊並記錄發信者；在所述語音合成資料庫中查找所述發信者的個人語音資料；判斷是否有所述發信者的個人語音資料；當有所述發信者的個人語音資料時，根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；當沒有所述發信者的個人語音資料時，識別所述發信者；記錄所述發信者一指定文字的語音資訊；提取所述語音資訊的聲音特性，將聲音特性與預設語音的聲音特性做比對，利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音資料，根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放所述語音資訊。
一種文字資訊處理裝置，存儲有語音合成資料庫，其中該文字資訊處理裝置包括：接收模組，用以接收一文字資訊並記錄發信者；查找模組，用以在所述語音合成資料庫中查找所述發信者的個人語音資料；判斷模組，用以判斷是否有所述發信者的個人語音資料；轉換模組，用以當有所述發信者的個人語音資料時，根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；識別模組，用以當沒有所述發信者的個人語音資料時，識別所述發信者；記錄模組，用以記錄所述發信者一指定文字的語音資訊；提取模組，用以提取所述語音資訊的聲音特性並存入所述發信者的個人語音資料；及處理模組，用以將聲音特性與一預設語音的聲音特性做比對，利用比對的聲音特性差異，對預設語音的聲音特性進行修改並生成發信者的個人語音資料；轉換模組還用以根據所述發信者的個人語音資料將所述文字資訊轉換為語音資訊；及播放模組，用以播放所述語音資訊。
一種電腦存儲介質，其中該電腦存儲介質存儲多條指令，所述多條指令適於由處理器載入並執行如申請專利範圍第1項所述的文字資訊處理方法。
一種移動終端，其中包括：語音合成資料庫，用以儲存個人語音資料；處理器，用以實現一條或一條以上指令；及電腦存儲介質，用以存儲多條指令，所述多條指令適於由處理器載入並執行如申請專利範圍第1項所述的文字資訊處理方法。