TW201417063A

TW201417063A - 中文電子有聲書播放裝置及方法

Info

Publication number: TW201417063A
Application number: TW101138729A
Authority: TW
Inventors: Dian-Liang Gao
Original assignee: Univ Ishou
Priority date: 2012-10-19
Filing date: 2012-10-19
Publication date: 2014-05-01

Abstract

一種中文電子有聲書播放裝置，適用於一電子有聲書媒體文件，包含一解譯模組、一中文字轉語音模組，及一音效卡。該解譯模組用以解譯該電子有聲書媒體文件，以產生多段文句。該中文字轉語音模組用以將該等文句轉換為多段合成人聲。該音效卡用以輸出該等合成人聲。一種中文電子有聲書播放方法，適用於一電子有聲書媒體文件，該中文電子有聲書播放方法包含下列步驟：(A)利用一解譯模組解譯該電子有聲書媒體文件，以產生多段文句；(B)利用一中文字轉語音模組接收該等文句，並產生多段合成人聲；及(C)輸出該等文句及該等合成人聲。

Description

中文電子有聲書播放裝置及方法

本發明是有關於一種播放裝置及方法，特別是指一種中文電子有聲書播放裝置及方法。

隨著時代的進步，各式各樣的電子書改變了人們的閱讀經驗，其中，電子有聲書是比較特別的一種，因為電子有聲書除了視覺上的資訊，更可以讓使用者接受到聽覺上的訊息。最初，電子有聲書是專門為視障人士發展的，讓視力不佳的人們也可以像明眼人一樣享受到書中的豐富的資訊內容。如今，電子有聲書已經普及至一般使用者的生活中，由於電子有聲書也提供了聲音資訊，而聲音能傳達更多的表情、包含更深的情感，具有更能夠吸引讀者、讓人著迷的特質，所以無論是一般使用者、視障人士，甚至是學齡前兒童，都可以享受到電子有聲書所帶來更豐富的使用者經驗。

傳統上的電子有聲書媒體文件，包含文字檔和音訊檔，製作時，出版商會先請人逐段錄製該音訊檔，如MP3檔案。然而，即便是經過壓縮的MP3檔案，相較於文字檔，仍然需要相當大的儲存空間，對於希望能隨身攜帶的電子有聲書播放裝置來說，需要較大的儲存空間代表著需要更多的記憶體，更高的成本。再者，記憶體中能放入的電子有聲書媒體文件也會比較少。

因此，本發明之目的，即在提供一種中文電子有聲書播放裝置。

於是，本發明中文電子有聲書播放裝置，適用於一電子有聲書媒體文件，包含一音效卡、一中文字轉語音模組，及一解譯模組。

該解譯模組用以解譯該電子有聲書媒體文件，以產生多段文句。該中文字轉語音模組用以將該等文句轉換為多段合成人聲。該音效卡則用以輸出該等合成人聲。

本發明之另一目的，即在提供一種中文電子有聲書播放方法。

於是，本發明中文電子有聲書播放方法，適用於一電子有聲書媒體文件，該中文電子有聲書播放方法包含下列步驟： (A)利用一解譯模組解譯該電子有聲書媒體文件，以產生多段文句； (B)利用一中文字轉語音模組接收該等文句，並產生多段合成人聲；及 (C)輸出該等文句及該等合成人聲。

有關本發明之前述及其他技術內容、特點與功效，在以下配合參考圖式之一個較佳實施例的詳細說明中，將可清楚的呈現。

在本發明被詳細描述之前，要注意的是，在以下的說明內容中，類似的元件是以相同的編號來表示。

參閱圖1及圖3，本發明中文電子有聲書播放裝置之較佳實施例，適用於一電子有聲書媒體文件10，該電子有聲書媒體文件10包括至少一內文檔案101、至少一同步檔案102及一結構檔案103。

該內文檔案101用以儲存該電子有聲書媒體文件10主要內文的文字內容，副檔名為.xml。

該同步檔案102用以指向該內文檔案101並使該內文檔案101中的文字內容與所產生的合成人聲相對應，副檔名為.smil。

該結構檔案103用以規範該電子有聲書媒體文件10的具體結構，副檔名為.ncc。由於電子有聲書媒體文件10以多層次架構呈現，包括篇、章、頁、節、小節、段落等多個項目，根據該結構檔案103產生一目錄，定義項目之間的順序，且項目之間具有連結，讓使用者可根據該目錄，在項目之間直接切換。

該結構檔案103包括多個標籤，每一標籤對應到文字內容或者還進一步根據同步檔案102連結到儲存文字內容的內文檔案101，如，

</docTitle>

</docAuthor>

</navLabel>

</navPoint>

其中，標籤<docTitle>(書名)對應文字內容「三國演義」、標籤<docAuthor>(作者)對應文字內容「羅貫中」、標籤<navLabel>(章節)對應文字內容「第一章」，且根據同步檔案102”smilFile1.smil”連結到包括第一章文字內容的內文檔案101。

值得一提的是，在本較佳實施例中，該電子有聲書媒體文件10中的內文檔案101、同步檔案102、結構檔案103皆符合XML規格，並支援多語系及Unicode。

該中文電子有聲書播放裝置包含一殼體(圖未示)、一音效卡1、一顯示幕2、一中文字轉語音模組3、一解譯模組4、一操作面版5，及一處理器6。在本較佳實施例中，以平板電腦搭配平板電腦軟體(App)實施本發明。

該音效卡1設置於該殼體中。

該顯示幕2用以呈現該電子有聲書媒體文件10的文字內容。

該操作面版5用以提供使用者選擇電子有聲書媒體文件 10，並進行播放、暫停、後退等功能。

在本較佳實施例中，該顯示幕2及操作面版5以平板電腦之觸控螢幕實施。藉由該顯示幕2及操作面版5的配合，使用者可以選擇想要閱讀的電子有聲書媒體文件10。

該解譯模組4用以解譯該電子有聲書媒體文件10以產生多段文句並輸出至中文字轉語音模組3，包括一具有多個欄位的資料結構41、一內容讀取單元42及一內容生成單元43。在本較佳實施例中，該解譯模組4為該平版電腦軟體之軟體元件，在載入該中文電子有聲書播放裝置的處理器6之後可達成所述之功能。

該資料結構41用以記錄電子有聲書媒體文件10中的標籤及所對應的文字內容，以一由電腦程式語言寫成的Book類別實作。

該內容讀取單元42負責讀取該電子有聲書媒體文件10，然後將文字內容儲存在該資料結構41中。

該內容生成單元43用以尋訪該資料結構41，並加以輸出。其中，該內容讀取單元42及該內容生成單元43以一Reader類別實作。

該中文字轉語音模組3用以產生合成人聲，包括一文句分析單元31、一單位音產生單元32、一韻律產生單元33、一語音合成單元34，及一中文人聲資料庫35。在本較佳實施例中，該中文字轉語音模組3為該平版電腦軟體之軟體元件，在載入該中文電子有聲書播放裝置的處理器6之後可達成所述之功能。其中，該等單元31、32、33、34皆由電腦程式語言寫成，相互配合可達成該中文字轉語音模組3之功能。

再者，該中文人聲資料庫35之人聲資料不限完全由電腦運算產生，也可以事先以真實人聲單音錄製，目前普遍認為後者可以產生較好的音色。

以下配合一中文電子有聲書播放方法，對於上述之音效卡1、顯示幕2、中文字轉語音模組3、解譯模組4、操作面版5，及處理器6之間的互動關係，進一步地說明。

參閱圖1、圖2及圖3，首先，利用解譯模組4解譯該電子有聲書媒體文件10，以產生多段文句。使用者先藉由該操作面版5選擇想要閱讀的電子有聲書媒體文件10，然後按下播放鈕，接著，如步驟S1所示，解譯模組4的內容讀取單元42會讀取該電子有聲書媒體文件10的結構檔案103、同步檔案102及內文檔案101，取得多個標籤及多個與該等標籤對應的文字內容，並儲存於該資料結構41的欄位之中。接著，如步驟S2所示，該內容生成單元43尋訪該資料結構41，以產生該等文句，並進一步將該等文句輸出至該中文字轉語音模組3。

接下來，該中文字轉語音模組3接收該等文句，並產生多段合成人聲。如步驟S3所示，該文句分析單元31將該等文句分析後產生多個單位音代號及多個語文特徵值。之後，如步驟S4所示，將該等單位音代號輸入該單位音產生單元32以產生多個語音參數，並且將該等語文特徵值輸入該韻律產生單元33以產生多個自然語音韻律。然後，如步驟S5所示，將該等語音參數及該等自然語音韻律輸入該語音合成單元34，然後根據該中文人聲資料庫35產生該等合成人聲。

然後，如步驟S6所示，該語音合成單元34配合該同步檔案102輸出該等文句及該等合成人聲。此時使用者可聽到由該音效卡1所輸出的合成人聲，以及看到與合成人聲相對應地輸出於該顯示幕2的該等文句。

綜上所述，本發明藉由該中文字轉語音模組3接收文句，並配合該中文人聲資料庫35，產生合成人聲。使得該電子有聲書媒體文件10中即使不包括音訊檔亦能輸出合成人聲，以供使用者聆聽，故確實能達成本發明之目的。

惟以上所述者，僅為本發明之較佳實施例而已，當不能以此限定本發明實施之範圍，即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾，皆仍屬本發明專利涵蓋之範圍內。

1‧‧‧音效卡

10‧‧‧電子有聲書媒體文件

101‧‧‧內文檔案

102‧‧‧同步檔案

103‧‧‧結構檔案

2‧‧‧顯示幕

3‧‧‧中文字轉語音模組

31‧‧‧文句分析單元

32‧‧‧單位音產生單元

33‧‧‧韻律產生單元

34‧‧‧語音合成單元

35‧‧‧中文人聲資料庫

4‧‧‧解譯模組

41‧‧‧資料結構

42‧‧‧內容讀取單元

43‧‧‧內容生成單元

5‧‧‧操作面版

6‧‧‧處理器

S1~S6‧‧‧步驟

圖1是一功能方塊圖，說明本發明中文電子有聲書播放裝置之較佳實施例；圖2是一流程圖，說明本發明中文電子有聲書播放方法之較佳實施例；及圖3是一示意圖，說明本發明中的電子有聲書媒體文件之較佳實施例。