TW201417063A - 中文電子有聲書播放裝置及方法 - Google Patents

中文電子有聲書播放裝置及方法 Download PDF

Info

Publication number
TW201417063A
TW201417063A TW101138729A TW101138729A TW201417063A TW 201417063 A TW201417063 A TW 201417063A TW 101138729 A TW101138729 A TW 101138729A TW 101138729 A TW101138729 A TW 101138729A TW 201417063 A TW201417063 A TW 201417063A
Authority
TW
Taiwan
Prior art keywords
unit
chinese
file
electronic
audiobook
Prior art date
Application number
TW101138729A
Other languages
English (en)
Inventor
Dian-Liang Gao
Original Assignee
Univ Ishou
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Ishou filed Critical Univ Ishou
Priority to TW101138729A priority Critical patent/TW201417063A/zh
Publication of TW201417063A publication Critical patent/TW201417063A/zh

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

一種中文電子有聲書播放裝置,適用於一電子有聲書媒體文件,包含一解譯模組、一中文字轉語音模組,及一音效卡。該解譯模組用以解譯該電子有聲書媒體文件,以產生多段文句。該中文字轉語音模組用以將該等文句轉換為多段合成人聲。該音效卡用以輸出該等合成人聲。一種中文電子有聲書播放方法,適用於一電子有聲書媒體文件,該中文電子有聲書播放方法包含下列步驟:(A)利用一解譯模組解譯該電子有聲書媒體文件,以產生多段文句;(B)利用一中文字轉語音模組接收該等文句,並產生多段合成人聲;及(C)輸出該等文句及該等合成人聲。

Description

中文電子有聲書播放裝置及方法
本發明是有關於一種播放裝置及方法,特別是指一種中文電子有聲書播放裝置及方法。
隨著時代的進步,各式各樣的電子書改變了人們的閱讀經驗,其中,電子有聲書是比較特別的一種,因為電子有聲書除了視覺上的資訊,更可以讓使用者接受到聽覺上的訊息。最初,電子有聲書是專門為視障人士發展的,讓視力不佳的人們也可以像明眼人一樣享受到書中的豐富的資訊內容。如今,電子有聲書已經普及至一般使用者的生活中,由於電子有聲書也提供了聲音資訊,而聲音能傳達更多的表情、包含更深的情感,具有更能夠吸引讀者、讓人著迷的特質,所以無論是一般使用者、視障人士,甚至是學齡前兒童,都可以享受到電子有聲書所帶來更豐富的使用者經驗。
傳統上的電子有聲書媒體文件,包含文字檔和音訊檔,製作時,出版商會先請人逐段錄製該音訊檔,如MP3檔案。然而,即便是經過壓縮的MP3檔案,相較於文字檔,仍然需要相當大的儲存空間,對於希望能隨身攜帶的電子有聲書播放裝置來說,需要較大的儲存空間代表著需要更多的記憶體,更高的成本。再者,記憶體中能放入的電子有聲書媒體文件也會比較少。
因此,本發明之目的,即在提供一種中文電子有聲書播放裝置。
於是,本發明中文電子有聲書播放裝置,適用於一電子有聲書媒體文件,包含一音效卡、一中文字轉語音模組,及一解譯模組。
該解譯模組用以解譯該電子有聲書媒體文件,以產生多段文句。該中文字轉語音模組用以將該等文句轉換為多段合成人聲。該音效卡則用以輸出該等合成人聲。
本發明之另一目的,即在提供一種中文電子有聲書播放方法。
於是,本發明中文電子有聲書播放方法,適用於一電子有聲書媒體文件,該中文電子有聲書播放方法包含下列步驟: (A)利用一解譯模組解譯該電子有聲書媒體文件,以產生多段文句; (B)利用一中文字轉語音模組接收該等文句,並產生多段合成人聲;及 (C)輸出該等文句及該等合成人聲。
有關本發明之前述及其他技術內容、特點與功效,在以下配合參考圖式之一個較佳實施例的詳細說明中,將可清楚的呈現。
在本發明被詳細描述之前,要注意的是,在以下的說明內容中,類似的元件是以相同的編號來表示。
參閱圖1及圖3,本發明中文電子有聲書播放裝置之較佳實施例,適用於一電子有聲書媒體文件10,該電子有聲書媒體文件10包括至少一內文檔案101、至少一同步檔案102及一結構檔案103。
該內文檔案101用以儲存該電子有聲書媒體文件10主要內文的文字內容,副檔名為.xml。
該同步檔案102用以指向該內文檔案101並使該內文檔案101中的文字內容與所產生的合成人聲相對應,副檔名為.smil。
該結構檔案103用以規範該電子有聲書媒體文件10的具體結構,副檔名為.ncc。由於電子有聲書媒體文件10以多層次架構呈現,包括篇、章、頁、節、小節、段落等多個項目,根據該結構檔案103產生一目錄,定義項目之間的順序,且項目之間具有連結,讓使用者可根據該目錄,在項目之間直接切換。
該結構檔案103包括多個標籤,每一標籤對應到文字內容或者還進一步根據同步檔案102連結到儲存文字內容的內文檔案101,如,
<docTitle>
<text>三國演義</text>
</docTitle>
<docAuthor>
<text>羅貫中</text>
</docAuthor>
<navPoint id=”item1”>
<navLabel>
<text>第一章</text>
</navLabel>
<content src=”smilFile1.smil”/>
</navPoint>
其中,標籤<docTitle>(書名)對應文字內容「三國演義」、標籤<docAuthor>(作者)對應文字內容「羅貫中」、標籤<navLabel>(章節)對應文字內容「第一章」,且根據同步檔案102”smilFile1.smil”連結到包括第一章文字內容的內文檔案101。
值得一提的是,在本較佳實施例中,該電子有聲書媒體文件10中的內文檔案101、同步檔案102、結構檔案103皆符合XML規格,並支援多語系及Unicode。
該中文電子有聲書播放裝置包含一殼體(圖未示)、一音效卡1、一顯示幕2、一中文字轉語音模組3、一解譯模組4、一操作面版5,及一處理器6。在本較佳實施例中,以平板電腦搭配平板電腦軟體(App)實施本發明。
該音效卡1設置於該殼體中。
該顯示幕2用以呈現該電子有聲書媒體文件10的文字內容。
該操作面版5用以提供使用者選擇電子有聲書媒體文件 10,並進行播放、暫停、後退等功能。
在本較佳實施例中,該顯示幕2及操作面版5以平板電腦之觸控螢幕實施。藉由該顯示幕2及操作面版5的配合,使用者可以選擇想要閱讀的電子有聲書媒體文件10。
該解譯模組4用以解譯該電子有聲書媒體文件10以產生多段文句並輸出至中文字轉語音模組3,包括一具有多個欄位的資料結構41、一內容讀取單元42及一內容生成單元43。在本較佳實施例中,該解譯模組4為該平版電腦軟體之軟體元件,在載入該中文電子有聲書播放裝置的處理器6之後可達成所述之功能。
該資料結構41用以記錄電子有聲書媒體文件10中的標籤及所對應的文字內容,以一由電腦程式語言寫成的Book類別實作。
該內容讀取單元42負責讀取該電子有聲書媒體文件10,然後將文字內容儲存在該資料結構41中。
該內容生成單元43用以尋訪該資料結構41,並加以輸出。其中,該內容讀取單元42及該內容生成單元43以一Reader類別實作。
該中文字轉語音模組3用以產生合成人聲,包括一文句分析單元31、一單位音產生單元32、一韻律產生單元33、一語音合成單元34,及一中文人聲資料庫35。在本較佳實施例中,該中文字轉語音模組3為該平版電腦軟體之軟體元件,在載入該中文電子有聲書播放裝置的處理器6之後可達成所述之功能。其中,該等單元31、32、33、34皆由電腦程式 語言寫成,相互配合可達成該中文字轉語音模組3之功能。
再者,該中文人聲資料庫35之人聲資料不限完全由電腦運算產生,也可以事先以真實人聲單音錄製,目前普遍認為後者可以產生較好的音色。
以下配合一中文電子有聲書播放方法,對於上述之音效卡1、顯示幕2、中文字轉語音模組3、解譯模組4、操作面版5,及處理器6之間的互動關係,進一步地說明。
參閱圖1、圖2及圖3,首先,利用解譯模組4解譯該電子有聲書媒體文件10,以產生多段文句。使用者先藉由該操作面版5選擇想要閱讀的電子有聲書媒體文件10,然後按下播放鈕,接著,如步驟S1所示,解譯模組4的內容讀取單元42會讀取該電子有聲書媒體文件10的結構檔案103、同步檔案102及內文檔案101,取得多個標籤及多個與該等標籤對應的文字內容,並儲存於該資料結構41的欄位之中。接著,如步驟S2所示,該內容生成單元43尋訪該資料結構41,以產生該等文句,並進一步將該等文句輸出至該中文字轉語音模組3。
接下來,該中文字轉語音模組3接收該等文句,並產生多段合成人聲。如步驟S3所示,該文句分析單元31將該等文句分析後產生多個單位音代號及多個語文特徵值。之後,如步驟S4所示,將該等單位音代號輸入該單位音產生單元32以產生多個語音參數,並且將該等語文特徵值輸入該韻律產生單元33以產生多個自然語音韻律。然後,如步驟S5所示,將該等語音參數及該等自然語音韻律輸入該語音合成單 元34,然後根據該中文人聲資料庫35產生該等合成人聲。
然後,如步驟S6所示,該語音合成單元34配合該同步檔案102輸出該等文句及該等合成人聲。此時使用者可聽到由該音效卡1所輸出的合成人聲,以及看到與合成人聲相對應地輸出於該顯示幕2的該等文句。
綜上所述,本發明藉由該中文字轉語音模組3接收文句,並配合該中文人聲資料庫35,產生合成人聲。使得該電子有聲書媒體文件10中即使不包括音訊檔亦能輸出合成人聲,以供使用者聆聽,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
1‧‧‧音效卡
10‧‧‧電子有聲書媒體文件
101‧‧‧內文檔案
102‧‧‧同步檔案
103‧‧‧結構檔案
2‧‧‧顯示幕
3‧‧‧中文字轉語音模組
31‧‧‧文句分析單元
32‧‧‧單位音產生單元
33‧‧‧韻律產生單元
34‧‧‧語音合成單元
35‧‧‧中文人聲資料庫
4‧‧‧解譯模組
41‧‧‧資料結構
42‧‧‧內容讀取單元
43‧‧‧內容生成單元
5‧‧‧操作面版
6‧‧‧處理器
S1~S6‧‧‧步驟
圖1是一功能方塊圖,說明本發明中文電子有聲書播放裝置之較佳實施例;圖2是一流程圖,說明本發明中文電子有聲書播放方法之較佳實施例;及圖3是一示意圖,說明本發明中的電子有聲書媒體文件之較佳實施例。
1‧‧‧音效卡
2‧‧‧顯示幕
3‧‧‧中文字轉語音模組
31‧‧‧文句分析單元
32‧‧‧單位音產生單元
33‧‧‧韻律產生單元
34‧‧‧語音合成單元
35‧‧‧中文人聲資料庫
4‧‧‧解譯模組
41‧‧‧資料結構
42‧‧‧內容讀取單元
43‧‧‧內容生成單元
5‧‧‧操作面版
6‧‧‧處理器

Claims (9)

  1. 一種中文電子有聲書播放裝置,適用於一電子有聲書媒體文件,包含:一解譯模組,用以解譯該電子有聲書媒體文件,以產生多段文句;一中文字轉語音模組,用以將該等文句轉換為多段合成人聲;及一音效卡,用以輸出該等合成人聲。
  2. 根據申請專利範圍第1項所述之中文電子有聲書播放裝置,其中該中文字轉語音模組包括一文句分析單元、一單位音產生單元、一韻律產生單元、一語音合成單元,及一中文人聲資料庫,該文句分析單元將該等文句分析後產生多個單位音代號及多個語文特徵值,然後將該等單位音代號輸入該單位音產生單元以產生多個語音參數,且該等語文特徵值輸入該韻律產生單元以產生多個自然語音韻律,再將該等語音參數及該等自然語音韻律輸入該語音合成單元,然後根據該中文人聲資料庫產生該等合成人聲。
  3. 根據申請專利範圍第1項所述之中文電子有聲書播放裝置,其中該解譯模組包括一具有多個欄位的資料結構、一內容讀取單元,及一內容生成單元,該內容讀取單元用以讀取該電子有聲書媒體文件,取得多個標籤及多個與該等標籤對應的文字內容,並儲存於該資料結構的欄位之中,該內容生成單元用以尋訪該資料結構,將該等 文句輸出至該中文字轉語音模組。
  4. 根據申請專利範圍第3項所述之中文電子有聲書播放裝置,其中還包含一顯示幕,該等文句還與該等合成人聲相對應地輸出於該顯示幕。
  5. 根據申請專利範圍第4項所述之中文電子有聲書播放裝置,其中該電子有聲書媒體文件,包括至少一內文檔案、至少一同步檔案,及一結構檔案,該內容讀取單元讀取該結構檔案、同步檔案,及該內文檔案,以取得該等標籤及所對應的文字內容並儲存至該資料結構中,該內容生成單元尋訪該資料結構,輸出該等文句至該中文字轉語音模組,並配合該同步檔案使該等文句與該等合成人聲相對應地輸出。
  6. 一種中文電子有聲書播放方法,適用於一電子有聲書媒體文件,該中文電子有聲書播放方法包含下列步驟:(A)利用一解譯模組解譯該電子有聲書媒體文件,以產生多段文句;(B)利用一中文字轉語音模組接收該等文句,並產生多段合成人聲;及(C)輸出該等合成人聲。
  7. 根據申請專利範圍第6項所述之中文電子有聲書播放方法,其中該中文字轉語音模組包括一文句分析單元、一單位音產生單元、一韻律產生單元、一語音合成單元,及一中文人聲資料庫,該步驟(B)包括下列子步驟:(B-1)該文句分析單元將該等文句分析後產生多個 單位音代號及多個語文特徵值;(B-2)將該等單位音代號輸入該單位音產生單元以產生多個語音參數,並且將該等語文特徵值輸入該韻律產生單元以產生多個自然語音韻律;及(B-3)將該等語音參數及該等自然語音韻律輸入該語音合成單元,然後根據該中文人聲資料庫產生該等合成人聲。
  8. 根據申請專利範圍第6項所述之中文電子有聲書播放方法,其中該解譯模組包括一具有多個欄位的資料結構、一內容讀取單元及一內容生成單元,該步驟(A)中包括下列子步驟:(A-1)該內容讀取單元讀取該電子有聲書媒體文件,取得多個標籤及多個與該等標籤對應的文字內容,並儲存於該資料結構的欄位之中;及(A-2)該內容生成單元尋訪該資料結構,將該等文句輸出至該中文字轉語音模組。
  9. 根據申請專利範圍第8項所述之中文電子有聲書播放方法,其中該電子有聲書媒體文件包括至少一內文檔案、至少一同步檔案及一結構檔案,在子步驟(A-1)中,該內容讀取單元先讀取該結構檔案、同步檔案及內文檔案,以取得該等標籤及對應的文字內容並儲存至該資料結構中;在子步驟(A-2)中,該內容生成單元尋訪該資料結構,輸出該等文句至該中文字轉語音模組;在步驟(C)中,配合該同步檔案使該等文句與該等合成人聲相對應地輸 出。
TW101138729A 2012-10-19 2012-10-19 中文電子有聲書播放裝置及方法 TW201417063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW101138729A TW201417063A (zh) 2012-10-19 2012-10-19 中文電子有聲書播放裝置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101138729A TW201417063A (zh) 2012-10-19 2012-10-19 中文電子有聲書播放裝置及方法

Publications (1)

Publication Number Publication Date
TW201417063A true TW201417063A (zh) 2014-05-01

Family

ID=51293890

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101138729A TW201417063A (zh) 2012-10-19 2012-10-19 中文電子有聲書播放裝置及方法

Country Status (1)

Country Link
TW (1) TW201417063A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825732A (zh) * 2016-05-23 2016-08-03 河南科技学院 汉语言文学教学用辅助***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825732A (zh) * 2016-05-23 2016-08-03 河南科技学院 汉语言文学教学用辅助***

Similar Documents

Publication Publication Date Title
US9142201B2 (en) Distribution of audio sheet music within an electronic book
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8359202B2 (en) Character models for document narration
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8352272B2 (en) Systems and methods for text to speech synthesis
US20080005656A1 (en) Apparatus, method, and file format for text with synchronized audio
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
WO2010036486A2 (en) Systems and methods for speech preprocessing in text to speech synthesis
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
KR20110070496A (ko) 전자책 시스템에서 인터랙티브 컨텐츠 제공 장치 및 방법
KR20060088175A (ko) 멀티 포맷을 갖는 전자책 파일 생성 방법 및 시스템
JP4697432B2 (ja) 音楽再生装置、音楽再生方法及び音楽再生用プログラム
TW201417063A (zh) 中文電子有聲書播放裝置及方法
KR101124798B1 (ko) 전자 그림책 편집 장치 및 방법
Turpin et al. Tools for analyzing verbal art in the field
CN201585019U (zh) 具有语音转换功能的移动终端
JP2005326811A (ja) 音声合成装置および音声合成方法
Gatti et al. To sing like a mockingbird
JP4407119B2 (ja) 命令コード作成装置
JP2007323034A (ja) 音声情報と文字・画像表示レイヤーを有するpdf文書による外国語学習用の教材の作成方法
JP2020204683A (ja) 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム
Kerscher et al. Accessible DAISY multimedia: Making reading easier for all
KR20170018281A (ko) 이 보이스북 편집장치 및 재생장치