JPH03150599A - 日本語音節の符号化方式 - Google Patents

日本語音節の符号化方式

Info

Publication number
JPH03150599A
JPH03150599A JP1290912A JP29091289A JPH03150599A JP H03150599 A JPH03150599 A JP H03150599A JP 1290912 A JP1290912 A JP 1290912A JP 29091289 A JP29091289 A JP 29091289A JP H03150599 A JPH03150599 A JP H03150599A
Authority
JP
Japan
Prior art keywords
japanese
consonants
syllable
consonant
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1290912A
Other languages
English (en)
Inventor
Atsushi Sakurai
櫻井 穆
Junichi Tamura
純一 田村
Tetsuo Kosaka
哲夫 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1290912A priority Critical patent/JPH03150599A/ja
Priority to US07/608,376 priority patent/US5208863A/en
Publication of JPH03150599A publication Critical patent/JPH03150599A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識処理や音声合成処理に不可欠従来、日
本語音節の符号化方式は通常日本語のローマ字表記に準
じており、音響楽的性質をあまり考慮していない、第4
図で示すような日本語の50音表に拗音を付加した形態
が多い。
〔発明が解決しようとしている問題点〕1、Lかしなが
ら、上記従来例では半母音−母音連鎖も子音部に含まれ
て上位バイトを示すカテゴリに含まれているために、半
母音−母音連鎖の音節の子音の音韻コードを取り出す処
理が複雑であつだ。
2.従来例では、同じ子音部でも音韻的に異なるものが
あり、音韻を判断するためには上位バイトだけでなく下
位バイトも調べなければならな〜≠ かた。
3、第4図、第5図の従来例においては、下位バイトを
示すカテゴリにおいて、半母音−母音連鎖の音韻が、た
だ順番にコードを与えられているために、音節から母音
のみを取り出そうとした時に、一つずつ調べていかなけ
ればならず、処理が複雑であった。
〔問題点を解決するための手段〕
1、本発明によれば、子音部を取り出す処理を簡略化す
るために上位バイトを示すカテゴリには子音のみを、子
音以外は下位バイトを示すカテゴリに集めた。
2、本発明によれば、日本語音節を構成する子音部のみ
を集め音韻的に互いに他と異なる様に分類した第1のカ
テゴリと、日本語音節を構成する子音部以外を集め音韻
的に互いに他と異なる様に分類した第2のカテゴリとの
組み合わせで日本語音節を表現することにより、外来語
や擬声語を含む全ての日本語音節を体系化して扱うこと
が出来、音声認識や音声合成における音韻単位の処理が
簡潔で明解になる様にしたものである。
3、本発明によれば、下位バイトがら母音のみを取り出
す処理を簡略化するために、子音以外を集めた第2のカ
テゴリにおいて音韻コードを(05)Hで除算した際に
、母音と半母音−母音連鎖の音韻が有する母音とが等し
いものは剰余も等しくなるように関連づけてコード化し
た。
〔実施例〕
第1図、第2図、第3図は本発明の第1の実施例を示し
、第1図は本発明の特徴を最もよく表わす日本語音節の
テーブルの図面であり、日本語音節は子音部を示す上位
バイトと子音部以外(ここで、子音部以外とは、母音、
半母音、それらの組み合わせ等のことである)を示す下
位バイトから構成される。
ここで、第4図に示す従来例においては、上位バイ1−
(02)Hは、下位バイトとの組み合わせで子音文字′
S′で始まる/す/打音を表現するが、日本語の/ザ/
打音を構成する子音は音韻としては一種類ではなく、歯
茎部における摩擦音/ s /と硬口蓋歯茎部における
摩擦音/f/とからなる。
具体的には第4図においてSA’、  ’SU’、  
’SE’。
’so’の子音部゛S′は音韻/s/を表わし、’SI
’″SYA’、’SYU’、’SYO’の子音部′S゛
は音韻/f/を表わず。このことは、16進数表記で第
4図において上位バイトがそれぞれ(03) H、(O
B) H。
(OC)oである子音部文字″T’、  ’Z’、  
’D’についても同様であり、第4図及び第5図におい
て右肩にカナを付加した音節の子音部の音韻は子音文字
が同じである他の音節の子音部と異なる。
よって、従来例では子音部の音韻を判断するのに」1位
バイトだけでなく下位バイトも調べなければいけなかっ
たが本発明においては上位バイトは、日本語音節の子音
部を音韻毎にコード化したもので、原則として英大文字
1字で表現されるが音韻的特徴が似ている子音がある場
合は、英小文字1字も使用して、音韻特徴によりコード
化した。
下位バイトは、日本語音節の子音部以外を音韻毎にコー
ド化したもので、五母音をそれぞれ英大文字/A/、/
I/、/U/、/E/、10/で表現し、半母音を英大
文字2字で/JA/、/JU/。
/JE/、/JO/、/WA/、/WI/、/WE/。
/WO/と表現している。又、半母音で日本語音節とし
て発音されない/JI/、/WE/が入るはずのコード
(06)+(+  (QC) Hはそれぞれ空欄とした
ままで空けておく。
また、本発明においては外来語や擬声語の音節も新たに
加えていけるので、体系化しやすい。
外来語の例としては「シェフ」の/シエ/。
「ティンパニ」の/ティ/、「チェスJの/チエ/2「
クォーツ」の/クオ/等があり、擬声語の例としては「
クォーツ」の/グオ/等がある。
第2図は音声の認識や合成の際必要とされるコード化さ
れた日本語音節から子音部の音韻コードだけを取り出す
処理をフローチャートの形で示したもので、本発明によ
れば日本語音節を構成する2バイトの中で上位バイトが
子音部の音韻をそのまま表わしているので、ステップ1
の「上位バイトを取り出す」処理だけで目的が達成され
る。これに対し、従来例では、コード化された日本語音
節から子音部の音韻コードを取り出す処理は上位バイト
の音韻が下位バイトとの組み合わせにより異なるので、
上位バイトのコードに応じて、下位バイトを遂−調べる
必要が生じるため、第6図に示す様に、総計18ステツ
プの複雑な処理となる。
更に、従来例では第4図で示すテーブルに第5図で示す
外来音/シエ/、/ティ/、/チエ/。
/ジエ/、/デイ/、/クア/、/クイ/、/ジエン。
/クオ/や擬声前/グア/、/グイ/、/グエ/。
/グオ/を付加した場合、第7図で示す様に、総計26
ステツプの更に複雑な処理になる。これに対し本発明に
よれば、第1図に示すように、任意の外来音や擬声音が
同じ一つのテーブルの中に組み込まれており、外来音や
擬声音に関しても上位バイトが音韻をそのまま表現して
いるので、処理は変化しない。
第3図は、音声の認識や合成の際に必要となる、コード
化された日本語音節から五母音の音韻コードだけを取り
出す処理をフローチャートの形で示したもので、本発明
のテーブルにおいては、半母音である/JA/、/WA
/は母音/A/に、半母音/WT/は母音/I/に、と
いうように半母音に対応した母音を求めるためには、コ
ード化された日本語音節から下位バイトを取り出しく■
)下位バイトを(05) Hで除算し、余りを求める(
■)だけで、このステップ■で求められた余りが即ち半
母音に対応した母音のコードであるように半母音にコー
ドを割り当てており、上記のような2ステツプでコード
化された日本語音節から五母音の音韻コードだけを取り
出すことができる。これに対し従来の第4図に示すよう
なテーブルを用いて同じ処理を行なおうとすると、第8
図に示すように、総計7ステツプの複雑な処理が必要と
なる。
〔「ベテイ」という単語から子音の音韻コードを取り出す〕
(1)従来の方法 「べ」は/BE/と表記され、コードは(OD03)H
9「ティ」は/TXT/と表記され、コードは(110
1)Hとなり、このコードから上位バイトを取り出して
第6図、第7図のフローチャートに従って子音の音韻コ
ードを得る。
(i) (ODO3) 、、に対する処理■→■→■→
0→[相]→@→■→[相]→[相]以上の9ステツプ
より、「べ」の子音の音韻コードは(OD)Hと求まる
(ii ) (1101) Hに対する処理■→■→■
→0→■→@→[相]以上の7ステツプより、「ティ」
の子音の音韻コードは(03)と求まる。
(2)本発明による方法 「べ」は/BE/と表記され、コードは(1103)H
「ティ」は/T■/と表記され、コードは(0401,
) Hとなり、第2図のフローチャートに従って子音の
音韻コードを得る。
(i)(1103) Hに対する処理 ステップ■だけで「べ」の子音の音韻コード(11)H
を得ることができる。
(ii)(0401)Hに対する処理 ステップ■だけで「ティ」の子音の音韻コード(04)
Hを得ることができる。
〔発明の効果〕
1、以上説明したように、上位バイトを示すカテゴリに
は子音のみを、子音以外は下位バイトを示すカテゴリに
集めることにより、上位バイトが即ち子音部となり、処
理が簡単になった。
2、日本語音節を構成する子音部のみを集め音韻的に互
いに他と異なるように分類した第1のカテゴリと、日本
語音節を構成する子音部以外の部分を集め音韻的に互い
に他と異なるように分類した第2のカテゴリとを設け、
両者の組み合わせにより日本語音節を表現しているので
、ある音節が特定の音韻を含んでいるか否かを極めて簡
単に判断できる効果がある。
又、2つのカテゴリの組み合わせで任意の外来音や擬声
音を表現できるので、外来語や擬声語の処理も体系的に
行える効果がある。
3、子音以外を集めた第2のカテゴリにおいて、音韻コ
ードを(05)Hで除算した際に、母音と、半母音−母
音連鎖の音韻が有する母音とが等しいものは剰余も等し
くなるように関連づけてコード化することにより、下位
バイトから母音のみを取り出す処理が簡単になった。
【図面の簡単な説明】
第1図は本発明を実施した日本語音節のテーブル、第2
図は日本語音節より子音コードを取り出す処理を示した
図、 第3図は日本語音節より母音コードを取り出す処理を示
した図、 第4図は従来例の日本語音節のテーブル、第5図は従来
例の外来音と擬声音のテーブル、第6図は従来例の日本
語音節より子音コードを取り出す処理を示した図、 第7図は外来音と擬声音を加えた従来例の子音コード処
理を示した図、 第8図は従来例の日本語音節より母音コードを取り出す
処理を示した図である。

Claims (4)

    【特許請求の範囲】
  1. (1)入力された日本語音節から、音節の子音部と子音
    部以外の各々の音韻コードを日本語音節のテーブルを用
    いて取り出す日本語音節の符号化方式であって、 前記モーラが日本語音節を構成する子音のみを集めた第
    1のカテゴリと、日本語音節を構成する子音以外の音声
    のみを集めた第2のカテゴリとの組み合わせによりなる
    ことを特徴とする日本語音節の符号化方式。
  2. (2)前記第1のカテゴリに属する子音を、音韻的に互
    いに異なる特徴を持つ様に分類して符号化したことを特
    徴とする、特許請求の範囲第1項の日本語音節符号化方
    式。
  3. (3)前記第2のカテゴリに属する子音以外の音声を、
    音韻的に互いに異なる特徴を持つ様に分類して符号化し
    たことを特徴とする特許請求の範囲第1項の日本語音節
    符号化方式。
  4. (4)前記第2のカテゴリにおいて、子音以外の音声を
    ある特定の整数で除算することにより、同一の母音部を
    有するものは同一の剰余を持つように符号化したことを
    特徴とする特許請求の範囲第1或は3項の日本語音節符
    号化方式。
JP1290912A 1989-11-07 1989-11-07 日本語音節の符号化方式 Pending JPH03150599A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1290912A JPH03150599A (ja) 1989-11-07 1989-11-07 日本語音節の符号化方式
US07/608,376 US5208863A (en) 1989-11-07 1990-11-02 Encoding method for syllables

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1290912A JPH03150599A (ja) 1989-11-07 1989-11-07 日本語音節の符号化方式

Publications (1)

Publication Number Publication Date
JPH03150599A true JPH03150599A (ja) 1991-06-26

Family

ID=17762118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1290912A Pending JPH03150599A (ja) 1989-11-07 1989-11-07 日本語音節の符号化方式

Country Status (2)

Country Link
US (1) US5208863A (ja)
JP (1) JPH03150599A (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3397568B2 (ja) * 1996-03-25 2003-04-14 キヤノン株式会社 音声認識方法及び装置
JPH1097276A (ja) * 1996-09-20 1998-04-14 Canon Inc 音声認識方法及び装置並びに記憶媒体
JP3962445B2 (ja) 1997-03-13 2007-08-22 キヤノン株式会社 音声処理方法及び装置
JPH10254486A (ja) 1997-03-13 1998-09-25 Canon Inc 音声認識装置および方法
JP2000047696A (ja) 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
JP2000081892A (ja) * 1998-09-04 2000-03-21 Nec Corp 効果音付加装置および効果音付加方法
JP3728177B2 (ja) 2000-05-24 2005-12-21 キヤノン株式会社 音声処理システム、装置、方法及び記憶媒体
CN1272698C (zh) 2000-10-11 2006-08-30 佳能株式会社 信息处理装置、信息处理方法
JP2002268681A (ja) * 2001-03-08 2002-09-20 Canon Inc 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法
JP2002318594A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP3542578B2 (ja) * 2001-11-22 2004-07-14 キヤノン株式会社 音声認識装置及びその方法、プログラム
US20070097126A1 (en) * 2004-01-16 2007-05-03 Viatcheslav Olchevski Method of transmutation of alpha-numeric characters shapes and data handling system
US20090132237A1 (en) * 2007-11-19 2009-05-21 L N T S - Linguistech Solution Ltd Orthogonal classification of words in multichannel speech recognizers
US8195456B2 (en) * 2009-12-04 2012-06-05 GM Global Technology Operations LLC Robust speech recognition based on spelling with phonetic letter families

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62284398A (ja) * 1986-06-03 1987-12-10 松下電器産業株式会社 文・音声変換装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4389059A (en) * 1980-11-10 1983-06-21 Allied Corporation Seat belt webbing guide
FR2547146B1 (fr) * 1983-06-02 1987-03-20 Texas Instruments France Procede et dispositif pour l'audition de messages parles synthetises et pour la visualisation de messages graphiques correspondants
JPH0833744B2 (ja) * 1986-01-09 1996-03-29 株式会社東芝 音声合成装置
US4829573A (en) * 1986-12-04 1989-05-09 Votrax International, Inc. Speech synthesizer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62284398A (ja) * 1986-06-03 1987-12-10 松下電器産業株式会社 文・音声変換装置

Also Published As

Publication number Publication date
US5208863A (en) 1993-05-04

Similar Documents

Publication Publication Date Title
Zhang The role of contrast-specific and language-specific phonetics in contour tone distribution
SY Phonological features of tone
JPH03150599A (ja) 日本語音節の符号化方式
Silva et al. A rule-based grapheme-phone converter and stress determination for Brazilian Portuguese natural language processing
Joshi et al. Text to speech system for Kannada language
Huang Nasality in Zhangzhou: distribution and constraint
Kumar et al. Significance of durational knowledge for speech synthesis system in an Indian language
Ranjha Urdu syllable: Templates and constraints
Afsar et al. Comparing Consonantal Phonemes of Pakistani Standard English with British Standard English.
van de Weijer Affricates in English as a natural class
Raghavendra et al. Speech synthesis using approximate matching of syllables
Mattingly Synthesis by rule as a tool for phonological research
Dika et al. The principles of designing of algorithm for speech synthesis from texts written in Albanian language
Braga et al. to-sound conversion for galician TTS systems
Van Dong et al. COMPUTATIONAL LINGUISTIC MATERIAL FOR VIETNAMESE SPEECH PROCESSING: APPLYING IN VIETNAMESE TEXT-TO-SPEECH.
Kaur et al. Segmentation of Punjabi Text into Prosodic Unit
Herdan The relation between the functional burdening of phonemes and the frequency of occurrence
Kim et al. A corpus-based study of English pronunciation variations
Singh et al. Punjabi text-to-speech synthesis system
Hirst On prosodic structure.
Rose Reverse-engineering tones and tone sandhi in Wenzhou dialect: between-speaker differences and historical development
KR100202539B1 (ko) 음성합성방법
Kuo Phonetic and phonological background of Chinese spoken languages
Sindran Automatic Phonetic Transcription of Standard Arabic with Applications in the NLP Domain
Fuller Word-initial/p/in Khalkha Mongolian: Variation in Connected Speech