JPH03150599A

JPH03150599A - 日本語音節の符号化方式

Info

Publication number: JPH03150599A
Application number: JP1290912A
Authority: JP
Inventors: Atsushi Sakurai; 櫻井　穆; Junichi Tamura; 純一田村; Tetsuo Kosaka; 哲夫小坂
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1989-11-07
Filing date: 1989-11-07
Publication date: 1991-06-26
Also published as: US5208863A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声認識処理や音声合成処理に不可欠従来、日
本語音節の符号化方式は通常日本語のローマ字表記に準
じており、音響楽的性質をあまり考慮していない、第４
図で示すような日本語の５０音表に拗音を付加した形態
が多い。

〔発明が解決しようとしている問題点〕１、Ｌかしなが
ら、上記従来例では半母音−母音連鎖も子音部に含まれ
て上位バイトを示すカテゴリに含まれているために、半
母音−母音連鎖の音節の子音の音韻コードを取り出す処
理が複雑であつだ。

２．従来例では、同じ子音部でも音韻的に異なるものが
あり、音韻を判断するためには上位バイトだけでなく下
位バイトも調べなければならな〜≠ かた。

３、第４図、第５図の従来例においては、下位バイトを
示すカテゴリにおいて、半母音−母音連鎖の音韻が、た
だ順番にコードを与えられているために、音節から母音
のみを取り出そうとした時に、一つずつ調べていかなけ
ればならず、処理が複雑であった。

〔問題点を解決するための手段〕

１、本発明によれば、子音部を取り出す処理を簡略化す
るために上位バイトを示すカテゴリには子音のみを、子
音以外は下位バイトを示すカテゴリに集めた。

２、本発明によれば、日本語音節を構成する子音部のみ
を集め音韻的に互いに他と異なる様に分類した第１のカ
テゴリと、日本語音節を構成する子音部以外を集め音韻
的に互いに他と異なる様に分類した第２のカテゴリとの
組み合わせで日本語音節を表現することにより、外来語
や擬声語を含む全ての日本語音節を体系化して扱うこと
が出来、音声認識や音声合成における音韻単位の処理が
簡潔で明解になる様にしたものである。

３、本発明によれば、下位バイトがら母音のみを取り出
す処理を簡略化するために、子音以外を集めた第２のカ
テゴリにおいて音韻コードを（０５）Ｈで除算した際に
、母音と半母音−母音連鎖の音韻が有する母音とが等し
いものは剰余も等しくなるように関連づけてコード化し
た。

〔実施例〕

第１図、第２図、第３図は本発明の第１の実施例を示し
、第１図は本発明の特徴を最もよく表わす日本語音節の
テーブルの図面であり、日本語音節は子音部を示す上位
バイトと子音部以外（ここで、子音部以外とは、母音、
半母音、それらの組み合わせ等のことである）を示す下
位バイトから構成される。

ここで、第４図に示す従来例においては、上位バイ１−
（０２）Ｈは、下位バイトとの組み合わせで子音文字′
Ｓ′で始まる／す／打音を表現するが、日本語の／ザ／
打音を構成する子音は音韻としては一種類ではなく、歯
茎部における摩擦音／　ｓ　／と硬口蓋歯茎部における
摩擦音／ｆ／とからなる。

具体的には第４図においてＳＡ’、　　’ＳＵ’、　　
’ＳＥ’。

’ｓｏ’の子音部゛Ｓ′は音韻／ｓ／を表わし、’ＳＩ
’″ＳＹＡ’、’ＳＹＵ’、’ＳＹＯ’の子音部′Ｓ゛
は音韻／ｆ／を表わず。このことは、１６進数表記で第
４図において上位バイトがそれぞれ（０３）　Ｈ、（Ｏ
Ｂ）　Ｈ。

（ＯＣ）ｏである子音部文字″Ｔ’、　　’Ｚ’、　　
’Ｄ’についても同様であり、第４図及び第５図におい
て右肩にカナを付加した音節の子音部の音韻は子音文字
が同じである他の音節の子音部と異なる。

よって、従来例では子音部の音韻を判断するのに」１位
バイトだけでなく下位バイトも調べなければいけなかっ
たが本発明においては上位バイトは、日本語音節の子音
部を音韻毎にコード化したもので、原則として英大文字
１字で表現されるが音韻的特徴が似ている子音がある場
合は、英小文字１字も使用して、音韻特徴によりコード
化した。

下位バイトは、日本語音節の子音部以外を音韻毎にコー
ド化したもので、五母音をそれぞれ英大文字／Ａ／、／
Ｉ／、／Ｕ／、／Ｅ／、１０／で表現し、半母音を英大
文字２字で／ＪＡ／、／ＪＵ／。

／ＪＥ／、／ＪＯ／、／ＷＡ／、／ＷＩ／、／ＷＥ／。

／ＷＯ／と表現している。又、半母音で日本語音節とし
て発音されない／ＪＩ／、／ＷＥ／が入るはずのコード
（０６）＋（＋　　（ＱＣ）　Ｈはそれぞれ空欄とした
ままで空けておく。

また、本発明においては外来語や擬声語の音節も新たに
加えていけるので、体系化しやすい。

外来語の例としては「シェフ」の／シエ／。

「ティンパニ」の／ティ／、「チェスＪの／チエ／２「
クォーツ」の／クオ／等があり、擬声語の例としては「
クォーツ」の／グオ／等がある。

第２図は音声の認識や合成の際必要とされるコード化さ
れた日本語音節から子音部の音韻コードだけを取り出す
処理をフローチャートの形で示したもので、本発明によ
れば日本語音節を構成する２バイトの中で上位バイトが
子音部の音韻をそのまま表わしているので、ステップ１
の「上位バイトを取り出す」処理だけで目的が達成され
る。これに対し、従来例では、コード化された日本語音
節から子音部の音韻コードを取り出す処理は上位バイト
の音韻が下位バイトとの組み合わせにより異なるので、
上位バイトのコードに応じて、下位バイトを遂−調べる
必要が生じるため、第６図に示す様に、総計１８ステツ
プの複雑な処理となる。

更に、従来例では第４図で示すテーブルに第５図で示す
外来音／シエ／、／ティ／、／チエ／。

／ジエ／、／デイ／、／クア／、／クイ／、／ジエン。

／クオ／や擬声前／グア／、／グイ／、／グエ／。

／グオ／を付加した場合、第７図で示す様に、総計２６
ステツプの更に複雑な処理になる。これに対し本発明に
よれば、第１図に示すように、任意の外来音や擬声音が
同じ一つのテーブルの中に組み込まれており、外来音や
擬声音に関しても上位バイトが音韻をそのまま表現して
いるので、処理は変化しない。

第３図は、音声の認識や合成の際に必要となる、コード
化された日本語音節から五母音の音韻コードだけを取り
出す処理をフローチャートの形で示したもので、本発明
のテーブルにおいては、半母音である／ＪＡ／、／ＷＡ
／は母音／Ａ／に、半母音／ＷＴ／は母音／Ｉ／に、と
いうように半母音に対応した母音を求めるためには、コ
ード化された日本語音節から下位バイトを取り出しく■
）下位バイトを（０５）　Ｈで除算し、余りを求める（
■）だけで、このステップ■で求められた余りが即ち半
母音に対応した母音のコードであるように半母音にコー
ドを割り当てており、上記のような２ステツプでコード
化された日本語音節から五母音の音韻コードだけを取り
出すことができる。これに対し従来の第４図に示すよう
なテーブルを用いて同じ処理を行なおうとすると、第８
図に示すように、総計７ステツプの複雑な処理が必要と
なる。

〔「ベテイ」という単語から子音の音韻コードを取り出す〕

（１）従来の方法「べ」は／ＢＥ／と表記され、コードは（ＯＤ０３）Ｈ
９「ティ」は／ＴＸＴ／と表記され、コードは（１１０
１）Ｈとなり、このコードから上位バイトを取り出して
第６図、第７図のフローチャートに従って子音の音韻コ
ードを得る。

（ｉ）　（ＯＤＯ３）　、、に対する処理■→■→■→
０→［相］→＠→■→［相］→［相］以上の９ステツプ
より、「べ」の子音の音韻コードは（ＯＤ）Ｈと求まる
。

（ｉｉ　）　（１１０１）　Ｈに対する処理■→■→■
→０→■→＠→［相］以上の７ステツプより、「ティ」
の子音の音韻コードは（０３）と求まる。

（２）本発明による方法「べ」は／ＢＥ／と表記され、コードは（１１０３）Ｈ
。

「ティ」は／Ｔ■／と表記され、コードは（０４０１，
）　Ｈとなり、第２図のフローチャートに従って子音の
音韻コードを得る。

（ｉ）（１１０３）　Ｈに対する処理ステップ■だけで「べ」の子音の音韻コード（１１）Ｈ
を得ることができる。

（ｉｉ）（０４０１）Ｈに対する処理ステップ■だけで「ティ」の子音の音韻コード（０４）
Ｈを得ることができる。

〔発明の効果〕

１、以上説明したように、上位バイトを示すカテゴリに
は子音のみを、子音以外は下位バイトを示すカテゴリに
集めることにより、上位バイトが即ち子音部となり、処
理が簡単になった。

２、日本語音節を構成する子音部のみを集め音韻的に互
いに他と異なるように分類した第１のカテゴリと、日本
語音節を構成する子音部以外の部分を集め音韻的に互い
に他と異なるように分類した第２のカテゴリとを設け、
両者の組み合わせにより日本語音節を表現しているので
、ある音節が特定の音韻を含んでいるか否かを極めて簡
単に判断できる効果がある。

又、２つのカテゴリの組み合わせで任意の外来音や擬声
音を表現できるので、外来語や擬声語の処理も体系的に
行える効果がある。

３、子音以外を集めた第２のカテゴリにおいて、音韻コ
ードを（０５）Ｈで除算した際に、母音と、半母音−母
音連鎖の音韻が有する母音とが等しいものは剰余も等し
くなるように関連づけてコード化することにより、下位
バイトから母音のみを取り出す処理が簡単になった。

【図面の簡単な説明】

第１図は本発明を実施した日本語音節のテーブル、第２
図は日本語音節より子音コードを取り出す処理を示した
図、第３図は日本語音節より母音コードを取り出す処理を示
した図、第４図は従来例の日本語音節のテーブル、第５図は従来
例の外来音と擬声音のテーブル、第６図は従来例の日本
語音節より子音コードを取り出す処理を示した図、第７図は外来音と擬声音を加えた従来例の子音コード処
理を示した図、第８図は従来例の日本語音節より母音コードを取り出す
処理を示した図である。

Claims

【特許請求の範囲】

（１）入力された日本語音節から、音節の子音部と子音
部以外の各々の音韻コードを日本語音節のテーブルを用
いて取り出す日本語音節の符号化方式であって、前記モーラが日本語音節を構成する子音のみを集めた第
１のカテゴリと、日本語音節を構成する子音以外の音声
のみを集めた第２のカテゴリとの組み合わせによりなる
ことを特徴とする日本語音節の符号化方式。
（２）前記第１のカテゴリに属する子音を、音韻的に互
いに異なる特徴を持つ様に分類して符号化したことを特
徴とする、特許請求の範囲第１項の日本語音節符号化方
式。
（３）前記第２のカテゴリに属する子音以外の音声を、
音韻的に互いに異なる特徴を持つ様に分類して符号化し
たことを特徴とする特許請求の範囲第１項の日本語音節
符号化方式。
（４）前記第２のカテゴリにおいて、子音以外の音声を
ある特定の整数で除算することにより、同一の母音部を
有するものは同一の剰余を持つように符号化したことを
特徴とする特許請求の範囲第１或は３項の日本語音節符
号化方式。