JP2009086597A

JP2009086597A - テキスト音声変換サービスシステム及び方法

Info

Publication number: JP2009086597A
Application number: JP2007259847A
Authority: JP
Inventors: Shiyunsuke Akifuji; 俊介秋藤
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2007-10-03
Filing date: 2007-10-03
Publication date: 2009-04-23

Abstract

【課題】文章の一部分を変換した音声データを作成し、不適切な用語の発声と同じになるように音声データの再生順序を作成すれば、これを聞いた側では、不適切な用語を発声したように聞こえる。
【解決手段】テキストデータを音声データに変換する際に、音声データの読みを表すテキストデータも生成する。複数の部分テキストデータに対応する音声データの読みを表すテキストデータの再生順序を変更し、変更した読みを表すテキストデータが予め設定した読み上げ禁止用語に該当する場合に、部分テキストデータに対応する音声データを予め定めた音声データに置換する。
【選択図】図１

Description

本発明は、ブログサイト（blog（Weblog）をWebサーバで公開および運用することを代行するサイト）やＳＮＳサイト（Social Networking Service：コミュニティ型のWebサイト）において、ユーザからのテキストデータからなる文章をネットワーク経由で入力し、音声データに変換して公開し、他のユーザが閲覧した際に文章を音声で出力するテキスト音声変換サービスシステムに関するものである。

人間の声を蓄積、解析し、特徴を表す特徴データを抽出し、その特徴データを用いて、任意のテキストデータを音声データに変換し、あたかも人間のように自然なアクセントで発声する音声合成装置が出現してきた。これらの音声合成装置として、例えば、ＨｉｄｅｙｕｋｉＭｉｚｕｎｏ、他著、Ｔｅｘｔ−ｔｏ−ＳｐｅｅｃｈＳｙｎｔｈｅｓｉｓＴｅｃｈｎｏｌｏｇｙＵｓｉｎｇＣｏｒｐｕｓ−ＢａｓｅｄＡｐｐｒｏａｃｈ、ＮＴＴＴｅｃｈｎｉｃａｌＲｅｖｉｅｗ、Ｖｏｌ．２、Ｎｏ．３、ｐｐ．７０−７５、Ｍａｒｃｈ２００４（非特許文献１）がある。

このような音声合成装置を用いると、視聴者の聞く環境によっては、特徴データの元となった声を提供した者（以下、元話者）が実際に話しているのと同じように聞こえる可能性がある。元話者は、俳優、またはアニメーションの登場人物（キャラクタと呼ぶ）の声を吹き替える声優の場合もある。公衆の面前で、このような音声合成装置を用いると、これらの俳優、キャラクタが発話することのありえない乱暴な言い回しなどの不適切な言葉を発話させることが可能である。この場合、音声データに変換された内容によっては、これらの俳優や声優のイメージを傷つける可能性がある。

この課題を解決するために、いくつかの技術が開発されてきた。

例えば、特開平５−１６５４８６号公報(特許文献１)に記載の技術では、テキストデータでなる入力文章を音声信号に変換して発音出力するテキスト音声変換装置において、読み上げ禁止用語を格納する読み上げ禁止テーブルと、入力文章を単語単位で切り出し、読み上げ禁止テーブルを検索して入力文章に含まれている単語が読み上げ禁止用語か否かを判断する読み上げ禁止用語判断手段と、この読み上げ禁止用語判断手段の判断結果に基づいて、読み上げ禁止用語に該当する単語の発音を禁止する発音禁止手段とを設けている。

上記特許文献１の技術では、テキストデータでなる入力文章を音声信号に変換して発音出力するテキスト音声変換装置において、読み上げ禁止用語とこの読み上げ禁止用語を表現する置換表現との対を格納する読み上げ禁止テーブルと、入力文章を単語単位で切り出し、読み上げ禁止テーブルを検索して入力文章に含まれている単語が読み上げ禁止用語か否かを判断する読み上げ禁止用語判断手段と、この読み上げ禁止用語判断手段の判断結果に基づいて、読み上げ禁止用語を置換表現に変換して発音させる読み上げ禁止用語置換手段とを設けている。

さらに、特開２００４−２７１７２７号公報(特許文献２)に記載の技術では、発注者の指定した音声メッセージの発話内容と、ある特定の話者の音声特徴データとを用いて音声合成処理し、それによって得られた音声合成データを音声データとして提供する音声データ提供システムであって、発注者から音声データ作成を受注する受注側は、発注者の指定した音声メッセージの発話内容を受信するとともに、その音声メッセージを発話させる話者の選択情報を受信すると、受信した音声メッセージの発話内容に選択された話者の発話する内容として不適切な表現が含まれているか否かを判定し、不適切な表現が含まれていないと判定された場合に、その音声メッセージの発話内容と当該選択された話者の音声特徴データとを用いて音声合成処理し、その音声合成データを音声データとして提供するようにしていた。

ＨｉｄｅｙｕｋｉＭｉｚｕｎｏ他著、Ｔｅｘｔ−ｔｏ−ＳｐｅｅｃｈＳｙｎｔｈｅｓｉｓＴｅｃｈｎｏｌｏｇｙＵｓｉｎｇＣｏｒｐｕｓ−ＢａｓｅｄＡｐｐｒｏａｃｈ、ＮＴＴＴｅｃｈｎｉｃａｌＲｅｖｉｅｗ、Ｖｏｌ．２、Ｎｏ．３、ｐｐ．７０−７５、Ｍａｒｃｈ２００４特開平５−１６５４８６号公報特開２００４−２７１７２７号公報

インターネットの普及に伴い、個人が情報を発信するＷｅｂページを設けることが多くなった。この代表的なものとしてブログがある。ブログとは、個人やグループが、日々起こったことや特定の話題について記述したＷｅｂページの集合である。多くのブログが、写真、音楽、動画のファイルを掲載しており、記述した人以外の者もＷｅｂブラウザを用いてアクセスすることで、掲載された文章を読んだり、写真や動画を見たり、音楽を聴くことができる。音声合成装置で作成した音声データをブログサイトなどで一般に公開することもできる。

上述の技術では、音声データをブログサイトなどで一般に公開する際に、文章の一部分を変換した音声データを作成し、不適切な用語の発声と同じになるように音声データの再生順序を作成すれば、これを聞いた側では、不適切な用語を発声したように聞こえてしまい、元話者の俳優、声優のイメージを傷つけることになる可能性がある。

本発明のテキスト音声変換サービスシステム及び方法は次のような態様により、上記課題を解決する。接続する端末から受信したテキストデータから複数の部分テキストデータを抽出する。抽出した複数の部分テキストデータを音声データに変換し、この音声データの読みを表すテキストデータを生成する。複数の部分テキストデータに対応する音声データの読みを表すテキストデータを連続させたとき（音声データの再生順序を変更したとき）、連続させた読みを表すテキストデータが予め設定した読み上げ禁止用語に該当する場合に、部分テキストデータに対応する音声データを予め定めた音声データに置換する。

本発明は、態様はさらに、音声合成のための音声合成サイト、及び読み上げ禁止用語をチェックする内容審査サイトをそれぞれ独立したサイトとし、他のブログサイトと共用することにより、効率的になる。

本発明は、音声データに対応する読みのテキストデータを用いることにより、部分テキストデータの音声合成に伴う、不適切な用語の発声を禁止することができる。

ブログサイトなどでテキストデータを音声データへ変換して再生する実施例を以下に説明する。

図１から図９を用いて、実施例１を詳細に説明する。実施例1は、Ｗｅｂブラウザと音声再生機能とを備えるパーソナルコンピュータ、ブログサイト、及び音声合成サイトの３つの部分から構成される。

実施例1では、ユーザがパーソナルコンピュータからブログサイトにアクセスし、文章を投稿したときに、文章の一部を俳優やアニメーションのキャラクタの音声に近似した音声に置き換えることができる。そして他のユーザが他のパーソナルコンピュータからブログサイトにアクセスし、文章を閲覧する際に、文章の一部を俳優やアニメーションのキャラクタが話しているように再生できる。

図1は、実施例１の構成図である。１と２は、オペレーティング・システムを搭載したパーソナルコンピュータ（PC）である。３と４は、人間が認知できるように文字や図形を表示するディスプレイ装置である。５と６は、ユーザが文字を入力するキーボードである。７と８は、それぞれ、ディスプレイ装置３と４に表示された図形や文字の場所を指し示すボタンつきのマウス(ポインティングデバイス)である。９と１０は、パーソナルコンピュータで動作するプログラムであって、ＨＴＭＬを用いて記述されたテキストデータをディスプレイ３と４に表示するＷｅｂブラウザ、１１と１２は、パーソナルコンピュータで動作するプログラムであって、ＷＡＶＥフォーマットで記録された音声データを音声で再生する音声再生部、１３と１４は、それぞれ音声再生部１１と１２の出力を人間が認知できる音声に変換するスピーカである。

ＷＡＶＥフォーマットは、音声ファイルの形式であり、音声信号をデジタルデータに変換したものを記録するための保存形式である。ＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）は、Ｗｅｂ上の文章を記述するためのマークアップ言語である。

ブログサイト２０は、ＨＴＴＰ（Hyper Text Transfer Protocol）でPCと通信するＷｅｂサーバ２２、ＨＴＭＬで記述されたＨＴＭＬテキストデータを編集する編集部２４、ＨＴＭＬで記述されたＨＴＭＬテキストデータを格納するＨＴＭＬテキストデータベース２６、音声データとテキストデータを格納する音声デキストデータベース２８、変換要求部３０、読み上げ禁止用語データベース３２、および内容審査部３４を有する。変換要求部３０は、ＨＴＭＬテキストデータベース２６に格納されたテキストデータの一部分を音声に変換することを要求し、変換した音声データと読み上げテキストデータを音声テキストデータベース２８に格納するように指示を出し、ＨＴＭＬテキストデータベース２６に格納されたテキストデータの一部を置換する。読み上げ禁止用語データベース３２は、音声での読み上げに適していない読み上げ禁止用語を格納する読み上げ禁止用語データベースである。内容審査部３４は、ＨＴＭＬテキストデータベース２６、音声テキストデータベース２８、及び読み上げ禁止用語データベース３２とを参照し、読み上げる用語が読み上げ禁止用語である場合、読み上げる用語に対応する音声データを変更する。

ブログサイト２０は、ブログの提供を代行するインターネット上のＷｅｂサイトであり、サーバなどのコンピュータとＷｅｂサイト用のソフトウェアから構成される。Ｗｅｂサイトに一意に対応するＵＲＩ(Uniform Resource Identifier)をＰＣ1のＷｅｂブラウザ９で入力することで、Ｗｅｂサイトであるブログサイト２０にアクセスし、ブログのＷｅｂページを閲覧できる。ブログサイト２０には、ユーザを認証するログイン機能やＷｅｂページを検索する検索機能などがある。

編集部２４、変換要求部３０、および内容審査部３４は、ブログサイト２０で動作するプログラムであり、ＨＴＭＬテキストデータベース２６、音声デキストデータベース２８、及び読み上げ禁止用語データベース３２は、ブログサイト２０で用いられるデータベースである。これらは、ブログサイト２０を構成するハードウエア(コンピュータ)、そのオペレーティング・システム、及びそれらが提供するファイルシステムなどで実現する。

音声合成サイト４０は、ブログサイト２０からＵＲＩとテキストデータとを受信する受信部４２、漢字かな混じりのテキストデータを入力し、ＷＡＶＥなどの音声ファイルの形式の音声データと、ローマ字などで記述した発声を表現する読みのテキストとを出力する音声合成部４４、ブログサイト２０へ、指定されたＵＲＩを用いてデータを送信する送信部４６である。漢字かな混じりのテキストデータを音声データに変換する音声合成機能を実装するため技術については、非特許文献１に詳細に記載されている。

本実施例では、「ａｈｏ」と「ｂａｋａ」は不適切な用語の発声であり、これを聞いた側では不適切な用語が発声されたように聞こえる。

以下、図２と図３を用いて、パーソナルコンピュータ１でのエンドユーザの操作に伴うブログサイト２０の編集部２４の動作を説明する。

図２は、エンドユーザがブログに文章を書き込む際にパーソナルコンピュータ１のディスプレイ装置３に表示される入力画面２００の例である。

文章を入力する入力画面２００は、文章のタイトルを入力するタイトル入力部分２０２、文章の本文を入力する本文入力部分２０４、変換した音声を読み上げる俳優やアニメーションのキャラクタと絵文字の対応を表示する音声−絵文字対応表示部分２０６、タイトル入力部分２０２と本文入力部分２０４に書き込まれた文章をブログサイト２０のＨＴＭＬテキストデータベース２６に格納せずに終了することを指示する「取り消すボタン」２０８、タイトル入力部分２０２と本文入力部分２０４に書き込まれた文章をブログサイト２０のＨＴＭＬテキストデータベース２６に格納することを指示する「書き込むボタン」２１０などを表示する。

音声−絵文字対応表示部分２０６は、本文入力部分２０４で、絵文字である星印で囲まれたテキストを俳優１の音声に変換し、絵文字である三角印で囲まれたテキストを俳優２の音声に変換することを表示している。この例では、２種類の音声を選択できるようにしているが、２種類以上あっても良い。音声−絵文字対応表示部分２０６の表示は、ユーザごとに異なっていても良く、例えば絵文字である四角が俳優１としても良い。

図３は、編集部２４の処理フローチャートである。いま、パーソナルコンピュータ１のＷｅｂブラウザ９がブログサイト２０にアクセスし、Ｗｅｂサーバ２２を通じて、編集部２４が処理を開始したとする。

編集部２４は、処理を開始し(ステップ３００)、図２のタイトル入力部分２０２及び本文入力部分２０４が空白の画面を作成し(ステップ３０２)、それらを表示する命令をＷｅｂサーバ２２を通じてパーソナルコンピュータ１のＷｅｂブラウザ９に送信すると、Ｗｅｂブラウザ９はディスプレイ３に表示し(ステップ３０４)、ユーザからの入力を待つ（ステップ３０６）。

テキストの入力があったならば、編集部２４は入力されたテキストを表示する命令を、Ｗｅｂサーバ２２を通じてパーソナルコンピュータ１のＷｅｂブラウザ９に送信し、Ｗｅｂブラウザ９はディスプレイ装置３に表示する。ステップ３０４と３０６とを繰り返すことによって、テキストを入力し、それを表示する。ステップ３０６でテキスト入力ではなく、「取り消すボタン」２０８、又は「書き込むボタン」２１０が選択(入力)されたときは、その選択されたボタンによって分岐する(ステップ３０８)。「取り消すボタン」２０８が選択されたときは、タイトル入力部分２０２及び本文入力部分２０４を空白に変更し(ステップ３１０)、処理を終了する(ステップ３１４)。「書き込むボタン」２１０が選択されたときは、タイトル入力部分２０２、本文入力部分２０４にある内容を、適当なユニークなＵＲＩでＨＴＭＬテキストデータベース２６へ格納し(ステップ３１２)、処理を終了する(ステップ３１４)。

ここでは、ユーザは、キーボード５とマウス７を用いて、Ｗｅｂブラウザ９から図２に示すように、タイトル入力部分２００に「近所の公園」、本文入力部分２０４に「面白い場所だった。また、いこうかな。」と入力したとする(ステップ３００から３０４)。

次に、その後、ユーザは、「場」と「か」を音声データに変換するために、それぞれ、「場」と「か」の直前と直後に、それぞれ、絵文字である星印を挿入したとする。図２の例では、「場」と「か」を俳優１の合成音声に変換することを指示した画面を示している。

ユーザは、この文章を格納したくないときは、取り消すボタン２０８を押す。入力したデータは、ステップ３１０で、消去され、パーソナルコンピュータ１のＷｅｂブラウザ９では、図２で、タイトル入力部分２０２、本文入力部分２０４を空白に変更し、ディスプレイ装置３に表示し、処理を終了する(ステップ３０８から３１４)。

ここでは、ユーザは、書き込むボタン２１０をマウス７で選択し、タイトル入力部分２０２と本文入力部分２０４に書き込まれた文章をブログサイト２０のＨＴＭＬテキストデータベース２６へ適当なＵＲＩをつけて、ファイルとして格納したとする（ステップ３１０から３１４）。ここでは、付けられたＵＲＩは、「ｈｔｔｐ：：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／ｈｏｎｂｕｎ．ｈｔｍｌ」とする。

このときにＨＴＭＬテキストデータベース２６に格納されたＨＴＭＬ文章を図４に示す。図４は、ひとつのファイルであるＨＴＭＬ文章４００を示す。図４の左端の番号４０１０から４０９０は、本実施例を説明するために付加した行番号であり、本来のＨＴＭＬ文章には含まれない。

変換要求部３０は、定期的にＨＴＭＬテキストデータベース２６を参照し、新たに格納されたファイルであるＨＴＭＬ文章を検出し、星印や三角印などの絵文字で囲まれたテキストデータの部分を抽出し、抽出されたテキストデータ毎に、ユニークなＵＲＩを生成し、それらのテキストデータと生成したＵＲＩを音声合成サイト４０へ送信し、ＵＲＩに対応するファイル名の音声データと、そのＵＲＩの最後尾の拡張子「．ｗａｖ」を「．ｔｘｔ」で置換した、音声データの読みのテキストデータを得る。

ここでは、音声合成サイト４０に送信されたデータのひとつは、テキストデータが「場」であり、それに対応して生成されたＵＲＩは、
「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」
であり、他のひとつは、テキストデータが、「か」であり、それに対応して生成されたＵＲＩは、
「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」
であるとする。

ここでは、生成されるＵＲＩは、ＨＴＭＬテキストデータベース２６に格納されたＨＴＭＬ文章のパス名にユニークな数字を追加したものとしているが、ＨＴＭＬ文章のパス名とは関係のないものでも良い。

上記のデータを受信した音声合成サイト４０の受信部４２は、テキストデータを音声合成部４４へ、ＵＲＩを送信部４６へそれぞれ出力する。音声合成部４４は、テキストデータを音声データに変換し、音声データの発声音を表現する読みのテキストデータと音声データを出力する。

送信部４６は、音声合成部４４から音声データと読みのテキストデータを得、受信部４２からＵＲＩとを得て、ＵＲＩに対応する音声データのファイルと、そのＵＲＩの最後尾の拡張子「．ｗａｖ」を「．ｔｘｔ」で置換したＵＲＩに対応させた読みのテキストデータとをブログサイト２０の変換要求部３０へ戻す。ここで、読みのテキストデータは「場」を「ｂａ」という発声音に変換し、「か」を「ｋａ」という発声音に変換したとし、テキストデータは「ｂａ」と「ｋａ」となる。

この段階では、「場」に対応する読みのテキストデータのＵＲＩは、
「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｔｘｔ」
であり、このＵＲＩで指定されるファイルの内容は、文字として解釈して「ｂａ」である。「か」に対応する読みのテキストデータのＵＲＩは、
「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｔｘｔ」
であり、このＵＲＩで指定されるファイルの内容は、文字として解釈して「ｋａ」である。

これらのデータを受信した変換要求部３０は、受信したデータを音声テキストデータベース２８へ格納し、ＨＴＭＬテキストデータベース２６にアクセスし、音声データと、テキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分を、Ｗｅｂブラウザが再生できるようにＵＲＩを含む適当なタグで置換する。

図５は、置換した後のＨＴＭＬ文章５００を表したものである。左端の番号５０１０から５０９０は、本実施例を説明するために付加した行番号であり、本来のＨＴＭＬ文章には含まれない。

読みのテキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分と音声データとを置換するので、星印で囲まれたテキストデータの部分を音声データのＵＲＩを含む適当なタグで置換する。ここでは、Ｗｅｂブラウザが、リンク先のＵＲＩの最後尾を拡張子と解釈して、その拡張子に対応するアプリケーション・プログラムを自動的に起動するとし、「＜ａ」タグ、リンク先を示すＵＲＩ、及び「＜／ａ」タグで置換する。

したがって、図４の４０６０行目の星で囲まれた部分「場」が、図５の５０６０行目から５０６６行目に示すように、「面白い
＜ａｈｒｅｆ＝“ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ”＞
場＜／ａ＞
所だった。」
に置換される。また、図４の４０７０行目の星で囲まれた部分「か」が、図５の５０７０行目から５０７６行目に示すように、
「また、いこう
＜ａｈｒｅｆ＝“ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ”＞
か＜／ａ＞
な。」
に置換される。以降は、図４に示すＨＴＭＬ文章に代わって、図５に示すＨＴＭＬ文章がＨＴＭＬテキストデータベース２６に格納される。

図６は、音声テキストデータベース２８に格納される音声データと読みのテキストデータの例を説明する図である。図６は、Ｗａｖｅ形式の音声データ６０２と６０６、及び音声データの発声音を表現するテキストデータ６０４と６０８を示す。

内容審査部３４は、ＨＴＭＬテキストデータベース２６にあるすべてのＨＴＭＬ文章と音声テキストデータベース２８にある音声データとテキストデータを参照し、読み上げ禁止用語データベース３２に格納した読み上げ禁止用語を用いて処理する。

以下、内容審査部３４の処理を図５から図８を用いて詳細に説明する。図７は、内容審査部３４の処理フローチャートである。図８は、読み上げ禁止用語データベース３２に格納されている読み上げ禁止用語の例を示すものである。

内容審査部３４は、定期的にＨＴＭＬテキストデータベース２６にあるＨＴＭＬ文章について、各々、図７のステップ７００からステップ７３０の処理を行う。内容審査部３４は、処理を開始する(ステップ７００)と、ＵＲＩのリストを記憶する変数である＄Ｆと、文字列を記憶する変数である＄Ｓを空にする(ステップ７０２)。次にＨＴＭＬテキストデータベース２６のひとつのＨＴＭＬ文章、つまり、ＵＲＩで指定されるひとつのファイルの先頭から１行を読み込み(ステップ７０４)、ファイルの終了（ＥＯＦ）か否かを判定する(ステップ７０６)。終了であるときはステップ７１４へ進み、終了でないときはステップ７０８へ進み、パタンマッチを行い、音声データのＵＲＩで指定されたファイル（Ｗａｖｅファイル）を抽出し、ステップ７１０へ進む。

ステップ７１０で、パタンマッチが成功し、Ｗａｖｅ形式のＵＲＩがあるときは、ステップ７１２へ進み、ＵＲＩを＄Ｆに追加し、そのＵＲＩの拡張子を「．ｗａｖ」から「．ｔｘｔ」に置換したＵＲＩで指定されるファイルに格納されているテキストデータを＄Ｓに追加し、ステップ７０４へ戻り、ステップ７０４から７１２を繰り返す。Ｗａｖｅ形式のＵＲＩがないときは、ステップ７０４へ戻り、ステップ７０４から７１２を繰り返す。

ここでは、内容審査部３４は、図５のＨＴＭＬ文章について処理し、ステップ７０２から７１２の処理を繰り返したとする。すると、図５のＨＴＭＬ文章５００の５０６２行目がステップ７０８でパタンマッチし、ステップ７１２で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」が、＄Ｆに追加される。また、「．ｗａｖ」から「．ｔｘｔ」に置換したＵＲＩは、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｔｘｔ」となり、それに格納されているテキストデータ、「ｂａ」が＄Ｓに追加される。

ステップ７０４へ戻り、上述のステップ７０４からステップ７１２を繰り返し、再び、図５のＨＴＭＬ文章５００の５０７２行目がステップ７０８でパタンマッチし、ステップ７１２で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」が、＄Ｆに追加される。また、「．ｗａｖ」から「．ｔｘｔ」に置換したＵＲＩは、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｔｘｔ」となり、それに格納されているテキストデータ、「ｋａ」が＄Ｓに追加される。

したがって、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］となり、＄Ｓは、［ｂａ、ｋａ］となる。

ステップ７１４へ進み、＄Ｓが空白のときは終了し（７３０）、空白でないときは、＄Ｓと読み上げ禁止用語データベース２８にある読み上げ禁止用語とのパタンマッチを行う(ステップ７１６)。次に、ステップ７１８へ進み、パタンマッチが成功した場合は、対応する音声データの内容を予め決めた音声データに置換し(ステップ７２０)、＄Ｆと＄Ｓを一要素分左へシフトする(ステップ７２２)。パタンマッチが成功しなかった場合は、ステップ７２２へ進む。ステップ７２２が終了した後は、ステップ７１４からステップ７２２を繰り返し、＄Ｓが空白のときは終了する(ステップ７３０)。

ここでは、図８に示すように、禁止用語データベース２８には、２つの読み上げ禁止用語８０２と８０４が格納され、内容は、それぞれ、「ａｈｏ」と「ｂａｋａ」であったとする。ここでは、ステップ７１４で、＄Ｓは［ｂａ、ｋａ］であり、空白で無いので、ステップ７１６へ進む。読み上げ禁止用語８０２は、「ａｈｏ」であり、パタンマッチは成功しないが、読み上げ禁止用語８０４は、「ｂａｋａ」であり、パタンマッチは成功する。したがって、ステップ７２０で、対応する音声データの内容を予め決めた音声データに置換する。ここでは、音声データの置換は、＄Ｆの先頭（左側）にあるＵＲＩで指定される音声データのファイルの内容を無音に置換するとする。

この段階で、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ、ｈｔｔｐ：／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］であるので、図６の音声データ６０２である「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」の内容は、「ｂａ」に対応する音ではなく、無音となる。

ステップ７２２で、＄Ｆと＄Ｓを一要素分左へシフトし、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］となり、＄Ｓは、［ｋａ］となる。ステップ７１４からステップ７１８でパタンマッチするものは無いので、ステップ７２２へ進み、＄Ｆと＄Ｓを一要素分左へシフトし、再度、ステップ７１４で、＄Ｆと＄Ｓは、両者とも空白になり、内容審査部３４の処理を終了する（ステップ７３０）。

上記の状態でパーソナルコンピュータ２のＷｅｂブラウザ１０が、ブログサイト２０へアクセスし、Ｗｅｂサーバ２０を経由して、ＨＴＭＬテキストデータベース２６にある、ＨＴＭＬ文章(図５)を閲覧したとする。このとき、パーソナルコンピュータ２のディスプレイ４には、図９に示すように表示される。

図９は、パーソナルコンピュータ２のディスプレイ４に表示される表示画面の例であり、９００は、表示画面、９０２は、文章のタイトル、９０４は、文章の本文、９０６と９０８は、リンクの存在を示す下線である。Ｗｅｂブラウザでは、下線のあるテキストをマウスでクリックすると、＜ａ＞タグの内部にかかれたリンクの拡張子に対応するアプリケーション・プログラムが起動し、リンクで示すファイルを読み込み、再生し、スピーカ１４から音声として出力する。

ここで、パーソナルコンピュータ２を操作しているユーザが、下線９０６、と９０８をマウスでこの順番に選択したとする。下線９０６と９０８に対応するリンクは、それぞれ図５の５０６２から５０６４行目と５０７２から５０７４行目であり、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」と、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」である。拡張子が「．ｗａｖ」であるので、パーソナルコンピュータ２の音声再生部１２は、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」と「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」の再生を試みる。音声再生部１２は、ブログサイト２０のＷｅｂサーバ２２経由で、音声テキストデータベース２８へアクセスし、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」と「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」に対応する音声ファイル６０２と６０６をパーソナルコンピュータ２にダウンロードし、再生する。

ここでは、上述のように、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」の内容は、無音となっているので、下線９０６をマウスで選択したときは、「ｂａ」の音は再生されず、スピーカ１４は、無音のままであり、下線９０８をマウスで選択したときだけ「ｋａ」の音が再生されるので、スピーカ１４から「ｂａｋａ」と聞こえることは無い。

本実施例では、ステップ７２０で、音声データの置換は、左にある単語に対応する方の音声データのファイルを無音にするとしたが、無音の代わりに、予め固定した音にしても良い。

本実施例では、パーソナルコンピュータ１のユーザが、ステップ３００から３１４の処理で、格納した合成音声の再生を含むＷｅｂページをそのまま、パーソナルコンピュータ２のユーザが閲覧する例を取り上げたが、パーソナルコンピュータ１のユーザが、一度格納したＷｅｂページを、再度編集し、再生される音声ファイルへのリンクの位置や順序を変更しても、内容審査部３４は、定期的にステップ７００から７３０の処理を行うので、不適切な発声を検出することができる。

上述の実施例１で、音声合成サイト４０で、受信部４２が受信したテキストデータを、音声合成部４４へ入力する前に、テキストデータで内容を審査し、不適切と判断した場合は、変更したテキストデータを音声合成部４４へ送るテキストデータとしても良い。

本実施例では、音声テキストデータベース２８に格納されたテキストデータ６０４と６０８は、変換要求部３０と内容審査部３４からだけアクセスされ、編集部２４など、他のプログラムからアクセスされることが無いので、いったん音声ファイルを作成し、音声テキストデータベース２８に格納した後に、音声テキストデータベース２８のテキストデータだけを変更して、内容審査部３４で適正と判定され、不適切な用語を発声するように変更することはできないという効果がある。

本実施例では、日本語の場合を用いたが、他の言語、例えば英語や中国語なども、発声を表現するテキストデータを用いることができるので、同様に扱うことができる。

実施例１では、変換したテキストデータを、そのまま、テキストデータとしてファイルに格納し、音声データとともにテキストデータをブログサイトへ送信したが、テキストデータとしてファイルに格納する代わりに、音声データにテキストデータを電子透かしで埋め込んで、電子透かし入りの音声データだけをブログサイトへ送信してもよい。

以下、この場合を実施例２として、図２から図４、図８から図１３を用いて説明する。図２から図４、図８から図９は、それぞれ実施例１と同じである。

この実施例２は、Ｗｅｂブラウザと音声再生機能を備えるパーソナルコンピュータ、実施例１とは異なる構成のブログサイトＡ、及び実施例１とは異なる構成の音声合成サイトＡの３つの部分から構成される。実施例２の構成を図１０に示す。図１０において、図１と同じものには同じ符号を付している。

ブログサイトＡ１０００における、実施例1との主な違いは、音声データベース１００２、変換要求部Ａ１００４、電子透かし検出部１００６及び内容審査部Ａ１００８にある。音声データベース１００２は、電子透かしが挿入された電子透かし入り音声データを格納する。変換要求部Ａ１００４は、ＨＴＭＬテキストデータベース２６に格納されたテキストデータの一部分を電子透かし入り音声に変換することを要求し、変換した電子透かし入り音声データを音声データベース１００２に格納するように指示を出し、ＨＴＭＬテキストデータベース２６に格納されたテキストデータの一部を置換する。電子透かし検出部１００６は、音声データベース１００２に格納された電子透かし入り音声データから電子透かしで挿入されたテキストデータを抽出する。内容審査部Ａ１００８は、ＨＴＭＬテキストデータベース２６と、読み上げ禁止用語データベース３２と、電子透かし検出部１００６から得たテキストデータとを参照し、読み上げ禁止用語か否かを判定し、読み上げ禁止用語と判定したときは、音声データベース１００２に格納された対応する音声データを変更する。

音声データベース１００２、変換要求部Ａ１００４、電子透かし検出部１００６、内容審査部Ａ１００８は、ブログサイトＡ１０００で動作するプログラムであり、ブログサイトＡ１０００を構成するハードウエア(コンピュータ)、そのオペレーティング・システム、及びそれらが提供するファイルシステムなどで実現する。

音声合成サイトＡ１０１０は、ブログサイトＡ１０００からＵＲＩとテキストデータとを受信する受信部Ａ１０１２、音声データにテキストデータの電子透かしを挿入する電子透かし挿入部１０１４、電子透かし入りの音声データをＵＲＩに対応するファイル名の音声データのファイルとして、ブログサイトＡ１０００へ送信する送信部Ａ１０１６である。

本実施例でも、「ａｈｏ」と「ｂａｋａ」は、不適切な用語の発声であり、これを聞いた側では、不適切な用語を発声したように聞こえる。

パーソナルコンピュータ１でのエンドユーザの操作の流れと、編集部２４の処理の流れは、実施例１と同じである（図２と図３）。ここでは、エンドユーザは、書き込むボタン２１０をマウス７で操作し、タイトル入力部分２０２と本文入力部分２０４に書き込まれた文章をブログサイトＡ１０００のＨＴＭＬテキストデータベース２６へ適当なＵＲＩで、ファイルとして格納したとする（ステップ３１０から３１４）。

ここでは、付けられたＵＲＩは、実施例１と同様に「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／ｈｏｎｂｕｎ．ｈｔｍｌ」であり、ＨＴＭＬテキストデータベース２６に格納されたＨＴＭＬ文章は実施例１と同様に図４であったとする。

変換要求部Ａ１００４は、定期的にＨＴＭＬテキストデータベース２６を参照し、新たに格納されたファイルであるＨＴＭＬ文章を検出し、星印や三角印など絵文字で囲まれたテキストデータの部分を抽出し、抽出されたテキストデータ毎に、ユニークなＵＲＩを生成し、それらテキストデータとＵＲＩを音声合成サイトＡ１０１０へ送信し、ＵＲＩに対応するファイル名の電子透かし入り音声データを得る。

ここでは、音声合成サイトに出力されたデータのひとつは、テキストデータが「場」であり、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」であったとし、他のひとつは、テキストデータが「か」であり、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」であったとする。

上記のデータを受信した音声合成サイトＡ１０１０の受信部Ａ１０１２は、テキストデータを音声合成部４４へ出力し、ＵＲＩを送信部Ａ１０１６へ出力する。音声合成部４４は、テキストデータを音声データに変換し、音声データの発声音を表現するテキストデータと、音声データを電子透かし挿入部１０１４へ出力する。

電子透かし挿入部１０１４は、音声合成部４４から入力した音声データに、テキストデータを電子透かしとして挿入し、送信部Ａ１０１６へ出力する。音声データへの電子透かしの挿入、電子透かしの検出、抽出については、特開２００３−９９０７７号公報に記載してある。

送信部Ａ１０１６は、電子透かし挿入部１０１４から得た、電子透かし入り音声データを、受信部Ａ１０１２から得たＵＲＩに対応するファイル名の音声データのファイルとしてブログサイトＡ１０００の変換要求部Ａ１００４へ戻す。ここで、テキストデータは、「場」を「ｂａ」という音に変換し、「か」を「ｋａ」という音に変換したものとする。

一方の「ｂａ」が、電子透かしで挿入された電子透かし入りの音声データのファイルは、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」であり、他方の「ｋａ」が、電子透かしで挿入された電子透かし入りの音声データのファイルは、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」である。

これらのデータを受信した変換要求部Ａ１００４は、受信したデータを音声データベース１００２へ格納し、ＨＴＭＬテキストデータベース２６にアクセスし、音声データと、テキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分を、Ｗｅｂブラウザが再生できるようにＵＲＩを含む適当なタグで置換する。

図１１は、置換した後のＨＴＭＬ文章１１００を表したものである。左端の番号１１０１０から１１０９０は、本実施例を説明するために付加した行番号であり、本来のＨＴＭＬ文章には、含まれない。

音声データと、テキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分を置換するので、ここでは、星印で囲まれたテキストデータの部分を音声データのＵＲＩを含む適当なタグで置換する。ここでは、Ｗｅｂブラウザが、リンク先のＵＲＩの最後尾を拡張子と解釈して、その拡張子に対応するアプリケーション・プログラムを自動的に起動するとし、「＜ａ」タグ、リンク先を示すＵＲＩ、「＜／ａ」タグで置換する。

したがって、図４の４０６０行目の星印で囲まれた部分「場」が、図１１の１１０６０行目から１１０６６行目に示すように、
「面白い
＜ａｈｒｅｆ＝“ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ”＞
場＜／ａ＞
所だった。」
に置換される。図４の４０７０行目の星印で囲まれた部分「か」が、図１１の１１０７０行目から１１０７６行目に示すように、
「また、いこう
＜ａｈｒｅｆ＝“ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ”＞
か＜／ａ＞
な。」
に置換される。以降は、図４に示すＨＴＭＬ文章に代わって、図１１に示すＨＴＭＬ文章がＨＴＭＬテキストデータベース２６に格納される。図１２は、音声データベース１００２に格納される電子透かし入り音声データの例１２０２と１２０４とを示す。

内容審査部Ａ１００８は、ＨＴＭＬテキストデータベース２６にあるＨＴＭＬ文章と音声データベース１００２にある電子透かし入り音声データとを参照し、読み上げ禁止用語データベース３２に格納した読み上げ禁止用語を用いて処理する。

以下、内容審査部Ａ１００８の処理を図８、図１１から図１３を用いて詳細に説明する。図１３は、内容審査部Ａ１００８の処理を示すフローチャートである。

内容審査部Ａ１００８は、定期的にＨＴＭＬテキストデータベース２６にあるファイルであるＨＴＭＬ文章の各々について、図１３のステップ１３００からステップ１３３０の処理を行う。

内容審査部Ａ１００８は、処理を開始する(ステップ１３００)と、ＵＲＩのリストを記憶する変数である＄Ｆと、文字列を記憶する変数である＄Ｓを空にする(ステップ１３０２)。次にＨＴＭＬテキストデータベース２６のひとつのＨＴＭＬ文章、つまりＵＲＩで指定されるひとつのファイルの先頭から１行を読み込み(ステップ１３０４)、ファイルの終了（ＥＯＦ）か否かを判定する(ステップ１３０６)。

終了であるときは、ステップ１３１４へ進み、終了でないときは、ステップ１３０８へ進み、パタンマッチを行い、音声データのＵＲＩで指定されたファイルを抽出し、ステップ１３１０へ進む。

ステップ１３１０で、パタンマッチが成功し、音声データのＵＲＩがあるときは、ステップ１３１１へ進み、パタンマッチしたＵＲＩで指定される音声データのファイルの音声データを電子透かし検出部１００６へ出力し、電子透かしで挿入されているテキストデータを抽出し、ステップ１３１２へ進み、パタンマッチしたＵＲＩを＄Ｆに追加し、テキストデータを＄Ｓに追加し、ステップ１３０４へ戻り、ステップ１３０４から１３１２を繰り返す。音声データのＵＲＩがないときは、ステップ１３０４へ戻り、ステップ１３０４から１３１２を繰り返す。

ここでは、内容審査部Ａ１００８は、図１１のＨＴＭＬ文章について処理し、ステップ１３０２から１３１２の処理を繰り返したとする。すると、図１１のＨＴＭＬ文章１１００の１１０６２行目がステップ１３０８でパタンマッチし、ステップ１３１１で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」から電子透かしで挿入されているテキストデータ「ｂａ」を抽出する。ステップ１３１２で「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」が、＄Ｆに追加され、「ｂａ」が＄Ｓに追加される。

ステップ１３０４へ戻り、上述のステップ１３０４からステップ１３１２を繰り返し、再び、図１１のＨＴＭＬ文章１１００の１１０７２行目がステップ１３０８でパタンマッチし、ステップ１３１１で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」から電子透かしで挿入されているテキストデータ「ｋａ」を抽出する。ステップ１３１２で「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」が、＄Ｆに追加され、「ｋａ」が＄Ｓに追加される。

したがって、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］となり、＄Ｓは、［ｂａ、ｋａ］となる。

ステップ１３１４へ進み、＄Ｓが空白のときは終了し（１３３０）、空白でないときは、＄Ｓと読み上げ禁止用語データベース２８にある読み上げ禁止用語とのパタンマッチを行う(ステップ１３１６)。次に、ステップ１３１８へ進み、パタンマッチが成功した場合は、対応する音声データの内容を予め決めた音声データに置換し(ステップ１３２０)、＄Ｆと＄Ｓを一要素分左へシフトする(ステップ１３２２)。パタンマッチが成功しなかった場合は、ステップ１３２２へ進む。ステップ１３２２が終了した後は、ステップ１３１４からステップ１３２２を繰り返し、＄Ｓが空白のときは終了する(ステップ１３３０)。

ここでは、図８に示すように、禁止用語データベース２８には、２つの読み上げ禁止用語８０２と８０４が格納され、内容は、それぞれ、「ａｈｏ」と「ｂａｋａ」であったとする。ステップ１３１４で、＄Ｓは［ｂａ、ｋａ］であり、空白で無いので、ステップ１３１６へ進む。読み上げ禁止用語８０２は「ａｈｏ」であり、パタンマッチは成功しないが、読み上げ禁止用語８０４は「ｂａｋａ」であり、パタンマッチは成功する。従って、ステップ１３２０で、対応する音声データの内容を予め決めた音声データに置換する。ここでは、音声データの置換は、＄Ｆの先頭（左側）にあるＵＲＩで指定される音声データのファイルの内容を無音に置換するとする。

この段階で、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］であるので、図１２の音声データ１２０２である「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」の内容は、「ｂａ」に対応する音ではなく、無音となる。

次に、ステップ１３２２で、＄Ｆと＄Ｓを一要素分左へシフトし、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］となり、＄Ｓは、［ｋａ］となる。ステップ１３１４からステップ１３１８でパタンマッチするものは無いので、ステップ１３２２へ進み、＄Ｆと＄Ｓを一要素分左へシフトし、再度、ステップ１３１４で、＄Ｆと＄Ｓは、両者とも空白になり、内容審査部Ａ１００８の処理を終了する（ステップ１３３０）。

上記の状態でパーソナルコンピュータ２のユーザがＷｅｂブラウザ１０を用いて、ブログサイト１０００へアクセスし、Ｗｅｂサーバ２２を経由して、ＨＴＭＬテキストデータベース２６にある、ＨＴＭＬ文章(図１１)を閲覧したとする。このとき、パーソナルコンピュータ２のディスプレイ４には、実施例１と同様に図９に示すように表示される。ここで、パーソナルコンピュータ２を操作しているユーザが、下線９０６、と９０８をマウスでこの順番に選択したとする。

下線９０６と９０８に対応するリンクは、それぞれ図１１の１１０６２から１１０６４行目と１１０７２から１１０７４行目であり、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」と「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」である。拡張子が「．ｗａｖ」であるので、実施例1と同様にパーソナルコンピュータ２の音声再生部１２は、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」と「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」の再生を試みる。

ここでは、上述のように、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」の内容は、無音となっているので、下線９０６をマウスで選択したときは、「ｂａ」の音は再生されず、スピーカ１４は、無音のままであり、下線９０８をマウスで選択したときだけ「ｋａ」の音が再生されるので、スピーカ１４から「ｂａｋａ」と聞こえることは無い。

本実施例では、ステップ１３２０で、音声データの置換は、左にある単語に対応する方の音声データのファイルを無音にするとしたが、無音の代わりに、予め固定した音にしても良い。

本実施例で、音声合成サイトＡ１０１０で、受信部Ａ１０１２が出力したテキストデータを、音声合成部４４へ入力する前に、テキストデータで内容を審査し、音声合成部４４へ送るテキストデータを変更しても良い。

実施例１では、複数のブログサイトがあった場合、新たな読み上げ禁止用語を登録するときに複数のブログサイトの読み上げ禁止用語データベースを、それぞれ更新する必要がある。内容審査部と、読み上げ禁止用語データベースをブログサイトの外部の別のサイトに内容審査サイトとして設置し、複数のブログサイトで、内容審査サイトを共有するようにすれば、新たな読み上げ禁止用語を登録するときに、共有する内容審査サイトの読み上げ禁止用語データベースだけを更新すればよく、手間が省ける。

以下、この場合の実施例３を図２から図９、図１４を用いて説明する。この実施例は、Ｗｅｂブラウザと音声再生機能を備えるパーソナルコンピュータ、実施例１と異なる構成のブログサイト、実施例１と同じ音声合成サイト、及び内容審査サイトの４つの部分から構成される。図２から図９の各構成要素の動作は、実施例１の図２から図９の各構成要素の動作と同じである。内容審査サイトは、インターネット上のＷｅｂサイトであり、サーバなどのコンピュータとソフトウェアで構成される。

図1４は、実施例３の構成を示す。図1４において、図１と同じものには同じ符号を付している。

ブログサイトＢ１４００は、内容審査に関わる構成を備えていない点が実施例１と異なり、内容審査に関わる構成は、ブログサイトＢ１４００とは異なるサイトである内容審査サイト１４０２に設けられる。

内容審査サイト１４０２は、読み上げ禁止用語データベース１４０４及び内容審査部１４０６を有する。読み上げ禁止用語データベース１４０４は、音声での読み上げに適していない読み上げ禁止用語を格納する。内容審査部１４０６は、ブログサイトＢ１４００のＨＴＭＬテキストデータベース２６と音声テキストデータベース２８、及び読み上げ禁止用語データベース１４０４を参照し、読み上げ禁止用語か否かを判定し、読み上げ禁止用語と判定したときは、対応する音声データを変更する。

ブログサイトＢ１４００には、ユーザを認証するログイン機能やＷｅｂページを検索する検索機能などがあるが、本実施例でも、省略する。

読み上げ禁止用語データベース１４０４と内容審査部１４０６とは、それぞれ内容審査サイト１４０２で動作するデータベース及びプログラムであり、内容審査サイト１４０２を構成するハードウエア(コンピュータ)、そのオペレーティング・システム、及びそれらが提供するファイルシステムなどで実現する。

以下、実施例１と同様に、パーソナルコンピュータ１でユーザが図２のように入力し、ブログサイト１４００の編集部２４が図３に示す処理を実行したとする。このときにＨＴＭＬテキストデータベース２６に格納されたＨＴＭＬ文章は、図４と同じであり、付けられたファイル名も実施例1と同様に、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／ｈｏｎｂｕｎ．ｈｔｍｌ」であったとする。

ブログサイトＢ１４００の変換要求部３０は、実施例１と同様に、定期的にＨＴＭＬテキストデータベース２６を参照し、新たに格納されたファイルであるＨＴＭＬ文章を検出し、星印や三角印など絵文字で囲まれたテキストデータの部分を抽出し、抽出されたテキストデータ毎に、ユニークなＵＲＩを生成し、それらテキストデータとＵＲＩを音声合成サイト４０へ送信し、ＵＲＩに対応するファイル名の音声データと、そのＵＲＩの最後尾の「．ｗａｖ」を「．ｔｘｔ」で置換したファイル名の読みのテキストデータを得る。ここでは、実施例１と同様に、音声合成サイトに送信されたデータのひとつは、テキストデータが「場」であり、生成されたＵＲＩは「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」であったとし、他のひとつは、テキストデータが「か」であり、生成されたＵＲＩは「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ」であったとする。

上記のデータを受信した音声合成サイト４０は、実施例１と同様に動作し、ＵＲＩに対応するファイル名の音声データのファイルと、そのＵＲＩの最後尾の「．ｗａｖ」を「．ｔｘｔ」を置換したＵＲＩで、テキストデータをブログサイト３１４００の変換要求部３０へ戻す。ここで、テキストデータは、実施例１と同様に、「場」を「ｂａ」という音に変換し、「か」を「ｋａ」という音に変換したとし、テキストデータは、「ｂａ」と、「ｋａ」となる。

この段階では、実施例1と同様に、「場」に対応するテキストデータのＵＲＩは、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｔｘｔ」となり、このＵＲＩで指定されるファイルの内容は、文字として解釈して、「ｂａ」である。「か」に対応するテキストデータのＵＲＩは、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｔｘｔ」で、このＵＲＩで指定されるファイルの内容は、文字として解釈して、「ｋａ」となる。

これらのデータを受信した変換要求部３０は、実施例１と同様に受信したデータを音声テキストデータベース２８へ格納し、ＨＴＭＬテキストデータベース２６にアクセスし、音声データと、テキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分を、Ｗｅｂブラウザが再生できるようにＵＲＩを含む適当なタグで置換する。置換した後のＨＴＭＬ文章は、図５と同じであり、図４に示すＨＴＭＬ文章に代わって、図５に示すＨＴＭＬ文章がＨＴＭＬテキストデータベース２６に格納される。音声テキストデータベース２８に格納される音声データと読みのテキストデータは、実施例１と同様に、図６に示す通りである。

内容審査サイト１４０２の内容審査部１４０６は、ブログサイトＢ１４００のＨＴＭＬテキストデータベース２６にあるＨＴＭＬ文章と音声テキストデータベース２８にある音声データとテキストデータを参照し、読み上げ禁止用語データベース１４０４に格納した読み上げ禁止用語を用いて処理する。

内容審査部１４０６の処理は、実施例１の内容審査部３４と同様であり、定期的にＨＴＭＬテキストデータベース２６にあるファイルであるＨＴＭＬ文章の各々について、図７のステップ７００からステップ７３０の処理を行う。ここでは、内容審査部３４は、図５のＨＴＭＬ文章について処理を行い、ステップ７０２から７１２の処理を繰り返したとする。

すると、図５のＨＴＭＬ文章５００の５０６２行目がステップ７０８でパタンマッチし、ステップ７１２で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」が、＄Ｆに追加される。また、「．ｗａｖ」から「．ｔｘｔ」に置換したＵＲＩは、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｔｘｔ」となり、それに格納されているテキストデータ、「ｂａ」が＄Ｓに追加される。

この結果、＄Ｆは［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］となり、＄Ｓは［ｂａ、ｋａ］となる。

次にステップ７１４へ進み、＄Ｓが空白のときは終了し（７３０）、空白でないときは、＄Ｓと読み上げ禁止用語データベース２８にある読み上げ禁止用語とのパタンマッチを行う(ステップ７１６)。

次に、ステップ７１８へ進み、パタンマッチが成功した場合は、対応する音声データの内容を予め決めた音声データに置換し(ステップ７２０)、＄Ｆと＄Ｓを一要素分左へシフトする(ステップ７２２)。パタンマッチが成功しなかった場合は、ステップ７２２へ進む。ステップ７２２が終了した後は、ステップ７１４からステップ７２２を繰り返し、＄Ｓが空白のときは終了する(ステップ７３０)。

読み上げ禁止用語データベース１４０４には、図８に示す２つの読み上げ禁止用語８０２と８０４が格納され、内容は、それぞれ、「ａｈｏ」と「ｂａｋａ」であったとする。

ここでは、ステップ７１４で、＄Ｓは［ｂａ、ｋａ］であり、空白で無いので、ステップ７１６へ進む。読み上げ禁止用語８０２は「ａｈｏ」であり、パタンマッチは成功しないが、読み上げ禁止用語８０４は「ｂａｋａ」であり、パタンマッチは成功する。どこで、ステップ７２０で、対応する音声データの内容を予め決めた音声データに置換する。ここでは、音声データの置換は、＄Ｆの先頭（左側）にあるＵＲＩで指定される音声データのファイルの内容を無音に置換するとする。

この段階で、＄Ｆは［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］であるので、図６の音声データ６０２である、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」の内容は、「ｂａ」に対応する音ではなく、無音となる。

次に、ステップ７２２で、＄Ｆと＄Ｓを一要素分左へシフトし、＄Ｆは［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０２．ｗａｖ］となり、＄Ｓは［ｋａ］となる。ステップ７１４からステップ７１８でパタンマッチするものは無いので、ステップ７２２へ進み、＄Ｆと＄Ｓを一要素分左へシフトし、再度、ステップ７１４で、＄Ｆと＄Ｓは、両者とも空白になり、内容審査部１４０６の処理を終了する（ステップ７３０）。

上記の状態でパーソナルコンピュータ２のユーザが、Ｗｅｂブラウザ１０を用いて、ブログサイトＢ１４００へアクセスし、Ｗｅｂサーバ２０を経由して、ＨＴＭＬテキストデータベース２６にある、ＨＴＭＬ文章(図５)を閲覧したとする。このとき、パーソナルコンピュータ２のディスプレイ４には、実施例１と同様に図９のように表示される。

ここで、実施例1と同様にパーソナルコンピュータ２を操作しているユーザが、下線９０６、と９０８をマウスでこの順番に選択したとする。ここでは、上述のように、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０１．ｗａｖ」の内容は、無音となっているので、下線９０６をマウスで選択したときは、「ｂａ」の音は再生されず、スピーカ１４は無音のままであり、下線９０８をマウスで選択したときだけ「ｋａ」の音が再生されるので、スピーカ１４から「ｂａｋａ」と聞こえることは無い。

本実施例では、ステップ７２０で、音声データの置換は、左にある単語に対応する方の音声データのファイルを無音にするとしたが、実施例１と同様に無音の代わりに、予め固定した音にしても良い。

上述の実施例３で、音声合成サイト４０で、受信部４２が出力したテキストデータを、音声合成部４４へ入力する前に、テキストデータで内容を審査し、不適切と判断した場合は、テキストデータを変更し、変更したテキストデータを音声合成部４４へ送るテキストデータとしても良い。

本実施例では、音声テキストデータベース２８に格納されたテキストデータ６０４と６０８は、変換要求部３０と内容審査サイト１４０２からだけアクセスされ、編集部２４など、他のプログラムからアクセスされることが無いので、いったん音声ファイルを作成し、音声テキストデータベース２８に格納した後に、音声テキストデータベース２８のテキストデータだけを変更して、内容審査サイト１４０２で適正と判定され、不適切な用語を発声するように変更することはできないという効果がある。

実施例２では、内容審査部と、電子透かし検出部と、読み上げ禁止用語データベースをブログサイトに備えたが、内容審査部と、電子透かし検出部と、読み上げ禁止用語データベースをブログサイトの外部の別のサイトに内容審査サイトとして設置し、複数のブログサイトで、内容審査サイトを共有するようにしても良い。

以下、この場合の実施例４を図２から図４、図８、図９、図１１から図１３、図１５を用いて説明する。この実施例は、Ｗｅｂブラウザと音声再生機能を備えるパーソナルコンピュータ、実施例２と異なる構成のブログサイト、実施例２と同じ音声合成サイト、及び実施例３と異なる構成の内容審査サイトの４つの部分から構成される。

内容審査サイトは、インターネット上のＷｅｂサイトであり、サーバなどのコンピュータとソフトウェアで構成する。

図４、図８、図９、図１１から図１３の各構成要素の動作は、実施例２の各構成要素の動作と同じである。

図1５は、実施例４の構成を示す。図1５において、図１０と同じものには同じ符号を付している。

ブログサイトＣ１５００は、内容審査に関わる構成を備えていない点が実施例２と異なり、内容審査に関わる構成は、ブログサイトＣ１５００とは異なるサイトである内容審査サイト１５０２に設けられる。

１５０２は、内容審査サイト１５０２は、電子透かし検出部１５０４、読み上げ禁止用語データベース１５０６及び内容審査部Ａ１５０８を有する。電子透かし検出部１５０４は、図１０の電子透かし検出部１００６と同じである。読み上げ禁止用語データベース１５０６は、図１０の読み上げ禁止用語データベース３２と同じである。内容審査部Ａ１５０８は、ブログサイトＣ１５００の音声データベース１００２を参照し、電子透かし検出部１５０４からテキストデータを得て、ブログサイトＣ１５００のＨＴＭＬテキストデータベース２６と、読み上げ禁止用語データベース１５０６を参照し、読み上げ禁止用語か否かを判定し、読み上げ禁止用語と判定したときは、音声データベース１００２に格納された対応する音声データを変更する。

ブログサイトには、ユーザを認証するログイン機能やＷｅｂページを検索する検索機能などがあるが、本実施例でも、省略する。

読み上げ禁止用語データベース１５０６、電子透かし検出部１５０４、及び内容審査部Ａ１５０８は、内容審査サイトＡ１５０２で動作するデータベース及びプログラムであり、内容審査サイトＡ１５０２を構成するハードウエア(コンピュータ)、そのオペレーティング・システム、及びそれらが提供するファイルシステムなどで実現する。

パーソナルコンピュータ１でのエンドユーザの操作の流れと、編集部２４での処理の流れは、実施例１から実施例３と同じである（図２と図３）。

ここでは、エンドユーザは、書き込むボタン２１０をマウス７で操作し、タイトル入力部分２０２と本文入力部分２０４に書き込まれた文章をブログサイトＣ１５００のＨＴＭＬテキストデータベース２６へ適当なファイル名をつけて、ファイルとして格納したとする（ステップ３１０から３１４）。ここでは、付けられたファイル名は、実施例１から実施例３と同様に「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／ｈｏｎｂｕｎ．ｈｔｍｌ」であったとする。このときにＨＴＭＬテキストデータベース２６に格納されたＨＴＭＬ文章は実施例１と同様に図４であったとする。

変換要求部Ａ１００４は、実施例１から実施例３と同様に、定期的にＨＴＭＬテキストデータベース２６を参照し、新たに格納されたファイルであるＨＴＭＬ文章を検出し、星印や三角印など絵文字で囲まれたテキストデータの部分を抽出し、抽出されたテキストデータ毎に、ユニークなＵＲＩを生成し、それらテキストデータとＵＲＩを音声合成サイトＡ１０１０へ送信し、ＵＲＩに対応するファイル名の電子透かし入り音声データを得る。

ここでは、音声合成サイトＡ１０１０に送信されたデータのひとつは、テキストデータが「場」であり、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」であったとし、他のひとつは、テキストデータが「か」であり、ＵＲＩが、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」であったとする。

上記のデータを受信した音声合サイトＡ１０１０の受信部Ａ１０１２は、テキストデータを音声合成部４４へ出力し、ＵＲＩを送信部Ａ１０１６へ出力する。音声合成部４４は、テキストデータを音声データに変換し、読みのテキストデータと、音声データを電子透かし挿入部１０１４へ出力する。電子透かし挿入部１０１４は、音声合成部４４から入力した音声データに、読みのテキストデータを電子透かしとして音声データに挿入し、送信部Ａ１０１６へ出力する。音声データへの電子透かしの挿入、電子透かしの検出、抽出については、実施例２と同様である。

送信部Ａ１０１６は、実施例２と同様に、電子透かし挿入部１０１４から得た、電子透かし入り音声データを、受信部Ａ１０１２から得たＵＲＩに対応するファイル名の音声データのファイルとしてブログサイトＣ１５００の変換要求部Ａ１００４へ戻す。ここで、テキストデータは、「場」を「ｂａ」という音に変換し、「か」を「ｋａ」という音に変換したとする。

一方の「ｂａ」が電子透かしで挿入された電子透かし入りの音声データのファイルは、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」であり、他方の「ｋａ」が電子透かしで挿入された電子透かし入りの音声データのファイルは、ＵＲＩが「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」である。

これらのデータを受信した変換要求部Ａ１００４は、受信したデータを音声データベース１００２へ格納し、ＨＴＭＬテキストデータベース２６にアクセスし、音声データと、テキストデータを得たＨＴＭＬ文章の絵文字で囲まれた部分を、Ｗｅｂブラウザが再生できるようにＵＲＩを含む適当なタグで置換する。置換した後のＨＴＭＬ文章は、実施例２の図１１と同様である。以降は、図４に示すＨＴＭＬ文章に代わって、図１１に示すＨＴＭＬ文章がＨＴＭＬテキストデータベース２６に格納される。音声データベース１００２に格納される電子透かし入り音声データは、実施例２の図１２と同様である。

内容審査サイトＡ１５０２の内容審査部Ａ１５０８は、ブログサイトＣ１５００のＨＴＭＬテキストデータベース２６にあるＨＴＭＬ文章と、音声データベース１００２にある電子透かし入り音声データを参照し、読み上げ禁止用語データベース１５０６に格納した読み上げ禁止用語を用いて処理を行う。

内容審査部Ａ１５０８の処理は、実施例２の内容審査部の処理と同様であり、定期的にＨＴＭＬテキストデータベース２６にあるファイルであるＨＴＭＬ文章の各々について、図１３のステップ１３００からステップ１３３０の処理を実行する。ここでは、内容審査部２１５０８は、図１１のＨＴＭＬ文章について処理を行い、ステップ１３０２から１３１２の処理を繰り返したとする。

すると、図１１のＨＴＭＬ文章１１００の１１０６２行目がステップ１３０８でパタンマッチし、ステップ１３１１で、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」から電子透かしで挿入されているテキストデータ「ｂａ」を抽出する。ステップ１３１２で「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」が、＄Ｆに追加され、「ｂａ」が＄Ｓに追加される。

この結果、＄Ｆは、実施例２と同様に、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］となり、＄Ｓは［ｂａ、ｋａ］となる。

次にステップ１３１４へ進み、＄Ｓが空白のときは終了し（１３３０）、空白でないときは、＄Ｓと読み上げ禁止用語データベース１５０６にある読み上げ禁止用語とのパタンマッチを行う(ステップ１３１６)。

次に、ステップ１３１８へ進み、パタンマッチが成功した場合は、対応する音声データの内容を予め決めた音声データに置換し(ステップ１３２０)、＄Ｆと＄Ｓを一要素分左へシフトする(ステップ１３２２)。パタンマッチが成功しなかった場合は、ステップ１３２２へ進む。ステップ１３２２が終了した後は、ステップ１３１４からステップ１３２２を繰り返し、＄Ｓが空白のときは終了する(ステップ１３３０)。

ここでは、禁止用語データベース１５０６には、実施例２と同様に図８に示すように、２つの読み上げ禁止用語８０２と８０４が格納され、内容は、それぞれ、「ａｈｏ」と「ｂａｋａ」であったとする。

ステップ１３１４で、＄Ｓは［ｂａ、ｋａ］であり、空白でないので、ステップ１３１６へ進む。読み上げ禁止用語８０２は「ａｈｏ」であり、パタンマッチは成功しないが、読み上げ禁止用語８０４は「ｂａｋａ」であり、パタンマッチは成功する。そこで、ステップ１３２０で、対応する音声データの内容を予め決めた音声データに置換する。ここでは、音声データに置換は、＄Ｆの先頭（左側）にある単語に対応する方の音声データのファイルを無音にするとする。

この段階で、＄Ｆは、［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ、ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］であるので、図１２の音声データ１２０２である、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」の内容は、「ｂａ」に対応する音ではなく、無音となる。

次に、ステップ１３２２で、＄Ｆと＄Ｓを一要素分左へシフトし、＄Ｆは［ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ］となり、＄Ｓは［ｋａ］となる。ステップ１３１４からステップ１３１８でパタンマッチするものは無いので、ステップ１３２２へ進み、＄Ｆと＄Ｓを一要素分左へシフトし、再度、ステップ１３１４で、＄Ｆと＄Ｓは、両者とも空白になり、内容審査部Ａ１５０８の処理を終了する（ステップ１３３０）。

上記の状態でパーソナルコンピュータ２のユーザが、Ｗｅｂブラウザ１０を用いて、ブログサイトＣ１５００へアクセスし、Ｗｅｂサーバ２２を経由して、ＨＴＭＬテキストデータベース２６にある、ＨＴＭＬ文章(図１１)を閲覧したとする。このとき、パーソナルコンピュータ２のディスプレイ４には、実施例１から実施例３と同様に図９に示すように表示される。

ここで、パーソナルコンピュータ２を操作しているユーザが、下線９０６、と９０８をマウスでこの順番に選択したとする。

下線９０６と９０８に対応するリンクは、それぞれ図１１の１１０６２から１１０６４行目と１１０７２から１１０７４行目であり、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」と、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」である。拡張子が「．ｗａｖ」であるので、実施例1と同様にパーソナルコンピュータ２の音声再生部１２は、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」と「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０４．ｗａｖ」の再生を試みる。

ここでは、上述のように、「ｈｔｔｐ：／／ｂｌｏｇ１．ｃｏｍ／ｕ１／１０／０３．ｗａｖ」の内容は無音となっているので、下線９０６をマウスで選択したときは、「ｂａ」の音は再生されず、スピーカ１４は、無音のままであり、下線９０８をマウスで選択したときに「ｋａ」の音が再生されるので、スピーカ１４から「ｂａｋａ」と聞こえることは無い。

上述の実施例４で、音声合成サイトＡ１０１０で、受信部Ａ１０１２が出力したテキストデータを、音声合成部４４へ入力する前に、テキストデータで内容を審査し、音声合成部４４へ送るテキストデータを変更しても良い。

実施例１の構成図である。ブログの入力画面の例である。編集部の処理フローチャートである。格納されたＨＴＭＬ文章の例を示した図である。置換したＨＴＭＬ文章の例を示した図である。音声テキストデータベースに格納されたデータの例を示す図である。内容審査部の処理フローチャートである。読み上げ禁止用語データベースに格納される用語の例を示す図である。ブログの表示画面例を示す図である。実施例２の構成図である。置換したＨＴＭＬ文章の例を示す図である。音声データベースに格納された電子透かし入り音声データの例示す図である。内容審査部の処理フローチャートである。実施例３の構成図である。実施例４の構成図である。

符号の説明

１、２：パーソナルコンピュータ、３、４：ディスプレイ、５、６：キーボード、７、８：マウス、９、１０：Ｗｅｂブラウザ、１１、１２音声再生部、１３、１４スピーカ、２０、１０００、１４００、１５００：ブログサイト、２２：Ｗｅｂサーバ、２４：編集部、２６：ＨＴＭＬテキストデータベース、２８：音声テキストデータベース、３０：変換要求部、３２：読み上げ禁止用語データベース、３４：内容審査部、４０、１０１０：音声合成サイト、４２：受信部、４４：音声合成部、４６：送信部、２００：入力画面、２０２：タイトル入力部分、２０４：本文入力部分、２０６：音声−絵文字対応表示部分、２０８：取り消すボタン、２１０：書き込むボタン、４００、５００：ＨＴＭＬ文章、６０２：音声データ、６０４：テキストデータ、６０６：音声データ、６０８：テキストデータ、８０２、８０４：読み上げ禁止用語、１４０２、１５０２：内容審査サイト。

Claims

テキストデータの受信に応答して、該テキストデータを音声データに変換し、該音声データと該音声データの読みを表すテキストデータとを送信する音声合成サイトと、
接続する端末から受信したテキストデータを格納するテキストデータベース、前記端末からの指示に応答して前記テキストデータから複数の部分テキストデータを抽出し、前記抽出した複数の部分テキストデータを前記音声合成サイトに送信し、前記音声合成サイトから送信された前記複数の部分テキストデータに対応する音声データと該音声データの読みを表すテキストデータとを音声テキストデータベースに格納する変換要求部、及び前記複数の部分テキストデータに対応する前記音声データの読みを表すテキストデータを連続させたとき、該連続させた読みを表すテキストデータが予め設定した読み上げ禁止用語に該当する場合に、前記部分テキストデータに対応する前記音声データを予め定めた音声データに置換する内容審査部を含むブログサイトとを有することを特徴とするテキスト音声変換サービスシステム。
前記音声データの読みを表すテキストデータが前記音声データに電子透かしとして挿入されることを特徴とする請求項１記載のテキスト音声変換サービスシステム。
テキストデータの受信に応答して、該テキストデータを音声データに変換し、該音声データと該音声データの読みを表すテキストデータとを送信する音声合成サイトと、
接続する端末から受信したテキストデータを格納するテキストデータベース、及び前記端末からの指示に応答して前記テキストデータから複数の部分テキストデータを抽出し、前記抽出した複数の部分テキストデータを前記音声合成サイトに送信し、前記音声合成サイトから送信された前記複数の部分テキストデータに対応する音声データと該音声データの読みを表すテキストデータとを音声テキストデータベースに格納する変換要求部を含むブログサイトと、
前記複数の部分テキストデータに対応する前記音声データの読みを表すテキストデータを連続させたとき、該連続させた読みを表すテキストデータが予め設定した読み上げ禁止用語に該当する場合に、前記部分テキストデータに対応する前記音声データを予め定めた音声データに置換する内容審査サイトを有することを特徴とするテキスト音声変換サービスシステム。
前記音声データの読みを表すテキストデータが前記音声データに電子透かしとして挿入されることを特徴とする請求項３記載のテキスト音声変換サービスシステム。
接続する端末からテキストデータを受信し、
前記端末からの指示に応答して前記テキストデータから複数の部分テキストデータを抽出し、
前記抽出した複数の部分テキストデータを音声データに変換し、
前記変換された音声データの読みを表すテキストデータを生成し、
前記複数の部分テキストデータに対応する前記音声データの読みを表すテキストデータを連続させたとき、該連続させた読みを表すテキストデータが予め設定した読み上げ禁止用語に該当する場合に、前記部分テキストデータに対応する前記音声データを予め定めた音声データに置換することを特徴とするテキスト音声変換サービス方法。