JP4785909B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP4785909B2 JP4785909B2 JP2008310224A JP2008310224A JP4785909B2 JP 4785909 B2 JP4785909 B2 JP 4785909B2 JP 2008310224 A JP2008310224 A JP 2008310224A JP 2008310224 A JP2008310224 A JP 2008310224A JP 4785909 B2 JP4785909 B2 JP 4785909B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- information
- frequency band
- audio
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 21
- 230000005236 sound signal Effects 0.000 claims description 54
- 238000012545 processing Methods 0.000 claims description 38
- 238000004458 analytical method Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000004807 localization Effects 0.000 description 32
- 238000000605 extraction Methods 0.000 description 24
- 238000000034 method Methods 0.000 description 17
- 238000000926 separation method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000003027 ear inner Anatomy 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000010415 Low Vision Diseases 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000004303 low vision Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
Claims (3)
- 文字情報から、あらかじめ定めた複数の条件のそれぞれに合致する文字列を抽出して、抽出した文字列の条件ごとの集合を処理単位とすることで、各条件に対応する複数の処理単位を形成する情報解析部と、
前記情報解析部が形成した、各条件に対応する処理単位ごとに、それに含まれる文字列を前記文字情報における出現順に音声信号に変換する音声変換部と、
前記音声変換部が変換した音声信号に対し、処理単位ごとに異なるパターンで周波数帯域を割り当てる周波数帯域割り当て部と、
前記周波数帯域割り当て部が割り当てた周波数帯域のパターンで、前記音声信号から、割り当てた周波数帯域成分を抽出したうえ、複数の処理単位の音声信号が同時に出力されるように合成する音声処理部と、
前記音声処理部が合成した音声信号を音響として出力する出力部と、
を備え、
前記文字情報は、マークアップ言語によって記述され、
前記情報解析部は、タグと、当該タグに囲まれた文字列の重要度と、を対応づけた重要度判定テーブルを参照し、前記条件として定められた重要度に応じて、該当するタグで囲まれた文字列を抽出して前記重要度ごとに処理単位を形成することを特徴とする情報処理装置。 - 前記複数の条件として定められた複数の重要度のそれぞれに対応づけられたタグが階層構造を有するとき、前記音声変換部が変換した複数の処理単位の音声信号の出力が開始されるタイミングを、文字列を抽出した条件に対応するタグの階層に応じて所定時間ずらす設定を行う時間割り当て部をさらに備え、
前記音声処理部はさらに、前記時間割り当て部が設定した時間分、出力開始タイミングがずれるように前記複数の処理単位の音声信号を合成することを特徴とする請求項1に記載の情報処理装置。 - 前記複数の条件として定められた複数の重要度のそれぞれに対応づけられたタグが階層構造を有するとき、前記複数の処理単位の音声信号の時間的な相対関係が前記文字情報における文字列の位置関係に対応するように、文字列を抽出した条件に対応するタグの階層に応じて、各処理単位における音声信号の出力間隔を調整する時間割り当て部をさらに備え、
前記音声処理部はさらに、前記時間割り当て部が調整した間隔で前記複数の処理単位の音声信号が出力されるように合成することを特徴とする請求項1に記載の情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008310224A JP4785909B2 (ja) | 2008-12-04 | 2008-12-04 | 情報処理装置 |
US12/621,576 US20100145686A1 (en) | 2008-12-04 | 2009-11-19 | Information processing apparatus converting visually-generated information into aural information, and information processing method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008310224A JP4785909B2 (ja) | 2008-12-04 | 2008-12-04 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010134203A JP2010134203A (ja) | 2010-06-17 |
JP4785909B2 true JP4785909B2 (ja) | 2011-10-05 |
Family
ID=42232063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008310224A Expired - Fee Related JP4785909B2 (ja) | 2008-12-04 | 2008-12-04 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20100145686A1 (ja) |
JP (1) | JP4785909B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102487461A (zh) * | 2010-12-02 | 2012-06-06 | 康佳集团股份有限公司 | 在网络电视上实现网页朗读的方法及其装置 |
JP2016191791A (ja) | 2015-03-31 | 2016-11-10 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN105975469A (zh) * | 2015-12-01 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种浏览器的网页浏览方法和装置 |
JP7468111B2 (ja) | 2020-04-17 | 2024-04-16 | ヤマハ株式会社 | 再生制御方法、制御システムおよびプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05225255A (ja) * | 1992-02-10 | 1993-09-03 | Nippon Telegr & Teleph Corp <Ntt> | 最大量規定型情報編集装置 |
JPH0916190A (ja) * | 1995-06-26 | 1997-01-17 | Matsushita Electric Ind Co Ltd | 文章読上装置 |
JPH09325796A (ja) * | 1996-06-06 | 1997-12-16 | Oki Electric Ind Co Ltd | 文書朗読装置 |
JP3309735B2 (ja) * | 1996-10-24 | 2002-07-29 | 三菱電機株式会社 | 音声マンマシンインタフェース装置 |
US6018710A (en) * | 1996-12-13 | 2000-01-25 | Siemens Corporate Research, Inc. | Web-based interactive radio environment: WIRE |
JP3668583B2 (ja) * | 1997-03-12 | 2005-07-06 | 株式会社東芝 | 音声合成装置及びその方法 |
JP2000075876A (ja) * | 1998-08-28 | 2000-03-14 | Ricoh Co Ltd | 文書読み上げシステム |
JP3460964B2 (ja) * | 1999-02-10 | 2003-10-27 | 日本電信電話株式会社 | マルチメディア情報閲覧システムにおける音声読み上げ方法および記録媒体 |
JP2001014306A (ja) * | 1999-06-30 | 2001-01-19 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
JP3673471B2 (ja) * | 2000-12-28 | 2005-07-20 | シャープ株式会社 | テキスト音声合成装置およびプログラム記録媒体 |
JP2002229985A (ja) * | 2001-02-06 | 2002-08-16 | Ricoh Co Ltd | 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム |
US6810378B2 (en) * | 2001-08-22 | 2004-10-26 | Lucent Technologies Inc. | Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech |
JP4038211B2 (ja) * | 2003-01-20 | 2008-01-23 | 富士通株式会社 | 音声合成装置,音声合成方法および音声合成システム |
US7672436B1 (en) * | 2004-01-23 | 2010-03-02 | Sprint Spectrum L.P. | Voice rendering of E-mail with tags for improved user experience |
JP3955881B2 (ja) * | 2004-12-28 | 2007-08-08 | 松下電器産業株式会社 | 音声合成方法および情報提供装置 |
JP4823030B2 (ja) * | 2006-11-27 | 2011-11-24 | 株式会社ソニー・コンピュータエンタテインメント | 音声処理装置および音声処理方法 |
-
2008
- 2008-12-04 JP JP2008310224A patent/JP4785909B2/ja not_active Expired - Fee Related
-
2009
- 2009-11-19 US US12/621,576 patent/US20100145686A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20100145686A1 (en) | 2010-06-10 |
JP2010134203A (ja) | 2010-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4823030B2 (ja) | 音声処理装置および音声処理方法 | |
CN106898340B (zh) | 一种歌曲的合成方法及终端 | |
US9786201B2 (en) | Wearable sound | |
Bendixen et al. | Regular patterns stabilize auditory streams | |
EP3522151B1 (en) | Method and device for processing dual-source audio data | |
US9390703B2 (en) | Masking sound generating apparatus, storage medium stored with masking sound signal, masking sound reproducing apparatus, and program | |
US20150332659A1 (en) | Sound vest | |
Liu | Just noticeable difference of tone pitch contour change for English-and Chinese-native listeners | |
JP4785909B2 (ja) | 情報処理装置 | |
Mackersie et al. | Effects of fundamental frequency and vocal-tract length cues on sentence segregation by listeners with hearing loss | |
JPWO2018038235A1 (ja) | 聴覚トレーニング装置、聴覚トレーニング方法、およびプログラム | |
US20140358528A1 (en) | Electronic Apparatus, Method for Outputting Data, and Computer Program Product | |
Summers et al. | Informational masking of speech by acoustically similar intelligible and unintelligible interferers | |
JP2005203981A (ja) | 音響信号処理装置および音響信号処理方法 | |
JP4756560B2 (ja) | 情報処理装置および情報処理方法 | |
Friedrichs et al. | Vowel recognition at fundamental frequencies up to 1 kHz reveals point vowels as acoustic landmarks | |
Marui et al. | Timbre of nonlinear distortion effects: Perceptual attributes beyond sharpness | |
Roberts et al. | Informational masking of monaural target speech by a single contralateral formant | |
Franich | Internal and contextual cues to tone perception in Medʉmba | |
Pearce et al. | Eliciting the most prominent perceived differences between microphones | |
CN113409761A (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
KR100812770B1 (ko) | 화이트 노이즈를 이용한 배속 나레이션 음성신호 제공 방법및 장치 | |
EP3128512A1 (en) | Method for transmitting arbitrary signal using acoustic piece | |
JP6438200B2 (ja) | 音声合成装置および制御プログラム | |
JP2008275836A (ja) | 読み上げ用ドキュメント処理方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101119 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20101125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110106 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110712 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |