JP2022534824A - 多重音声システムが装着されたオンラインメディアサービス具現方法 - Google Patents
多重音声システムが装着されたオンラインメディアサービス具現方法 Download PDFInfo
- Publication number
- JP2022534824A JP2022534824A JP2021513294A JP2021513294A JP2022534824A JP 2022534824 A JP2022534824 A JP 2022534824A JP 2021513294 A JP2021513294 A JP 2021513294A JP 2021513294 A JP2021513294 A JP 2021513294A JP 2022534824 A JP2022534824 A JP 2022534824A
- Authority
- JP
- Japan
- Prior art keywords
- online
- voice
- articles
- contents
- subscriber
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000010586 diagram Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 208000003464 asthenopia Diseases 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0613—Third-party assisted
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
S12 音声
S13 資料分析
S14 音声変換
S15 出力
Claims (13)
- 既設定のオンライン記事及びコンテンツを特定のメディアサイトから収集して個人端末機の画面に表示する1段階と、
購読者の音声を入力するかデータベースに予め保存された音声の中で特定人物の音声を設定する2段階と、
前記オンライン記事及びコンテンツを認識して分類する3段階と、
前記分類されたオンライン記事及びコンテンツを音声に変換する4段階と、
前記2段階で設定された購読者又は特定人物の音声で前記オンライン記事及びコンテンツを出力する5段階とを含み、
音声の入力及び出力は選択国家の言語に変換されて入力及び出力可能であることを特徴とする、多重音声システムが装着されたオンラインメディアサービス具現方法。 - 前記2段階は、前記特定人物の音声がオンライン商店に分野別に予め保存されており、前記購読者の選択によって前記オンライン商店で購買することができることを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記2段階は、前記購読者の音声を前記オンライン商店に直接登録して販売することができ、前記購読者は購読者自身又は購読者が使用権を獲得した第3者を含むことを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記5段階は、前記オンライン記事及びコンテンツを全体又はセクション別、キーワード別、記事別、出版社別、最新順、日付別、アクセス数別、関連度順、ヘッドライン別の中で一つ以上を選択し、既設定の音声で出力することを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記4段階で分類されたオンライン記事及びコンテンツの条件によって予め保存された背景音の中で特定の背景音を設定し、前記音声とともに前記背景音を出力することを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記4段階で分類されたオンライン記事及びコンテンツの条件によって予め保存されたイントネーションスタイルの中で特定のイントネーションスタイルを設定して音声を出力することを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記5段階は、前記オンライン記事及びコンテンツを全体又はセクション別、キーワード別、記事別、出版社別、最新順、日付別、アクセス数別、関連度順、ヘッドライン別の中で一つ以上を選択し、使用者が選択した音声で出力することを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 通常のインターネット新聞及び検索ポータルなどの多様なオンラインコンテンツプラットホーム(ウェブ又はアプリを含む)が前記1~5段階を組み込むことを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記購読者自身又は購読者が使用権を獲得した第3者の音声を前記購読者が選択した国家の言語に変換して入力及び出力することができることを特徴とする、請求項3に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 予め設定されて商店に登録されている音声は、出力の際、利用者が選択した国家の言語に変換して出力することを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記5段階で、音声出力の際、使用者が出力される音声の速度を選択して調節することができるように構成されることを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記5段階で、音声出力の際、使用者が出力される音声のボリュームを選択して調節することができるように構成されることを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
- 前記1~5段階で、オンライン記事及びコンテンツの選択と音声出力に対する実行、中止又は変更の命令を音声で実施することができるように、通常のインターネット新聞及び検索ポータルなどの多様なオンラインコンテンツプラットホーム(ウェブ又はアプリを含む)に音声認識ボタンが装着されることを特徴とする、請求項1に記載の多重音声システムが装着されたオンラインメディアサービス具現方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2019-0115017 | 2019-09-18 | ||
KR1020190115017A KR102111360B1 (ko) | 2019-09-18 | 2019-09-18 | 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 |
PCT/KR2020/006592 WO2021054565A1 (ko) | 2019-09-18 | 2020-05-20 | 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022534824A true JP2022534824A (ja) | 2022-08-04 |
JP7262142B2 JP7262142B2 (ja) | 2023-04-21 |
Family
ID=74867869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021513294A Active JP7262142B2 (ja) | 2019-09-18 | 2020-05-20 | 複数の音声システムが装着されたオンラインメディアサービス具現方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11521593B2 (ja) |
JP (1) | JP7262142B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2006330440A (ja) * | 2005-05-27 | 2006-12-07 | Kenwood Corp | 音声案内装置、音声案内システム及びプログラム |
JP2007164210A (ja) * | 2007-01-25 | 2007-06-28 | Oki Electric Ind Co Ltd | コンテンツ音声化提供システム |
JP2009265279A (ja) * | 2008-04-23 | 2009-11-12 | Sony Ericsson Mobilecommunications Japan Inc | 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム |
JP2019161465A (ja) * | 2018-03-13 | 2019-09-19 | 株式会社東芝 | 情報処理システム、情報処理方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100071765A (ko) | 2008-12-19 | 2010-06-29 | 비플라이소프트(주) | 온라인 망을 이용한 맞춤형 정보 제공 시스템 및 그 방법 |
US8370151B2 (en) * | 2009-01-15 | 2013-02-05 | K-Nfb Reading Technology, Inc. | Systems and methods for multiple voice document narration |
US20120265533A1 (en) * | 2011-04-18 | 2012-10-18 | Apple Inc. | Voice assignment for text-to-speech output |
US9159313B2 (en) * | 2012-04-03 | 2015-10-13 | Sony Corporation | Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis |
PL401346A1 (pl) * | 2012-10-25 | 2014-04-28 | Ivona Software Spółka Z Ograniczoną Odpowiedzialnością | Generowanie spersonalizowanych programów audio z zawartości tekstowej |
JP6038848B2 (ja) | 2014-09-01 | 2016-12-07 | ヤフー株式会社 | 再生プログラム、配信装置、再生方法および情報処理装置 |
US10083684B2 (en) * | 2016-08-22 | 2018-09-25 | International Business Machines Corporation | Social networking with assistive technology device |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
JP7142333B2 (ja) | 2018-01-11 | 2022-09-27 | ネオサピエンス株式会社 | 多言語テキスト音声合成方法 |
-
2020
- 2020-05-20 JP JP2021513294A patent/JP7262142B2/ja active Active
- 2020-10-21 US US17/076,121 patent/US11521593B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2006330440A (ja) * | 2005-05-27 | 2006-12-07 | Kenwood Corp | 音声案内装置、音声案内システム及びプログラム |
JP2007164210A (ja) * | 2007-01-25 | 2007-06-28 | Oki Electric Ind Co Ltd | コンテンツ音声化提供システム |
JP2009265279A (ja) * | 2008-04-23 | 2009-11-12 | Sony Ericsson Mobilecommunications Japan Inc | 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム |
JP2019161465A (ja) * | 2018-03-13 | 2019-09-19 | 株式会社東芝 | 情報処理システム、情報処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7262142B2 (ja) | 2023-04-21 |
US11521593B2 (en) | 2022-12-06 |
US20210082393A1 (en) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102111360B1 (ko) | 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 | |
US20210224319A1 (en) | Artificially generating audio data from textual information and rhythm information | |
JP6505117B2 (ja) | 模写によるデジタル携帯情報端末の対話、および応答時のリッチなマルチメディア | |
JP5866728B2 (ja) | 画像認識システムを備えた知識情報処理サーバシステム | |
CN109118562A (zh) | 虚拟形象的讲解视频制作方法、装置以及终端 | |
CN103236259A (zh) | 语音识别处理及反馈***、语音回复方法 | |
US10777199B2 (en) | Information processing system, and information processing method | |
KR101983635B1 (ko) | 개인방송 컨텐츠 추천방법 | |
WO2019032994A1 (en) | ORAL, FACIAL AND GESTURE COMMUNICATION DEVICES AND COMPUTER INTERACTION ARCHITECTURE WITH DIGITAL MULTIMEDIA CONTENT | |
WO2019047850A1 (zh) | 标识的显示方法和装置、请求的响应方法和装置 | |
CN108877753A (zh) | 音乐合成方法及***、终端以及计算机可读存储介质 | |
US20220246135A1 (en) | Information processing system, information processing method, and recording medium | |
CN112750187A (zh) | 一种动画生成方法、装置、设备及计算机可读存储介质 | |
CN109545194A (zh) | 唤醒词预训练方法、装置、设备及存储介质 | |
Strange et al. | Cross-language categorization of French and German vowels by naïve American listeners | |
CN113033245A (zh) | 一种功能调节方法、装置、存储介质及电子设备 | |
JP4250938B2 (ja) | コミュニケーション支援方法およびコミュニケーションサーバ | |
JP7136099B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN112673641A (zh) | 对视频或语音消息的内联响应 | |
CN110379406A (zh) | 语音评论转换方法、***、介质和电子设备 | |
CN113821188A (zh) | 调整音频播放速度的方法、装置、电子设备及存储介质 | |
JP7262142B2 (ja) | 複数の音声システムが装着されたオンラインメディアサービス具現方法 | |
KR20210067426A (ko) | 음성 일기 장치 | |
JP7229296B2 (ja) | 関連情報提供方法及びシステム | |
Behrendt | Telephones, music and history: From the invention era to the early smartphone days |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211210 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210304 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211210 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20210304 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220809 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221108 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20230106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7262142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |