WO2021054565A1 - 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 - Google Patents

다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 Download PDF

Info

Publication number
WO2021054565A1
WO2021054565A1 PCT/KR2020/006592 KR2020006592W WO2021054565A1 WO 2021054565 A1 WO2021054565 A1 WO 2021054565A1 KR 2020006592 W KR2020006592 W KR 2020006592W WO 2021054565 A1 WO2021054565 A1 WO 2021054565A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
online
subscriber
content
output
Prior art date
Application number
PCT/KR2020/006592
Other languages
English (en)
French (fr)
Inventor
이종엽
이근영
Original Assignee
이종엽
(주) 제이디미디어그룹
이근영
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이종엽, (주) 제이디미디어그룹, 이근영 filed Critical 이종엽
Priority to JP2021513294A priority Critical patent/JP7262142B2/ja
Priority to US17/076,121 priority patent/US11521593B2/en
Publication of WO2021054565A1 publication Critical patent/WO2021054565A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/12Payment architectures specially adapted for electronic shopping systems
    • G06Q20/123Shopping for digital content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Definitions

  • the present invention relates to a method of implementing an online media service equipped with a multi-voice system, and more particularly, when subscribing to online articles in various online content platforms such as Internet newspapers and search portals,
  • the present invention relates to a method of implementing an online media service equipped with a multi-voice system for a series of processes in which a subscriber can directly select and listen to an article with the voices of a number of people.
  • card news which is designed so that readers can easily and conveniently check only the essential information on mobile, by providing only major and core issues concisely is also gaining popularity.
  • the present invention is to solve such a conventional problem, and when subscribing to online articles and contents in various online content platforms such as Internet newspapers and search portals, reading and viewing articles and contents with eyes, and with the voices of a number of characters including the readers themselves.
  • An object of the present invention is to provide a method of implementing an online media service equipped with a multi-voice system that enables subscribers to directly select and listen to relevant articles and contents.
  • a method for implementing an online media service equipped with a multiple voice system includes: a first step of collecting preset online articles and contents from a specific media site and displaying them on a screen of a personal terminal; A second step of inputting a subscriber's voice or setting a voice of a specific person among voices previously stored in the database; A third step of recognizing and classifying the online article and content; A fourth step of converting the classified online articles and contents into voice; And a fifth step of outputting the online article and content with the voice of a subscriber or a specific person set in the second step.
  • the voice of the specific person is pre-stored for each field in the online store, and can be purchased at the online store according to the subscriber's selection.
  • the subscriber's voice may be directly registered and sold in the online store, and the subscriber includes an individual subscriber or a third party whose use right has been obtained.
  • the fifth step is to select one or more of the online articles and contents by whole or by section, by keyword, by article, by media, by latest, by date, by number of views, by degree of relevance, by headline, and preset It can be output by voice.
  • a specific background sound may be set from among the previously stored background sound, and the background sound may be output together with the sound.
  • a specific intonation style may be set among pre-stored intonation styles to output a voice.
  • the fifth step is to select one or more of the online articles by all or by section, by keyword, by article, by media, by latest, by date, by number of views, by degree of relevance, and by headline, and the voice selected by the user. You can print it out.
  • the input and output of the voice of the individual subscriber or the third party for which the subscriber has obtained the right to use is converted into the language of the country selected by the subscriber, so that voice input and output is possible.
  • the voice set in advance and registered in the store can be converted into the language of the country selected by the user and output when output.
  • step 5 when the voice is output, it may be configured so that the user can select and adjust the speed of the output voice.
  • step 5 when the voice is output, the user may be configured to select and adjust the volume of the output voice.
  • various online content platforms can be executed by voice to execute, stop, or change commands for online article and content selection and audio output.
  • voice can be equipped with a voice recognition button.
  • the subscribers themselves record their own voice or the voice of a third party that the reader has acquired the license to use, and when they subscribe to articles and contents on online media sites (internet newspapers, search portals, and various online content platforms), their voice or subscribers
  • the voices of people in various fields that have already been set are prepared in the voice storage system, and the reader selects a specific voice and selects the articles and contents according to their taste. There is also the effect of being able to listen to the content.
  • users can directly select their preferred language and listen to specific articles and contents in the language of their choice, and all or sections provided by various online content platforms such as Internet newspapers and portals, by keywords, by articles, by media companies.
  • various online content platforms such as Internet newspapers and portals, by keywords, by articles, by media companies.
  • 1 is an exemplary diagram for multiple voice recognition of the present invention.
  • FIG. 2 is a control flow chart showing an embodiment of a method for implementing an online media service equipped with a multiple voice system according to the present invention
  • FIG. 3 is a flow chart showing a specific embodiment of implementing online articles and contents of various online content platforms such as a search portal or Internet newspaper by voice;
  • FIG. 4 is a control flow chart showing another embodiment of FIG. 2;
  • FIG. 5 is a control flow chart showing a process of recording and storing a subscriber's voice according to the present invention
  • FIG. 6 is a control flow chart showing a process of registering and selling to an online store by selecting a stored voice according to the present invention
  • FIG. 7 is a control flow chart showing a process of setting a background sound according to the present invention.
  • FIG. 8 is a control flow chart showing a process of setting voices for each style according to the present invention.
  • FIG. 1 and 2 are control flow charts showing an embodiment of a method for implementing an online media service equipped with a multiple voice system according to the present invention.
  • the method for implementing an online media service equipped with a multiple voice system includes: a first step (S11) of collecting preset online articles and contents from a specific media site and displaying them on a screen of a personal terminal; A second step of inputting a subscriber's voice or setting a voice of a specific person among voices previously stored in the database (S12); A third step (S13) of recognizing and classifying the online article and content; A fourth step (S14) of converting the classified online articles and contents into voice; And a fifth step (S15) of outputting the online article and content with the voice of a subscriber or a specific person set in the second step.
  • preset online articles and contents are collected from a specific media site and displayed on the screen of a personal terminal.
  • the online article and content may be classified and set by article and section, such as politics, economy, sports, and culture.
  • languages such as Korean, English, Japanese, and Chinese may be selected.
  • the subscriber's voice can be directly registered and sold in the online store, and the subscriber includes an individual subscriber or a third party whose use right has been obtained.
  • the individual subscriber or the voice of a third party for which the subscriber has obtained the right to use may be input, or the voice of a specific person among voices previously stored in the database may be set.
  • the store has a list of purchased voices classified such as politicians, entertainers, announcers, sportsmen, etc., and voice resistance may be directly registered therein.
  • step 3 (S13) the online article and content are recognized and classified.
  • an image or text area is extracted from the extracted keyframe using conventional artificial intelligence technology, and the article (content) title for each article (content) of news and content through character recognition in the extracted area Is obtained and stored, so that news and content can be classified by title or content.
  • news can be classified by all or sections of online articles and contents, by keyword, by article, by press, by the latest, by date, by hits, by degree of relevance, and by headline. May be.
  • step 4 (S14) the classified online articles and contents are converted into voice
  • step 5 (S15) the online articles and contents are output using the voice of a subscriber or a specific person set in the second step.
  • the fifth step is to select one or more of the online articles and contents by whole or by section, by keyword, by article, by media, by latest, by date, by number of views, by degree of relevance, by headline, and preset It is desirable to output audio.
  • FIG. 3 is a flow chart showing a specific embodiment of implementing online articles and contents of various online content platforms, such as a search portal or Internet newspaper, by voice.
  • FIG. 4 is a control flow chart showing another embodiment of FIG. 2.
  • the method for implementing an online media service equipped with a multiple voice system includes: a first step of collecting preset online articles and contents from a specific media site and displaying them on a screen of a personal terminal (S41); A second step (S42) of inputting a voice of an individual subscriber or a third party for which the subscriber has obtained a use right, or setting a voice of a specific person among voices previously stored in the database; A third step (S43) of recognizing and classifying the online article and content; A fourth step (S44) of converting the classified online articles and contents into voice; Including the fifth step (S45) of outputting the online article and content with the voice of a subscriber or a specific person set in step 2 is substantially the same as described with reference to FIG. 1.
  • the second step (S42) in inputting the voice of the individual subscriber or the third party for which the subscriber has obtained the right to use, or setting the voice of a specific person among voices previously stored in the database, the individual subscriber or the subscriber obtained the use right.
  • a function of directly registering the voice of a third party in the online store and selling it is further added.
  • FIG. 5 is a control flow chart showing a process of recording and storing the voice of an individual subscriber or a third party who has obtained a use right of the subscriber according to the present invention.
  • a specific language conversion is selected among languages such as English, Korean, Japanese, and Chinese, and the storage is completed through sequential change and storage steps (S54 to S58).
  • FIG. 6 is a control flowchart showing a process of registering and selling a stored voice in an online store according to the present invention.
  • the voice of the specific person is pre-stored for each field in the online store, and can be purchased at the online store according to the subscriber's selection.
  • the store displays by classification such as politician, entertainer, announcer, sportsman, etc. as an example of a specific person of the corresponding voice. You can do it (S63), and you can register for sale by registering the desired selling price of the subscriber's voice here (S64 ⁇ S66).
  • FIG. 7 is a control flow chart showing a process of setting a background sound according to the present invention.
  • a specific background sound may be set from among the background sounds stored in advance, and the background sound may be output together with the voice.
  • the subscriber selects non-use or use of the background sound (S71 to S72) and sets the section (eg, all, early, middle, end, random) by type ( For example, the sound of rain, thunder, wave, wind, bell, flute, etc.) can be used to output the background sound (S73 ⁇ S74).
  • the section eg, all, early, middle, end, random
  • type For example, the sound of rain, thunder, wave, wind, bell, flute, etc.
  • FIG. 8 is a control flow chart showing a process of setting voices for each style according to the present invention.
  • a specific intonation style may be set among pre-stored intonation styles to output the voice of the corresponding style.
  • the subscriber selects not to use or use the accent style (S81 to S82), and as an example of various types of accent styles, joy, sadness, calmness, loveliness, youthfulness It is possible to selectively use ham, refreshing, and so on.
  • a general Internet newspaper and search portal and various online content platforms (including web or app) can be equipped with the methods of steps 1 to 5 above.
  • the input and output of the voice of the individual subscriber or the third party for which the subscriber has obtained the right to use is converted into the language of the country selected by the subscriber, so that voice input and output is possible.
  • the conversion process into the language of the country selected by the subscriber may use a conventional voice conversion system.
  • the voice conversion system it is possible to use the voice conversion system to convert the voice set in advance and registered in the store into the language of the country selected by the user upon output.
  • the user can select and adjust the speed of the output voice.
  • the subscriber may configure the online article and content to be output by setting the speed of the voice output when the online article and content are converted into voice and output as very fast, fast, normal, slow, or very slow.
  • the voice speed control menu is provided so that the user can arbitrarily set the speed control of the voice himself, and the user can select the speed control by arbitrarily setting within the speed control value from 0 to 100 through the corresponding menu.
  • step 5 when the voice is output, the user can select and adjust the volume of the output voice.
  • the subscriber may configure the volume of the voice output when the online article and content are converted into voice and output as very loud, loud, normal, small, or very small.
  • a voice size adjustment menu is provided so that the user can arbitrarily adjust the size of the voice himself, and the user can select the size adjustment by arbitrarily setting within the size adjustment value from 0 to 100 through the corresponding menu.
  • steps 1 to 5 various online content platforms (web or Including apps) can be equipped with a voice recognition button.
  • the user can execute all commands through the voice execution button on the mobile screen when using this service.
  • search for articles and contents For example, in the search for articles and contents, search for media companies, search for headline articles and contents, search for articles and contents according to keywords, search for the latest articles and contents, and search for articles and contents with high views.
  • Classification, search by section, search by date, and search by relevance can be instructed through the corresponding voice recognition button, and commands from all users (subscribers) to stop and execute the command and stop using the service are voiced by the voice execution button. It can be done through the device.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 인터넷 신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼에서 온라인 기사 및 콘텐츠 구독시 눈으로 기사 및 콘텐츠를 읽고, 보는 것과 함께 독자 자신을 포함한 다수의 인물들의 음성으로 해당 기사 및 콘텐츠를 구독자가 직접 선택하여 청취할 수 있도록 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법에 관한 것이다. 본 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법은, 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이하는 1단계; 구독자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정하는 2단계; 상기 온라인 기사 및 콘텐츠를 인식 및 분류하는 3단계; 상기 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하는 4단계; 상기 2단계에서 설정된 구독자 또는 특정 인물 음성으로 상기 온라인 기사 및 콘텐츠를 출력하는 5단계를 포함한다.

Description

다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법
본 발명은 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법에 관한 것으로, 더욱 상세하게는 인터넷신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼 에서 온라인 기사 구독시 눈으로 기사를 읽고, 보는 것과 함께 독자 자신을 포함한 다수의 인물들의 음성으로 해당 기사를 구독자가 직접 선택하여 청취할 수 있도록 하는 일련의 과정에 대한 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법에 관한 것이다.
종래에는 인터넷신문과 같은 온라인미디어 및 검색포털, 온라인 콘텐츠 플랫폼 등에서 온라인 기사 및 콘텐츠 구독시 단순 텍스트로만 구성된 기사를 구독하는 것이 일반적이었다.
하지만, 온라인미디어 환경의 변화로 인해 독자들의 기사구독 패턴 또한 PC에서 모바일로 전환되면서, 기사를 읽는 것에서 보는 것으로의 진화도 함께 이뤄지고 있는 실정이다.
실제로 최근 온라인미디어 독자들의 경우는 방대한 정보의 홍수속에서 자신들이 필요한 정보만을 획득하길 바라는게 현실이다.
이에 독자들에게 주요 핵심 이슈만을 간결하게 제공해 꼭 필요한 정보만을 모바일에서 손쉽게 편리하게 독자들이 확인할 수 있도록 구성된 카드뉴스 또한 인기를 얻고 있다.
하지만, 온라인상에서의 기사 및 콘텐츠 구독시 전통적인 텍스트 기반의 기사(콘텐츠)나 카드뉴스가 온라인미디어 환경에서 독자들의 모든 기사 구독 활동을 만족시킬 수 있는 것만은 아니다.
실제로 현재의 온라인미디어 환경에서의 온라인 기사 및 콘텐츠 구독은 사람의 눈을 많이 사용하며, 이로 인해 시력저하 등의 질환에 노출되어 있다.
또한 바쁜 현대인들의 생활 패턴에서도 모바일상에서 눈으로만 온라인 기사 및 콘텐츠를 구독하는 것은 시간적, 장소적, 환경적 영향에 의해 그 활용도가 저조해지고 있는 것도 사실이다.
특히 장거리 운전을 통해 출장 및 이동이 많은 사람들의 경우 모바일을 활용해 눈으로만 온라인 기사 및 콘텐츠를 구독하는 것은 상당한 안구 건강위험에 노출될 뿐만아니라, 교통사고 등 인명피해에 이를 수 있는 사건을 유발 시킬 수 있는 환경속에 노출되어 있다.
또한 모바일을 통해 눈으로만 온라인 기사 및 콘텐츠를 구독할시에는 기타 다른 활동을 병행할 수 없는 단점들도 존재한다.
이에, 이후 온라인 기사 및 콘텐츠 구독(소비)를 위해 등장한 기술이 텍스트를 음성으로 변환하여 천편일률적인 음성으로 콘텐츠를 리딩, 송출하는 것이다.
하지만, 위와 같은 종래의 기술은 텍스트를 변환 프로그램을 이용해 음성으로의 변환을 통해, 기 설정된 음성에 의해 스피커를 통해 단순 출력하는 것에 지나지 않아 인터넷신문과 검색포털 등 다양한 온라인 콘텐츠 플랫폼에서 기사청취시 매우 지루하고, 독자(대중)들의 참여 시스템의 부재로 인해 대중적 관심 또한 불러일으키지 못하고 있는 문제점이 있었다.
본 발명은 이러한 종래 문제점을 해결하기 위한 것으로, 인터넷 신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼에서 온라인기사 및 콘텐츠 구독시 눈으로 기사 및 콘텐츠를 읽고, 보는 것과 함께 독자 자신을 포함한 다수의 인물들의 음성으로 해당 기사 및 콘텐츠를 구독자가 직접 선택하여 청취할 수 있도록 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법을 제공하는데 목적이 있다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위해 본 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법은, 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이하는 1단계; 구독자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정하는 2단계; 상기 온라인 기사 및 콘텐츠를 인식 및 분류하는 3단계; 상기 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하는 4단계; 상기 2단계에서 설정된 구독자 또는 특정 인물 음성으로 상기 온라인 기사 및 콘텐츠를 출력하는 5단계를 포함힌다.
상기 2단계는, 상기 특정 인물의 음성이 온라인 상점에 분야별로 미리 저장되어 있고, 상기 구독자의 선택에 따라 상기 온라인 상점에서 구매할 수 있다.
상기 2단계는, 상기 구독자의 음성을 상기 온라인 상점에 직접 등록하여 판매할 수 있고, 상기 구독자는 구독자 개인 또는 구독자가 사용권을 획득한 제3자를 포함한다.
상기 5단계는, 상기 온라인 기사 및 콘텐츠를 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별 중 한 개 이상을 선택하고, 미리 설정된 음성으로 출력할 수 있다.
상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 배경음 중 특정 배경음을 설정하여 상기 음성과 함께 배경음을 출력할 수 있다.
상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 억양 스타일중 특정 억양 스타일을 설정하여 음성을 출력할 수 있다.
상기 5단계는, 상기 온라인 기사를 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별 중 한 개 이상을 선택하고, 사용자가 선택한 음성으로 출력할 수 있다.
통상의 인터넷신문 및 검색포털 등 다양한 온라인 콘텐츠플랫폼(웹 또는 앱을 포함한다)이 상기 1 내지 5 단계를 장착할 수 있다.
상기 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성의 입력과 출력은 구독자가 선택한 국가의 언어로 변환되어 음성의 입력과 출력이 가능하다.
미리 설정되어 상점에 등록되어 있는 음성은 출력시, 이용자가 선택한 국가의 언어로 변환되어 출력이 가능하다.
상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 속도를 선택해 조절할 수 있도록 구성될 수 있다.
상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 볼륨의 크기를 선택해 조절할 수 있도록 구성될 수 있다.
상기 1 내지 5단계에서, 온라인 기사 및 콘텐츠 선택과 음성출력에 대한 실행과 중지 또는 변경 명령을 음성으로 실시할 수 있도록, 통상의 인터넷신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼(웹 또는 앱을 포함한다)에 음성인식 버튼이 장착될 수 있다.
본 발명의 기타 특징 및 더욱 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
상기와 같이 구성된 본 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법에 의하면, 종래 기술의 문제점을 극복하고, 현대인들의 다양한 일상생활에서도 시간적, 장소적, 환경의 영향을 받지 않고 , 원활한 온라인미디어 구독활동의 편의성을 증가시키는 효과가 있다.
또한, 구독자 스스로 자신의 음성을 녹음하거나 또는 독자가 사용권을 획득한 제3자의 음성을 녹음하여 온라인 미디어 사이트(인터넷신문, 검색포털, 다양한 온라인 콘텐츠 플랫폼) 등에서 기사 및 콘텐츠 구독시 자신의 음성 또는 구독자가 사용권을 획득한 제3자의 음성으로 특정 기사 및 콘텐츠들을 청취할 수 있을 뿐더러, 이미 기 설정된 다양한 분야의 인물들의 음성들을 음성저장시스템에 마련해, 독자가 특정 음성을 선택해 자신의 취향에 따라 기사 및 콘텐츠를 청취할 수 있는 효과도 있다.
또한, 자신의 음성 또는 구독자가 사용권을 획득한 제3자의 음성을 직접 음성 스토어를 통해 판매도 할 수 있으며, 특정인의 음성들 또한 구독자(이용자)들이 해당 음성의 선택과 구매가 가능한 매우 유용한 효과도 있다.
또한, 사용자는 자신이 원하는 언어를 직접 선택하여 선택한 언어로 특정 기사 및 콘텐츠를 청취할 수 있으며, 인터넷신문 및 포털 등 다양한 온라인 콘텐츠 플랫폼에서 제공하는 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별로 자신이 선택한 기사 및 콘텐츠들을 자신이 선택한 음성으로 청취할 수 있는 효과도 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 다중 음성인식에 대한 실시예도.
도 2는 본 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법의 일실시예를 나타낸 제어 순서도,
도 3은 검색포털 또는 인터넷신문 등 다양한 온라인 콘텐츠 플랫폼의 온라인 기사 및 콘텐츠를 음성으로 구현하는 구체적인 실시예를 나타낸 순서도,
도 4는 도 2의 다른 실시예를 나타낸 제어 순서도,
도 5는 본 발명의 구독자의 음성을 녹음하여 저장하는 과정을 나타낸 제어 순서도,
도 6은 본 발명의 저장된 음성을 선택하여 온라인 상점에 등록 판매하는 과정을 나타낸 제어 순서도,
도 7은 본 발명의 배경음을 설정하는 과정을 나타낸 제어 순서도,
도 8은 본 발명의 스타일별 음성을 설정하는 과정을 나타낸 제어 순서도이다.
본 발명은 다양한 변형 및 여러 가지 실시예를 가질 수 있는 바, 그중 특정 실시예를 상세한 설명과 도면의 예시를 통하여 보다 상세하게 설명하고자 한다. 아울러, 본 발명을 설명함에 있어서 관련된 주지 관용 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 설명을 생략한다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명하기로 한다.
*도 1 및 2는 본 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법의 일실시예를 나타낸 제어 순서도이다.
도시된 바와 같이, 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법은, 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이하는 1단계(S11); 구독자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정하는 2단계(S12); 상기 온라인 기사 및 콘텐츠를 인식 및 분류하는 3단계(S13); 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하는 4단계(S14); 상기 2단계에서 설정된 구독자 또는 특정 인물의 음성으로 상기 온라인 기사 및 콘텐츠를 출력하는 5단계(S15)를 포함한다.
상기 1단계(S11)에서는 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이한다.
이때, 상기 온라인 기사 및 콘텐츠는 정치, 경제, 스포츠, 문화 등과 같이 기사별, 섹션별로 분류되어 설정될 수 있다. 또한, 한국어, 영어, 일어, 중국어 등과 같이 각국 언어가 선택될 수 있다.
상기 2단계(S12)는, 상기 구독자의 음성을 상기 온라인 상점에 직접 등록하여 판매할 수 있으며, 상기 구독자는 구독자 개인 또는 구독자가 사용권을 획득한 제3자를 포함한다.
따라서, 상기 2단계(S12)에서는 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정할 수 있다.
상기 상점에는 정치인, 연예인, 아나운서, 스포츠맨 등과 같이 분류된 구매음성목록이 구비되어 있고 여기에 내음성을 직접 등록할 수도 있다.
3단계(S13)에서는 상기 온라인 기사 및 콘텐츠를 인식 및 분류한다.
이때, 통상의 인공 지능(Artificial Intelligence) 기술을 이용하여 추출된 키프레임에서 이미지 또는 텍스트 영역을 추출하고, 추출된 영역에서 문자인식을 통하여 뉴스 및 콘텐츠의 각 기사(콘텐츠)별 기사(콘텐츠)제목을 획득, 저장하게 되어 제목별 또는 내용별로 뉴스 및 콘텐츠를 분류할 수 있다.
더욱 구체적으로는, 상기 인공 지능 기술을 이용하여 온라인기사 및 콘텐츠의 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별로 뉴스를 분류할 수도 있다.
4단계(S14)에서는 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하고, 5단계(S15)에서는 상기 2단계에서 설정된 구독자 또는 특정 인물의 음성으로 상기 온라인 기사 및 콘텐츠를 출력한다.
상기 5단계는, 상기 온라인 기사 및 콘텐츠를 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별 중 한 개 이상을 선택하고, 미리 설정된 음성으로 출력하는 것이 바람직하다.
도 3은 검색포탈 또는 인터넷신문 등 다양한 온라인 콘텐츠 플랫폼의 온라인 기사 및 콘텐츠를 음성으로 구현하는 구체적인 실시예를 나타낸 순서도이다.
도시된 바와 같이, 특정 검색포털에서 미리 설정된 온라인 기사 및 콘텐츠를 수집하고(S21); 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성 또는 온라인 상점에서 구매한 특정 인물의 음성을 설정하고(S22); 상기 온라인 기사 및 콘텐츠를 인식 및 분류한 후(S23); 분류된 온라인 기사 및 콘텐츠를 음성으로 변환한 후 출력 순서를 검색하고(S24); 상기 단계에서 설정된 구독자 또는 특정 인물의 음성으로 상기 온라인 기사 및 콘텐츠를 출력한다(S25).
다른 예로서, 도시된 바와 같이, 특정 인터넷신문에서 미리 설정된 온라인 기사 및 콘텐츠를 수집하고(S31); 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 설정하거나 또는 온라인 상점에서 구매한 특정 인물의 음성을 설정하고(S32); 상기 온라인 기사 및 콘텐츠를 인식 및 분류한 후(S33); 분류된 온라인 기사 및 콘텐츠를 음성으로 변환한 후 출력 순서를 검색하고(S34); 상기 단계에서 설정된 구독자 또는 특정 인물의 음성으로 상기 온라인 기사 및 콘텐츠를 출력한다(S35).
도 4은 도 2의 다른 실시예를 나타낸 제어 순서도이다.
도시된 바와 같이, 발명에 따른 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법은, 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이하는 1단계(S41); 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정하는 2단계(S42); 상기 온라인 기사 및 콘텐츠를 인식 및 분류하는 3단계(S43); 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하는 4단계(S44); 상기 2단계에서 설정된 구독자 또는 특정 인물의 음성으로 상기 온라인 기사 및 콘텐츠를 출력하는 5단계(S45)를 포함하는 것을 도 1을 통하여 설명한 바와 대동소이하다.
다만, 상기 2단계(S42)에서는 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정함에 있어서, 상기 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 상기 온라인 상점에 직접 등록하여 판매할 수 있는 기능을 더 추가한다.
도 5는 본 발명의 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성을 녹음하여 저장하는 과정을 나타낸 제어 순서도이다.
도시된 바와 같이, 음성 녹음(S50)을 위하여 먼저, 개인의 음성을 마이크를 통하여 입력하면(S51), 입력된 음성을 듣고 저장을 할 것인지 아닌지를 선택한다(S52~S53).
저장할 것으로 선택되면, 영어, 한국어, 일어, 중국어 등의 언어중 특정 언어 변환을 선택하고, 변화 및 저장 단계를 순차적으로 거쳐 저장을 완료한다(S54~S58).
도 6은 본 발명의 저장된 음성을 선택하여 온라인 상점에 등록 판매하는 과정을 나타낸 제어 순서도이다.
도시된 바와 같이, 상기 특정 인물의 음성이 온라인 상점에 분야별로 미리 저장되어 있고, 상기 구독자의 선택에 따라 상기 온라인 상점에서 구매할 수 있다.
예로서, 먼저 데이터베이스에 저장된 음성목록을 보고(S60), 특정 음성을 선택하여 상점으로 전송하면(S61~62), 상점에서는 해당 음성의 특정인 예로서 정치인, 연예인, 아나운서, 스포츠맨 등의 분류별로 표시할 수 있고(S63), 여기에 구독자의 음성을 희망 판매가를 등록하여 판매 등록 할수 있다(S64~S66).
도 7은 본 발명의 배경음을 설정하는 과정을 나타낸 제어 순서도이다.
본 발명의 상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 배경음중 특정 배경음을 설정하여 상기 음성과 함께 배경음을 출력할 수 있다.
이때, 도시된 바와 같이, 배경음의 설정시(S70) 구독자는 배경음의 비사용 또는 사용을 선택하고(S71~S72) 구간(예, 전체, 초반부, 중간부, 말미, 랜덤)을 설정하여 종류별(예, 비소리, 천둥소리, 파도소리, 바람소리, 종소리, 피리소리 등등)로 배경음을 출력시킬 수 있다(S73~S74).
도 8은 본 발명의 스타일별 음성을 설정하는 과정을 나타낸 제어 순서도이다.
본 발명의 상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 억양 스타일중 특정 억양 스타일을 설정하여 해당 스타일의 음성을 출력할 수 있다.
이때, 도시된 바와 같이, 상기 스타일의 설정시(S80) 구독자는 억양 스타일의 비사용 또는 사용을 선택하고(S81~S82), 다양한 종류별 억양 스타일 예로서, 기쁨, 슬픔, 차분함, 사랑스러움, 발랄함, 상큼함 등등을 선택적으로 사용할 수 있다.
본 발명은 통상의 인터넷신문 및 검색포털, 다양한 온라인 콘텐츠 플랫폼(웹 또는 앱을 포함한다)이 상기 1 내지 5 단계의 방법을 장착할 수 있다.
상기 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성의 입력과 출력은 구독자가 선택한 국가의 언어로 변환되어 음성의 입력과 출력이 가능하다.
이때, 구독자가 선택한 국가의 언어로 변환되는 과정은 통상의 음성변환시스템을 사용할 수 있다.
또한, 미리 설정되어 상점에 등록되어 있는 음성은 출력시, 이용자가 선택한 국가의 언어로 변환되어 출력하는 것도 상기 음성변환시스템을 사용하여 가능하다.
또한, 상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 속도를 선택해 조절할 수 있도록 구성된다.
이때, 구독자가 온라인 기사 및 콘텐츠가 음성으로 변환되어 출력시 출력되는 음성의 속도를 매우 빠르게, 빠르게, 보통, 느리게, 매우 느리게와 같이 설정하여 출력될 수 있도록 구성할 수 있다.
또한 사용자가 음성의 속도조절을 임의로 자신이 직접 설정할 수 있도록 음성속도 조절 메뉴가 마련되어, 사용자는 해당 메뉴를 통해 0부터 100까지의 속도조절 수치내에서 임의로 설정하여 속도조절을 선택할 수 있다,
또한, 상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 볼륨의 크기를 선택해 조절할 수 있도록 구성된다.
이때, 구독자가 온라인 기사 및 콘텐츠가 음성으로 변환되어 출력시 출력되는 음성의 볼륨을 매우 크게, 크게, 보통, 작게, 매우 작게와 같이 설정하여 출력될 수 있도록 구성할 수 있다.
또한 사용자가 음성의 크기조절을 임의로 자신이 직접 설정할 수 있도록 음성크기 조절 메뉴가 마련되어, 사용자는 해당 메뉴를 통해 0부터 100까지의 크기조절 수치내에서 임의로 설정하여 크기조절을 선택할 수 있다,
또한, 상기 1 내지 5단계에서, 온라인 기사 및 콘텐츠 선택과 음성출력에 대한 실행과 중지 또는 변경 명령을 음성으로 실시할 수 있도록, 통상의 인터넷신문 및 검색포털을 포함하는 다양한 온라인 콘텐츠 플랫폼(웹 또는 앱을 포함한다)에 음성인식 버튼이 장착될 수 있다.
즉, 사용자(구독자)는 본 서비스를 이용시 모바일 화면에서 음성 실행 버튼을 통해 모든 명령을 실시할 수 있다.
일례로, 기사 및 콘텐츠에 대한 검색에 있어서, 언론사에 대한 검색, 헤드라인 기사 및 콘텐츠에 대한 검색, 키워드에 따른 기사 및 콘텐츠 검색, 최신기사 및콘텐츠에 대한 검색, 조회수가 높은 기사 및 콘텐츠의 검색, 분류, 섹션에 따른 검색, 일자별 검색, 관련도별 검색을 해당 음성인식 버튼을 통해 지시할 수 있으며, 해당 명령의 중지 및 실행, 서비스 이용 정지에 대한 모든 사용자(구독자)의 명령을 음성 실행버튼 장치를 통해 실시할 수 있다.
본 명세서에 기재된 본 발명의 실시예와 도면에 도시된 구성은 본 발명의 바람직한 실시예에 관한 것으로, 발명의 기술적 사상을 모두 포괄하는 것은 아니므로, 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다. 따라서, 본 발명은 상술한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 본 발명의 청구범위 기재의 권리범위 내에 있게 된다.

Claims (13)

  1. 미리 설정된 온라인 기사 및 콘텐츠를 특정 미디어 사이트로부터 수집하여 개인 단말기 화면에 디스플레이하는 1단계;
    구독자의 음성을 입력하거나 데이터베이스에 미리 저장된 음성중 특정 인물의 음성을 설정하는 2단계;
    상기 온라인 기사 및 콘텐츠를 인식 및 분류하는 3단계;
    상기 분류된 온라인 기사 및 콘텐츠를 음성으로 변환하는 4단계;
    상기 2단계에서 설정된 구독자 또는 특정 인물 음성으로 상기 온라인 기사 및 콘텐츠를 출력하는 5단계;를 포함하고,
    음성의 입력과 출력은 선택한 국가의 언어로 변환되어 음성의 입력과 출력이 가능한 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  2. 제 1항에 있어서,
    상기 2단계는,
    상기 특정 인물의 음성이 온라인 상점에 분야별로 미리 저장되어 있고, 상기 구독자의 선택에 따라 상기 온라인 상점에서 구매할 수 있는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  3. 제 1항에 있어서,
    상기 2단계는,
    상기 구독자의 음성을 상기 온라인 상점에 직접 등록하여 판매할 수 있고,
    상기 구독자는 구독자 개인 또는 구독자가 사용권을 획득한 제3자를 포함하는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  4. 제 1항에 있어서,
    상기 5단계는, 상기 온라인 기사 및 콘텐츠를 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별 중 한 개 이상을 선택하고, 미리 설정된 음성으로 출력하는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  5. 제 1항에 있어서,
    상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 배경음 중 특정 배경음을 설정하여 상기 음성과 함께 배경음을 출력하는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  6. 제 1항에 있어서,
    상기 4단계에서 분류된 온라인 기사 및 콘텐츠의 조건에 따라 미리 저장된 억양 스타일중 특정 억양 스타일을 설정하여 음성을 출력하는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  7. 제 1항에 있어서,
    상기 5단계는, 상기 온라인 기사 및 콘텐츠를 전체 또는 섹션별, 키워드별, 기사별, 언론사별, 최신별, 일자별, 조회수별, 관련도별, 헤드라인별 중 한 개 이상을 선택하고, 사용자가 선택한 음성으로 출력하는 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법.
  8. 제 1항에 있어서,
    통상의 인터넷신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼(웹 또는 앱을 포함한다)이 상기 1 내지 5 단계를 장착한 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  9. 제 3항에 있어서,
    상기 구독자 개인 또는 구독자가 사용권을 획득한 제3자의 음성의 입력과 출력은 구독자가 선택한 국가의 언어로 변환되어 음성의 입력과 출력이 가능한 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  10. 제 1항에 있어서,
    미리 설정되어 상점에 등록되어 있는 음성은 출력시, 이용자가 선택한 국가의 언어로 변환되어 출력이 가능한 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  11. 제 1항에 있어서,
    상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 속도를 선택해 조절할 수 있도록 구성된 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  12. 제 1항에 있어서,
    상기 5단계에서 음성 출력시 사용자가 출력되는 음성의 볼륨의 크기를 선택해 조절할 수 있도록 구성된 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
  13. 제 1항에 있어서,
    상기 1 내지 5단계에서, 온라인 기사 및 콘텐츠 선택과 음성출력에 대한 실행과 중지 또는 변경 명령을 음성으로 실시할 수 있도록, 통상의 인터넷신문 및 검색포털 등 다양한 온라인 콘텐츠 플랫폼(웹 또는 앱을 포함한다)에 음성인식 버튼이 장착된 것을 특징으로 하는 다중 음성시스템이 장착된 온라인미디어 서비스 구현방법.
PCT/KR2020/006592 2019-09-18 2020-05-20 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법 WO2021054565A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021513294A JP7262142B2 (ja) 2019-09-18 2020-05-20 複数の音声システムが装着されたオンラインメディアサービス具現方法
US17/076,121 US11521593B2 (en) 2019-09-18 2020-10-21 Method of embodying online media service having multiple voice systems

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0115017 2019-09-18
KR1020190115017A KR102111360B1 (ko) 2019-09-18 2019-09-18 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/076,121 Continuation US11521593B2 (en) 2019-09-18 2020-10-21 Method of embodying online media service having multiple voice systems

Publications (1)

Publication Number Publication Date
WO2021054565A1 true WO2021054565A1 (ko) 2021-03-25

Family

ID=70912692

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/006592 WO2021054565A1 (ko) 2019-09-18 2020-05-20 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법

Country Status (2)

Country Link
KR (1) KR102111360B1 (ko)
WO (1) WO2021054565A1 (ko)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100071765A (ko) * 2008-12-19 2010-06-29 비플라이소프트(주) 온라인 망을 이용한 맞춤형 정보 제공 시스템 및 그 방법
JP2016051407A (ja) * 2014-09-01 2016-04-11 ヤフー株式会社 情報処理装置、配信装置、再生方法および再生プログラム
KR20190071794A (ko) * 2016-11-03 2019-06-24 구글 엘엘씨 음성 인터페이스 디바이스에서의 포커스 세션
KR20190085883A (ko) * 2018-01-11 2019-07-19 네오사피엔스 주식회사 다중 언어 텍스트-음성 합성 모델을 이용한 음성 번역 방법 및 시스템

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040033767A (ko) 2002-10-15 2004-04-28 케이투아이엠에스 한국어 이미지 문자인식기능을 통한 뉴스 동영상의뉴스제목 자동추출방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100071765A (ko) * 2008-12-19 2010-06-29 비플라이소프트(주) 온라인 망을 이용한 맞춤형 정보 제공 시스템 및 그 방법
JP2016051407A (ja) * 2014-09-01 2016-04-11 ヤフー株式会社 情報処理装置、配信装置、再生方法および再生プログラム
KR20190071794A (ko) * 2016-11-03 2019-06-24 구글 엘엘씨 음성 인터페이스 디바이스에서의 포커스 세션
KR20190085883A (ko) * 2018-01-11 2019-07-19 네오사피엔스 주식회사 다중 언어 텍스트-음성 합성 모델을 이용한 음성 번역 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONG HANA: "KT and KAKAO Using Celebrity Voice on AI Speaker", THE BCHAIN, 4 June 2018 (2018-06-04), XP055793270, Retrieved from the Internet <URL:http://www.digitaltoday.co.kr/news/articleView.html?idxno=200290> *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US12009007B2 (en) 2013-02-07 2024-06-11 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones

Also Published As

Publication number Publication date
KR102111360B1 (ko) 2020-05-18

Similar Documents

Publication Publication Date Title
WO2021054565A1 (ko) 다중 음성시스템이 장착된 온라인미디어 서비스 구현 방법
US10334301B2 (en) Providing content responsive to multimedia signals
WO2019156332A1 (ko) 증강현실용 인공지능 캐릭터의 제작 장치 및 이를 이용한 서비스 시스템
WO2013054839A1 (ja) 画像認識システムを備えた知識情報処理サーバシステム
CN105224581B (zh) 在播放音乐时呈现图片的方法和装置
US20140223279A1 (en) Data augmentation with real-time annotations
WO2021169347A1 (zh) 提取文本关键字的方法及装置
CN110517689A (zh) 一种语音数据处理方法、装置及存储介质
CN109086026A (zh) 播报语音的确定方法、装置和设备
Yu et al. Inferring user profile attributes from multidimensional mobile phone sensory data
WO2020085663A1 (ko) 인공지능 기반의 자동 로고생성 시스템 및 이를 이용한 로고생성 서비스 방법
CN101739437A (zh) 一种网络搜音机的实现方法及其专用设备
CN114464180A (zh) 一种智能设备及智能语音交互方法
JP2016024282A (ja) 語学教材生成システム、語学教材生成装置、携帯端末、語学教材生成プログラム、および語学教材生成方法
CN110309324A (zh) 一种搜索方法及相关装置
CN115237301A (zh) 互动小说中弹幕的处理方法及装置
CN113573128A (zh) 一种音频处理方法、装置、终端以及存储介质
CN110111795B (zh) 一种语音处理方法及终端设备
WO2023167496A1 (ko) 인공지능을 이용한 음악 작곡 방법
WO2012057561A2 (ko) 인스턴트 메신저 서비스 제공시스템 및 그 제공방법, 및 통신 단말기 및 그 통신방법
JP2014149571A (ja) コンテンツ検索装置
KR102414993B1 (ko) 연관 정보 제공 방법 및 시스템
JP7262142B2 (ja) 複数の音声システムが装着されたオンラインメディアサービス具現方法
CN114297372A (zh) 个性化的笔记生成方法及***
CN112885356A (zh) 一种基于声纹的语音识别方法

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2021513294

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20864392

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20864392

Country of ref document: EP

Kind code of ref document: A1