RU2571520C2 - Image processing device and associated control method and image processing system - Google Patents
Image processing device and associated control method and image processing system Download PDFInfo
- Publication number
- RU2571520C2 RU2571520C2 RU2013103490/08A RU2013103490A RU2571520C2 RU 2571520 C2 RU2571520 C2 RU 2571520C2 RU 2013103490/08 A RU2013103490/08 A RU 2013103490/08A RU 2013103490 A RU2013103490 A RU 2013103490A RU 2571520 C2 RU2571520 C2 RU 2571520C2
- Authority
- RU
- Russia
- Prior art keywords
- call sign
- speech
- server
- callsign
- voice
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000008569 process Effects 0.000 claims abstract description 57
- 230000006854 communication Effects 0.000 claims abstract description 22
- 238000004891 communication Methods 0.000 claims abstract description 21
- 239000000126 substance Substances 0.000 abstract 1
- 230000000007 visual effect Effects 0.000 description 72
- 230000003993 interaction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4227—Providing Remote input by a user located remotely from the client device, e.g. at work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Telephonic Communication Services (AREA)
- Facsimiles In General (AREA)
- Details Of Television Systems (AREA)
Abstract
Description
УРОВЕНЬ ТЕХНИКИBACKGROUND
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕFIELD OF THE INVENTION
Устройства и способы, соответствующие примерным вариантам осуществления, относятся к устройству обработки изображений и соответствующему способу управления и к системе обработки изображений, которая обрабатывает сигнал изображения, например вещательный сигнал, подаваемый извне, для отображения изображения на основе обработанного сигнала изображения, а более конкретно к устройству обработки изображений и соответствующему способу управления и к системе обработки изображений, которая распознает голосовую команду пользователя для выполнения функции или операции.The devices and methods corresponding to exemplary embodiments relate to an image processing device and a corresponding control method and to an image processing system that processes an image signal, for example, a broadcast signal supplied from outside, to display an image based on the processed image signal, and more particularly, to a device image processing and the corresponding control method and to an image processing system that recognizes a user's voice command for you complete functions or operations.
ОПИСАНИЕ ПРЕДШЕСТВУЮЩЕГО УРОВНЯ ТЕХНИКИDESCRIPTION OF THE PRIOR ART
Устройство обработки изображений обрабатывает сигналы изображения и/или данные изображения, подаваемые извне, согласно различным операциям обработки изображения. Устройство обработки изображений может отображать изображение на своей панели визуального отображения на основе обработанного сигнала изображения, или выводить обработанный сигнал изображения в другое устройство визуального отображения, содержащее панель для отображения на ней изображения на основе обработанного сигнала изображения. Соответственно, если устройство обработки изображений может обрабатывать сигнал изображения, то оно может включать или не включать в себя панель для отображения изображения. Первый случай может быть реализован в виде телевизора, а второй случай может быть реализован в виде телевизионной приставки.The image processing apparatus processes image signals and / or image data supplied externally according to various image processing operations. The image processing device may display an image on its visual display panel based on the processed image signal, or output the processed image signal to another visual display device comprising a panel for displaying an image on it based on the processed image signal. Accordingly, if the image processing apparatus can process the image signal, then it may or may not include a panel for displaying the image. The first case can be realized in the form of a television set, and the second case can be realized in the form of a set-top box.
В устройство обработки изображений непрерывно добавляются функции для расширения его функций в соответствии с усовершенствованием технологии. При такой тенденции, для ввода требуемых команд пользователя в устройство обработки изображений, обеспечиваются различные конфигурации и способы для ввода команд пользователя, как необходимо для устройства обработки изображений. Например, в обычном устройстве обработки изображений, если пользователь нажимает на клавишу/кнопку с удаленного управляющего устройства, то для выполнения операции, требуемой пользователем, в устройство обработки изображений передается управляющий сигнал. В последние годы, однако, устройство обработки изображений обнаруживает речь или жест пользователя, анализирует обнаруженное содержимое, и выполняет соответствующую операцию, т.е. управление устройством обработки изображений осуществляется согласно намерению пользователя.Functions are continuously added to the image processing device to expand its functions in accordance with technology improvements. With this trend, to enter the desired user commands into the image processing device, various configurations and methods for inputting user commands as necessary for the image processing device are provided. For example, in a conventional image processing device, if the user presses a key / button from a remote control device, then to perform the operation required by the user, a control signal is transmitted to the image processing device. In recent years, however, the image processing apparatus detects a user's speech or gesture, analyzes the detected content, and performs the corresponding operation, i.e. the image processing device is controlled according to the intention of the user.
СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Соответственно, в одном или нескольких примерных вариантах осуществления обеспечивается электронное устройство, сервер и соответствующий способ управления, который минимизирует время для распознавания команды пользователя и выполнения операции.Accordingly, in one or more exemplary embodiments, an electronic device, a server, and a corresponding control method are provided that minimizes time for recognizing a user command and performing an operation.
Вышеизложенные и/или другие аспекты могут быть осуществлены посредством обеспечения устройства обработки изображений, включающего в себя: процессор изображений, который обрабатывает вещательный сигнал, переданный извне, для отображения изображения на основе обработанного вещательного сигнала, блок связи, который соединен с сервером для связи, блок голосового ввода, который принимает речь пользователя, голосовой процессор, который обрабатывает выполнение предварительно установленной соответствующей операции согласно голосовой команде, соответствующей этой речи, и контроллер, который обрабатывает голосовую команду, соответствующую этой речи, посредством одного из голосового процессора и сервера, если эта речь введена через блок голосового ввода, причем, если голосовая команда включает в себя ключевое слово, относящееся к позывному вещательного канала, то контроллер осуществляет управление одним из голосового процессора и сервера для выбора рекомендуемого позывного, соответствующего ключевому слову, согласно предопределенному условию выбора, и выполняет соответствующую операцию согласно голосовой команде в отношении вещательного канала по рекомендуемому позывному.The foregoing and / or other aspects may be implemented by providing an image processing apparatus including: an image processor that processes a broadcast signal transmitted from outside to display an image based on a processed broadcast signal, a communication unit that is connected to a server for communication, a unit voice input that receives user speech, a voice processor that processes the execution of a predefined corresponding operation according to the voice com nde corresponding to this speech, and a controller that processes the voice command corresponding to this speech through one of the voice processor and server, if this speech is entered through the voice input unit, and if the voice command includes a keyword related to the broadcast call sign channel, the controller controls one of the voice processor and server to select the recommended callsign corresponding to the keyword, according to the predefined selection condition, and performs accordingly corresponding operations according to the voice command in relation to the broadcasting channel on the recommended callsign.
База данных из, по меньшей мере, одного кандидата на позывной, соответствующего ключевому слову, может храниться в устройстве обработки изображений и на сервере, и рекомендуемый позывной может быть выбран из множества кандидатов на позывной, найденных в этой базе данных согласно условию выбора.A database of at least one call sign candidate corresponding to a keyword can be stored in the image processing device and on the server, and a recommended call sign can be selected from a plurality of call sign candidates found in this database according to a selection condition.
Условие выбора может включать в себя выбор кандидата на позывной, в качестве рекомендуемого позывного, частота выбора которого больше или равна предварительно установленного ранжирования, среди множества кандидатов на позывной, на основе информации предыстории применения устройства обработки изображений.The selection condition may include the selection of a call sign candidate as a recommended call sign, the frequency of which is greater than or equal to a predetermined ranking, among a plurality of call sign candidates, based on the history information of the image processing apparatus.
Условие выбора может включать в себя выбор кандидата на позывной, в качестве рекомендуемого позывного, частота выбора которого больше или равна предварительно установленного ранжирования, в пределах множества других устройств обработки изображений, осуществляющих связь с сервером, среди множества кандидатов на позывной.The selection condition may include the selection of a call sign candidate as a recommended call sign, the frequency of which is greater than or equal to a predetermined ranking, within a plurality of other image processing devices communicating with the server among the plurality of call sign candidates.
Рекомендуемый позывной может быть одним или несколькими позывными, выбранными из множества кандидатов на позывной, и контроллер может отображать интерфейс пользователя (UI), который обеспечивается для выбора одного из множества выбранных кандидатов на позывной, если выбрано множество кандидатов на позывной.The recommended callsign may be one or more callsigns selected from a plurality of callsign candidates, and the controller may display a user interface (UI) that is provided for selecting one of a plurality of selected callsign candidates if multiple callsign candidates are selected.
Если ввод выбора одного из кандидатов на позывной не выполняется за предварительно установленное время после отображения UI, то контроллер может выбрать один из рекомендуемых позывных согласно предварительно установленному условию выбора.If the selection selection of one of the candidates for the call sign is not performed within the preset time after displaying the UI, the controller can select one of the recommended callsigns according to the pre-set selection condition.
Блок связи может осуществлять связь с сервером для преобразования речи в текст (speech-to-text, STT), который преобразует речь в голосовую команду в виде текста, и после ввода речи в блок голосового ввода, контроллер может передавать голосовой сигнал этой речи на сервер STT, и может принимать голосовую команду, соответствующую этой речи, из сервера STT.The communication unit can communicate with the server to convert speech to text (speech-to-text, STT), which converts speech into a voice command in the form of text, and after entering the speech into the voice input unit, the controller can transmit the voice signal of this speech to the server STT, and can receive a voice command corresponding to this speech from the STT server.
Если голосовая команда может являться коротким предложением, то для обработки этой голосовой команды контроллер может осуществлять управление голосовым процессором, и если голосовая команда является предложением разговорной речи, то для обработки этой голосовой команды контроллер может осуществлять управление сервером.If the voice command can be a short sentence, then the controller can control the voice processor to process this voice command, and if the voice command is a conversation offer, the controller can control the server to process this voice command.
Устройство обработки изображений может также включать в себя дисплей, на котором отображается изображение на основе вещательного сигнала, обработанного процессором изображений.The image processing apparatus may also include a display on which an image is displayed based on the broadcast signal processed by the image processor.
Другой аспект настоящего примерного варианта осуществления может быть осуществлен посредством обеспечения способа управления устройства обработки изображений, которое осуществляет связь с сервером, включающего в себя: прием речи пользователя, и обработку голосовой команды, соответствующей этой речи, посредством одного из устройства обработки изображений и сервера, и выполнение предварительно установленной соответствующей операции согласно этой голосовой команде, причем выполнение предварительно установленной соответствующей операции согласно упомянутой голосовой команде включает в себя управление для выбора рекомендуемого позывного, соответствующего ключевому слову, одним из устройства обработки изображений и сервера согласно предварительно установленному условию выбора, если голосовая команда включает в себя ключевое слово, относящееся к позывному вещательного канала, и выполнение соответствующей операции согласно голосовой команде в отношении вещательного канала по рекомендуемому позывному.Another aspect of the present exemplary embodiment may be implemented by providing a control method of an image processing apparatus that communicates with a server, including: receiving a user's speech, and processing a voice command corresponding to that speech through one of the image processing apparatus and the server, and performing a pre-set corresponding operation according to this voice command, and performing a pre-installed corresponding op A walkie-talkie according to said voice command includes a control for selecting a recommended call sign corresponding to a keyword by one of the image processing device and a server according to a pre-set selection condition if the voice command includes a keyword related to the call sign of the broadcast channel and performing the corresponding operation according to the voice command regarding the broadcast channel at the recommended callsign.
База данных из, по меньшей мере, одного кандидата на позывной, соответствующего ключевому слову, может храниться в устройстве обработки изображений и на сервере, и рекомендуемый позывной может быть выбран из множества кандидатов на позывной, найденных в этой базе данных, согласно условию выбора.A database of at least one call sign candidate corresponding to the keyword can be stored in the image processing device and on the server, and the recommended call sign can be selected from a plurality of call sign candidates found in this database according to the selection condition.
Условие выбора может включать в себя выбор кандидата на позывной, в качестве рекомендуемого позывного, частота выбора которого больше или равна предварительно установленного ранжирования, среди множества кандидатов на позывной, на основе информации предыстории применения устройства обработки изображений.The selection condition may include the selection of a call sign candidate as a recommended call sign, the frequency of which is greater than or equal to a predetermined ranking, among a plurality of call sign candidates, based on the history information of the image processing apparatus.
Условие выбора может включать в себя выбор кандидата на позывной, в качестве рекомендуемого позывного, частота выбора которого больше или равна предварительно установленного ранжирования, в пределах множества других устройств обработки изображений, осуществляющих связь с сервером, среди множества кандидатов на позывной.The selection condition may include the selection of a call sign candidate as a recommended call sign, the frequency of which is greater than or equal to a predetermined ranking, within a plurality of other image processing devices communicating with the server among the plurality of call sign candidates.
Рекомендуемый позывной может быть одним позывным или несколькими позывными, выбранными из множества кандидатов на позывной, и выполнение соответствующей операции может включать в себя отображение интерфейса пользователя (UI), который обеспечивается для выбора одного из множества выбранных кандидатов на позывной, если выбрано множество кандидатов на позывной.The recommended call sign may be one call sign or several callsign selected from a plurality of call sign candidates, and performing the corresponding operation may include displaying a user interface (UI) that is provided for selecting one of a plurality of selected call sign candidates if a plurality of call sign candidates are selected .
Отображение UI может включать в себя выбор одного из рекомендуемых позывных согласно предварительно установленному условию выбора, если ввод выбора одного из кандидатов на позывной не выполняется за предварительно установленное время после отображения UI.The display of the UI may include the selection of one of the recommended callsigns according to a predefined selection condition, if the selection selection of one of the call sign candidates is not completed within a predetermined time after the display of the UI.
Устройство обработки изображений может осуществлять связь с сервером STT, который преобразует речь в голосовую команду в виде текста, и прием речи пользователя может включать в себя передачу голосового сигнала этой речи на сервер STT и прием голосовой команды, соответствующей этой речи, из сервера STT.The image processing apparatus may communicate with the STT server, which converts the speech into a voice command in the form of text, and receiving a user's speech may include transmitting the voice signal of this speech to the STT server and receiving a voice command corresponding to this speech from the STT server.
Выполнение предварительно установленной соответствующей операции согласно голосовой команде может включать в себя обработку этой голосовой команды посредством устройства обработки изображений, если эта голосовая команда является коротким предложением, и обработку этой голосовой команды посредством сервера, если эта голосовая команда является предложением разговорной речи.Performing a predetermined corresponding operation according to the voice command may include processing this voice command by the image processing device if the voice command is a short sentence, and processing this voice command by the server if this voice command is a conversation offer.
Другой аспект настоящего примерного варианта осуществления может быть осуществлен посредством обеспечения системы обработки изображений, включающей в себя: устройство обработки изображений, которое обрабатывает вещательный сигнал, переданный извне, для отображения изображения на основе обработанного вещательного сигнала, сервер, который осуществляет связь с устройством обработки изображений, причем это устройство обработки изображений включает в себя блок голосового ввода, который принимает речь пользователя, голосовой процессор, который выполняет предварительно установленную соответствующую операцию согласно голосовой команде, соответствующей этой речи, контроллер, который осуществляет управление одним из голосового процессора и сервера для обработки голосовой команды, соответствующей этой речи, если эта речь введена, причем этот контроллер осуществляет управление одним из голосового процессора и сервера для выбора рекомендуемого позывного, соответствующего ключевому слову, согласно предварительно установленному условию выбора, если эта голосовая команда включает в себя ключевое слово, относящееся к позывному вещательного канала, и выполняет соответствующую операцию согласно этой голосовой команде в отношении вещательного канала по рекомендуемому позывному.Another aspect of the present exemplary embodiment may be implemented by providing an image processing system including: an image processing device that processes a broadcast signal transmitted from outside to display an image based on the processed broadcast signal, a server that communicates with the image processing device, moreover, this image processing device includes a voice input unit that receives user speech, a voice processor which performs a pre-set corresponding operation according to a voice command corresponding to this speech, a controller that controls one of the voice processor and a server for processing a voice command corresponding to this speech, if this speech is entered, and this controller controls one of the voice processor and server to select the recommended callsign corresponding to the keyword, according to the predefined selection condition, if this voice command yes includes a keyword related to the call sign of the broadcast channel and performs the corresponding operation according to this voice command with respect to the broadcast channel by the recommended call sign.
Система обработки изображений может также (включать в себя) сервер STT, который преобразует речь в голосовую команду в виде текста, причем, если речь введена в блок голосового ввода, то контроллер может передавать голосовой сигнал этой речи на сервер STT, и принимает голосовую команду, соответствующую этой речи, из сервера STT.The image processing system can also (include) a STT server, which converts speech into a voice command in the form of text, and if speech is entered into the voice input unit, the controller can transmit the voice signal of this speech to the STT server, and receives a voice command, corresponding to this speech, from the STT server.
В одном примерном варианте осуществления существует устройство обработки изображений, включающее в себя: процессор изображений, который обрабатывает вещательный сигнал, принятый извне, для отображения изображения на основе обработанного вещательного сигнала, устройство связи, которое выполнено с возможностью осуществления связи с сервером, голосовой приемник, который принимает речь пользователя, голосовой процессор, который выполнен с возможностью обработки выполнения операции согласно голосовой команде, соответствующей речи пользователя, и контроллер, который обрабатывает голосовую команду, соответствующую этой речи, посредством одного из голосового процессора и сервера, если эта речь принята через голосовой приемник, причем, если голосовая команда включает в себя ключевое слово, относящееся к требуемому позывному вещательного канала, то контроллер осуществляет управление одним из голосового процессора и сервера для выбора позывного, соответствующего ключевому слову, согласно предопределенному условию выбора, в качестве рекомендуемого позывного, и выполняет операцию согласно голосовой команде в отношении вещательного канала по рекомендуемому позывному.In one exemplary embodiment, there is an image processing apparatus including: an image processor that processes a broadcast signal received from outside to display an image based on a processed broadcast signal, a communication device that is configured to communicate with a server, a voice receiver that receives a user’s speech, a voice processor that is adapted to process an operation according to a voice command corresponding to speech the caller, and the controller that processes the voice command corresponding to this speech, through one of the voice processor and server, if this speech is received through the voice receiver, and if the voice command includes a keyword related to the required call sign of the broadcast channel, then the controller controls one of the voice processor and server to select a callsign corresponding to a keyword according to a predetermined selection condition as a recommended callsign, and operation according to the voice command in relation to the broadcasting channel on the recommended callsign.
В еще одном примерном варианте осуществления, существует способ управления устройства обработки изображений, которое осуществляет связь с сервером, причем способ включает в себя: прием речи пользователя, и обработку голосовой команды, соответствующей речи пользователя, посредством одного из устройства обработки изображений и сервера, и выполнение операции согласно этой голосовой команде, причем выполнение операции согласно голосовой команде включает в себя: управление для выбора позывного, соответствующего ключевому слову, в качестве рекомендуемого позывного, одним из устройства обработки изображений и сервера согласно предварительно установленному условию выбора, если голосовая команда включает в себя ключевое слово, относящееся к позывному вещательного канала, и выполнение операции согласно голосовой команде в отношении вещательного канала по рекомендуемому позывному.In yet another exemplary embodiment, there is a method of controlling an image processing apparatus that communicates with a server, the method including: receiving a user’s speech, and processing a voice command corresponding to the user's speech through one of the image processing device and the server, and executing operations according to this voice command, and the operation according to the voice command includes: control for selecting a callsign corresponding to a keyword, as e of the recommended call sign, by one of the image processing device and the server according to a pre-established selection condition, if the voice command includes a keyword related to the call sign of the broadcast channel, and the operation according to the voice command regarding the broadcast channel of the recommended call sign.
В еще одном примерном варианте осуществления существует система обработки изображений, включающая в себя: устройство обработки изображений, которое обрабатывает вещательный сигнал, принятый извне, для отображения изображения на основе обработанного вещательного сигнала, сервер, который осуществляет связь с устройством обработки изображений, причем устройство обработки изображений включает в себя голосовой приемник, который выполнен с возможностью приема речи пользователя, голосовой процессор, который выполняет предварительно установленную соответствующую операцию для голосовой команды, соответствующей речи пользователя, и контроллер, который осуществляет управление одним из голосового процессора и сервера для обработки голосовой команды, соответствующей речи пользователя, если речь пользователя принята, причем этот контроллер осуществляет управление одним из голосового процессора и сервера для выбора позывного, соответствующего ключевому слову, в качестве рекомендуемого позывного, согласно предварительно установленному условию выбора, если эта голосовая команда включает в себя ключевое слово, относящееся к позывному вещательного канала, и выполняет соответствующую операцию согласно этой голосовой команде в отношении вещательного канала по рекомендуемому позывному.In another exemplary embodiment, there is an image processing system including: an image processing device that processes a broadcast signal received from outside to display an image based on the processed broadcast signal, a server that communicates with the image processing device, the image processing device includes a voice receiver that is configured to receive user speech, a voice processor that preliminarily sets an updated corresponding operation for a voice command corresponding to the user's speech, and a controller that controls one of the voice processor and the server to process the voice command corresponding to the user's speech, if the user’s speech is received, and this controller controls one of the voice processor and the server to select the callsign corresponding to the keyword as the recommended callsign, according to the pre-established selection condition, if this voice the command includes a keyword related to the call sign of the broadcast channel and performs the corresponding operation according to this voice command with respect to the broadcast channel by the recommended call sign.
В одном примерном варианте осуществления существует способ распознавания голосовой команды, включающий в себя: прием голосовой команды пользователя через микрофон устройства отображения для переключения с отображаемого вещательного канала на другой вещательный канал, причем эта голосовая команда пользователя включает в себя идентификатор (ID) другого вещательного канала, оцифровку упомянутой голосовой команды пользователя и обработку оцифрованной голосовой команды пользователя, сравнение упомянутой обработанной голосовой команды пользователя с предварительно сохраненными цифровыми моделями ID множества вещательных каналов и определение одной из предварительно сохраненных цифровых моделей ID множества вещательных каналов как совпадающей, причем эта операция сравнения выполняется в, по меньшей мере, одном из устройства отображения или внешнего сервера, который является отделенным от устройства отображения, и переключение с отображаемого вещательного канала на вещательный канал, соответствующий определенной одной из предварительно сохраненных цифровых моделей ID множества вещательных каналов, являющейся совпадающей.In one exemplary embodiment, there is a method for recognizing a voice command, including: receiving a user's voice command through the microphone of the display device to switch from the displayed broadcast channel to another broadcast channel, wherein this user voice command includes an identifier (ID) of another broadcast channel, digitizing said user voice command and processing digitized user voice command, comparing said processed voice command a user with pre-stored digital ID models of multiple broadcast channels and determining one of the pre-stored digital ID models of multiple broadcast channels as matching, this comparison operation being performed in at least one of a display device or an external server that is separate from the display device , and switching from the displayed broadcast channel to the broadcast channel corresponding to a specific one of the previously stored digital models th ID multiple broadcast channels are coincident.
ID может быть одним из цифрового ID, буквенного ID и буквенно-цифрового ID.The ID may be one of a digital ID, an alphabetic ID, and an alphanumeric ID.
Определение одной из предварительно сохраненных цифровых моделей ID множества вещательных каналов как являющейся совпадающей включает в себя определение множества предварительно сохраненных цифровых моделей ID множества вещательных каналов как являющегося совпавшим, причем упомянутый способ также включает в себя: отображение ID, соответствующих определенному множеству предварительно сохраненных цифровых моделей ID множества вещательных каналов, являющемуся совпавшим.Determining one of the pre-stored digital ID models of the set of broadcast channels as being the same includes determining the set of pre-stored digital models ID of the set of broadcast channels as being the same, said method also including: displaying IDs corresponding to the determined set of pre-stored digital ID models multiple broadcast channels being matched.
Способ распознавания голосовой команды также включает в себя: автоматический выбор одного из отображаемых ID, если не принят ввод пользователя для выбора одного из отображаемых ID, причем этот выбранный один из отображаемых ID ранее выбирался чаще других из отображаемых ID.The voice command recognition method also includes: automatic selection of one of the displayed IDs if the user input for selecting one of the displayed IDs is not accepted, moreover, this selected one of the displayed IDs was previously selected more often than the other of the displayed IDs.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
Вышеупомянутые и/или другие аспекты станут очевидными и более понятыми из следующего описания примерных вариантов осуществления во взаимосвязи с прилагаемыми чертежами, в которых:The above and / or other aspects will become apparent and better understood from the following description of exemplary embodiments in conjunction with the accompanying drawings, in which:
Фиг. 1 - блок-схема устройства визуального отображения согласно первому примерному варианту осуществления.FIG. 1 is a block diagram of a visual display device according to a first exemplary embodiment.
На фиг. 2 изображен пример структуры базы данных, относящейся к ключевому слову и кандидатам на позывной.In FIG. 2 illustrates an example database structure related to a keyword and call sign candidates.
Фиг. 3 - блок-схема структуры взаимодействия устройства визуального отображения и сервера на фиг. 1.FIG. 3 is a block diagram of the interaction structure of the visual display device and the server of FIG. one.
На фиг. 4 изображен пример процесса взаимодействия между устройством визуального отображения и сервером на фиг. 3.In FIG. 4 shows an example of the interaction process between the visual display device and the server of FIG. 3.
На фиг. 5 и фиг. 6 изображен пример изображения интерфейса пользователя (UI), который обеспечивается для выбора одного из множества рекомендуемых позывных, на устройстве визуального отображения на фиг. 1.In FIG. 5 and FIG. 6 depicts an example user interface (UI) image that is provided for selecting one of a plurality of recommended callsigns on a visual display device in FIG. one.
На фиг. 7 изображает пример процесса взаимодействия между устройством визуального отображения и сервером согласно второму примерному варианту осуществления.In FIG. 7 depicts an example interaction process between a visual display device and a server according to a second exemplary embodiment.
Фиг. 8 - блок-схема структуры взаимодействия устройства визуального отображения и сервера согласно третьему примерному варианту осуществления.FIG. 8 is a block diagram of an interaction structure of a visual display device and a server according to a third exemplary embodiment.
На фиг. 9 изображен процесс взаимодействия между устройством визуального отображения и сервером на фиг. 8.In FIG. 9 shows the interaction process between the visual display device and the server of FIG. 8.
Фиг. 10 - блок-схема, изображающая структуру передачи сигнала голосового процессора устройства визуального отображения согласно четвертому примерному варианту осуществления.FIG. 10 is a block diagram showing a signal transmission structure of a voice processor of a visual display device according to a fourth exemplary embodiment.
ПОДРОБНОЕ ОПИСАНИЕ ПРИМЕРНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯDETAILED DESCRIPTION OF EXAMPLE EMBODIMENTS
Ниже подробно описаны примерные варианты осуществления со ссылкой на прилагаемые чертежи для облегчения понимания лицу, обладающему обычными познаниями в данной области техники. Примерные варианты осуществления могут быть воплощены в различных формах и не ограничиваются примерными вариантами осуществления, изложенными в этом документе. Описания известных частей опущены для ясности, и используется сквозная нумерация ссылочных позиций.Exemplary embodiments are described in detail below with reference to the accompanying drawings in order to facilitate understanding by a person having ordinary knowledge in the art. Exemplary embodiments can be embodied in various forms and are not limited to the exemplary embodiments set forth herein. Descriptions of well-known parts are omitted for clarity, and end-to-end reference numerals are used.
Фиг. 1 является блок-схемой устройства 100 обработки изображений согласно первому примерному варианту осуществления.FIG. 1 is a block diagram of an
Ниже примерные варианты осуществления описывают устройство 100 обработки изображений, которое само может отображать изображение, но идея настоящего изобретения может применяться к другим устройствам, которые сами не отображают изображение, а вместо этого выводят сигналы изображения и/или управляющие сигналы в другое устройство визуального отображения. Соответственно, идея настоящего изобретение не ограничивается нижеизложенными примерными вариантами осуществления. Несмотря на то, что в настоящем примерном варианте осуществления описано устройство 100 обработки изображений, которое реализовано в виде телевизора, в других примерных вариантах осуществления могут существовать другие реализации.Below, exemplary embodiments describe an
Как представлено на фиг. 1, устройство 100 обработки изображений или устройство 100 визуального отображения согласно настоящему примерному варианту осуществления принимает сигнал изображения из источника подачи изображения. Сигнал изображения, который может быть принят устройством 100 визуального отображения, не ограничен по типу или формату, например, устройство 100 визуального отображения может принимать вещательный сигнал, передаваемый передающим устройством вещательной станции, настраивать этот вещательный сигнал и отображать изображение вещания.As shown in FIG. 1, an
Устройство 100 визуального отображения включает в себя приемник 110 изображения, который принимает сигнал изображения из источника подачи изображения, процессор 120 изображений, который обрабатывает сигнал изображения, принятый приемником 110 изображения, согласно предварительно установленной операции обработки изображения, дисплей 130, на котором отображается изображение на основе сигнала изображения, обработанного процессором 120 изображений, блок 140 связи (например, устройство связи), который осуществляет связь с внешним устройством, например, сервером 10, блок 150 ввода пользователя, которым манипулирует пользователь, блок 160 голосового ввода, (например, голосовой приемник, микрофон и т.д.), который принимает голос или звук извне, голосовой процессор 170, который интерпретирует и обрабатывает голос или звук, введенный в блок 160 голосового ввода, блок 180 памяти (например, запоминающее устройство), в котором хранятся данные и/или информация, и контроллер 190, который управляет всеми операциями устройства 100 визуального отображения.The
Приемник 110 изображения принимает сигналы изображения и/или данные изображения проводным или беспроводным способом, и передает эти сигналы изображения и/или данные изображения в процессор 120 изображений. Приемник 110 изображения может меняться в зависимости от стандарта принимаемого сигнала изображения и типа примерного варианта осуществления устройства 100 визуального отображения. Например, приемник 110 изображения может принимать радиочастотный (RF) сигнал или сигнал изображения согласно различным стандартам, например, композитный видеосигнал, компонентный видеосигнал, видео высокого качества (super video), SCART, мультимедийный интерфейс высокой четкости (HDMI), DisplayPort, унифицированный дисплейный интерфейс (UDI), беспроводный стандарт для HD или другой стандарт. Если сигнал изображения является вещательным сигналом, то приемник 110 изображения включает в себя устройство настройки для настройки на вещательный сигнал канала.The image receiver 110 receives image signals and / or image data in a wired or wireless manner, and transmits these image signals and / or image data to the image processor 120. The image receiver 110 may vary depending on the standard of the received image signal and the type of an exemplary embodiment of the
Процессор 120 изображений обрабатывает сигнал изображения, принятый приемником 110 изображения, согласно различным операциям обработки изображения. Процессор 120 изображений выводит обработанный сигнал изображения на дисплей 130, на котором отображается изображение на основе обработанного сигнала изображения. Например, если устройство настройки настраивается на вещательный сигнал конкретного канала в приемнике 110 изображения, то процессор 120 изображений извлекает изображение, голос и дополнительные данные из вещательного сигнала, соответствующего этому каналу, корректирует сигнал изображения до предварительно установленного разрешения и отображает изображение на дисплее 130.The image processor 120 processes the image signal received by the image receiver 110 according to various image processing operations. The image processor 120 outputs the processed image signal to a display 130 on which an image is displayed based on the processed image signal. For example, if the tuning device is tuned to the broadcast signal of a particular channel in the image receiver 110, the image processor 120 extracts the image, voice and additional data from the broadcast signal corresponding to that channel, corrects the image signal to a preset resolution and displays the image on the display 130.
Операция обработки изображения процессора 120 изображений может включать в себя, например, операцию декодирования, соответствующую формату изображения данных изображения, операцию обратного перемежения для преобразования данных изображения с перемежением в данные прогрессивного изображения, операцию масштабирования для корректировки данных изображения до предварительно установленного разрешения, операцию подавления шума для улучшения качества изображения, операцию улучшения деталей, преобразование частоты обновления кадров и т.д.The image processing operation of the image processor 120 may include, for example, a decoding operation corresponding to the image format of the image data, an interleaving operation for converting the interleaved image data into progressive image data, a scaling operation for adjusting the image data to a preset resolution, a noise suppression operation to improve image quality, detail enhancement operation, frame refresh rate conversion, etc. .
Процессор 120 изображений реализован как однокристальная система (SOC), в которой интегрируются некоторые или все вышеизложенные функции, или как плата обработки изображений, которая сформирована посредством монтажа отдельных элементов на печатной плате (PCB), для выполнения некоторых или всех вышеизложенных операций обработки изображения, и установлен в устройстве 100 визуального отображения.The image processor 120 is implemented as a single-chip system (SOC) in which some or all of the above functions are integrated, or as an image processing board, which is formed by mounting individual elements on a printed circuit board (PCB), to perform some or all of the above image processing operations, and installed in the
На дисплее 130 отображается изображение на основе сигнала изображения, выведенного процессором 120 изображений. Дисплей 130 может быть реализован, но без ограничения, в виде различных панелей визуального отображения, включающих в себя, например, жидкокристаллические, плазменные, проекционные, светодиодные (LED), на органических светодиодах (OLED), с электронной эмиссией на основе поверхностной проводимости, на основе углеродных нанотрубок и нанокристаллические.An image 130 is displayed on the display 130 based on the image signal output by the image processor 120. The display 130 can be implemented, but without limitation, in the form of various visual display panels, including, for example, liquid crystal, plasma, projection, light emitting diode (LED), organic light emitting diodes (OLED), with electronic emission based on surface conductivity, on based on carbon nanotubes and nanocrystalline.
Дисплей 130 также может включать в себя дополнительные элементы в зависимости от его реализации. Например, дисплей 130 в виде ЖКД (LCD) может включать в себя ЖК-панель, блок фоновой подсветки для излучения света на ЖК-панель и плату для управления панелью для управления ЖК-панелью.The display 130 may also include additional elements depending on its implementation. For example, an LCD display 130 may include an LCD panel, a backlight unit for emitting light to the LCD panel, and a board for controlling the panel for controlling the LCD panel.
Блок 140 связи передает и принимает данные для осуществления связи между устройством 100 визуального отображения и сервером 10. В примерном варианте осуществления, связь может являться интерактивной связью. Блок 140 связи соединен с сервером 10 через проводную и/или беспроводную глобальную и/или локальную сеть или локальное соединение в соответствии с протоколом связи сервера 10.The
Блок 150 ввода пользователя передает различные предварительно установленные команды управления или информацию в контроллер 190 согласно принятому вводу пользователя. Блок 150 ввода пользователя реализован в виде кнопки вывода меню или панели ввода, установленной на внешней части устройства 100 визуального отображения, или удаленного контроллера, который является отделенным от устройства 100 визуального отображения. Или же, блок 150 ввода пользователя может быть объединен с дисплеем 130. Если дисплей 130 является сенсорным экраном, то пользователь может коснуться меню ввода, отображенного на дисплее 130, для передачи предварительно установленной команды в контроллер 190.The user input unit 150 transmits various preset control commands or information to the
Блок 160 голосового ввода реализован в виде микрофона и обнаруживает различные звуки, создаваемые во внешнем окружении устройства 100 визуального отображения. Звук, который обнаружен блоком 160 голосового ввода, включает в себя речь пользователя и другие звуки, которые создаются различными источниками, отличными от пользователя.The
Голосовой процессор 170 обрабатывает голоса или звуки, введенные в блок 160 голосового ввода, исходя из различных предварительно установленных процессов, выполняемых устройством 100 визуального отображения. Под "голосом", который обрабатывается голосовым процессором 170, подразумевается голос, введенный в блок 160 голосового ввода. Сигнал изображения, который обрабатывается процессором 120 изображений, может включать в себя голосовые данные, которые обрабатываются процессором 120 изображений.The
Если голос или звук вводятся в блок 160 голосового ввода, то голосовой процессор 170 определяет то, является ли введенный голос или звук результатом речи пользователя, или они были созданы другими факторами. При таком определении могут использоваться различные конфигурации, и оно не может быть задано, например, оно включает в себя способ определения того, подпадают ли введенный голос или звук под длину волны или полосу частот, соответствующую человеческому голосу, или способ определения того, подпадают ли введенный голос или звук под профиль голоса пользователя, который является сохраненным заранее, или совпадают с ним.If voice or sound is input to the
Если определено, что введена речь пользователя, то голосовой процессор 170 выполняет предварительно установленную соответствующую операцию для голосовой команды, соответствующей этой речи. В одном примерном варианте осуществления, голосовая команда является содержимым того, что сказал пользователь. Это будет подробно описано ниже.If it is determined that user speech has been entered, then voice
В блоке 180 памяти сохраняются данные под управлением контроллера 190. Блок 180 памяти реализован как энергонезависимая память, например флэш-память или жесткий диск. К блоку 180 памяти обращается контроллер 190, процессор 120 изображений или голосовой процессор 170, и данные, сохраняемые в нем, могут считываться, записываться, модифицироваться, удаляться или обновляться контроллером 190, процессором 120 изображений или голосовым процессором 170.In the block 180 memory is stored data under the control of the
После приема речи пользователя через блок 160 голосового ввода, контроллер 190 осуществляет управление голосовым процессором 170 для обработки этой введенной речи. Когда процессор 120 изображений обрабатывает сигнал изображения, принятый приемником 110 изображения, для отображения изображения вещания на дисплее 130, контроллер 190 меняет канал согласно содержимому речи пользователя, если эта речь пользователя принята, чтобы командовать сменить канал через блок 160 голосового ввода.After receiving user speech through the
Голосовая команда, относящаяся к 'смене канала', может включать в себя произнесение номера канала вещательного канала, который требуется пользователю, или произнесение позывного требуемого вещательного канала. Номер канала и позывной являются выражениями, которые устанавливаются заранее для того, чтобы отличать каналы друг от друга. Номер канала выражается положительным числом, например, 6, 7 и 11.A voice command related to a “channel change” may include pronouncing the channel number of the broadcast channel that the user requires, or pronouncing the call sign of the desired broadcast channel. The channel number and call sign are expressions that are set in advance in order to distinguish the channels from each other. The channel number is expressed as a positive number, for example, 6, 7 and 11.
Позывной является ID провайдера, который обеспечивает конкретный канал, и обычно является идентификационным именем вещательной станции, которая осуществляет вещание канала, для одного канала может существовать множество позывных, и если одна вещательная станция обеспечивает множество каналов, то соответствующие каналы имеют разные позывные для того, чтобы отличать их. Альтернативными формами ID являются цифровая, буквенная и буквенно-цифровая формы.The call sign is the provider ID that provides the particular channel, and is usually the identification name of the broadcasting station that broadcasts the channel, there can be many callsigns for one channel, and if one broadcasting station provides many channels, the corresponding channels have different callsigns so that distinguish them. Alternate forms of ID are numeric, alphabetic, and alphanumeric.
Примером первого случая является следующий: если позывным предопределенного первого канала является "KBS", то тогда такой позывной "Korean Broadcasting System" ("Корейская система вещания") может относиться к первому каналу, идентичному "KBS". Позывным предопределенного второго канала в одном географическом местоположении является "MBC", но позывным этого второго канала в другом географическом местоположении может являться "TNN". Соответственно, для конкретного канала может существовать множество позывных.An example of the first case is the following: if the call sign of the predefined first channel is "KBS", then such a call sign "Korean Broadcasting System" ("Korean Broadcasting System") can refer to the first channel identical to "KBS". The call sign of the predefined second channel in one geographical location is "MBC", but the call sign of this second channel in another geographical location may be "TNN". Accordingly, for a particular channel, there may be many callsigns.
Примером второго случая является следующий: вещательная станция, позывным которой является "KBS", может обеспечивать вещательный сигнал в предопределенный третий канал и четвертый (канал). В этом случае, позывным третьего канала является "KBS-1", а позывным четвертого канала является "KBS-2", которые отличаются друг от друга. "KBS" может рассматриваться как представительный позывной вещательной станции, а "KBS-1" и "KBS-2" являются позывными более низкого уровня по отношению к "KBS". Соответственно, позывной "KBS" относится как к третьему каналу, так и к четвертому каналу.An example of the second case is the following: a broadcast station whose call sign is “KBS” can provide a broadcast signal to a predetermined third channel and fourth (channel). In this case, the callsign of the third channel is “KBS-1”, and the callsign of the fourth channel is “KBS-2”, which are different from each other. “KBS” can be considered as representative of the broadcast call sign, and “KBS-1” and “KBS-2” are lower level callsigns to “KBS”. Accordingly, the call sign "KBS" refers to both the third channel and the fourth channel.
Соответственно, если речь пользователя, которая введена через блок 160 голосового ввода, является голосовой командой, "воспроизвести KBS", то может быть не понятно то, к какому из третьего канала "KBS-1" и четвертого канала "KBS-2" это относится.Accordingly, if the user’s speech that is inputted through the
Согласно настоящему примерному варианту осуществления, контроллер 190 определяет то, включает ли в себя голосовая команда, соответствующая речи пользователя, ключевое слово, относящееся к позывному вещательного канала.According to the present exemplary embodiment, the
Если определяется, что голосовая команда включает в себя ключевое слово, относящееся к позывному, то контроллер 190 осуществляет управление голосовым процессором 170 для поиска позывного, соответствующего этому ключевому слову, в базе данных, содержащей множество позывных. База данных хранится в блоке 180 памяти, и найденный позывной называется кандидатом на позывной. Если найдено множество кандидатов на позывной, соответствующих ключевому слову, то контроллер 190 выбирает позывной как рекомендуемый позывной из этого множества кандидатов на позывной согласно предварительно установленным условиям выбора. В других примерных вариантах осуществления, позывной, выбранный контроллером, может являться наиболее совпадающим позывным, предполагаемым позывным или распознанным позывным.If it is determined that the voice command includes a keyword related to the callsign, then the
В других случаях, контроллер 190 может передавать ключевое слово и голосовую команду на сервер 10, на котором хранится база данных. После этого, (сервер) 10, согласно принципу, который является аналогичным принципу, раскрытому выше, выбирает рекомендуемый позывной, анализирует соответствующую операцию в голосовой команде и передает управляющий сигнал в устройство 100 визуального отображения согласно выбору и результатам анализа.In other cases, the
Контроллер 190 выполняет соответствующую операцию в отношении вещательного сигнала по выбранному, рекомендуемому позывному, для голосовой команды.The
Далее в этом документе, со ссылкой на фиг. 2 описаны конфигурация базы 200 данных и способ поиска в базе 200 данных кандидата 230 на позывной.Hereinafter, with reference to FIG. 2, the configuration of the
На фиг. 2 изображен пример базы 200 данных.In FIG. 2 illustrates an
Как на ней показано, контроллер 190 определяет то, включает ли в себя голосовая команда "воспроизвести KBS", замененная на текст исходя из речи пользователя, ключевое слово, относящееся к позывному. Если в блоке 180 памяти хранится база 200 данных взаимосвязей, которая устанавливает соответствие ключевого слова и позывного, то контроллер 190 может осуществлять поиск предопределенного ключевого слова в базе 200 данных и определять то, относится ли это ключевое слово к позывному.As shown,
База 200 данных устанавливает соответствие множества ключевых слов 220 и множества позывных 230, и используется для поиска, по меньшей мере, одного кандидата на позывной среди множества позывных 230 на основе одного ключевого слова из множества ключевых слов 220. На чертеже изображена взаимосвязь элементов, относящихся только к двум представительным позывным, "KBS" и "FTV", из базы 200 данных.The
Представительные позывные 210 действуют как связующее звено между множеством ключевых слов 220 и множеством позывных 230. Более конкретно, если введено предопределенное ключевое слово из множества ключевых слов 220, то в базе 200 данных осуществляется поиск представительного позывного, соответствующего этому предопределенному ключевому слову. Если найден соответствующий представительный позывной 210, то во второй раз осуществляется поиск позывного более низкого уровня или соответственного кандидата на позывной, соответствующего найденному, для представительного позывного 210.
В случае ключевого слова, группируются и/или распределяются по категориям для представительного позывного различные термины, включающие в себя синонимы, относящиеся к представительному позывному. Кандидаты на позывной включают в себя позывные, по меньшей мере, одного канала, относящегося к представительному позывному 210, и эти позывные группируются и/или распределяются по категориям для представительного позывного 210.In the case of a keyword, various terms are grouped and / or categorized for the representative callsign, including synonyms related to the representative callsign. Candidate candidates include the callsigns of at least one channel belonging to the
Например, если введено ключевое слово "канал рыбалки", то представительным позывным, относящимся к "каналу рыбалки", является "FTV", и кандидатом на позывной, который относится к представительному позывному "FTV" 20, является только один, "FTV". Соответственно, согласно результатам поиска в базе 200 данных, позывным канала, соответствующим ключевому слову "канал рыбалки" 220, является один "FTV".For example, if the keyword “fishing channel” is entered, then the representative callsign referring to the “fishing channels” is “FTV”, and the candidate for the callsign that refers to the representative callsign “FTV” 20 is only one, “FTV”. Accordingly, according to the search results in the
Если введено ключевое слово "KBS", то представительным позывным, относящимся к "KBS", является "KBS", и кандидатами на позывной, относящимися к представительному позывному "KBS", являются четыре кандидата, т.е. "KBS-1", "KBS-2", "KBS - спорт" и "KBS - кино".If the keyword “KBS” is entered, then the representative callsign related to “KBS” is “KBS”, and the candidates for the callsign related to the representative callsign “KBS” are four candidates, i.e. "KBS-1", "KBS-2", "KBS - Sport" and "KBS - Cinema".
Вышеизложенным способом в базе 200 данных осуществляется поиск для получения, по меньшей мере, одного кандидата на позывной, относящегося к ключевому слову. Вышеизложенный способ является только примером реализации базы 200 данных, и способ реализации базы 200 данных может варьироваться, и не ограничивается вышеизложенным примером.In the foregoing method, a database is searched in the
Фиг. 3 является блок-схемой, на которой представлена структура взаимодействия устройства 100 визуального отображения и серверов 20 и 30.FIG. 3 is a block diagram showing an interaction structure of the
Как на ней представлено, устройство 100 визуального отображения включает в себя блок 140 связи, блок 160 голосового ввода, голосовой процессор 170 и контроллер 190. Элементы являются идентичными тем, которые раскрыты на фиг. 1. Блок 140 связи соединен с сервером 20 для преобразования речи в текст (STT), который преобразует речь пользователя в голосовую команду, и с сервером 30 для разговорной речи, который анализирует голосовую команду для определения операции, соответствующей этой голосовой команде.As shown, the
Сервер 20 STT анализирует форму волны принятого голосового сигнала и формирует текст исходя из содержимого этого голосового сигнала. Сервер 20 STT преобразует голосовой сигнал речи пользователя, переданный устройством 200 визуального отображения, в голосовую команду.The
Сервер 30 для разговорной речи включает в себя базу данных, которая устанавливает соответствие различных операций устройства 100 визуального отображения, соответствующих голосовой команде. Сервер 30 для разговорной речи анализирует голосовую команду, переданную устройством 100 визуального отображения, и передает в устройство 100 визуального отображения управляющий сигнал для выполнения операции, соответствующей голосовой команде согласно результатам анализа.The
Если речь пользователя введена в блок 160 голосового ввода или принята в нем, то контроллер 190 передает голосовой сигнал этой речи на сервер 20 STT, и принимает голосовую команду из сервера 20 STT, соответствующую этой речи.If the user's speech is entered into or received in the
Контроллер 190 определяет то, является ли голосовая команда, переданная сервером 20 STT, коротким предложением или предложением разговорной речи. Если голосовая команда является коротким предложением, то контроллер 190 осуществляет управление голосовым процессором 170 для обработки этой голосовой команды. Если голосовая команда является предложением разговорной речи, то контроллер 190 осуществляет управление сервером 30 для разговорной речи для обработки этой голосовой команды. В примерном варианте осуществления, короткое предложение можно отличить от предложения разговорной речи на основе количества слов или нескольких фонем. В одном примерном варианте осуществления, короткое предложение содержит (N1) или меньшее количество слов, где N1 может быть равно одному из 1, 2, 3, 4, 5, 6, 7, 8, а предложение разговорной речи содержит большее количество, чем (N1) слов. В другом примерном варианте осуществления, короткое предложение содержит N2 или меньшее количество фонем, где N2 может быть равно одному из 1, 2, 3, 4, 5, 6, 7, 8, а предложение разговорной речи содержит большее количество, чем N фонем.The
Это потому, что предложение разговорной речи является естественным языком, и механическое извлечение требуемой соответствующей операции из голосовой команды в виде предложения разговорной речи является относительно сложным. Например, если голосовая команда пользователя является коротким предложением "воспроизвести KBS", то голосовой процессор 170 может немедленно выполнить операцию с ключевым словом "KBS" позывного и ключевым словом "воспроизвести" операции.This is because the suggestion of spoken language is a natural language, and the mechanical extraction of the required corresponding operation from the voice command in the form of a sentence of spoken speech is relatively difficult. For example, if the user's voice command is a short “play KBS” sentence, then the
Однако, если голосовая команда является предложением разговорной речи "сменить текущий канал на Korean Broadcasting System", содержимое которой является по существу идентичным содержимому вышеизложенного короткого предложения, то потребуется процесс извлечения ключевого слова "KBS" позывного, соответствующего "Korean Broadcasting System", и процесс извлечения ключевого слова "воспроизвести" операции, соответствующего "сменить на". Вследствие различных факторов, например загрузки системы или размера базы данных, обработка такого предложения разговорной речи голосовым процессором 170 может являться сложной.However, if the voice command is a colloquial sentence "change the current channel to the Korean Broadcasting System", the content of which is essentially identical to the contents of the above short sentence, then the process of extracting the KBS keyword of the callsign corresponding to the "Korean Broadcasting System" will be required, and the process retrieve the keyword "play" the operation corresponding to "change to". Due to various factors, such as system loading or database size, processing such a colloquial sentence by the
На фиг. 4 изображен пример процесса взаимодействия между устройствами 100 визуального отображения и серверами 20 и 30 согласно настоящему примерному варианту осуществления.In FIG. 4 shows an example of a communication process between the
Как на ней представлено, после приема ввода речи пользователя (600), устройство 100 визуального отображения передает голосовой сигнал этой речи на сервер 20 STT (610).As shown, after receiving user input of speech (600), the
Сервер 20 STT преобразует голосовой сигнал в голосовую команду (620) и передает преобразованную голосовую команду в устройство 100 визуального отображения (630).The
Устройство 100 визуального отображения анализирует голосовую команду, переданную сервером (20) STT, и извлекает ключевое слово, относящееся к позывному, из голосовой команды (640). Устройство 100 визуального отображения определяет то, является ли голосовая команда коротким предложением или предложением разговорной речи.The
Если определяется, что голосовая команда является предложением разговорной речи, то устройство 100 визуального отображения передает голосовую команду и ключевое слово, относящееся к позывному, на сервер 30 для разговорной речи (650).If it is determined that the voice command is a conversation offer, the
Сервер 30 для разговорной речи выполняет процесс анализа позывного с учетом голосовой команды и ключевого слова, относящегося к позывному, переданному устройством 100 визуального отображения (660). Процесс анализа позывного включает в себя процесс поиска кандидата на позывной, соответствующего ключевому слову, относящемуся к упомянутому позывному, процесс выбора позывного из найденных кандидатов на позывной в качестве рекомендуемого позывного и процесс определения операции устройства 100 визуального отображения, соответствующей рекомендуемому позывному, в пределах текста. Это подробно описывается ниже.The
Если выбор рекомендуемого позывного и определение соответствующей операции голосовой команды завершены, то сервер 30 для разговорной речи передает управляющий сигнал в устройство 100 визуального отображения согласно этим результатам выбора и определения. Устройство 100 визуального отображения может выполнять соответствующую операцию в отношении рекомендуемого позывного согласно упомянутому управляющему сигналу.If the selection of the recommended call sign and the determination of the corresponding voice command operation are completed, then the
Например, если в результате анализа оказалось, что рекомендуемым позывным является "KBS-1", и соответствующей операцией является смена канала, то сервер 30 для разговорной речи передает управляющий сигнал, с указанием этого содержимого, в устройство 100 визуального отображения, которое меняет канал на "KBS-1".For example, if as a result of the analysis it turned out that the recommended call sign is “KBS-1”, and the corresponding operation is changing the channel, then the
Если определяется то, что голосовая команда является коротким предложением, то, при операции 640, устройство 100 визуального отображения выполняет процесс анализа позывного в отношении принятой голосовой команды и ключевого слова, относящегося к этому позывному. Такой процесс выполняется согласно по существу идентичному принципу, как и в случае процесса, выполняемого сервером 30 для разговорной речи.If it is determined that the voice command is a short sentence, then, in
Далее в этом документе описывается процесс анализа позывного относительно ключевого слова, относящегося к этому позывному.The rest of this document describes the process of analyzing the callsign relative to the keyword related to this callsign.
Сервер 30 для разговорной речи осуществляет поиск кандидата на позывной, соответствующего ключевому слову, относящемуся к этому позывному, и определяет то, существует ли множество кандидатов на позывной.The
Определение того, включает ли в себя голосовая команда ключевое слово, относящееся к позывному, и поиск кандидата на позывной, соответствующего упомянутому ключевому слову, могут быть выполнены способом, идентичным тому, который раскрыт на фиг. 2. Соответственно, сервер 30 для разговорной речи осуществляет поиск слов, извлеченных из голосовой команды, в базе 200 данных (см. фиг. (2)), и определяет то, существует ли какое-либо соответствующее слово 220 (см. фиг. 2), и если это так, то может получить кандидата на позывной (см. фиг. 2) по представительному позывному (см. фиг. 2).The determination of whether the voice command includes a keyword related to the callsign and the search for a candidate for the callsign corresponding to the mentioned keywords can be performed in a manner identical to that disclosed in FIG. 2. Accordingly, the
В процессе извлечения ключевого слова из голосовой команды, может выполняться коррекция или фильтрация ошибки в голосовой команде. Например, если существует голосовая команда "воспроизвести Orean Broadcasting System", то в базе данных может быть выбрано слово "Korean Broadcasting System", даже если слово "Orean Broadcasting System" не включено в базу данных, но определено то, что слово "Korean Broadcasting System" является похожим на слово "Orean Broadcasting System". Способ определения сходства слов может варьироваться и не ограничивает идею настоящего изобретение.In the process of extracting a keyword from a voice command, error correction or filtering in a voice command may be performed. For example, if the voice command “play Orean Broadcasting System” exists, then the word “Korean Broadcasting System” may be selected in the database, even if the word “Orean Broadcasting System” is not included in the database, but it is determined that the word “Korean Broadcasting System "is similar to the word" Orean Broadcasting System ". The method for determining word similarity may vary and does not limit the idea of the present invention.
Если существует только один кандидат на позывной, то сервер 30 для разговорной речи выбирает кандидат на позывной в качестве рекомендуемого позывного.If there is only one call sign candidate, then the
Если существует множество кандидатов на позывной, то сервер 30 для разговорной речи выбирает рекомендуемый позывной согласно предварительно установленным условиям выбора.If there are many candidates for the call sign, then the
Условия выбора для выбора рекомендуемого позывного из кандидатов на позывной могут быть заданы заранее. Например, сервер 30 для разговорной речи может выбрать множество позывных, частоты выбора которых, основанные на предыдущих данных, имеют предварительно установленный ранг или выше него, в качестве рекомендуемых позывных, или выбрать один позывной, частота выбора которого, основанная на предыдущих данных, является самой высокой, в качестве рекомендуемого позывного.The selection conditions for selecting a recommended call sign from the call sign candidates may be predetermined. For example, the
Если в качестве кандидатов на позывной существуют четыре позывных "KBS-1", "KBS-2", "KBS - спорт" и "KBS - кино", то контроллер 190, в устройстве 100 визуального отображения, определяет частоту выбора каналов, основанную на предыдущих данных, за предопределенный период на основе информации о предыстории применения. Например, если позывные упорядочены согласно уменьшению частоты выбора, основанной на предыдущих данных, то порядок может быть следующим: "KBS - спорт", "KBS - кино", "KBS-2" и "KBS-1", контроллер 190 может выбирать множество позывных в порядке частоты выбора, основанной на предыдущих данных, или выбирать один позывной.If there are four callsigns “KBS-1”, “KBS-2”, “KBS-sport” and “KBS-movie” as candidates for the callsign, then the
Контроллер 190 может отображать интерфейс пользователя (UI), который используется для того, чтобы пользователь выбрал один из множества кандидатов на позывной.The
На фиг. 5 и фиг. 6 изображен пример UI 310 и 320, которые обеспечиваются для выбора одного из множества рекомендуемых позывных.In FIG. 5 and FIG. 6 depicts an example of
Как представлено на фиг. 5, контроллер 190 выбирает "KBS - спорт" и "KBS - кино", которые выбирались наиболее часто на устройстве 100 визуального отображения, в качестве (рекомендуемых позывных) на основе информации о предыстории применения, и обеспечивает UI 310 для того, чтобы пользователь выбрал требуемый канал из (выбранных рекомендуемых позывных). Пользователь может выбрать один позывной и вещательный канал из "KBS - спорт" и "KBS - кино" посредством UI 310.As shown in FIG. 5, the
Как представлено на фиг. 6, контроллер 190 может обеспечить UI 320, который используется для выбора одного из всех кандидатов на позывной: "KBS - спорт", "KBS - кино", "KBS-2" и "KBS-1". В UI 320 контроллер 190 может отображать все найденные кандидаты на позывной, но может определять порядок отображения позывных согласно частоте выбора, основанной на предыдущих данных. Например, в UI 320 могут отображаться кандидаты на позывной в порядке, начиная с самой высокой частоты выбора, основанной на предыдущих данных.As shown in FIG. 6, the
Если выбор пользователя не сделан за предварительно установленное время, пока отображаются UI 310 и 320, то контроллер 190 может выбрать канал с самым высоким рангом, например, "KBS - спорт", который выбирался наиболее часто, из кандидатов на позывной.If the user’s choice has not been made in the preset time while the
Условия выбора для выбора рекомендуемого позывного из кандидатов на позывной могут отличаться от условий в вышеупомянутом примере. Сервер 10 (см. фиг. 1) является соединенным с различными другими устройствами визуального отображения, которые отличаются от устройства 100 визуального отображения. Сервер 10 может быть идентичным серверу 20 STT или серверу 30 для разговорной речи или отличаться от них. Сервер 20 STT и сервер 30 для разговорной речи были (описаны) как разные, но могут быть реализованы как идентичные серверы.The selection conditions for selecting a recommended call sign from the call sign candidates may differ from the conditions in the above example. Server 10 (see FIG. 1) is connected to various other visual display devices that are different from the
Другие устройства визуального отображения передают информацию о предыстории применения на сервер 10. Сервер 10 определяет частоту выбора "KBS-1", "KBS-2", "KBS - спорт" (и) "KBS - кино" в пределах кандидатов на позывной на основе упомянутой информации о предыстории применения, собранной из других устройств визуального отображения.Other visual display devices transmit application history information to server 10. Server 10 determines the frequency of selection of "KBS-1", "KBS-2", "KBS - sport" (s), "KBS - movies" within the call sign candidates based on mentioned application history information collected from other visual display devices.
Контроллер 190 передает кандидаты на позывной, "KBS-1", "KBS-2", "KBS - спорт" и "KBS - кино", на сервер 10, и может запрашивать, чтобы сервер 10 выбрал рекомендуемого кандидата из кандидатов на позывной.The
Сервер 10 определяет ранг выбора на основе информации о предыстории применения из других устройств визуального отображения, в пределах кандидатов на позывной. Если ранг выбора представлен в порядке: "KBS - кино", "KBS-2", "KBS - спорт" и "KBS-1", и количество (рекомендуемых кандидатов), запрашиваемых устройством 100 визуального отображения равно одному, то сервер 10 принимает решение о "KBS - кино", который выбирался наиболее часто, в качестве рекомендуемого кандидата, и уведомляет устройство 100 визуального отображения о вышеупомянутом. Контроллер 190 может отображать информацию, относящуюся к "KBS - кино", в виде изображения.Server 10 determines the selection rank based on information about the application history from other visual display devices within the call sign candidates. If the selection rank is presented in the order: "KBS - movie", "KBS-2", "KBS - sport" and "KBS-1", and the number (recommended candidates) requested by the
Если выбран только один рекомендуемый позывной, то контроллер 190 может автоматически отображать изображение вещательного канала по рекомендуемому позывному. Однако номер канала, соответствующий позывному, может являться не идентичным, в зависимости от географического местоположения.If only one recommended callsign is selected, then the
Соответственно, контроллер 190 получает информацию о географическом местоположении, касающуюся географического местоположения, где расположено устройство 100 визуального отображения, и определяет номер канала позывного для этого географического местоположения. Способ определения географического местоположения устройства 100 визуального отображения может варьироваться, например, извлечение географического местоположения и/или ID страны, включенного в заголовок или метаданные вещательного сигнала, определение сервером 10 на основе MAC-адреса блока 140 связи или ввод информации о географическом местоположении пользователем заранее, в устройстве 100 визуального отображения.Accordingly, the
Как описано выше, если голосовая команда, соответствующая речи пользователя, включает в себя ключевое слово, относящееся к позывному, то устройство 100 визуального отображения выбирает рекомендуемый позывной, соответствующий этому ключевому слову, и выполняет соответствующую операцию согласно голосовой команде в отношении вещательного канала по выбранному рекомендуемому позывному.As described above, if the voice command corresponding to the user's speech includes a keyword related to the call sign, then the
На фиг. 7 изображает пример процесса взаимодействия устройства 100 визуального отображения и серверов 20 и 30 согласно второму примерному варианту осуществления.In FIG. 7 depicts an example interaction process of the
Как на ней представлено, после приема ввода речи пользователя (700), устройство 100 визуального отображения передает голосовой сигнал этой речи на сервер 20 STT (710).As shown, after receiving user input of speech (700), the
Сервер 20 STT преобразует принятый голосовой сигнал в голосовую команду (720). Операции 700-720 являются идентичными операциям на фиг. 4.The
Сервер 20 STT передает голосовую команду на сервер 30 для разговорной речи (730).The
Сервер 30 для разговорной речи выполняет процесс анализа позывного, например поиск кандидатов на позывной и выбор рекомендуемого позывного (740). Подробное описание может быть аналогичным описанию вышеизложенного примерного варианта осуществления, и не приводится повторно. Однако, в отличие от случая на фиг. 4, процесс анализа позывного согласно настоящему примерному варианту осуществления выполняется сервером 30 для разговорной речи посредством извлечения позывного слова из голосовой команды.The
Сервер 30 для разговорной речи передает рекомендуемый позывной и управляющий сигнал с указанием соответствующей операции в устройство 100 визуального отображения, которое выполняет операцию согласно этому управляющему сигналу (750).The
В вышеизложенном примерном варианте осуществления, раскрыта конфигурация для преобразования, сервером 20 STT, речевого ввода пользователя в устройство 100 визуального отображения в голосовую команду, и обработки, устройством 100 визуального отображения, короткого предложения как голосовой команды, и обработки, сервером 30 для разговорной речи, предложения разговорной речи как голосовой команды.In the above exemplary embodiment, a configuration is disclosed for converting, by the
Однако идея настоящего изобретения не ограничивается вышеизложенным, и конфигурация для преобразования речи в голосовую команду и конфигурация, касающаяся субъекта, который обрабатывает голосовую команду, в зависимости от того, является ли эта голосовая команда коротким предложением или предложением разговорной речи, могут отличаться от этих конфигураций в вышеизложенном примерном варианте осуществления.However, the idea of the present invention is not limited to the foregoing, and the configuration for converting speech into a voice command and the configuration relating to the subject who processes the voice command, depending on whether this voice command is a short sentence or a sentence of spoken language, may differ from these configurations in the above exemplary embodiment.
Фиг. 8 является блок-схемой, изображающей структуру взаимодействия устройства 100a визуального отображения и сервера 40 согласно третьему примерному варианту осуществления. На фиг. 9 изображен пример процесса взаимодействия между устройством 100a визуального отображения и сервером 40 на фиг. 8.FIG. 8 is a block diagram depicting an interaction structure of the
Как представлено на фиг. 8, устройство 100a визуального отображения включает в себя блок 140a связи, блок 160a голосового ввода, голосовой процессор 170a и контроллер 190a.As shown in FIG. 8, the
Голосового процессор 170a включает в себя преобразователь 171a STT, который преобразует речь, переданную блоком 160a голосового ввода, в голосовую команду, и командный процессор 172a для короткого предложения, который обрабатывает голосовую команду, если эта голосовая команда является коротким предложением.The
Если введена речь пользователя, то блок 160a голосового ввода передает голосовой сигнал введенной речи в преобразователь 171a STT. Преобразователь 171a STT анализирует голосовой сигнал, переданный блоком 160a голосового ввода, и преобразует этот голосовой сигнал в голосовую команду, включающую в себя содержимое этого голоса. Преобразователь (171a) STT передает преобразованную голосовую команду в контроллер 190a. Соответственно, преобразователь 171a STT выполняет функцию сервера 20 STT в первом примерном варианте осуществления.If user speech is input, the
Контроллер 190a определяет то, является ли голосовая команда коротким предложением или предложением разговорной речи. Если голосовая команда является коротким предложением, то контроллер 190a передает эту голосовую команду в командный процессор 172a для короткого предложения. Командный процессор 172a для короткого предложения анализирует голосовую команду посредством осуществления управления контроллером 190a, и выполняет соответствующую операцию согласно результатам анализа. При анализе и выполнении голосовой команды может применяться вышеизложенный примерный вариант осуществления, и подробное описание опущено.The
Если голосовая команда является предложением разговорной речи, то контроллер 190a передает эту голосовую команду на сервер 40 для разговорной речи через блок 140a связи, а не в командный процессор 172a для короткого предложения. Сервер 20 для разговорной речи выполняет идентичную функцию, что и сервер 30 для разговорной речи согласно первому примерному варианту осуществления.If the voice command is a conversation offer, then the
Устройство 100a визуального отображения выполняет операцию, соответствующую управляющему сигналу, передаваемому сервером (30) для разговорной речи.The
Как представлено на фиг. 9, устройство 100a визуального отображения соединено с сервером 40 для разговорной речи для связи. Если введена речь пользователя (810), то устройство 100a визуального отображения определяет то, является ли голосовая команда, соответствующая этой речи, коротким предложением или предложением разговорной речи (820). Если определяется то, что голосовая команда является предложением разговорной речи, то устройство 100a визуального отображения передает голосовую команду на сервер 40 для разговорной речи (830).As shown in FIG. 9, the
После приема голосовой команды из устройства 100 визуального отображения (910), сервер 40 для разговорной речи извлекает ключевое слово, относящееся к позывному, из этой голосовой команды (920).After receiving the voice command from the visual display device 100 (910), the
В других случаях, ключевое слово, относящееся к позывному, может быть извлечено устройством 100a визуального отображения, а не сервером 40 для разговорной речи. В этом случае, устройство 100a визуального отображения передает, на сервер 40 для разговорной речи, ключевое слово, относящееся к позывному, вместе с голосовой командой.In other cases, the keyword related to the call sign may be retrieved by the
Сервер 40 для разговорной речи осуществляет поиск кандидата на позывной, соответствующего ключевому слову (930). Если найдено множество кандидатов на позывной, то сервер 40 для разговорной речи выбирает позывной из этого множества найденных кандидатов на позывной как рекомендуемый позывной, согласно условиям выбора, как описано выше (940). Сервер 40 для разговорной речи анализирует голосовую команду и определяет соответствующую операцию согласно этой голосовой команде.The
Сервер 40 для разговорной речи передает, в устройство 100a визуального отображения, рекомендуемый позывной и управляющий сигнал с указанием соответствующей операции (950).The
Устройство 100a визуального отображения выполняет соответствующую операцию в отношении вещательного сигнала по рекомендуемому позывному, согласно управляющему сигналу, переданному сервером 40 для разговорной речи (840).The
Если определяется то, что голосовая команда является коротким предложением, при операции 820, то устройство 100 визуального отображения анализирует рекомендуемый позывной и соответствующую операцию.If it is determined that the voice command is a short sentence, at
Фиг. 10 является блок-схемой, изображающей структуру передачи сигнала голосового процессора 171b устройства 100b визуального отображения согласно четвертому примерному варианту осуществления.FIG. 10 is a block diagram depicting a signal transmission structure of a
Как на ней представлено, голосовой процессор 170b включает в себя преобразователь 171b STT, который преобразует речь пользователя, переданную блоком 160b голосового ввода, в голосовую команду, командный процессор 172b для короткого предложения, который обрабатывает голосовую команду, если эта голосовая команда, преобразованная преобразователем 171b STT, является коротким предложением, и командный процессор 173b для разговорной речи, который обрабатывает голосовую команду, преобразованную преобразователем 171b STT, если эта голосовая команда является предложением разговорной речи/обычным языком. Структура голосового процессора 170b не ограничивается вышеизложенным примером, и настоящий пример коротко раскрывает предметы, непосредственно относящиеся к настоящему примерному варианту осуществления.As presented, the voice processor 170b includes an
Если введена речь пользователя, то блок 160b голосового ввода передает голосовой сигнал введенной речи в преобразователь 171b STT. Преобразователь 171b STT преобразует речь, переданную блоком 160b голосового ввода, в голосовую команду, включающую в себя содержимое этой этой речи. Преобразователь 171b STT передает преобразованную голосовую команду в контроллер 190b.If user speech is input, the
Контроллер 190b определяет то, является ли голосовая команда коротким предложением или предложением разговорной речи. Вышеизложенное определение может быть выполнено посредством различных алгоритмов.The
Если голосовая команда является коротким предложением, то контроллер 190b передает эту голосовую команду в командный процессор 172b для короткого предложения. Если голосовая команда является предложением разговорной речи, то контроллер 190b передает эту голосовую команду в командный процессор 173b для разговорной речи.If the voice command is a short sentence, then the
Командный процессор I72b для короткого предложения выполняет по существу идентичную функцию, что и командный процессор 172b для короткого предложения на фиг. 8. Командный процессор 173b для разговорной речи выполняет функцию, выполняемую серверами 30 и 40 для разговорной речи согласно вышеизложенным вариантам осуществления.The short sentences command processor I72b has a substantially identical function as the short sentences command
Соответственно, в отличие от вышеизложенных примерных вариантов осуществления, устройство 100b визуального отображения согласно настоящему примерному варианту осуществления может преобразовывать голосовую команду из речи пользователя и анализировать операцию, соответствующую этой голосовой команде, вместо того, чтобы обмениваться данными и/или сигналами с внешними серверами 20-40.Accordingly, in contrast to the above exemplary embodiments, the
Если устройство визуального отображения соединено с дополнительным сервером, который выполняет процесс анализа позывного, то командный процессор 172a для короткого предложения или командный процессор 173b для разговорной речи могут передавать ключевое слово и голосовую команду на сервер, который выполняет процесс анализа позывного.If the visual display device is connected to an additional server that performs the call sign analysis process, then the
Соответственно, в вышеизложенных примерных вариантах осуществления, процесс анализа позывного выполняют серверы 30 и 40 для разговорной речи или голосовые процессоры 170, 170a и 170b, но в других случаях процесс анализа позывного может быть выполнен дополнительным сервером.Accordingly, in the above exemplary embodiments, the call sign analysis process is performed by the
Несмотря на то что представлены и описаны несколько примерных вариантов осуществления, специалистам в данной области техники очевидно, что в этих примерных вариантах осуществления могут быть сделаны изменения, не выходя за границы принципов и сущности изобретения, объем которого определен в прилагаемой формуле изобретения и ее эквивалентах. Кроме того, специалистам в данной области техники очевидно, что все упомянутые выше блоки могут быть реализованы аппаратно.Although several exemplary embodiments are presented and described, it will be apparent to those skilled in the art that changes can be made to these exemplary embodiments without departing from the principles and spirit of the invention, the scope of which is defined in the appended claims and their equivalents. In addition, it will be apparent to those skilled in the art that all of the above blocks can be implemented in hardware.
Claims (13)
процессор изображений, сконфигурированный с возможностью обработки вещательного сигнала для отображения программы вещательного канала,
средство связи, сконфигурированное с возможностью осуществления связи с сервером,
голосовой приемник, сконфигурированный с возможностью приема речи от пользователя,
голосовой процессор, сконфигурированный с возможностью обработки выполнения операции, соответствующей упомянутой речи, и
контроллер, сконфигурированный с возможностью обработки упомянутой речи, которая должна быть обработана посредством одного из голосового процессора и сервера,
при этом, если упомянутая речь содержит ключевое слово, относящееся к требуемому позывному вещательного канала, то контроллер осуществляет управление для выбора представительного позывного, соответствующего упомянутому ключевому слову, из базы данных, которая хранит множество представительных позывных и множество групп позывных, каждая содержит по меньшей мере один позывной, относящийся к соответствующему представительному позывному, осуществляет управление для отображения списка, который содержит группу позывных, относящуюся к выбранному представительному позывному, так что один позывной выбирается из группы позывных в отображаемом списке, и выполняет операцию согласно упомянутой речи в отношении вещательного канала по выбранному позывному.1. An image processing apparatus comprising:
an image processor configured to process a broadcast signal to display a broadcast channel program,
communication means configured to communicate with a server,
a voice receiver configured to receive speech from a user,
a voice processor configured to process an operation corresponding to said speech, and
a controller configured to process said speech to be processed by one of the voice processor and server,
however, if the said speech contains a keyword related to the desired call sign of the broadcast channel, the controller controls to select a representative callsign corresponding to the mentioned keyword from a database that stores a plurality of representative callsigns and a plurality of call sign groups, each containing at least one call sign related to the corresponding representative callsign controls to display a list that contains a group of callsigns related to you a selected representative callsign, so that one callsign is selected from the group of callsigns in the displayed list, and performs an operation according to said speech with respect to the broadcast channel on the selected callsign.
осуществление связи с сервером,
прием речи от пользователя, и
обработку речи посредством одного из устройства обработки изображений и сервера, и выполнение операции согласно упомянутой речи,
при этом, в по меньшей мере одном из устройства обработки изображений и сервера хранится база данных, причем база данных хранит множество представительных позывных и множество групп позывных, включающих в себя по меньшей мере один позывной, относящийся к соответствующему представительному позывному, и
при этом упомянутые обработка и выполнение содержат:
если упомянутая речь содержит ключевое слово, относящееся к требуемому позывному вещательного канала, осуществление управления для выбора из базы данных представительного позывного, соответствующего ключевому слову,
отображение списка, который содержит группу позывных, относящуюся к выбранному представительному позывному, так что один позывной выбирается из группы позывных в отображаемом списке, и
выполнение операции согласно упомянутой речи в отношении вещательного канала по выбранному позывному.9. A method of controlling an image processing device, comprising:
communication with the server,
receiving speech from the user, and
speech processing by one of the image processing device and the server, and performing an operation according to said speech,
however, in at least one of the image processing apparatus and the server, a database is stored, wherein the database stores a plurality of representative callsigns and a plurality of groups of callsigns including at least one callsign related to the corresponding representative callsign, and
wherein said processing and execution comprise:
if the said speech contains a keyword related to the required call sign of the broadcast channel, the control for selecting from the database a representative callsign corresponding to the keyword,
displaying a list that contains a group of callsigns related to the selected representative callsign, so that one callsign is selected from a group of callsigns in the displayed list, and
performing an operation according to said speech with respect to the broadcast channel on the selected callsign.
выбор по меньшей мере одного позывного на основе частоты выбора позывного, которая больше или равна предварительно установленному рангу, из упомянутого множества позывных в упомянутой группе позывных, относящейся к выбранному представительному позывному.10. The control method of claim 9, wherein said control for selecting a representative callsign comprises:
selecting at least one call sign based on a call sign selection frequency that is greater than or equal to a predetermined rank from the plurality of call signs in said call sign group related to the selected representative call sign.
выбор по меньшей мере одного позывного на основе частоты выбора позывного, которая больше или равна предварительно установленному рангу, причем частота выбора происходит из множества других устройств обработки изображений, осуществляющих связь с сервером, из упомянутого множества позывных в упомянутой группе позывных, относящейся к выбранному представительному позывному.11. The control method of claim 9, wherein said control for selecting a representative callsign comprises:
selecting at least one call sign based on a call sign selection frequency that is greater than or equal to a predetermined rank, wherein the selection frequency comes from a plurality of other image processing devices communicating with the server, from the plurality of callsigns in said call sign group related to the selected representative callsign .
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0109454 | 2012-09-28 | ||
KR20120109454 | 2012-09-28 | ||
KR1020120115783A KR20140039946A (en) | 2012-09-28 | 2012-10-18 | Image processing apparatus and control method thereof, image processing system |
KR10-2012-0115783 | 2012-10-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013103490A RU2013103490A (en) | 2014-07-27 |
RU2571520C2 true RU2571520C2 (en) | 2015-12-20 |
Family
ID=50650455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013103490/08A RU2571520C2 (en) | 2012-09-28 | 2013-01-25 | Image processing device and associated control method and image processing system |
Country Status (5)
Country | Link |
---|---|
JP (2) | JP2022008691A (en) |
KR (2) | KR20140039946A (en) |
BR (1) | BR102013002349A2 (en) |
MX (1) | MX341560B (en) |
RU (1) | RU2571520C2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2704876C1 (en) * | 2016-03-01 | 2019-10-31 | ГУГЛ ЭлЭлСи | Developer voice actions system |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6801539B2 (en) * | 2017-03-17 | 2020-12-16 | 株式会社リコー | Information processing system, information processing device, information processing program and information processing method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6757718B1 (en) * | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
JP2005249829A (en) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | Computer network system performing speech recognition |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007142840A (en) * | 2005-11-18 | 2007-06-07 | Canon Inc | Information processing apparatus and information processing method |
KR20070087910A (en) * | 2006-02-01 | 2007-08-29 | 삼성전자주식회사 | Method and apparatus for providing user easy accessibility to contents in data broadcasting using voice recognition |
-
2012
- 2012-10-18 KR KR1020120115783A patent/KR20140039946A/en active Search and Examination
-
2013
- 2013-01-18 MX MX2015003890A patent/MX341560B/en active IP Right Grant
- 2013-01-23 JP JP2013010622A patent/JP2022008691A/en active Pending
- 2013-01-25 RU RU2013103490/08A patent/RU2571520C2/en active
- 2013-01-30 BR BR102013002349-3A patent/BR102013002349A2/en not_active Application Discontinuation
- 2013-05-21 KR KR1020130057262A patent/KR101877430B1/en active IP Right Grant
-
2014
- 2014-04-17 JP JP2014085816A patent/JP2014149548A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6757718B1 (en) * | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
JP2005249829A (en) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | Computer network system performing speech recognition |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2704876C1 (en) * | 2016-03-01 | 2019-10-31 | ГУГЛ ЭлЭлСи | Developer voice actions system |
Also Published As
Publication number | Publication date |
---|---|
KR20140042637A (en) | 2014-04-07 |
JP2022008691A (en) | 2022-01-14 |
JP2014149548A (en) | 2014-08-21 |
RU2013103490A (en) | 2014-07-27 |
KR20140039946A (en) | 2014-04-02 |
KR101877430B1 (en) | 2018-07-12 |
MX2015003890A (en) | 2015-07-06 |
BR102013002349A2 (en) | 2014-07-08 |
MX341560B (en) | 2016-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8838456B2 (en) | Image processing apparatus and control method thereof and image processing system | |
US10009645B2 (en) | Electronic device and method for controlling the same | |
US9547716B2 (en) | Displaying additional data about outputted media data by a display device for a speech search command | |
US11381879B2 (en) | Voice recognition system, voice recognition server and control method of display apparatus for providing voice recognition function based on usage status | |
JP6375521B2 (en) | Voice search device, voice search method, and display device | |
KR20180025121A (en) | Method and apparatus for inputting information | |
US10783885B2 (en) | Image display device, method for driving the same, and computer readable recording medium | |
US20140122089A1 (en) | Image processing apparatus and control method thereof and image processing system | |
JP2014132465A (en) | Display device and control method of the same | |
JP2000250591A (en) | Automatic retrieval system for television program | |
US10140985B2 (en) | Server for processing speech, control method thereof, image processing apparatus, and control method thereof | |
KR102210933B1 (en) | Display device, server device, voice input system comprising them and methods thereof | |
US20150052169A1 (en) | Method, electronic device, and computer program product | |
US20230186941A1 (en) | Voice identification for optimizing voice search results | |
CN109792502B (en) | Information processing apparatus, information processing method, storage medium, and information processing system | |
KR100970711B1 (en) | Apparatus for searching the internet while watching TV and method threrefor | |
RU2571520C2 (en) | Image processing device and associated control method and image processing system | |
KR102594022B1 (en) | Electronic device and method for updating channel map thereof | |
CN117809633A (en) | Display device and intention recognition method |