BR102019000231A2 - Dispositivo de processamento de informação, método, e meio de armazenamento de programa - Google Patents

Dispositivo de processamento de informação, método, e meio de armazenamento de programa Download PDF

Info

Publication number
BR102019000231A2
BR102019000231A2 BR102019000231-0A BR102019000231A BR102019000231A2 BR 102019000231 A2 BR102019000231 A2 BR 102019000231A2 BR 102019000231 A BR102019000231 A BR 102019000231A BR 102019000231 A2 BR102019000231 A2 BR 102019000231A2
Authority
BR
Brazil
Prior art keywords
passenger
vehicle
oral expression
issued
oral
Prior art date
Application number
BR102019000231-0A
Other languages
English (en)
Inventor
Hideki Kobayashi
Akihiro Muguruma
Yukiya Sugiyama
Shota HIGASHIHARA
Riho Matsuo
Naoki YAMAMURO
Original Assignee
Toyota Jidosha Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Jidosha Kabushiki Kaisha filed Critical Toyota Jidosha Kabushiki Kaisha
Publication of BR102019000231A2 publication Critical patent/BR102019000231A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0011Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots associated with a remote control arrangement
    • G05D1/0016Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots associated with a remote control arrangement characterised by the operator's input device
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/023Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/12Limiting control by the driver depending on vehicle state, e.g. interlocking means for the control input for preventing unsafe operation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W2040/089Driver voice
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2540/00Input parameters relating to occupants
    • B60W2540/21Voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computational Linguistics (AREA)
  • Mechanical Engineering (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Transportation (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Auxiliary Drives, Propulsion Controls, And Safety Devices (AREA)

Abstract

dispositivo de processamento de informação, método, e meio de armazenamento de programa a presente invenção refere-se a um dispositivo de processamento de informação que inclui (i) uma unidade de aquisição que pode obter expressões orais de vários passageiros que estão a bordo de um veículo, (ii) uma unidade de reconhecimento que, em um caso em que uma expressão oral é obtida pela unidade de aquisição, reconhece um dos passageiros que emitiu a expressão oral, e (iii) uma unidade de controle que controla a operação de condução do veículo indicada pela expressão oral do passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral, o resultado do reconhecimento sendo obtido pela unidade de reconhecimento, e informação de configuração que é informação tendo sido determinada antecipadamente com respeito a cada um dos vários passageiros e que é informação sobre se ou não o passageiro é um passageiro que é permitido realizar a operação de condução do veículo.

Description

Campo Técnico [001] A presente invenção refere-se a um dispositivo de processamento de informação, um método de processamento de informação, e um meio de armazenamento de programa.
Técnica Relacionada [002] Convencionalmente, são conhecidos os dispositivos que controlam por voz os respectivos dispositivos montados em um veículo. Por exemplo, ver Patente U.S. N°. 9580028.
[003] No entanto, uma tecnologia descrita na Patente U.S. N°. 9580028 não leva em consideração um caso em que a operação de condução de um veículo é realizada por voz. Por exemplo, em um caso em que um dispositivo de diálogo que tem um diálogo com os passageiros que estão a bordo de um veículo é instalado no veículo e a operação de condução do veículo é realizada de acordo com uma expressão oral, a operação de condução é exigida ser realizada somente de acordo com expressões orais do motorista.
[004] No entanto, desde que a tecnologia descrita na Patente U.S. N°. 9580028 algumas vezes causa um caso em que a operação de condução é realizada baseada em uma expressão oral emitida por um passageiro que não é o motorista, a tecnologia não é apropriada. SUMÁRIO [005] A presente invenção fornece um dispositivo de processamento de informação, um método de processamento de informação, e um meio de armazenamento de programa que são capazes de realizar operação de condução de um veículo apropriadamente mesmo se vá
Petição 870190001417, de 07/01/2019, pág. 38/106
2/26 rios passageiros estão a bordo do veículo, em um caso em que a operação de condução do veículo é realizada de acordo com uma expressão oral de um motorista.
[006] Um dispositivo de processamento de informação de acordo com um primeiro aspecto da presente invenção inclui uma unidade de aquisição que pode obter expressões orais de vários passageiros que estão a bordo de um veículo, uma unidade de reconhecimento que, em um caso em que uma expressão oral é obtida pela de unidade de aquisição, reconhece um dos passageiros que emitiu a expressão oral, e uma unidade de controle que controla a operação de condução do veículo indicada pela expressão oral emitida pelo passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral, o resultado de reconhecimento sendo obtido pela unidade de reconhecimento, e informação de configuração que é a informação tendo sido determinada antecipadamente com respeito a cada um dos vários passageiros e que é informação sobre se ou não o passageiro é um passageiro a quem é permitido realizar a operação de condução do veículo.
[007] O dispositivo de processamento de informação do primeiro aspecto reconhece um passageiro que emitiu uma expressão oral de acordo com a expressão oral obtida. O dispositivo de processamento de informação controla a operação de condução do veículo indicada pela expressão oral do passageiro, baseado em um resultado de reconhecimento do passageiro e informação de configuração. Por exemplo, em um caso em que uma expressão oral emitida pelo motorista tem um conteúdo instruindo a operação de condução do veículo, a operação de condução é permitida. Em um caso em que uma expressão oral emitida por um passageiro que não é o motorista tem um conteúdo instruindo a operação de condução do veículo, a operação de condução é impedida. Esta configuração permite que a operação de
Petição 870190001417, de 07/01/2019, pág. 39/106
3/26 condução do veículo seja realizada apropriadamente mesmo em um caso em que vários passageiros estão a bordo do veículo quando a operação de condução do veículo é realizada de acordo com uma expressão oral emitida pelo motorista. A informação de configuração é informação com respeito a cada dos vários passageiros e informação sobre se ou não cada passageiro é um passageiro a quem é permitido realizar a operação de condução do veículo. Desde que o uso da informação de configuração permite se ou não um passageiro que emitiu uma expressão oral é um motorista que está autorizado a realizar a operação de condução do veículo a ser identificado, é possível realizar a operação de condução do veículo de acordo com uma expressão oral emitida pelo motorista mesmo em um caso em que vários passageiros estão a bordo do veículo.
[008] Um dispositivo de processamento de informação de acordo com um segundo aspecto da presente invenção é configurado de modo que, no primeiro aspecto, a unidade de controle, baseada em um resultado de reconhecimento do passageiro obtido pela unidade de reconhecimento e informação de configuração, no caso em que o passageiro que emitiu a expressão oral obtida pela unidade de aquisição é um passageiro que está autorizado a realizar a operação de condução do veículo e um conteúdo da expressão oral é um conteúdo relacionado com a operação de condução do veículo, emite um sinal de controle que indica realizar a operação de condução de acordo com o conteúdo da expressão oral emitida pelo passageiro e, no caso em que o passageiro que emitiu a expressão oral obtida pela unidade de aquisição é um passageiro que não está autorizado a realizar a operação de condução do veículo e o conteúdo da expressão oral é um conteúdo relacionado à operação de condução do veículo, emite um sinal de controle que indica restringir a operação de condução de acordo com o conteúdo da expressão oral do passageiro.
Petição 870190001417, de 07/01/2019, pág. 40/106
4/26 [009] No dispositivo de processamento de informação do segundo aspecto, a operação de condução do veículo é realizada de acordo com um conteúdo de uma expressão oral emitida por um passageiro e se ou não o passageiro está autorizado a realizar a operação de condução do veículo. Esta configuração permite que a operação de condução, de acordo com um conteúdo de uma expressão oral emitida pelo motorista, seja realizada. Esta configuração também permite que a operação de condução do veículo seja impedida mesmo no caso em que a expressão oral tendo um conteúdo relacionado com a operação de condução foi emitida por um passageiro que não é o motorista.
[0010] Um dispositivo de processamento de informação de acordo com um terceiro aspecto da presente invenção é configurado de modo que, no segundo aspecto, a informação de configuração ainda inclui informação sobre se ou não o passageiro é um passageiro que está autorizado a realizar a operação do veículo que é diferente da operação de condução, e a unidade de controle, baseado em um resultado de reconhecimento do passageiro obtido pela unidade de reconhecimento e a informação de configuração, no caso em que o passageiro que emitiu a expressão oral obtida pela unidade de aquisição é um passageiro que foi autorizado a realizar a operação de veículo diferente da operação de condução do veículo e um conteúdo da expressão oral é um conteúdo relacionado à operação de veículo diferente da operação de condução do veículo, emite um sinal de controle que indica, de acordo com o conteúdo da expressão oral, realizar a operação de veículo diferente da operação de condução do veículo.
[0011] No dispositivo de processamento de informação do terceiro aspecto, no caso em que, mesmo quando um passageiro que emitiu uma expressão oral é um passageiro que não está autorizado a realizar a operação de condução do veículo, o passageiro está autorizado a realizar a operação de veículo diferente da operação de condução
Petição 870190001417, de 07/01/2019, pág. 41/106
5/26 do veículo, e um conteúdo da expressão oral é um conteúdo relacionado à operação de veículo diferente da operação de condução do veículo, a operação de veículo é realizada de acordo com o conteúdo da expressão oral. Assim, no caso em que um passageiro está autorizado a realizar a operação de veículo diferente da operação de condução, é possível instruir a operação de veículo por expressão oral.
[0012] Um dispositivo de processamento de informação de acordo com um quarto aspecto da presente invenção é configurado de modo que, nos primeiro a terceiro aspectos, a unidade de controle configura o dispositivo de processamento de informação em um estado em que a operação de condução pode ser realizada de acordo com uma expressão oral emitida pelo passageiro no caso em que uma posição do dispositivo de processamento de informação está dentro do veículo.
[0013] O dispositivo de processamento de informação do quarto aspecto configura o dispositivo de processamento de informação em um estado em que a operação de condução pode ser realizada por uma expressão oral em um caso em que uma posição do dispositivo de processamento de informação é dentro do veículo. Esta configuração permite que a operação de condução realizada por uma expressão oral emitida pelo motorista seja iniciada suavemente.
[0014] Um dispositivo de processamento de informação de acordo com um quinto aspecto da presente invenção é configurado de modo que, nos primeiro a quarto aspectos, a unidade de reconhecimento reconhece se ou não o passageiro que emitiu a expressão oral é um motorista e a unidade de controle emite um sinal de controle que indica realizar a operação de condução de acordo com um conteúdo da expressão oral emitida pelo motorista.
[0015] No dispositivo de processamento de informação do quinto aspecto, é possível reconhecer um motorista e realizar a operação de condução de acordo com uma expressão oral emitida pelo motorista.
Petição 870190001417, de 07/01/2019, pág. 42/106
6/26 [0016] Um dispositivo de processamento de informação de acordo com um sexto aspecto da presente invenção é configurado de modo que, nos primeiro a quinto aspectos, o dispositivo de processamento de informação tem um dispositivo de diálogo que realiza um diálogo com os passageiros.
[0017] À medida que o dispositivo de processamento de informação do sexto aspecto é um dispositivo de diálogo, o dispositivo de processamento de informação pode realizar uma operação diferente da operação de veículo para um veículo. Por exemplo, é possível reproduzir música dentro de um veículo de acordo com um conteúdo de uma instrução indicada por uma expressão oral de um passageiro.
[0018] Um programa de acordo com um sétimo aspecto da presente invenção é um programa que faz um computador executar um processamento incluindo expressões orais obtidas de vários passageiros que estão a bordo de um veículo, no caso em que uma expressão oral é obtida por uma unidade de aquisição, reconhecendo um dos passageiros que emitiu a expressão oral, e controlar a operação de condução do veículo indicada pela expressão oral emitida pelo passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral, o resultado de reconhecimento sendo obtido por uma unidade de reconhecimento, e a informação de configuração que é a informação determinada antecipadamente com respeito a cada um dos vários passageiros e que é a informação sobre se ou não o passageiro é um passageiro que está autorizado a realizar a operação de condução do veículo.
[0019] Um método de processamento de informação de acordo com um oitavo aspecto da presente invenção inclui, no caso em que uma expressão oral emitida por um dos vários passageiros que estão a bordo do veículo é obtida, reconhecer o passageiro que emitiu a expressão oral, e controlar a operação de condução do veículo indicada
Petição 870190001417, de 07/01/2019, pág. 43/106
7/26 pela expressão oral emitida pelo passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral e informação de configuração que é a informação determinada antecipadamente com respeito a cada um dos vários passageiros e que é a informação sobre se ou não o passageiro é um passageiro autorizado a realizar a operação de condução do veículo.
[0020] Como descrito acima, a presente invenção permite a operação de condução de um veículo a ser realizada apropriadamente mesmo em um caso em que vários passageiros estão a bordo do veículo quando a operação de condução do veículo é realizada de acordo com uma expressão oral emitida por um motorista.
BREVE DESCRIÇÃO DOS DESENHOS [0021] Modalidades exemplares da presente invenção serão descritas em detalhe baseadas nas seguintes figuras, em que:
[0022] a Figura 1 é um diagrama de bloco esquemático de um dispositivo de diálogo de acordo com uma primeira modalidade;
[0023] a Figura 2 é um diagrama explicativo para uma descrição de um esboço da primeira modalidade;
[0024] a Figura 3 é um diagrama explicativo para uma descrição de processamento de registro de informação de voz de um passageiro; [0025] a Figura 4 é um diagrama ilustrando um exemplo de informação de configuração;
[0026] a Figura 5 é um diagrama ilustrando um exemplo de informação de palavras que foram registradas antecipadamente;
[0027] a Figura 6 é um diagrama ilustrando um exemplo de configuração de um computador no dispositivo de diálogo;
[0028] a Figura 7 é um fluxograma ilustrando um exemplo de processamento realizado pelo dispositivo de diálogo de acordo com a primeira modalidade;
[0029] a Figura 8 é um diagrama de bloco esquemático de um dis
Petição 870190001417, de 07/01/2019, pág. 44/106
8/26 positivo de diálogo de acordo com uma segunda modalidade;
[0030] a Figura 9 é um diagrama explicativo para uma descrição de um esboço da segunda modalidade.
DESCRIÇÃO DETALHADA
Primeira Modalidade [0031] Daqui em diante, um dispositivo de diálogo 10 de acordo com uma primeira modalidade será descrito com referência aos desenhos.
[0032] A Figura 1 é um diagrama de bloco ilustrando um exemplo de uma configuração do dispositivo de diálogo 10 de acordo com a primeira modalidade. Como ilustrado na Figura 1, o dispositivo de diálogo 10 inclui um microfone de voz 12, uma unidade de operação 14, um computador 16, e um alto-falante 18. O dispositivo de diálogo 10 é um exemplo de um dispositivo de processamento de informação da presente invenção.
[0033] O microfone de voz 12 detecta uma expressão oral emitida por um usuário que está presente em uma vizinhança do dispositivo de diálogo 10. O microfone de voz 12 emite a expressão oral detectada do usuário para o computador 16, que será descrita posteriormente.
[0034] A unidade de operação 14 aceita a informação de operação de um operador do dispositivo de diálogo 10. Por exemplo, um passageiro em um veículo que é um operador do dispositivo de diálogo 10 opera a unidade de operação 14 e emite informação de operação para o dispositivo de diálogo 10.
[0035] O computador 16 é configurado incluindo uma unidade de processamento central (CPU), uma memória de leitura (ROM) armazenando um programa e similar para obter rotinas de processamento respectivas, uma memória de acesso randômico (RAM) armazenando dados temporariamente, uma memória servindo como uma unidade de armazenamento, uma interface de rede, e similar. O computador 16
Petição 870190001417, de 07/01/2019, pág. 45/106
9/26 inclui funcionalmente uma unidade de aquisição 20, uma unidade de geração de informação 22, uma unidade de registro 24, uma unidade de armazenamento de informação de configuração 26, uma unidade de reconhecimento 28, e uma unidade de controle 30.
[0036] O alto-falante 18 emite saída de informação de voz pelo computador 16.
[0037] Na Figura 2, um diagrama explicativo para uma descrição de um esboço da modalidade é ilustrado. Como ilustrado na Figura 2, o dispositivo de diálogo 10 de acordo com a modalidade é trazido para dentro de um veículo V por um passageiro do veículo V. Em um caso em que uma posição do dispositivo de diálogo 10 propriamente dito está dentro do veículo V, a unidade de controle 30 no dispositivo de diálogo 10 ajusta o dispositivo de diálogo 10 em um modo (daqui em diante, referido como um modo de condução) em que a operação de condução do veículo V pode ser realizada de acordo com uma expressão oral emitida por um passageiro. Por exemplo, a unidade de controle 30 no dispositivo de diálogo 10 realiza uma troca de informação por meio de um servidor predeterminado (ilustração omitida) com uma unidade de controle eletrônico (ECU) (ilustração omitida) que é montada no veículo V. Em um caso em que a unidade de controle 30 no dispositivo de diálogo 10 detectou que o dispositivo de diálogo 10 está dentro do veículo V, a unidade de controle 30 ajusta o dispositivo de diálogo 10 no modo de condução.
[0038] O dispositivo de diálogo 10 realiza um diálogo com passageiros A, B, C e D no veículo V, baseado em conteúdos de expressões orais emitidas pelos passageiros. Por exemplo, em um caso em que o dispositivo de diálogo 10 é questionado, Como está o tempo hoje?, pelo passageiro D, o dispositivo de diálogo 10 obtém informação de tempo de um banco de dados predeterminado (ilustração omitida) e responde, O tempo hoje é X. Em um caso em que o dispositivo de
Petição 870190001417, de 07/01/2019, pág. 46/106
10/26 diálogo 10 é instruído, Reproduzir música, pelo passageiro C, o dispositivo de diálogo 10 obtém uma peça de música de um banco de dados predeterminado (ilustração omitida) e reproduz a peça de música obtida.
[0039] O dispositivo de diálogo 10 de acordo com a modalidade emite um sinal de controle relacionado com a operação de condução do veículo V de acordo com uma expressão oral pelo passageiro A que é um motorista. Por exemplo, em um caso em que o dispositivo de diálogo 10 é instruído, Comutar para condução automática, pelo passageiro A, que é um motorista, ilustrado na Figura 2, o dispositivo de diálogo 10 emite um sinal de controle para comutar de condução manual para condução automática.
[0040] No entanto, em um caso em que uma expressão oral relacionada com a operação de condução é emitida por um dos passageiros B, C e D, que são diferentes do motorista A, a operação de condução instruída pela expressão oral é exigida ser impedida. Por exemplo, em um caso em que uma expressão oral Comutar para condução automática, que se refere à operação de condução, é emitida pelo passageiro D ilustrado na Figura 2, a operação de condução instruída pela expressão oral é exigida ser impedida.
[0041] Consequentemente, na modalidade, um passageiro que emitiu cada expressão oral é reconhecido baseado em expressões orais dos passageiros que estão a bordo do veículo. Baseado em resultado de reconhecimento de cada passageiro, a operação de condução do veículo indicada por uma expressão oral pelo passageiro é impedida. Esta configuração permite a operação de condução do veículo a ser controlado somente de acordo com uma expressão oral do motorista dentre os passageiros que estão a bordo do veículo.
[0042] Especificamente, o dispositivo de diálogo 10 de acordo com a modalidade, registra informação de voz de expressões orais emitidas
Petição 870190001417, de 07/01/2019, pág. 47/106
11/26 pelo motorista e informação de voz de expressões orais emitida por passageiros que não são o motorista antecipadamente. O dispositivo de diálogo 10 determina se ou não uma expressão oral obtida foi emitida pelo motorista, baseado na informação de voz de expressões orais emitidas pelos passageiros e informação de configuração que é informação se ou não cada passageiro é um passageiro que está autorizado a realizar a operação de condução do veículo. Em um caso em que uma expressão oral é uma expressão oral emitida por um passageiro que não é o motorista, o dispositivo de diálogo 10 restringe a operação de condução do veículo. Em um caso em que uma expressão oral obtida é uma expressão oral pelo motorista, o dispositivo de diálogo 10 permite a operação de condução do veículo. Daqui em diante, uma descrição específica será feita.
[0043] A unidade de aquisição 20 obtém sucessivamente expressões orais de vários passageiros a bordo do veículo que são detectados pelo microfone de voz 12.
[0044] A unidade de geração de informação 22 gera informação de saída predeterminada de acordo com uma expressão oral obtida pela unidade de aquisição 20. Por exemplo, no caso em que a unidade de aquisição 20 obteve uma expressão oral Reproduzir música de um passageiro, a unidade de geração de informação 22 obtém uma peça de música de um banco de dados predeterminado (ilustração omitida) e ajusta a peça de música obtida como informação de saída. A unidade de geração de informação 22 emite a informação de saída do altofalante 18. O alto-falante 18 emite uma voz de acordo com a informação de saída.
[0045] A unidade de registro 24 registra informação de configuração com respeito a cada um dos vários passageiros de acordo com informação de operação aceita pela unidade de operação 14. A informação de configuração na modalidade é informação que foi determi
Petição 870190001417, de 07/01/2019, pág. 48/106
12/26 nada antecipadamente com respeito a cada um dos vários passageiros e informação sobre se ou não cada passageiro é um passageiro que é autorizado a realizar operação de condução do veículo. Na informação de configuração, a informação sobre se ou não o passageiro é um passageiro que é autorizado a realizar a operação de veículo que é diferente da operação de condução também é incluída. Especificamente, a unidade de registro 24 registra informação de voz de cada passageiro e informação de configuração indicando uma operação(s) que o passageiro é permitido realizar, baseado em uma expressão oral do passageiro obtida pela unidade de aquisição 20.
[0046] Por exemplo, um passageiro que está a bordo do veículo fala para o dispositivo de diálogo 10 e registra informação de voz de si próprio, como ilustrado na Figura 3.
[0047] Neste caso, um passageiro predeterminado, operando a unidade de operação 14 do dispositivo de diálogo 10, ajusta o dispositivo de diálogo 10 em um primeiro modo. No primeiro modo, informação de voz de um passageiro (daqui em diante, referido simplesmente como um primeiro passageiro) que é permitido realizar operação de condução do veículo é coletada. O primeiro passageiro que fala com o dispositivo de diálogo 10 quando o dispositivo de diálogo 10 é colocado no primeiro modo faz a informação de voz do primeiro passageiro ser coletada por meio do microfone de voz 12. A unidade de registro 24 registra a informação de voz do primeiro passageiro na unidade de armazenamento de informação de configuração 26, que será descrita posteriormente.
[0048] A seguir, é coletada a informação de voz de um passageiro que é permitido realizar a operação de veículo que é diferente da operação de condução. Exemplos de tal operação de veículo que é diferente da operação de condução incluem abrir uma janela do veículo. Com relação a uma operação de abrir uma janela, um passageiro que
Petição 870190001417, de 07/01/2019, pág. 49/106
13/26 não é o motorista pode algumas vezes ser permitido realizar a operação.
[0049] Assim, em um caso em que a operação de veículo que é diferente da operação de condução é permitida para outro passageiro que não é o motorista, o passageiro predeterminado, operando a unidade de operação 14 do dispositivo de diálogo 10, ajusta o dispositivo de diálogo 10 em um segundo modo. No segundo modo, é coletada a informação de voz de um passageiro (daqui em diante, simplesmente referido como um segundo passageiro) que não é autorizado a realizar a operação de condução do veículo e é permitido realizar a operação de veículo diferente da operação de condução do veículo.
[0050] O segundo passageiro que fala com o dispositivo de diálogo 10 quando o dispositivo de diálogo 10 é ajustado no segundo modo faz a informação de voz do segundo passageiro ser coletada por meio do microfone de voz 12. A unidade de registro 24 registra a informação de voz do segundo passageiro na unidade de armazenamento de informação de configuração 26, que será descrita posteriormente.
[0051] No entanto, algumas vezes é preferível restringir, por exemplo, uma operação de um passageiro criança abrindo uma janela embora a operação seja uma operação de veículo diferente da operação de condução. Assim, em um caso em que um passageiro que está, de preferência, impedido de realizar uma operação de veículo mesmo quando a operação do veículo é diferente da operação de condução está a bordo do veículo, o passageiro predeterminado, operando a unidade de operação 14 do dispositivo de diálogo 10, ajusta o dispositivo de diálogo 10 em um terceiro modo. No terceiro modo, é coletada a informação de voz de um passageiro (daqui em diante, simplesmente referido como um terceiro passageiro) que não é permitido realizar a operação de condução do veículo nem realizar a operação de veículo diferente da operação de condução de veículo.
Petição 870190001417, de 07/01/2019, pág. 50/106
14/26 [0052] O terceiro passageiro que fala com o dispositivo de diálogo 10 quando o dispositivo de diálogo 10 é ajustado no terceiro modo faz a informação de voz do terceiro passageiro ser coletada por meio do microfone de voz 12. A unidade de registro 24 registra a informação de voz do terceiro passageiro na unidade de armazenamento de informação de configuração 26, que será descrita posteriormente.
[0053] Na unidade de armazenamento de informação de configuração 26, a informação de configuração e a informação de voz de cada passageiro registradas pela unidade de registro 24 são armazenadas. A informação de configuração e a informação de voz de cada passageiro são, por exemplo, armazenadas em uma forma de uma tabela como ilustrado na Figura 4. Em cada registro na tabela ilustrada na Figura 4, uma ID representando informação de identificação de um passageiro, informação de voz do passageiro, e informação de configuração indicando o tipo(s) de operação que o passageiro é permitido realizar são armazenados em associação um com o outro. Como informação de voz de um passageiro, por exemplo, a informação de frequência de uma voz do passageiro é armazenada.
[0054] Por exemplo, referindo-se à tabela ilustrada na Figura 4, um passageiro com uma ID 00001 é permitido realizar operação de condução, operação de veículo diferente da operação de condução, e outra operação.
[0055] Um passageiro com uma ID 00002 é permitido realizar operação de veículo diferente da operação de condução e outra operação. Por exemplo, o passageiro com ID 00002 é permitido realizar uma operação de abrir e fechar uma janela do veículo e similar.
[0056] Passageiros com IDs 00003 e 00004 são permitidos realizar somente outra operação. Por exemplo, os passageiros com as IDs 00003 e 00004 são permitidos realizar uma operação de reproduzir música e similar como outra operação.
Petição 870190001417, de 07/01/2019, pág. 51/106
15/26 [0057] Em um caso em que uma expressão oral de um passageiro foi obtida pela unidade de aquisição 20, a unidade de reconhecimento 28 reconhece o passageiro que emitiu a expressão oral. Especificamente, a unidade de reconhecimento 28 reconhece que um de um primeiro passageiro, um segundo passageiro, e um terceiro passageiro, o passageiro que emitiu a expressão oral é baseada na expressão oral do passageiro obtida pela unidade de aquisição 20 e informação de voz armazenada na unidade de armazenamento de informação de configuração 26.
[0058] A unidade de controle 30 controla uma operação de condução do veículo indicada por uma expressão oral de um passageiro, baseada em um resultado de reconhecimento do passageiro obtido pela unidade de reconhecimento 28 e informação de configuração armazenada na unidade de armazenamento de informação de configuração 26.
[0059] Especificamente, em um caso em que um passageiro que emitiu uma expressão oral é um primeiro passageiro e um conteúdo de expressão oral é um conteúdo relacionado com a operação de condução do veículo, a unidade de controle 30 emite um sinal de controle que indica realizar a operação de condução de acordo com o conteúdo da expressão oral do primeiro passageiro.
[0060] Por exemplo, em um caso em que um passageiro que emitiu uma expressão oral é o passageiro com a ID 00001 como ilustrado na Figura 4 descrita acima, a unidade de controle 30 emite um sinal de controle que indica a realização de uma operação de condução de acordo com a expressão oral do passageiro.
[0061] Em um caso em que um passageiro que emitiu uma expressão oral é um segundo passageiro e um conteúdo da expressão oral é um conteúdo relacionado com a operação de condução do veículo, a unidade de controle 30 emite um sinal que indica impedir a
Petição 870190001417, de 07/01/2019, pág. 52/106
16/26 operação de condução de acordo com o conteúdo da expressão oral do passageiro.
[0062] Por exemplo, em um caso em que um passageiro que emitiu uma expressão oral é qualquer um dos passageiros com IDs 00002, 00003 e 00004, como ilustrado na Figura 4 descrita acima, a unidade de controle 30 emite um sinal de controle que indica impedir toda a operação de condução.
[0063] Em um caso em que um passageiro que emitiu uma expressão oral é um segundo passageiro e um conteúdo da expressão oral é um conteúdo relacionado a uma operação diferente da operação de condução do veículo, a unidade de controle 30 emite um sinal de controle que indica realizar a operação diferente da operação de condução do veículo de acordo com o conteúdo da expressão oral.
[0064] Por exemplo, em um caso em que um passageiro que emitiu uma expressão oral é o passageiro com a ID 00002, o passageiro, embora sendo um passageiro que não tem autorização para realizar a operação de condução do veículo, é um passageiro que está autorizado a realizar operação de veículo diferente da operação de condução do veículo, como ilustrado na Figura 4 descrita acima. Assim, em um caso em que o passageiro com a ID 00002 emitiu uma expressão oral Abrir a janela, a unidade de controle 30 emite um sinal de controle que indica uma operação de abrir uma janela, que é uma operação de veículo diferente da operação de condução. Em um caso em que o passageiro com a ID 00002 emitiu uma expressão oral Comutar uma condução automática e similar, no entanto, a unidade de controle 30 impede uma operação de condução instruída pela expressão oral.
[0065] Por exemplo, em um caso em que um passageiro que emitiu uma expressão oral é o passageiro com a ID 00003 ou o passageiro com a ID 00004, o passageiro, embora sendo um passageiro
Petição 870190001417, de 07/01/2019, pág. 53/106
17/26 que não é permitido realizar a operação de condução do veículo, é autorizado a realizar outra operação, como ilustrado na Figura 4 descrita acima. Assim, em um caso em que tanto o passageiro com a ID 00003 ou o passageiro com a ID 00004 emitiu uma expressão oral Reproduzir música, a unidade de controle 30 emite um sinal de controle que indica uma operação de reproduzir música, que é uma outra operação. Em um caso em que tanto o passageiro com a ID 00003 ou o passageiro com a ID 00004 emitiu uma expressão oral Comutar para condução automática, Abrir a janela, ou similar, no entanto, a unidade de controle 30 impede operações instruídas pelas expressões orais.
[0066] Se ou não um conteúdo de uma expressão oral é operação de condução do veículo é determinado antecipadamente, baseado em, por exemplo, informação de palavra como ilustrado na Figura 5. Por exemplo, em um caso em que uma palavra(s) condução automática, condução manual, freio ou similar é incluída em uma expressão oral, a unidade de controle 30 determina que a expressão oral é uma expressão oral relacionada com uma operação de condução do veículo. Em um caso em que uma palavra janela, assento ou similar é incluída em uma expressão oral, a unidade de controle 30 determina que a expressão oral é uma expressão oral relacionada com a operação de veículo diferente da operação de condução. Em um caso em que uma palavra(s) música, peça de música, tempo, ou similar, está incluída em uma expressão oral, a expressão oral é determinada para ser uma expressão oral relacionada com a operação diferente da operação de veículo.
[0067] A ECU montada no veículo obtém um sinal de controle emitido pela unidade de controle 30. A ECU controla o veículo de acordo com o sinal de controle emitido da unidade de controle 30.
[0068] O computador 16 no dispositivo de diálogo 10 pode, por
Petição 870190001417, de 07/01/2019, pág. 54/106
18/26 exemplo, ser obtido por uma configuração como ilustrado na Figura 6. O computador 16 inclui uma CPU 51, uma memória 52 como uma área de armazenamento temporária, e uma unidade de armazenamento não volátil 53. O computador 16 também inclui uma interface de entrada/saída (I/F) 54 na qual um dispositivo de entrada/saída e similar (ilustração omitida) são conectados e uma unidade de leitura/escrita (R/W) 55 que controla leituras e escritas de dados de e para um meio de registro 59. O computador 16 ainda inclui também uma rede I/F 56 que é conectada a uma rede, tal como a Internet. A CPU 51, a memória 52, a unidade de armazenamento 53, a entrada/saída I/F 54, a unidade R/W 55, e a rede I/F 56 são interconectadas por meio de um barramento 57.
[0069] A unidade de armazenamento 53 pode ser obtida por uma unidade de disco rígido (HDD), uma unidade de estado sólido (SSD), uma memória flash, ou similar. Na unidade de armazenamento 53 servindo como um meio de armazenamento, um programa para fazer o computador 16 funcionar é armazenado. A CPU 51 lê o programa da unidade de armazenamento 53, expande o programa na memória 52, e executa sucessivamente os processos que o programa inclui. Esta configuração permite que a CPU 51 no computador 16 funcione como cada uma da unidade de aquisição 20, a unidade de geração de informação 22, a unidade de registro 24, a unidade de armazenamento de informação de configuração 26, a unidade de reconhecimento 28, e a unidade de controle 30. A unidade de aquisição 20, a unidade de reconhecimento 28 e a unidade de controle 30 são exemplos respectivos de uma unidade de aquisição, uma unidade de reconhecimento e uma unidade de controle da presente invenção.
[0070] A seguir, a operação da modalidade será descrita.
[0071] Um passageiro predeterminado, operando a unidade de operação 14 do dispositivo de diálogo 10, ajusta o dispositivo de diálo
Petição 870190001417, de 07/01/2019, pág. 55/106
19/26 go 10 em cada modo. A unidade de registro 24 registra informação de voz de um primeiro passageiro, informação de um segundo passageiro(s), e informação de voz de um terceiro passageiro(s) na unidade de armazenamento de informação de configuração 26. Esta operação faz a informação de voz e informação de configuração de cada passageiro para ser armazenada na unidade de armazenamento de informação de configuração 26.
[0072] A seguir, quando o dispositivo de diálogo 10 é colocado em um veículo, a unidade de controle 30 no dispositivo de diálogo 10 detecta que o dispositivo de diálogo 10 está dentro do veículo. A unidade de controle 30 no dispositivo de diálogo 10 ajusta o dispositivo de diálogo 10 no modo de condução. Esta operação permite que a operação de condução do veículo seja realizada de acordo com uma expressão oral emitida por um motorista que foi registrada antecipadamente. Com relação a um passageiro que não é o motorista, uma operação que foi determinada antecipadamente é permitida de acordo com uma expressão oral emitida pelo passageiro.
[0073] Quando, depois que o deslocamento do veículo se iniciou, um passageiro no veículo fala para o dispositivo de diálogo 10, é executada uma rotina de processamento de operação de condução ilustrada na Figura 7.
[0074] Na etapa S100, a unidade de aquisição 20 obtém uma expressão oral detectada pelo microfone de voz 12.
[0075] Na etapa S120, a unidade de reconhecimento 28 reconhece que um de um primeiro passageiro, um segundo passageiro, e um terceiro passageiro, o passageiro que emitiu a expressão oral é baseada na expressão oral emitida pelo passageiro obtida na etapa S100 acima, e informação de voz armazenada na unidade de armazenamento de informação de configuração 26.
[0076] Na etapa S104, a unidade de controle 30 determina se ou
Petição 870190001417, de 07/01/2019, pág. 56/106
20/26 não um conteúdo da expressão oral obtida na etapa acima S100 é um conteúdo relacionado com a operação de condução do veículo. Por exemplo, o conteúdo da expressão oral é determinado dependendo de ser ou não qualquer palavra ilustrada na Figura 5 descrita acima é incluída na expressão oral. Em um caso em que o conteúdo da expressão oral obtida na etapa acima S100 é um conteúdo relacionado com a operação de condução do veículo, o processo prossegue para a etapa S106. Em um caso em que o conteúdo da expressão oral obtida na etapa acima S100 é um conteúdo relacionado com uma operação diferente da operação de condução do veículo, o processo prossegue para a etapa S108.
[0077] Na etapa S106, a unidade de controle 30 determina se ou não o passageiro que emitiu a expressão oral obtida na etapa acima S100 é um primeiro passageiro. Em um caso em que o passageiro que emitiu a expressão oral obtida na etapa acima S100 é um primeiro passageiro, o processo prossegue para a etapa S112. Em um caso em que o passageiro que emitiu a expressão oral obtida na etapa acima S100 não é um primeiro passageiro, o processo prossegue para a etapa S108. Esta operação faz a operação de condução do veículo ser impedida baseada em um resultado de reconhecimento de um passageiro.
[0078] Na etapa S108, a unidade de controle 30 determina se ou não o passageiro que emitiu a expressão oral obtida na etapa acima S100 é um segundo passageiro. Em um caso em que o passageiro que emitiu a expressão oral obtida na etapa S100 acima é um segundo passageiro, o processo prossegue para a etapa S110. Em um caso em que o passageiro que emitiu a expressão oral obtida na etapa S100 acima não é um segundo passageiro, o processo prossegue para a etapa S116. Esta operação faz a operação de veículo diferente da operação de condução do veículo ser impedida baseada em um resultado de reconhecimento de um passageiro.
Petição 870190001417, de 07/01/2019, pág. 57/106
21/26 [0079] Na etapa S110, a unidade de controle 30 determina se ou não um conteúdo da expressão oral obtida na etapa acima S100 é um conteúdo relacionado com a operação de veículo diferente da operação de condução do veículo. Em um caso em que o conteúdo da expressão oral obtida na etapa S100 acima é um conteúdo relacionado com a operação do veículo diferente da operação de condução do veículo, o processo prossegue para a etapa S114. Em um caso em que o conteúdo da expressão oral obtida na etapa acima S100 é um conteúdo relacionado a uma operação diferente da operação de condução do veículo e relacionado com outra operação, o processo prossegue para a etapa S116.
[0080] Na etapa S112, a unidade de controle 30 emite um sinal de controle que indica realizar a operação de condução de acordo com um conteúdo da expressão oral obtida na etapa acima S100 e termina a rotina de processamento de operação de condução. Por exemplo, em um caso em que o conteúdo da expressão oral é Comutar para condução automática, um sinal de controle de acordo com o conteúdo é emitido.
[0081] Na etapa S114, a unidade de controle 30 emite um sinal de controle que indica realizar a operação de veículo diferente da operação de condução do veículo de acordo com o conteúdo da expressão oral obtida na etapa S100 acima. Por exemplo, um sinal de controle indicando um conteúdo de uma expressão Abrir a janela é emitido.
[0082] Na etapa S116, a unidade de controle 30 emite um sinal de controle que indica realizar outra operação de acordo com um conteúdo da expressão oral obtida na etapa S100 acima. Por exemplo, um sinal de controle indicando um conteúdo de uma expressão oral Reproduzir música é emitido.
[0083] Como descrito até agora, o dispositivo de diálogo de acordo com a primeira modalidade reconhece um passageiro de acordo com
Petição 870190001417, de 07/01/2019, pág. 58/106
22/26 uma expressão oral emitida pelo passageiro e, baseado em um resultado de reconhecimento do passageiro, impede a operação de condução do veículo indicado pela expressão oral do passageiro. Esta configuração permite que a operação de condução do veículo seja realizada apropriadamente mesmo em um caso em que vários passageiros estão a bordo do veículo, quando a operação de condução do veículo é realizada de acordo com uma expressão oral emitida por um passageiro.
[0084] O dispositivo de diálogo de acordo com a primeira modalidade emite um sinal de controle que indica realizar a operação de condução de acordo com um conteúdo de uma expressão oral emitida por um passageiro em um caso em que, baseado em um resultado de reconhecimento do passageiro e informação de configuração tendo sido determinado antecipadamente, o passageiro que emitiu a expressão oral é um primeiro passageiro que é permitido realizar operação de condução do veículo e o conteúdo da expressão oral é um conteúdo relacionado à operação de condução do veículo. Esta configuração permite operação de condução de acordo com um conteúdo de uma expressão oral que o motorista emitiu seja realizada.
[0085] O dispositivo de diálogo emite um sinal de controle que indica impedir a operação de condução de acordo com um conteúdo de uma expressão oral emitida por um passageiro em um caso em que o passageiro que emitiu a expressão oral é um passageiro que não é permitida realizar a operação de condução do veículo e o conteúdo da expressão oral é um conteúdo relacionado com a operação de condução do veículo. Esta configuração permite que a operação de condução do veículo seja impedida apropriadamente mesmo em um caso em que uma expressão oral tendo um conteúdo relacionado à operação de condução foi emitida por um passageiro que não é o motorista.
Petição 870190001417, de 07/01/2019, pág. 59/106
23/26 [0086] O dispositivo de diálogo emite um sinal de controle que indica realizar uma operação diferente da operação de condução do veículo em um caso em que um passageiro que emitiu uma expressão oral é um segundo passageiro ou um terceiro passageiro e um conteúdo da expressão oral é um conteúdo relacionado com uma operação diferente da operação de condução do veículo. Esta configuração permite que uma operação diferente da operação de condução do veículo seja realizada de acordo com um conteúdo de uma expressão oral emitida por um passageiro à medida que o conteúdo da expressão oral é um conteúdo relacionado com uma operação diferente da operação de condução do veículo mesmo em um caso em que o passageiro que emitiu a expressão oral é um segundo passageiro ou um terceiro passageiro.
Segunda Modalidade [0087] A seguir, um dispositivo de diálogo de acordo com uma segunda modalidade será descrito. Os mesmos sinais são atribuídos aos mesmos componentes constituintes como aqueles na primeira modalidade, e uma descrição dos mesmos será omitida.
[0088] O dispositivo de diálogo da segunda modalidade é o mesmo que o dispositivo de diálogo da primeira modalidade exceto que o dispositivo de diálogo da segunda modalidade emite um sinal de controle quer indica realizar a operação de condução de acordo com uma expressão oral emitida por um motorista que é um passageiro realizando uma operação de direção de um veículo.
[0089] A Figura 8 é um diagrama de bloco ilustrando um exemplo de uma configuração de um dispositivo de diálogo 210 de acordo com a segunda modalidade. Como ilustrado na Figura 8, o dispositivo de diálogo 210 inclui um microfone de voz 12, um microfone de motorista 212, uma unidade de operação 14 e um computador 216.
[0090] O microfone de motorista 212 é instalado em uma vizinhan
Petição 870190001417, de 07/01/2019, pág. 60/106
24/26 ça de um motorista A que é um passageiro realizando uma operação de direção, como ilustrado na Figura 9. O microfone de motorista 212 obtém sucessivamente expressões orais emitidas pelo motorista A. [0091] O computador 216 é configurado incluindo uma CPU, uma ROM armazenando um programa e similar para obter rotinas de processamento respectivas, uma RAM armazenando dados temporariamente, uma memória servindo como uma unidade de armazenamento, uma interface de rede, e similar. O computador 216 inclui funcionalmente uma unidade de aquisição 220, uma unidade de registro 224, uma unidade de armazenamento de informação de configuração 26, uma unidade de reconhecimento 228, e uma unidade de controle 230. O microfone de motorista 212 e o computador 216, por exemplo, são interconectados usando uma unidade de comunicação predeterminada.
[0092] A unidade de aquisição 220 obtém sucessivamente expressões orais dos passageiros obtidas pelo microfone de voz 12. A unidade de aquisição 220 também obtém sucessivamente expressões orais do motorista obtidas pelo microfone do motorista 212.
[0093] A unidade de registro 224 registra informação de voz de uma expressão oral do motorista obtida pelo microfone de motorista 212 na unidade de armazenamento de informação de configuração 26 como informação de voz de um primeiro passageiro.
[0094] A unidade de reconhecimento 228 reconhece se ou não um passageiro que emitiu uma expressão oral é o motorista. Especificamente, a unidade de reconhecimento 228 reconhece que uma expressão oral obtida pelo microfone de motorista 212 é uma expressão oral emitida pelo motorista. Alternativamente, a unidade de reconhecimento 228 reconhece se ou não um passageiro que emitiu uma expressão oral obtida pelo microfone de voz 12 é o motorista, baseado na expressão oral obtida pela unidade de aquisição 220 e informação de voz do primeiro passageiro armazenada na unidade de registro 224.
Petição 870190001417, de 07/01/2019, pág. 61/106
25/26 [0095] Em um caso em que, baseado em um resultado de reconhecimento obtido pela unidade de reconhecimento 228, um passageiro que emitiu uma expressão oral obtida pela unidade de aquisição 220 é determinado para ser o motorista, a unidade de controle 230 emite um sinal de controle que indica realizar a operação de condução do veículo de acordo com um conteúdo da expressão oral.
[0096] Haja vista que outros componentes e operação do dispositivo de diálogo 210 de acordo com a segunda modalidade são os mesmos que aqueles da primeira modalidade, uma descrição dos mesmos será omitida.
[0097] Como descrito até agora, de acordo com o dispositivo de diálogo 210 de acordo com a segunda modalidade, o dispositivo de diálogo 210 reconhece se ou não um passageiro que emitiu uma expressão oral é o motorista que realiza a operação de direção do veículo e emite um sinal de controle que indica realizar a operação de condução de acordo com um conteúdo da expressão oral do motorista. Esta configuração permite que a operação de condução do veículo seja realizada somente de acordo com uma expressão oral emitida pelo motorista.
[0098] Embora o processamento realizado pelo dispositivo de diálogo nas modalidades descritas acima foi descrito como processamento de software realizado executando um programa, o processamento pode ser configurado para ser realizado por hardware. Alternativamente, o processamento pode ser configurado para ser realizado por uma combinação de software e hardware. O programa a ser armazenado na ROM pode ser distribuído armazenado em vários tipos de meio de armazenamento.
[0099] A presente invenção não é limitada às modalidades acima, e é desnecessário dizer que várias modificações diferentes daquelas descritas acima podem ser feitas e implementadas sem se afastar do assunto da presente invenção.
Petição 870190001417, de 07/01/2019, pág. 62/106
26/26 [00100] Por exemplo, cada um dos dispositivos de diálogo, nas modalidades descritas acima, pode ser obtido por um terminal móvel e similar. Neste caso, a operação de condução e similar de acordo com uma expressão oral emitida por um passageiro é realizada baseada em uma função de diálogo do terminal móvel.
[00101] Embora nas modalidades descritas acima a descrição tenha sido feita usando, como um exemplo, um caso em que a unidade de controle 30 emite um sinal de controle que indica impedir a operação de condução de acordo com um conteúdo de uma expressão oral emitida por um passageiro em um caso em que o passageiro que emitiu a expressão oral é um passageiro que não está autorizado a realizar a operação de condução do veículo, e o conteúdo da expressão oral é um conteúdo relacionado à operação de condução do veículo, a presente invenção não é limitada ao caso. Por exemplo, a unidade de controle 30 pode ser configurada para, sem emitir um sinal de controle, impedir a operação de condução de acordo com uma expressão oral por um passageiro que não é permitido realizar a operação de condução do veículo. Neste caso, a unidade de controle 30 emite um sinal de controle somente em um caso em que o passageiro que emitiu a expressão oral é um passageiro que é permitido realizar a operação de condução do veículo e um conteúdo da expressão oral é um conteúdo relacionado com a operação de condução do veículo. A unidade de controle 30 não emite um sinal de controle, desse modo impedindo a operação de condução em um caso em que o passageiro que emitiu a expressão oral é um passageiro que não é permitido realizar a operação de condução do veículo e um conteúdo da expressão oral é um conteúdo relacionando com a operação de condução do veículo.

Claims (8)

  1. REIVINDICAÇÕES
    1. Dispositivo de processamento de informação, caracterizado pelo fato de que compreende:
    uma unidade de aquisição que obtém expressões orais de vários passageiros que estão a bordo de um veículo;
    uma unidade de reconhecimento que, em um caso em que uma expressão oral é obtida pela de unidade de aquisição, reconhece um dos passageiros que emitiu a expressão oral; e uma unidade de controle que controla a operação de condução do veículo indicada pela expressão oral do passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral, e informação de configuração que é a informação tendo sido determinada antecipadamente com respeito a cada um dos vários passageiros e que é informação sobre se ou não o passageiro é um passageiro que está autorizado a realizar a operação de condução do veículo.
  2. 2. Dispositivo de processamento de informação, de acordo com a reivindicação 1, caracterizado pelo fato de que:
    a unidade de controle, baseada em um resultado de reconhecimento dos passageiros obtido pela unidade de reconhecimento e informação de configuração, emite um primeiro sinal de controle que indica realizar a operação de condução do veículo de acordo com o conteúdo de uma expressão oral emitida por um primeiro passageiro, no caso em que o primeiro passageiro que é reconhecido por ter emitido a expressão oral é um passageiro que é permitido realizar a operação de condução e o conteúdo da expressão oral emitida do primeiro passageiro se refere à operação de condução, e emite um segundo sinal de controle que indica impedir a operação de condução do veículo de acordo com um conteúdo de uma
    Petição 870190001417, de 07/01/2019, pág. 64/106
    2/4 expressão oral emitida de um segundo passageiro, em um caso em que o segundo passageiro que é reconhecido ter emitido a expressão oral é um passageiro que não é permitido realizar a operação de condução e o conteúdo da expressão oral emitida do segundo passageiro se refere à operação de condução.
  3. 3. Dispositivo de processamento de informação, de acordo com a reivindicação 2, caracterizado pelo fato de que:
    a informação de configuração ainda inclui informação sobre se ou não o passageiro é um passageiro que está autorizado a realizar a operação do veículo que é diferente da operação de condução, e a unidade de controle, baseada em um resultado de reconhecimento do passageiro obtido pela informação de reconhecimento e a de configuração, emite um terceiro sinal de controle que indica realizar a operação de veículo diferente da operação de condução do veículo de acordo com um conteúdo de uma expressão oral emitida por um terceiro passageiro, em um caso em que o terceiro passageiro que é reconhecido por ter emitido a expressão oral é um passageiro que não está autorizado a realizar a operação de condução do veículo e é um passageiro que está permitido a realizar a operação de veículo diferente da operação de condução do veículo, e o conteúdo da expressão oral emitida pelo terceiro passageiro se refere à operação de veículo diferente da operação de condução do veículo.
  4. 4. Dispositivo de processamento de informação, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que:
    a unidade de controle configura o dispositivo de processamento de informação em um estado em que a operação de condução pode ser realizada de acordo com uma expressão oral do passageiro no caso em que uma posição do dispositivo de processamento de informação está dentro do veículo.
    Petição 870190001417, de 07/01/2019, pág. 65/106
    3/4
  5. 5. Dispositivo de processamento de informação, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que:
    a unidade de reconhecimento reconhece se ou não o passageiro que emitiu a expressão oral é um motorista, e a unidade de controle emite um quarto sinal de controle que indica realizar a operação de condução de acordo com um conteúdo da expressão oral do motorista.
  6. 6. Dispositivo de processamento de informação, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que:
    o dispositivo de processamento de informação é um dispositivo de diálogo que realiza um diálogo com os passageiros.
  7. 7. Meio de armazenamento não transitório armazenando um programa que faz um computador executar processamento, caracterizado pelo fato de que compreende:
    obter expressões orais de vários passageiros que estão a bordo de um veículo;
    em um caso em que uma expressão oral é obtida, reconhecer um dos passageiros que emitiu a expressão oral; e controlar a operação de condução do veículo indicada pela expressão oral do passageiro, baseada em um resultado de reconhecimento do passageiro que emitiu a expressão oral, e informação de configuração que é a informação tendo sido determinada antecipadamente com respeito a cada um dos vários passageiros e que é a informação sobre se ou não o passageiro é um passageiro que é permitido realizar a operação de condução do veículo.
  8. 8. Método de processamento de informação, caracterizado pelo fato de que compreende:
    em um caso em que uma expressão oral emitida por um de
    Petição 870190001417, de 07/01/2019, pág. 66/106
    4/4 vários passageiros que estão a bordo de um veículo é obtido, reconhecendo o passageiro que emitiu a expressão oral; e controlar a operação de condução do veículo indicada pela expressão oral do passageiro, baseado em um resultado de reconhecimento do passageiro que emitiu a expressão oral, e informação de configuração que é informação que foi determinada antecipadamente com respeito a cada um dos vários passageiros e que é informação sobre se ou não o passageiro é um passageiro que está autorizado a realizar a operação de condução do veículo.
BR102019000231-0A 2018-01-11 2019-01-07 Dispositivo de processamento de informação, método, e meio de armazenamento de programa BR102019000231A2 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-002759 2018-01-11
JP2018002759A JP7069730B2 (ja) 2018-01-11 2018-01-11 情報処理装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
BR102019000231A2 true BR102019000231A2 (pt) 2019-07-30

Family

ID=64949196

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102019000231-0A BR102019000231A2 (pt) 2018-01-11 2019-01-07 Dispositivo de processamento de informação, método, e meio de armazenamento de programa

Country Status (8)

Country Link
US (1) US20190214008A1 (pt)
EP (1) EP3511932B1 (pt)
JP (1) JP7069730B2 (pt)
KR (1) KR20190085856A (pt)
CN (1) CN110027491A (pt)
BR (1) BR102019000231A2 (pt)
RU (1) RU2714611C1 (pt)
SG (1) SG10201811716XA (pt)

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3446805B2 (ja) * 1997-08-18 2003-09-16 本田技研工業株式会社 車両用音声入力装置
JP2001125591A (ja) 1999-10-27 2001-05-11 Fujitsu Ten Ltd 音声対話システム
JP4755556B2 (ja) * 2006-09-04 2011-08-24 クラリオン株式会社 車載装置
US20090055178A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method of controlling personalized settings in a vehicle
JP2009056890A (ja) 2007-08-30 2009-03-19 Toyota Motor Corp 操舵制御装置
ATE456490T1 (de) 2007-10-01 2010-02-15 Harman Becker Automotive Sys Sprachgesteuerte einstellung von fahrzeugteilen
CN102763002A (zh) * 2009-08-05 2012-10-31 福特全球技术公司 用于将车辆信息发送到乘员通信装置的***和方法
JP2011065587A (ja) * 2009-09-18 2011-03-31 Advantest Corp 処理システムおよび試験装置
US9348492B1 (en) * 2011-04-22 2016-05-24 Angel A. Penilla Methods and systems for providing access to specific vehicle controls, functions, environment and applications to guests/passengers via personal mobile devices
KR101974136B1 (ko) * 2012-09-10 2019-04-30 삼성전자주식회사 차량의 정보를 처리하는 시스템 및 방법
US9747898B2 (en) * 2013-03-15 2017-08-29 Honda Motor Co., Ltd. Interpretation of ambiguous vehicle instructions
US9275208B2 (en) * 2013-03-18 2016-03-01 Ford Global Technologies, Llc System for vehicular biometric access and personalization
JP2015074315A (ja) 2013-10-08 2015-04-20 株式会社オートネットワーク技術研究所 車載中継装置及び車載通信システム
KR101513643B1 (ko) * 2014-05-26 2015-04-22 엘지전자 주식회사 정보 제공 장치 및 그 방법
JP6348831B2 (ja) * 2014-12-12 2018-06-27 クラリオン株式会社 音声入力補助装置、音声入力補助システムおよび音声入力方法
US20170221480A1 (en) * 2016-01-29 2017-08-03 GM Global Technology Operations LLC Speech recognition systems and methods for automated driving
US20190057703A1 (en) * 2016-02-29 2019-02-21 Faraday&Future Inc. Voice assistance system for devices of an ecosystem
CN106373568A (zh) * 2016-08-30 2017-02-01 深圳市元征科技股份有限公司 智能车载单元控制方法和装置
CN106683673B (zh) * 2016-12-30 2020-11-13 智车优行科技(北京)有限公司 驾驶模式的调整方法、装置和***、车辆

Also Published As

Publication number Publication date
JP7069730B2 (ja) 2022-05-18
KR20190085856A (ko) 2019-07-19
SG10201811716XA (en) 2019-08-27
JP2019120904A (ja) 2019-07-22
EP3511932A1 (en) 2019-07-17
EP3511932B1 (en) 2020-05-27
CN110027491A (zh) 2019-07-19
RU2714611C1 (ru) 2020-02-18
US20190214008A1 (en) 2019-07-11

Similar Documents

Publication Publication Date Title
US12039481B2 (en) Interactive test method, device and system
EP2963644A1 (en) Audio command intent determination system and method
DE112016006496T5 (de) Stimmerkennungsvorrichtung
US6397181B1 (en) Method and apparatus for voice annotation and retrieval of multimedia data
US20080201135A1 (en) Spoken Dialog System and Method
US20100185445A1 (en) Machine, system and method for user-guided teaching and modifying of voice commands and actions executed by a conversational learning system
US10950229B2 (en) Configurable speech interface for vehicle infotainment systems
BR112016020402B1 (pt) Método para definir cenário de utilização interno de veículo, dispositivo montado em veículo, e dispositivo de rede
CN109669663A (zh) 音区幅值获取方法、装置、电子设备及存储介质
CN104200805A (zh) 汽车驾驶员语音助手
WO2018072327A1 (zh) 防止语音命令误识别的方法和装置
CN105161096B (zh) 基于垃圾模型的语音识别处理方法及装置
CN106463115B (zh) 借助于语音输入能够控制的、具有功能装置和多个语音识别模块的辅助***
JP2020086571A (ja) 車載装置及び音声認識方法
US20080140928A1 (en) Apparatus and method for performing a plurality of storage devices
BR102019000231A2 (pt) Dispositivo de processamento de informação, método, e meio de armazenamento de programa
CN113643704A (zh) 车机语音***的测试方法、上位机、***和存储介质
US20020087324A1 (en) Voice recognition method and device
CN110188327B (zh) 文本去口语化方法及装置
US20040258392A1 (en) Information processing apparatus for detecting inter-track boundaries
JP4770374B2 (ja) 音声認識装置
US9978399B2 (en) Method and apparatus for tuning speech recognition systems to accommodate ambient noise
US20070005361A1 (en) Process and device for interaction with a speech recognition system for selection of elements from lists
CN110377811A (zh) 一种设备名称的显示方法、装置、存储介质及电子设备
KR101795361B1 (ko) 히터유닛검사장치 및 그 동작 방법

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]
B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements