DE112016007158T5 - Spracherkennungsvorrichtung und Spracherkennungsverfahren - Google Patents

Spracherkennungsvorrichtung und Spracherkennungsverfahren Download PDF

Info

Publication number
DE112016007158T5
DE112016007158T5 DE112016007158.2T DE112016007158T DE112016007158T5 DE 112016007158 T5 DE112016007158 T5 DE 112016007158T5 DE 112016007158 T DE112016007158 T DE 112016007158T DE 112016007158 T5 DE112016007158 T5 DE 112016007158T5
Authority
DE
Germany
Prior art keywords
search function
estimation
execution
search
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112016007158.2T
Other languages
English (en)
Other versions
DE112016007158B4 (de
Inventor
Keita Yamamuro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112016007158T5 publication Critical patent/DE112016007158T5/de
Application granted granted Critical
Publication of DE112016007158B4 publication Critical patent/DE112016007158B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Es wird eine Technik zur Vermeidung einer fehlerhaften Ausführung einer Suchfunktion bereitgestellt, die nicht von einem Benutzer beabsichtigt ist. Eine Spracherkennungsvorrichtung beinhaltet eine Erfassungseinheit, eine Schätzeinheit, einen Ausführungshäufigkeitsspeicher und eine Steuerung. Die Erfassungseinheit erfasst eine Stimme. Die Schätzeinheit schätzt eine zu auszuführende Suchfunktion durch Erkennen der durch die Erfassungseinheit erfassten Stimme. Der Ausführungshäufigkeitsspeicher speichert die Ausführungshäufigkeit der Suchfunktion. Die Steuerung nimmt Bezug auf die Ausführungshäufigkeit einer Schätzsuchfunktion und steuert dann die Ausführung der Schätzsuchfunktion. Die Schätzsuchfunktion ist die durch die Schätzeinheit geschätzte Suchfunktion.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft Spracherkennungsvorrichtungen, die Stimmen erkennen, und Spracherkennungsverfahren.
  • Hintergrund
  • Verschiedene Techniken wurden kürzlich vorgestellt, die Spracherkennungsvorrichtungen betreffen, die in Vorrichtungen installiert werden, wie zum Beispiel Autonavigationsvorrichtungen und Smartphones. Die Technik, die in Patentschrift 1 offenbart ist, erzielt zum Beispiel eine hochpräzise Spracherkennung mit Hilfe der Bewertungen von Spracherkennungsergebnissen.
  • Neben einer solchen Technik wurde eine Spracherkennungsvorrichtung vorgestellt, die eine Absicht eines Benutzers von einem Sprachinhalt schätzt. Diese Art von Spracherkennungsvorrichtung wählt, durch einmalige Spracherkennung, eine von einer Vielzahl von Suchfunktionen aus, wie zum Beispiel eine Routensuchfunktion, eine Musiksuchfunktion, und eine Einrichtungssuchfunktion, und führt dann die ausgewählte Suchfunktion aus, um nach einem gewünschten Zielobjekt zu suchen. Nachdem zum Beispiel die Stimme eines Benutzers „Ich will zum Baseballstadion X gehen“ empfangen worden ist, schätzt die Spracherkennungsvorrichtung, dass die „Routensuchfunktion“ angefordert wird, von der Sprachformulierung „will gehen“, und bestimmt, dass „Baseballstadion X“ der Zielort in der Routensuchfunktion ist.
  • Stand der Technik
  • Patentschriften
  • Patentschrift 1: Japanische Patentanmeldung mit der Offenlegungsnummer 2003-15688
  • Zusammenfassung
  • Das von der Erfindung zu lösende Problem
  • Die oben genannte Spracherkennungsvorrichtung, die eine Absicht eines Benutzers schätzt, reduziert die Anzahl von Interaktionen zwischen dem Benutzer und der Spracherkennungsvorrichtung. Die Spracherkennungsvorrichtung benötigt jedoch aufwändige Verarbeitung, wie zum Beispiel Spracherkennung und Schätzung der Benutzerabsichten basierend auf nur mehreren Malen von der Stimme des Benutzers, und Informationssuche basierend auf Erkennungsergebnissen und Absichtenschätzergebnissen. Die Spracherkennungsvorrichtung führt infolgedessen oft fälschlicherweise eine Suchfunktion aus, die nicht von dem Benutzer beabsichtigt ist. Als Beispiel ist die japanische Sprache zu nehmen. Die Formulierung „wollen gehen (in japanischer Romanisierung, ikitai)“ und die Formulierung „wollen hören (in japanischer Romanisierung, kikitai)“ hören sich ähnlich an. Falls der Benutzer in Japanisch „Ich will zum Baseballstadion X gehen“ sagt, kann die oben genannte Spracherkennungsvorrichtung Suchresultate über Baseballstadion X, die von der ausgeführten Routensuchfunktion erhalten worden sind, und Suchresultate über Baseballstadion X bereitstellen, die von der ausgeführten Musiksuchfunktion erhalten worden sind. Die Spracherkennungsvorrichtung führt infolgedessen auch eine Suchfunktion aus, die nicht vom Benutzer beabsichtigt ist. Obwohl die Bewertungen von Spracherkennungsergebnissen falsche Suchergebnisse während der Ausführung einer Suchfunktion reduzieren können, sind solche Bewertungen nicht für eine Bestimmung beabsichtigt, auf der eine Suchfunktion ausgeführt werden soll.
  • Um das oben genannte Problem zu lösen, ist es ein Ziel der vorliegenden Erfindung eine Technik zum Vermeiden von falschen Ausführungen einer Suchfunktion bereitzustellen, die nicht von einem Benutzer beabsichtigt ist.
  • Mittel zum Lösen des Problems
  • Eine Spracherkennungsvorrichtung gemäß der vorliegenden Erfindung beinhaltet das Folgende: eine Erfassungseinheit, die eine Stimme erfasst; eine Schätzeinheit, die eine auszuführende Suchfunktion schätzt, durch Erkennen der durch die Erfassungseinheit erfassten Stimme; einen Ausführungshäufigkeitsspeicher, der eine Ausführungshäufigkeit der Suchfunktion speichert; und eine Steuerung, die auf die Ausführungshäufigkeit einer Schätzsuchfunktion Bezug nimmt, und dann die Ausführung der Schätzsuchfunktion steuert, wobei die Schätzsuchfunktion die durch die Schätzeinheit geschätzte Suchfunktion ist.
  • Auswirkungen der Erfindung
  • Die Spracherkennungsvorrichtung in der vorliegenden Erfindung nimmt Bezug auf die Ausführungshäufigkeit der Schätzsuchfunktion und steuert dann die Ausführung der Schätzsuchfunktion. Das verhindert das falsche Ausführen der Suchfunktion, die nicht vom Benutzer beabsichtigt ist.
  • Diese und andere Ziele, Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden aus der folgenden, detaillierten Beschreibung der vorliegenden Erfindung in Verbindung mit den beiliegenden Zeichnungen offensichtlicher.
  • Figurenliste
    • 1 ist ein Blockdiagramm der Konfiguration einer Spracherkennungsvorrichtung gemäß einer ersten Ausführungsform.
    • 2 ist ein Blockdiagramm der Konfiguration einer Spracherkennungsvorrichtung gemäß einer zweiten Ausführungsform.
    • 3 ist ein Flussdiagramm, das einen Vorgang in der Spracherkennungsvorrichtung gemäß der zweiten Ausführungsform zeigt.
    • 4 ist ein Blockdiagramm der Konfiguration einer Spracherkennungsvorrichtung gemäß einer dritten Ausführungsform.
    • 5 ist ein Flussdiagramm, das einen Vorgang in der Spracherkennungsvorrichtung gemäß der dritten Ausführungsform zeigt.
    • 6 ist ein Flussdiagramm, das einen Vorgang in der Spracherkennungsvorrichtung gemäß der dritten Ausführungsform zeigt.
    • 7 ist ein Diagramm, das ein Anzeige-Beispiel in einer Spracherkennungsvorrichtung gemäß einer vierten Ausführungsform darstellt.
    • 8 ist ein Diagramm, das ein Anzeige-Beispiel in der Spracherkennungsvorrichtung gemäß der vierten Ausführungsform darstellt.
    • 9 ist ein Flussdiagramm, das den Vorgang in der Spracherkennungsvorrichtung gemäß der vierten Ausführungsform zeigt.
    • 10 ist ein Blockdiagramm der Hardware-Konfiguration einer Spracherkennungsvorrichtung gemäß einer anderen Modifikation.
    • 11 ist ein Blockdiagramm der Hardware-Konfiguration einer Spracherkennungsvorrichtung gemäß einer anderen Modifikation.
    • 12 ist ein Blockdiagramm der Konfiguration eines Servers gemäß einer anderen Modifikation.
    • 13 ist ein Blockdiagramm der Konfiguration eines Kommunikationsterminals gemäß einer anderen Modifikation.
  • Beschreibung der Ausführungsform(en)
  • <Erste Ausführungsform>
  • 1 ist ein Blockdiagramm der Konfiguration einer Spracherkennungsvorrichtung 1 gemäß einer ersten Ausführungsform. Die Spracherkennungsvorrichtung 1 in 1 ist in der Lage, eine Ausführung einer Suchfunktion, die durch eine Ausführungseinheit 18 durchgeführt wird, zu steuern. Es ist anzumerken, dass sich die Ausführungseinheit 18 außerhalb oder innerhalb der Spracherkennungsvorrichtung 1 befinden kann.
  • Wie aus der folgenden Beschreibung ersichtlich ist, ist die Spracherkennungsvorrichtung 1 gemäß der ersten Ausführungsform in der Lage zu verhindern, dass die Ausführungseinheit 18 eine Suchfunktion falsch ausführt, die nicht von einem Benutzer vorgesehen ist. Eine Suchfunktion ist hier eine Funktion zum Suchen nach einem Zielobjekt, das über einen vorgegebenen Gegenstand angewiesen worden ist. Beispiele der Suchfunktion beinhalten eine Routensuchfunktion zum Suchen nach einer Route zu einem angewiesenen Zielort, eine Musiksuchfunktion zum Suchen nach einem angewiesenen Musikstück, eine Einrichtungssuchfunktion zum Suchen nach einer angewiesenen Einrichtung, und eine Websuchfunktion zum Suchen im Web für ein angewiesenes Objekt.
  • Zurück zu 1, die Spracherkennungsvorrichtung 1 beinhaltet eine Erfassungseinheit 11, eine Schätzeinheit 12, einen Ausführungshäufigkeitsspeicher 13 und eine Steuerung 14. Im Folgenden werden die Komponenten der Spracherkennungsvorrichtung 1 im Detail beschrieben.
  • Die Erfassungseinheit 11 erfasst eine Stimme.
  • Die Schätzeinheit 12 schätzt eine auszuführende Suchfunktion aus einer Vielzahl von vorgegebenen Suchfunktionen durch Erkennen der durch die Erfassungseinheit 11 erfassten Stimme.
  • Es ist anzumerken, dass, wenn der Inhalt der durch die Erfassungseinheit 11 erfassten Sprache die Suchfunktion nicht wortwörtlich enthält, die Schätzeinheit 12 zum Verarbeiten einer Absichtenschätzung zum Schätzen einer Suchfunktion, die vom Benutzer beabsichtigt ist, von dem Inhalt der Sprache in der Lage sein kann. Der Inhalt der Sprache, die von der Erfassungseinheit 11 erfasst wird, kann darauf hinweisen, dass der Benutzer zum Baseballstadion X gehen will. Die Schätzeinheit 12 ist dann in der Lage zu schätzen, dass eine „Routensuchfunktion“ die auszuführende Suchfunktion ist, und zu schätzen, dass Baseballstadion X der Zielort ist, der in der Routensuchfunktion angewiesen wird.
  • Der Ausführungshäufigkeitsspeicher 13 speichert die Ausführungshäufigkeit jeder Suchfunktion. Das heißt, dass der Ausführungshäufigkeitsspeicher 13 die Ausführungshäufigkeit jeder Suchfunktion lernt.
  • Die Steuerung 14 nimmt Bezug auf die von dem Ausführungshäufigkeitsspeicher 13 gespeicherte Ausführungshäufigkeit in Bezug auf eine Schätzsuchfunktion. Die Schätzsuchfunktion ist die durch die Schätzeinheit 12 geschätzte Suchfunktion. Die Steuerung 14 steuert dann die Ausführungseinheit 18, die Schätzsuchfunktion auszuführen.
  • <Kernaussage der ersten Ausführungsform>
  • Die Spracherkennungsvorrichtung 1 gemäß der ersten Ausführungsform ermöglicht Steuerung, sodass die Schätzsuchfunktion zum Beispiel sofort ausgeführt wird, wenn die Schätzsuchfunktion eine relativ hohe Häufigkeit der Ausführung hat, und nicht sofort ausgeführt wird, wenn die Schätzsuchfunktion eine relativ niedrige Häufigkeit der Ausführung hat. Hier ist eine Schätzsuchfunktion mit einer relativ hohen Häufigkeit der Ausführung wahrscheinlich eine Suchfunktion, die vom Benutzer beabsichtigt ist. Darüber hinaus ist eine Schätzsuchfunktion mit einer relativ niedrigen Häufigkeit der Ausführung wahrscheinlich eine Suchfunktion, die nicht vom Benutzer beabsichtigt ist. Die oben genannte Konfiguration verhindert somit, dass die Ausführungseinheit 18 eine Suchfunktion ausführt, die nicht vom Benutzer beabsichtigt ist.
  • <Zweite Ausführungsform>
  • 2 ist ein Blockdiagramm der Konfiguration der Spracherkennungsvorrichtung 1 gemäß einer zweiten Ausführungsform. Identische oder ähnliche Komponenten zwischen der ersten und der zweiten Ausführungsform werden mit denselben Referenzzeichen gekennzeichnet. Es werden hauptsächlich unterschiedliche Komponenten zwischen diesen Ausführungsformen beschrieben.
  • Die Spracherkennungsvorrichtung 1 in 2 beinhaltet ein Mikrophon 21, eine Spracherfassungseinheit 22, einen Spracherkennungs- und Absichtenschätz-Prozessor 23, eine Nutzhäufigkeits-Lerneinheit 24, eine Suchfunktions-Benachrichtigungseinheit 25, eine Suchfunktions-Bestimmungseinheit 26, eine Suchfunktions-Ausführungseinheit 27, eine Benachrichtigungssteuerung 28 und eine Suchergebnis-Benachrichtigungseinheit 29.
  • Das Mikrophon 21 und die Spracherfassungseinheit 22 zusammen entsprechen der Erfassungseinheit 11, die in der ersten Ausführungsform mit Bezug auf 1 beschrieben ist. Der Spracherkennungs- und Absichtenschätz-Prozessor 23 und die Nutzhäufigkeits-Lerneinheit 24 entsprechen jeweils der Schätzeinheit 12 und dem Ausführungshäufigkeitsspeicher 13, die in der ersten Ausführungsform mit Bezug auf 1 beschrieben sind. Die Suchfunktions-Bestimmungseinheit 26 und die Benachrichtigungssteuerung 28 zusammen entsprechen der Steuerung 14, die in der ersten Ausführungsform mit Bezug auf 1 beschrieben ist. Die Suchfunktions-Ausführungseinheit 27 entspricht der Ausführungseinheit 18, die in der ersten Ausführungsform mit Bezug auf 1 beschrieben ist. Im Folgenden werden die Komponenten der Spracherkennungsvorrichtung 1 in 2 im Detail beschrieben.
  • Das Mikrophon 21 empfängt eine Stimme eines Benutzers und wandelt die Stimme des Benutzers in ein Audiosignal um.
  • Die Spracherfassungseinheit 22 erfasst das Audiosignal vom Mikrophon 21 und wandelt das Audiosignal in Audiodaten um. Die Spracherfassungseinheit 22 führt für ein analoges Signal, das das Audiosignal ist, eine analog-digitale Umwandlung auf dem Audiosignal durch, sodass Audiodaten erfasst werden, die digitale Daten sind. Dabei kann die Spracherfassungseinheit 22 eine Verarbeitung durchführen, wie zum Beispiel eine Geräuschunterdrückung und Beamforming, um die Genauigkeit der Umwandlung in digitale Daten mit Hilfe von zum Beispiel einem Pulscodemodulationsverfahren (PCM) zu erhöhen.
  • Der Spracherkennungs- und Absichtenschätz-Prozessor 23 erkennt Audioabschnitte von den Audiodaten, die von der Spracherfassungseinheit 22 erfasst werden, und extrahiert dann Merkmalswerte. Der Spracherkennungs- und Absichtenschätz-Prozessor 23 führt Spracherkennungsverarbeitung auf der Basis der extrahierten Merkmalswerte durch, sodass zum Beispiel Zeichenfolgedaten entsprechend der Audiodaten erhalten werden. Der Spracherkennungs- und Absichtenschätz-Prozessor 23 führt die Absichtenschätzverarbeitung, die in der ersten Ausführungsform beschrieben ist, auf den erhaltenen Zeichenfolgedaten durch, sodass eine auszuführende Suchfunktion geschätzt wird. Der Spracherkennungs- und Absichtenschätz-Prozessor 23 erhält dadurch eine Schätzsuchfunktion. Auf diese Weise erfasst der Spracherkennungs- und Absichtenschätz-Prozessor 23 auch die Schätzbewertung der Schätzsuchfunktion während der Spracherkennungsverarbeitung oder der Absichtenschätzverarbeitung. Die Schätzbewertung zeigt die Wahrscheinlichkeit an, dass die Schätzsuchfunktion eine Suchfunktion ist, die vom Benutzer beabsichtigt ist. Die Schätzbewertung kann höher werden, wenn der Merkmalswert, der der Spracherkennungsverarbeitung unterzogen werden soll, mehr mit einem vorgegebenen Merkmalswert übereinstimmt; zum Beispiel kann die Schätzbewertung höher werden, wenn die Zeichenfolgedaten, die der Absichtenschätzverarbeitung unterzogen werden sollen, mehr mit vorgegebenen Zeichenfolgedaten übereinstimmen. In der zweiten Ausführungsform wird angenommen, dass die von dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erfasste Schätzsuchfunktion eine Schätzsuchfunktion mit der höchsten Schätzbewertung von Schätzsuchfunktionen ist.
  • Obwohl der Spracherkennungs- und Absichtenschätz-Prozessor 23 in einem einzigen funktionalen Block durchgeführt wird, wie zum Beispiel der Spracherkennungs- und Absichtenschätz-Prozessor 23 in der zweiten Ausführungsform, kann er in irgendeinem anderen Gegenstand durchgeführt werden. Die Spracherkennungsverarbeitung und die Absichtenschätzverarbeitung können zum Beispiel unabhängig voneinander in einer Vielzahl von Vorrichtungen durchgeführt werden, wie zum Beispiel ein Server und ein mobiles Endgerät.
  • Die in dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erfasste Schätzsuchfunktion wird in manchen Fällen von der Suchfunktions-Ausführungseinheit 27 ausgeführt und wird in anderen Fällen nicht von der Suchfunktions-Ausführungseiheit 27 ausgeführt. Die Einzelheiten werden später beschrieben. Wenn die Schätzsuchfunktion ausgeführt wird, stellt die Suchfunktions-Ausführeinheit 27 die Ergebnisse der Suche in der Schätzsuchfunktion bereit. Wenn zum Beispiel eine Musiksuchfunktion 27b ausgeführt wird, stellt die Suchfunktions-Ausführeinheit 27, als die Ergebnisse der Suche, den Musiktitel, der in den oben genannten Zeichenfolgedaten beinhaltet ist, einen ähnlichen Musiktitel, und andere Dinge bereit.
  • Die Nutzhäufigkeits-Lerneinheit 24 speichert die Ausführungshäufigkeit jeder Suchfunktion. Die Nutzhäufigkeits-Lerneinheit 24 lernt hier, die Ausführungshäufigkeit der Schätzsuchfunktion zu ändern auf der Basis von, ob das Suchergebnis der ausgeführten Schätzsuchfunktion benutzt worden ist. Die Nutzhäufigkeits-Lerneinheit 24 erhöht zum Beispiel die Ausführungshäufigkeit der Schätzsuchfunktion, wenn das Suchergebnis der ausgeführten Schätzsuchfunktion von dem Benutzer ausgewählt wird und dann benutzt wird. Zusätzlich reduziert die Nutzhäufigkeits-Lerneinheit 24 die Ausführungshäufigkeit der Schätzsuchfunktion, wenn das Suchergebnis der ausgeführten Schätzsuchfunktion nicht benutzt wird. In solch einer Konfiguration in der zweiten Ausführungsform kann sich die Ausführungshäufigkeit der Suchfunktion auf die Nutzhäufigkeit der Suchfunktion, die Anzahl der Ausführungszeiten der Suchfunktion und die Anzahl der Nutzzeiten der Suchfunktion beziehen. Dementsprechend werden die Ausführungshäufigkeit, die Nutzhäufigkeit, die Anzahl der Ausführungszeiten und die Anzahl der Nutzzeiten in der folgenden Beschreibung nicht voneinander unterschieden.
  • Die Suchfunktions-Benachrichtigungseinheit 25 benachrichtigt den Benutzer über verschiedene Informationsstücke unter der Steuerung der Suchfunktions-Bestimmungseinheit 26. Die Suchfunktions-Benachrichtigungseinheit 25 benachrichtigt hier den Benutzer über die von dem Spracherkennungs- und Absichtenschätz-Prozessor 23 geschätzte Suchfunktion, das heißt die Schätzsuchfunktion. Beispiele der Suchfunktions-Benachrichtigungseinheit 25 beinhalten eine Anzeigevorrichtung, wie zum Beispiel eine Flüssigkristallanzeige, und eine Audioausgabevorrichtung, wie zum Beispiel ein Lautsprecher. Für eine Anzeigevorrichtung, die die Suchfunktions-Benachrichtigungseinheit 25 ist, wird eine Anzeige auf der Anzeigevorrichtung als eine Benachrichtigung von der Suchfunktions-Benachrichtigungseinheit 25 benutzt. Für eine Audioausgabevorrichtung, die die Suchfunktions-Benachrichtigungseinheit 25 ist, wird ein Audioguidance-Stück von der Audioausgabevorrichtung als eine Benachrichtigung von der Suchfunktions-Benachrichtigungseinheit 25 benutzt.
  • Die Suchfunktions-Bestimmungseinheit 26 nimmt Bezug auf die Nutzhäufigkeit der Schätzsuchfunktion aus den in der Nutzhäufigkeits-Lerneinheit 24 gespeicherten Nutzhäufigkeiten und steuert dann die Suchfunktions-Ausführungseinheit 27, um die Schätzsuchfunktion auszuführen.
  • Die Nutzhäufigkeit jeder Suchfunktion wird hier in eine Vielzahl von Nutzhäufigkeitslevels klassifiziert, das heißt eine Vielzahlt von Ausführungshäufigkeitslevels. Die Suchfunktions-Bestimmungseinheit 26 nimmt Bezug auf das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört. Die Suchfunktions-Bestimmungseinheit 26 steuert dann die Ausführung der Schätzsuchfunktion und steuert die Suchfunktions-Benachrichtigungseinheit 25, um die Schätzsuchfunktion zu benachrichtigen.
  • Im Folgenden wird ein Beispiel beschrieben, in dem die Vielzahl von Nutzhäufigkeitslevels drei Levels sind; ein niedriges Häufigkeitslevel, ein mittleres Häufigkeitslevel und ein hohes Häufigkeitslevel. In dieser Konfiguration, wenn die Schätzsuchfunktion eine Nutzhäufigkeit niedriger als ein vorbestimmter erster Schwellenwert hat, wird das niedrige Häufigkeitslevel, das heißt ein erstes Level, der Nutzhäufigkeit der Schätzsuchfunktion zugeordnet. Zusätzlich, wenn die Schätzsuchfunktion eine Nutzhäufigkeit größer gleich dem vorbestimmten ersten Schwellenwert und niedriger als ein vorbestimmter zweiter Schwellenwert hat, wird das mittlere Häufigkeitslevel, das heißt ein zweites Level, der Nutzhäufigkeit der Schätzsuchfunktion zugeordnet. Weiterhin, wenn die Schätzsuchfunktion eine Nutzhäufigkeit größer gleich dem vorbestimmten zweiten Schwellenwert hat, wird das hohe Häufigkeitslevel, das heißt ein drittes Level, der Nutzhäufigkeit der Schätzsuchfunktion zugeordnet.
  • Als solches ist die Nutzhäufigkeit, die zum niedrigen Häufigkeitslevel gehört, niedriger als die Nutzhäufigkeit, die zum mittleren Häufigkeitslevel gehört; außerdem ist die Nutzhäufigkeit, die zum mittleren Häufigkeitslevel gehört, niedriger als die Nutzhäufigkeit, die zum hohen Häufigkeitslevel gehört. Es ist anzumerken, dass die Vielzahl von Nutzhäufigkeitslevels in zwei Levels oder in vier Levels und mehr klassifiziert werden können, obwohl sie in der obigen Beschreibung in diese drei Levels klassifiziert werden. Die Steuerung basierend auf den Nutzhäufigkeitslevels in der Suchfunktions-Bestimmungseinheit 26 wird in Detail später beschrieben.
  • Die Suchfunktions-Ausführungseinheit 27 führt die Schätzsuchfunktion unter Steuerung der Suchfunktions-Bestimmungseinheit 26 aus. 2 stellt die Suchfunktions-Ausführungseinheit 27 dar, die in der Lage ist, die Schätzsuchfunktion auszuführen, die hier eine Einrichtungssuchfunktion 27a, eine Musiksuchfunktion 27b, oder eine XX Suchfunktion 27c zum Suchen nach anderen Objekten als eine Einrichtung und ein Musikstück ist. Zum Beispiel stellt die Suchfunktions-Ausführungseinheit 27, wenn die Einrichtungssuchfunktion 27a ausgeführt wird, die Ergebnisse der Suche für die Einrichtung, die in den oben genannten Zeichenfolgedaten beinhaltet sind, und anderer Dinge bereit.
  • Die Benachrichtigungssteuerung 28 steuert die Suchergebnis-Benachrichtigungseinheit 29, um die Suchergebnisse, die von der Ausführung der Schätzsuchfunktion in der Suchfunktion-Ausführungseinheit 27 erhalten werden, zu benachrichtigen.
  • Die Suchergebnis-Benachrichtigungseinheit 29 benachrichtigt den Benutzer über die Suchergebnisse unter der Steuerung der Benachrichtigungssteuerung 28. Beispiele der Suchergebnis-Benachrichtigungseinheit 29 beinhalten eine Anzeigevorrichtung, wie zum Beispiel eine Flüssigkristallanzeige, und eine Audioausgabevorrichtung, wie zum Beispiel ein Lautsprecher. Die Suchfunktions-Benachrichtigungseinheit 25 und die Suchergebnis-Benachrichtigungseinheit 29 können zusammen in einer einzigen Vorrichtung beinhaltet sein oder können individuell in einer Vielzahl von Vorrichtungen beinhaltet sein.
  • <Bedienung>
  • 3 ist ein Flussdiagramm, das den Vorgang in der Spracherkennungsvorrichtung gemäß der zweiten Ausführungsform zeigt.
  • Die Spracherfassungseinheit 22 erfasst in Schritt S1 ein Audiosignal von dem Mikrophon 21 und wandelt das Audiosignal in Audiodaten um. Der Spracherkennungs- und Absichtenschätz-Prozessor 23 schätzt in Schritt S2 eine Suchfunktion durch sequentielles Durchführen von Spracherkennungsverarbeitung und Absichtenschätzverarbeitung auf den Audiodaten von der Spracherfassungseinheit 22. Die Suchfunktion-Bestimmungseinheit 26 erhält in Schritt S3, von der Nutzhäufigkeits-Lerneinheit 24, die Nutzhäufigkeit einer Schätzsuchfunktion, die die von dem Spracherkennungs- und Absichtenschätz-Prozessor 23 geschätzte Suchfunktion ist.
  • Die Suchfunktions-Bestimmungseinheit 26 bestimmt in Schritt S4, ob die Schätzsuchfunktion eine häufig benutzte Funktion ist. Wenn das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, das hohe Häufigkeitslevel ist, bestimmt die Suchfunktions-Bestimmungseinheit 26 hier, dass die Schätzsuchfunktion eine häufig benutzte Funktion ist, und wird der Vorgang somit zu Schritt S9 bewegt. Wenn das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, nicht das hohe Häufigkeitslevel ist, bestimmt die Suchfunktions-Bestimmungseinheit 26, dass die Schätzsuchfunktion keine häufig benutzte Funktion ist, und somit wird der Vorgang zu Schritt S5 bewegt.
  • Die Suchfunktions-Bestimmungseinheit 26 bestimmt in Schritt S5, ob die Schätzsuchfunktion eine selten benutzte Funktion ist. Wenn das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, das mittlere Häufigkeitslevel ist, bestimmt die Suchfunktions-Bestimmungseinheit 26 hier, dass die Schätzsuchfunktion keine selten benutzte Funktion ist, und wird der Vorgang somit zu Schritt S6 bewegt. Wenn das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, das niedrige Häufigkeitslevel ist, bestimmt die Suchfunktions-Bestimmungseinheit 26, dass die Schätzsuchfunktion eine selten benutzte Funktion ist, und wird der Vorgang somit zu Schritt S7 bewegt.
  • Die Suchfunktions-Bestimmungseinheit 26 steuert in Schritt S6 die Suchfunktions-Benachrichtigungseinheit 25, um die Schätzsuchfunktion zu benachrichtigen. Die Suchfunktions-Benachrichtigungseinheit 25 benachrichtigt dementsprechend die Schätzsuchfunktion. Der Vorgang fährt dann mit Schritt S9 fort.
  • Wenn der Vorgang von Schritt S5 mit Schritt S7 fortfährt, steuert die Suchfunktions-Bestimmungseinheit 26 die Suchfunktions-Benachrichtigungseinheit 25, um eine Prüfung zu benachrichtigen, ob die Schätzsuchfunktion ausgeführt wird, das heißt eine Prüfung der Ausführung der Schätzsuchfunktion. Für die Einrichtungssuchfunktion 27a, die die Schätzsuchfunktion ist, benachrichtigt die Suchfunktions-Benachrichtigungseinheit 25 dementsprechend den Benutzer über eine Nachricht, die „Ausführen eine Einrichtungssuche, OK?“ besagt.
  • Die Suchfunktions-Bestimmungseinheit 26 bestimmt in Schritt S8 nach Schritt S7, ob eine externe Anweisung eine Ausführungsanweisung ist, um die in Schritt S7 benachrichtigte Schätzsuchfunktion auszuführen. Die externe Anweisung kann durch separates Empfangen einer Stimme eines Benutzers in das Mikrophon 21 bereitgestellt werden. Alternativ kann die externe Anweisung durch separates Empfangen einer manuellen Bedienung eines Benutzers in eine Eingabevorrichtung bereitgestellt werden, was nicht gezeigt ist. Der Vorgang fährt mit Schritt S9 fort, falls bestimmt wird, dass die externe Anweisung eine Ausführungsanweisung ist. Der Vorgang in 3 endet, falls bestimmt wird, dass die externe Anweisung eine Nicht-Ausführungsanweisung ist, die angibt, dass die Schätzsuchfunktion nicht auszuführen ist.
  • Die Suchfunktions-Bestimmungseinheit 26 steuert in Schritt S9 die Ausführung der Schätzsuchfunktion. Die Suchfunktions-Ausführungseinheit 27 führt die Schätzsuchfunktion unter dieser Steuerung aus.
  • Unter Bezugnahme auf die Schritte S4 bis S9 in der Zusammenfassung, wenn das Nutzhäufigkeitslevel das niedrige Häufigkeitslevel ist, steuert die Suchfunktions-Bestimmungseinheit 26 die Suchfunktions-Benachrichtigungseinheit 25, um die Schätzsuchfunktion zu benachrichtigen (Schritt S7) und steuert sie auch die Ausführung der Schätzsuchfunktion in Antwort auf die externe Anweisung. Zusätzlich, wenn das Nutzhäufigkeitslevel das mittlere Häufigkeitslevel ist, steuert die Suchfunktions-Bestimmungseinheit 26 die Suchfunktions-Benachrichtigungseinheit 25, um die Schätzsuchfunktion zu benachrichtigen (Schritt S6) und steuert sie auch die Ausführung der Schätzsuchfunktion ungeachtet der externen Anweisung. Weiterhin, wenn das Nutzhäufigkeitslevel das hohe Häufigkeitslevel ist, steuert die Suchfunktions-Bestimmungseinheit 26 die Ausführung der Schätzsuchfunktion ungeachtet der externen Anweisung, ohne die Suchfunktions-Benachrichtigungseinheit 25 zu steuern, um die Schätzsuchfunktion zu benachrichtigen.
  • Die Benachrichtigungssteuerung 28 bewirkt in Schritt S10 nach Schritt S9, dass die Suchergebnis-Benachrichtigungseinheit 29 eine Liste der Suchergebnisse der Schätzsuchfunktion wie durch die Suchfunktions-Ausführungseinheit 27 ausgeführt benachrichtigt.
  • Die Spracherkennungsvorrichtung 1 empfängt in Schritt S11 eine Auswahl eines Benutzers über jegliche benachrichtigte Suchergebnisse. Diese Auswahl kann durch separates Empfangen einer Stimme eines Benutzers in dem Mikrophon 21 durchgeführt werden. Alternativ kann Auswahl durch separates Empfangen einer manuellen Bedienung eines Benutzers in eine Eingabevorrichtung durchgeführt werden, was nicht gezeigt ist.
  • Die Nutzhäufigkeits-Lerneinheit 24 lernt in Schritt S12, die Nutzhäufigkeit der in Schritt S9 ausgeführten Schätzsuchfunktion zu ändern basierend auf, ob das Suchergebnis in Antwort auf die Auswahl des Benutzers benutzt worden ist.
  • Ein System (nicht gezeigt), das mit der Spracherkennungsvorrichtung 1 verbunden ist, führt in Schritt S13 eine Verarbeitung durch, die mit dem wie in Schritt S11 ausgewählten Suchergebnis konform ist. Wenn zum Beispiel ein Musikstück in Schritt S11 aus einer Vielzahl von Musikstücken, nach denen aufgrund der Ausführung der Musiksuchfunktion 27b gesucht wurde, ausgewählt wird, spielt das System das ausgewählte Musikstück ab. Der Vorgang in 3 endet dann.
  • <Kernaussage der zweiten Ausführungsform>
  • Die Spracherkennungsvorrichtung 1 gemäß der zweiten Ausführungsform bezieht sich auf das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, und steuert dann die Ausführung der Schätzsuchfunktion. Diese Konfiguration steuert die Ausführung der Schätzsuchfunktion auf einer geeigneten Anzahl von Levels.
  • Die Spracherkennungsvorrichtung 1 gemäß der zweiten Ausführungsform bezieht sich auf das Nutzhäufigkeitslevel, zu der die Nutzhäufigkeit der Schätzsuchfunktion gehört, und steuert dann die Ausführung der Schätzsuchfunktion. Die Spracherkennungsvorrichtung 1 steuert auch due Suchfunktions-Benachrichtigungseinheit 25, um die Schätzsuchfunktion zu benachrichtigen. Dies verhindert zusätzlich die falsche Ausführung der Suchfunktion, die nicht vom Benutzer beabsichtigt ist.
  • Die Spracherkennungsvorrichtung 1 gemäß der zweiten Ausführungsform ändert die Nutzhäufigkeit der Schätzsuchfunktion auf der Basis von, ob das Suchergebnis der ausgeführten Schätzsuchfunktion benutzt worden ist. Dies macht die in der Suchfunktions-Bestimmungseinheit 26 verwendete Nutzfrequenz geeignet. Es ist anzumerken, dass die Nutzhäufigkeits-Lerneinheit 24 die Nutzhäufigkeit auf jede andere Weise lernen kann. Die Nutzhäufigkeits-Lerneinheit 24 kann zum Beispiel die Nutzhäufigkeit der Schätzsuchfunktion auf der Basis von, ob die Suchfunktions-Ausführungseinheit 27 die Schätzsuchfunktion ausgeführt hat, lernen.
  • <Modifikation der zweiten Ausführungsform>
  • Die in der Nutzhäufigkeits-Lerneinheit 24 gespeicherte Nutzhäufigkeit der Spracherkennungsvorrichtung 1 gemäß der zweiten Ausführungsform kann einen Initialwert haben, der zuvor durch zum Beispiel den Benutzer registriert ist. Solch eine Konfiguration ermöglicht es der Nutzhäufigkeits-Lerneinheit 24, die Nutzhäufigkeit einer gewünschten Suchfunktion zu lernen, nicht von auf dem normalen, niedrigen Häufigkeitslevel, sondern von auf dem mittleren Häufigkeitslevel oder dem hohen Häufigkeitslevel. Diese Modifikation ist auf eine dritte Ausführungsform und die nachfolgende Ausführungsform anwendbar.
  • <Dritte Ausführungsform>
  • 4 ist ein Blockdiagramm der Konfiguration der Spracherkennungsvorrichtung 1 gemäß einer dritten Ausführungsform. Identische oder ähnliche Komponenten zwischen der zweiten und der dritten Ausführungsform werden mit denselben Referenzzeichen gekennzeichnet. Es werden hauptsächlich unterschiedliche Komponenten zwischen diesen Ausführungsformen beschrieben.
  • Die Spracherkennungsvorrichtung 1 in 4 beinhaltet zusätzlich eine Suchfunktions-Schalteinheit 30 zusätzlich zu den Komponenten in 2. Die Suchfunktions-Bestimmungseinheit 26, die Benachrichtigungssteuerung 28 und die Suchfunktions-Schalteinheit 30 zusammen entsprechen der Steuerung 14, die in der ersten Ausführungsform mit Bezug auf 1 beschrieben ist.
  • Wenn eine Vielzahl von Schätzsuchfunktionen von der Schätzung in dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erhalten wird, steuert die Suchfunktions-Bestimmungseinheit 26 die Ausführung einer der Schätzsuchfunktionen. Die Suchfunktions-Ausführungseinheit 27 führt dementsprechend die eine Schätzsuchfunktion aus. In der dritten Ausführungsform hat die eine Schätzsuchfunktion eine Schätzbewertung, die höher ist als die Schätzbewertungen der Vielzahl von Schätzsuchfunktionen mit Ausnahme der einen Schätzsuchfunktion. Das heißt, dass die Suchfunktions-Ausführungseinheit 27 in der dritten Ausführungsform die eine Schätzsuchfunktion mit der höchsten Schätzbewertung von der Vielzahl der Schätzsuchfunktionen ausführt. Die eine Schätzsuchfunktion mit der höchsten Schätzbewertung von der Vielzahl der Schätzsuchfunktionen wird im Folgenden als eine „Höchstbewertungs-Suchfunktion“ bezeichnet.
  • Die Suchfunktions-Schalteinheit 30 ist in der Lage, Schalten von Ausführen der einen Schätzsuchfunktion auf Ausführen einer verschiedenen von den Schätzsuchfunktionen innerhalb eines Zeitraums von dem Ausführungsstart bis zu dem Ausführungsende der einen Schätzsuchfunktion zu steuern. Die Suchfunktions-Schalteinheit 30 gemäß der dritten Ausführungsform, in Zusammenarbeit mit der Suchfunktions-Bestimmungseinheit 26, steuert die Suchfunktions-Benachrichtigungseinheit 25, um eine oder mehrere Schätzsuchfunktionen innerhalb eines bestimmten Zeitraums des oben genannten Zeitraums zu benachrichtigen. Zusätzlich steuert die Suchfunktions-Schalteinheit 30 Schalten von Ausführen der einen Schätzsuchfunktion auf Ausführen der anderen Schätzsuchfunktion in Antwort auf eine externe Anweisung innerhalb des bestimmten Zeitraums. Die folgenden ersten und zweiten Beispiele werden als solche Konfiguration angewandt.
  • Es wird auf das erste Konfigurationsbeispiel verwiesen. Die Suchfunktions-Schalteinheit 30 steuert die Suchfunktions-Benachrichtigungseinheit 25, um die Vielzahl der Schätzsuchfunktionen mit Ausnahme der einen Schätzsuchfunktion in der Reihenfolge der Nutzhäufigkeiten zu benachrichtigen, innerhalb eines bestimmten Zeitraums, während dem die eine Schätzsuchfunktion ausgeführt wird. Die Suchfunktions-Schalteinheit 30 bewirkt zum Beispiel, dass die Suchfunktions-Benachrichtigungseinheit 25 innerhalb des oben genannten bestimmten Zeitraums eine der Vielzahl von Schätzsuchfunktionen benachrichtigt, die gerade ausgeführt wird. Wenn die externe Anweisung angibt, dass die eine, die gerade ausgeführt wird, nicht eine beabsichtigte Suchfunktion ist, bewirkt die Suchfunktions-Schalteinheit 30 dann, dass die Suchfunktions-Benachrichtigungseinheit 25 eine verschiedene der Schätzsuchfunktionen benachrichtigt, die die höchste Nutzhäufigkeit der Vielzahl von Schätzsuchfunktionen mit Ausnahme der einen Schätzsuchfunktion hat. Die Suchfunktions-Schalteinheit 30 steuert auch Schalten von Ausführen der einen Schätzsuchfunktion auf Ausführen der anderen Schätzsuchfunktion.
  • Es wird auf das zweite Konfigurationsbeispiel verwiesen. Die Suchfunktions-Schalteinheit 30 bewirkt, dass die Suchfunktions-Benachrichtigungseinheit 25 alle Schätzsuchfunktionen innerhalb eines bestimmten Zeitraums, während dem die eine Schätzsuchfunktion ausgeführt wird, benachrichtigt. In Antwort auf eine externe Anweisung zum „Ausführen einer verschiedenen Schätzsuchfunktion“, steuert die Suchfunktions-Schalteinheit 30 dann das Schalten von Ausführen der einen Schätzsuchfunktion auf Ausführen der anderen Schätzsuchfunktion, die angewiesen wird.
  • Das Beispiel in 4 zeigt, dass die externe Anweisung eine Stimme eines Benutzers ist, die separat durch das Mikrophon 21 empfangen wird, und dass die Audiodaten der Stimme des Benutzers in die Suchfunktions-Schalteinheit 30 eingegeben wird. Die externe Anweisung kann eine manuelle Bedienung eines Benutzers sein, die separat durch eine Eingabevorrichtung empfangen wird, was nicht gezeigt ist.
  • <Bedienung>
  • 5 und 6 sind Flussdiagramme, wobei jedes den Vorgang in der Spracherkennungsvorrichtung 1 gemäß der dritten Ausführungsform zeigt. Genauer gesagt, stellen 5 und 6 jeweils den Vorgang in dem zweiten Konfigurationsbeispiel dar. Hier werden hauptsächlich die verschiedenen Vorgangsschritte zwischen 3 und 5 und 6 beschrieben.
  • Schritte S1 bis S5 in 5 sind die gleichen wie Schritte S1 bis S5, die in 3 in der zweiten Ausführungsform beschrieben werden.
  • Ebenso sind die Schritte S7 bis S13 in 5 die gleichen wie Schritte S7 bis S13 in 3 in der zweiten Ausführungsform.
  • Der Vorgang fährt in Schritt S5 in 5 mit Schritt S21 in 6 fort, falls bestimmt wird, dass eine in dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erhaltene Schätzsuchfunktion, das heißt eine Höchstbewertungs-Suchfunktion, nicht eine seltene benutzte Funktion ist.
  • Die Suchfunktions-Bestimmungseinheit 26 steuert in Schritt S21 die Ausführung der Schätzsuchfunktion, das heißt der Höchstbewertungs-Suchfunktion, die in dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erhalten wird. Die Suchfunktions-Ausführungseinheit 27 führt die Höchstbewertungs-Suchfunktion unter dieser Steuerung aus.
  • Die Suchfunktions-Schalteinheit 30 bewirkt in Schritt S22, dass die Suchfunktions-Benachrichtigungseinheit 25 eine Vielzahl von Schätzsuchfunktionen einschließlich der Höchstbewertungs-Suchfunktion benachrichtigt.
  • Die Suchfunktions-Schalteinheit 30 bestimmt in Schritt S23, ob eine externe Anweisung eine Anweisung ist, eine der Vielzahl der Schätzsuchfunktionen, die von der Höchstbewertungs-Suchfunktion unterschiedlich ist, auszuführen. Der Vorgang fährt mit Schritt S24 fort, falls bestimmt wird, dass die externe Anweisung eine Anweisung ist, die andere Schätzsuchfunktion auszuführen. Der Vorgang fährt mit Schritt S10 in 5 fort, falls bestimmt wird, dass die externe Anweisung keine Anweisung ist, die andere Schätzsuchfunktion auszuführen. Außerdem fährt der Vorgang auch mit Schritt S10 in 5 fort, wenn ein bestimmter Zeitraum von der Benachrichtigung in Schritt S22 ohne jegliche externe Anweisung verstrichen ist.
  • Die Suchfunktions-Schalteinheit 30 steuert in Schritt S24 das Schalten auf das Ausführen der anderen Schätzsuchfunktion, die angewiesen wird. Die Suchfunktions-Ausführungseinheit 27, unter dieser Steuerung, führt die andere Schätzsuchfunktion aus, die angewiesen wird. Der Vorgang fährt dann mit Schritt S10 in 5 fort.
  • <Kernaussage der dritten Ausführungsform>
  • Die Vielzahl der Schätzsuchfunktionen, wenn diese von dem Spracherkennungs- und Absichtenschätz-Prozessor 23 geschätzt werden, können auf folgende Weise ausgeführt werden: die Vielzahl der Schätzsuchfunktionen werden sequentiell eine nach der anderen ausgeführt, oder die Vielzahl der Schätzsuchfunktionen werden gleichzeitig ausgeführt. Leider kann es etwas Zeit brauchen, bevor die Suchergebnisse auf beide Weisen erhalten werden.
  • Um dieses Problem anzugehen steuert die Spracherkennungsvorrichtung 1 gemäß der dritten Ausführungsform Schalten von Ausführen einer der Schätzsuchfunktionen auf Ausführen einer anderen der Schätzsuchfunktionen innerhalb eines Zeitraums von dem Ausführungsstart bis zu dem Ausführungsende der einen Schätzsuchfunktion. Solch eine Konfiguration ermöglicht es dem Benutzer, die Ausführung einer unbeabsichtigten Suchfunktion in die Ausführung einer beabsichtigten Suchfunktion zu ändern, während die unbeabsichtigte Suchfunktion gerade ausgeführt wird. Dies verkürzt die Zeit, die benötigt wird, um die Suchergebnisse der ausgeführten Suchfunktion zu erhalten, die beabsichtigt ist.
  • In der dritten Ausführungsform wird eine Schätzsuchfunktion mit der höchsten Schätzbewertung als eine der Vielzahl von Schätzsuchfunktionen benutzt, die ursprünglich ausgeführt wird. Dies ermöglicht, dass eine Suchfunktion, die wahrscheinlich eine Suchfunktion ist, die vom Benutzer beabsichtigt ist, ursprünglich ausgeführt wird.
  • <Vierte Ausführungsform>
  • Die Blockkonfiguration der Spracherkennungsvorrichtung 1 gemäß einer vierten Ausführungsform der vorliegenden Erfindung ist die gleiche wie die Blockkonfiguration (4) der Spracherkennungsvorrichtung 1 gemäß der dritten Ausführungsform. Identische oder ähnliche Komponenten zwischen der vierten und der zweiten und dritten Ausführungsform werden mit denselben Referenzzeichen gekennzeichnet. Es werden hauptsächlich unterschiedliche Komponenten zwischen diesen Ausführungsformen beschrieben.
  • Es wird auf ein Beispiel verwiesen, in dem eine Vielzahl von Schätzsuchfunktionen von der Schätzung in dem Spracherkennungs- und Absichtenschätz-Prozessor 23 erhalten wird. Die Suchfunktions-Bestimmungseinheit 26 steuert gleichzeitiges Ausführen der Vielzahl von Schätzsuchfunktionen. Die Suchfunktions-Ausführungseinheit 17 führt dementsprechend gleichzeitig die Vielzahl von Schätzsuchfunktionen aus. Die Benachrichtigungssteuerung 28 steuert die Suchergebnis-Benachrichtigungseinheit 29, um die Suchergebnisse der ausgeführten Suchfunktionen in Übereinstimmung mit den jeweiligen Suchfunktionen zu benachrichtigen.
  • 7 und 8 sind Diagramme, die Anzeige-Beispiele von Benachrichtigungen in der Suchergebnis-Benachrichtigungseinheit 29 darstellen. Genauer gesagt stellen 7 und 8 Anzeige-Beispiele da, in dem eine Einrichtungssuchfunktion die höchste Nutzhäufigkeit von der Vielzahl von Schätzsuchfunktionen hat und eine Musiksuchfunktion die zweit höchste Nutzhäufigkeit hinter der Nutzhäufigkeit der Einrichtungssuchfunktion hat. Wie in 7 dargestellt, in der vierten Ausführungsform, werden die Suchergebnisse der Einrichtungssuchfunktion zunächst angezeigt, das heißt die Suchergebnisse der Schätzsuchfunktion mit der höchsten Nutzhäufigkeit der Vielzahl der Schätzsuchfunktionen. Zusätzlich hat die Suchergebnis-Benachrichtigungseinheit 29 Schätzsuchfunktionstabs 29a und 29b. Wie in 7 und 8 dargestellt, werden Listenanzeigen der Suchergebnisse der Schätzsuchfunktionen in der Suchergebnis-Benachrichtigungseinheit 29 in Übereinstimmung mit den jeweiligen Tabs 29a und 29b geschaltet. Das heißt, wenn der Benutzer den Tab 29b während der Anzeige der Suchergebnisse der Einrichtungssuchfunktion wie in 7 dargestellt wählt, schaltet die Einrichtungsanzeige auf die Anzeige der Suchergebnisse der Musiksuchfunktion wie in 8 dargestellt. Außerdem, wenn der Benutzer den Tab 29a während der Anzeige der Suchergebnisse der Musiksuchfunktion wie in 8 dargestellt wählt, schaltet die Musikanzeige auf die Anzeige der Suchergebnisse der Einrichtungssuchfunktion wie in 7 dargestellt.
  • Es ist anzumerken, dass die Suchergebnis-Benachrichtigungseinheit 29 die Suchergebnisse der Schätzsuchfunktionen in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen auf jegliche andere Weise als das Anzeigeschalten wie in 7 und 8 dargestellt benachrichtigen kann. Zum Beispiel kann die Suchfunktions-Benachrichtigungseinheit 29 die Suchergebnisse der Vielzahl von Schätzsuchfunktionen auf einem einzigen Bildschirm anzeigen, wobei die Suchergebnisse der Schätzsuchfunktionen in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen durch Rahmen oder andere Dinge geteilt sind.
  • <Bedienung>
  • 9 ist ein Flussdiagramm, das den Vorgang in der Spracherkennungsvorrichtung 1 gemäß der vierten Ausführungsform zeigt. Es werden hier hauptsächlich die verschiedenen Vorgangsschritte zwischen 9 und 5 beschrieben.
  • Der Vorgang fährt mit Schritt S9a fort, falls in Schritt S4 in 9 bestimmt wird, dass eine Höchstbewertungs-Suchfunktion eine häufig benutzte Funktion ist. Die gleichen Vorgangsschritte wie die Vorgangsschritte nach Schritt S5, die in der dritten Ausführungsform mit Bezug auf 5 beschrieben werden, werden durchgeführt, falls in Schritt S4 in 9 bestimmt wird, dass die Höchstbewertungs-Suchfunktion keine häufig benutzte Funktion ist.
  • Die Suchfunktions-Bestimmungseinheit 26 steuert in Schritt S9a gleichzeitiges Ausführen einer Vielzahl von Schätzsuchfunktionen. Die Suchfunktions-Ausführungseinheit 17 führt dementsprechend gleichzeitig die Vielzahl von Schätzsuchfunktionen aus.
  • Die Benachrichtigungssteuerung 28 bewirkt in Schritt S10a, dass die Suchfunktions-Benachrichtigungseinheit 29 die Suchergebnisse der Schätzsuchfunktionen in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen benachrichtigt. Auf diese Weise benachrichtigt die Suchergebnis-Benachrichtigungseinheit 29, unter der Steuerung der Benachrichtigungssteuerung 28, zuerst die Suchergebnisse einer Schätzsuchfunktion mit der höchsten Nutzhäufigkeit.
  • Die Spracherkennungsvorrichtung 1 bestimmt in Schritt S31, ob die Spracherkennungsvorrichtung 1 eine Anweisung erhalten hat, um die zuerst benachrichtigten Suchergebnisse auf Suchergebnisse einer verschiedenen Schätzsuchfunktion zu schalten. Der Vorgang fährt mit Schritt S32 fort, falls bestimmt wird, dass die Spracherkennungsvorrichtung 1 eine Schaltanweisung von zum Beispiel dem Benutzer empfangen hat. Der Vorgang fährt mit Schritt S11 fort, falls bestimmt wird, dass die Spracherkennungsvorrichtung 1 keine Schaltanweisung empfangen hat.
  • Die Suchergebnis-Benachrichtigungseinheit 29 schaltet in Schritt S32, unter der Steuerung der Benachrichtigungssteuerung 28, die zuerst benachrichtigten Suchergebnisse auf die Suchergebnisse der Schätzsuchfunktion, die in Schritt S31 angewiesen wird. Der Vorgang kehrt dann zu Schritt S31 zurück.
  • Die Spracherkennungsvorrichtung 1 empfängt in Schritt S11 eine Auswahl eines Benutzers von einem der benachrichtigten Suchergebnisse.
  • Die Nutzhäufigkeits-Lerneinheit 24 lernt in Schritt S12, die Nutzhäufigkeit der Vielzahl von Schätzsuchfunktionen, die in Schritt S9a ausgeführt werden, auf der Basis von, ob das Suchergebnis in Antwort auf die Auswahl des Benutzers benutzt worden ist, zu wechseln. Die Nutzhäufigkeits-Lerneinheit 24 reduziert zum Beispiel, wenn Schritt S12 zum Beispiel über Schritt S32 durchgeführt wird, die Nutzhäufigkeit der Höchstbewertungs-Suchfunktion, und erhöht auch die Nutzhäufigkeit der Schätzsuchfunktion, die in Schritt S31 angewiesen wird.
  • Ein System (nicht gezeigt), das mit der Spracherkennungsvorrichtung 1 verbunden ist, führt in Schritt S13 eine Verarbeitung durch, das mit dem wie in Schritt S11 ausgewählten Suchergebnis konform ist. Der Vorgang in 9 endet dann.
  • <Kernaussage der vierten Ausführungsform>
  • Wenn die Vielzahl der Schätzsuchfunktionen von der Schätzung in der Spracherkennungs- und Absichtenschätz-Prozessor 23 erhalten wird, steuert die Spracherkennungsvorrichtung 1 gemäß der vierten Ausführungsform die gleichzeitige Ausführung der Vielzahl von Schätzsuchfunktionen und bewirkt auch, dass die Suchergebnis-Benachrichtigungseinheit 29 die von der gleichzeitigen Ausführung erhaltenen Suchergebnisse benachrichtigt, in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen. Solch eine Konfiguration eliminiert die Notwendigkeit die Vorgangsschritte zu wiederholen, wie zum Beispiel Spracheingabe, Spracherkennung und Absichtenschätzung, auch wenn eine Schätzsuchfunktion, die zuerst benachrichtigt wird, keine Suchfunktion ist, die vom Benutzer beabsichtigt ist. Dies ermöglicht, dass ein Suchergebnis, das vom Benutzer beabsichtigt ist, sofort benutzt wird.
  • <Modifikation>
  • In der Spracherkennungsvorrichtung 1 gemäß der vierten Ausführungsform, nach der Steuerung der gleichzeitigen Ausführung der Schätzsuchfunktionen, kann die Benachrichtigungssteuerung 28 die Suchergebnis-Benachrichtigungssteuerung 29 steuern, um zu einem Zeitpunkt, wenn die Suchergebnisse der Schätzsuchfunktion mit der höchsten Nutzhäufigkeit erhalten werden, die Suchergebnisse der Schätzsuchfunktionen zu benachrichtigen, die bis zu dem Zeitpunkt erhalten worden sind. Außerdem kann die Suchergebnis-Benachrichtigungssteuerung 29 benachrichtigen, dass eine Suche läuft, wenn die Benachrichtigung der Suchergebnisse der Schätzsuchfunktion mit der höchsten Nutzhäufigkeit, durch eine Tab-Auswahl oder andere Dinge, auf die Benachrichtigung der Suchergebnisse einer Schätzsuchfunktion geschaltet wird, die noch nicht ausgeführt worden ist.
  • Solch eine Konfiguration ermöglicht, dass die Suchergebnisse der Schätzsuchfunktion mit der höchsten Nutzhäufigkeit benachrichtigt werden, auch wenn die anderen Suchfunktionen noch nicht ausgeführt worden sind. Dies verkürzt die Zeit, die benötigt wird, um die Suchergebnisse der ausgeführten Suchfunktion mit der höchsten Nutzhäufigkeit zu erhalten, das heißt die Zeit, die benötigt wird, um die Suchergebnisse einer ausgeführten Suchfunktion zu erhalten, die wahrscheinlich vom Benutzer beabsichtigt ist.
  • In der Spracherkennungsvorrichtung 1 gemäß der vierten Ausführungsform, können eine oder mehrere der Vielzahl von Schätzsuchfunktionen durch eine Vorrichtung, die sich außerhalb der Spracherkennungsvorrichtung 1 befindet, ausgeführt werden. Manche der Vielzahl von Schätzsuchfunktionen können zum Beispiel durch einen Server ausgeführt werden, der in der Lage ist, mit der Spracherkennungsvorrichtung 1 zu kommunizieren, und mindestens ein Teil der anderen kann durch ein tragbares Terminal ausgeführt werden, das in der Lage ist mit der Spracherkennungsvorrichtung 1 zu kommunizieren. Solch eine Konfiguration ermöglicht, dass die Vielzahl von Schätzsuchfunktionen auf verteilte Weise ausgeführt wird, wodurch die Zeit, die benötigt wird, um die Suchergebnisse der Vielzahl von Schätzsuchfunktionen zu erhalten, verkürzt wird.
  • <Andere Modifikationen>
  • Die Erfassungseinheit 11, die Schätzeinheit 12, der Ausführungshäufigkeitsspeicher 13 und die Steuerung 14 in 1, die in der Spracherkennungsvorrichtung 1 beinhaltet sind, werden nachfolgend als „die Erfassungseinheit 11 und die anderen Komponenten“ bezeichnet. Die Erfassungseinheit 11 und die anderen Komponenten werden durch eine Prozessschaltung 81 implementiert, die in 10 dargestellt ist. Das heißt, dass die Prozessschaltung 81 das Folgende beinhaltet: die Erfassungseinheit 11, die eine Stimme erfasst; die Schätzeinheit 12, die eine auszuführende Suchfunktion schätzt, durch Erkennen der durch die Erfassungseinheit 11 erfassten Stimme; den Ausführungshäufigkeitsspeicher 13, der die Ausführungshäufigkeit der Suchfunktion speichert; und die Steuerung 14, die auf die Ausführungshäufigkeit einer Schätzsuchfunktion Bezug nimmt, und dann die Ausführung der Schätzsuchfunktion steuert, wobei die Schätzsuchfunktion die durch die Schätzeinheit 12 geschätzte Suchfunktion ist. Die Prozessschaltung 81 kann spezielle Hardware sein oder ein Prozessor, um ein in einem Speicher gespeichertes Programm auszuführen. Beispiele des Prozessors beinhalten eine Zentraleinheit, eine Verarbeitungseinheit, ein Rechner, ein Mikroprozessor, ein Mikrocomputer, und ein digitaler Signalprozessor (DSP).
  • Für spezielle Hardware, die als Prozessschaltung 81 dient, beinhalten Beispiele der Prozessschaltung 81 eine Einzelschaltung, eine komplexe Schaltung, einen programmierten Prozessor, einen parallel-programmierten Prozessor, eine anwendungsspezifische integrierte Schaltung (ASIC), eine feldprogrammierbare Gate-Anordnung (FPGA) und eine Kombination davon. Die Funktionen der Erfassungseinheit 11 und der anderen Komponenten können jeweils durch eine dezentralisierte Prozessschaltung implementiert werden. Alternativ können die Funktionen der Erfassungseinheit 11 und der anderen Komponenten alle zusammen durch eine einzige Prozessschaltung implementiert werden.
  • Für einen Prozessor, der als die Prozessschaltung 81 dient, werden die Funktionen der Erfassungseinheit 11 und der anderen Komponenten in Kombination mit Software und anderen Dingen implementiert. Beispiele der Software und anderen Dinge beinhalten Software, Firmware und eine Kombination von Software und Firmware. Die Software und andere Dinge sind als ein Programm geschrieben und in einem Speicher gespeichert. Wie in 11 dargestellt, liest ein Prozessor 82, der als die Prozessschaltung 81 dient, ein in einem Speicher 83 gespeichertes Programm zum Ausführen, um die Funktion jeder Komponente zu implementieren. Das heißt, dass die Spracherkennungsvorrichtung 1 den Speicher 83 zum Speichern eines Programms beinhaltet, das, wenn es durch die Prozessschaltung 81 ausgeführt wird, die folgenden Schritte durchführt: Erfassen einer Stimme; Schätzen einer auszuführenden Suchfunktion durch Erkennen der erfassten Stimme; Speichern der Ausführungshäufigkeit der Suchfunktion; und Bezug nehmen auf die Ausführungshäufigkeit einer Schätzsuchfunktion, und dann Steuern der Ausführung der Schätzsuchfunktion, wobei die Schätzsuchfunktion die als geschätzte Suchfunktion ist. In anderen Worten bewirkt dieses Programm, dass ein Computer die Vorgehensweise oder das Verfahren der Erfassungseinheit 11 und der anderen Komponenten ausführt. Beispiele des Speichers 83 beinhalten hier einen nicht flüchtigen oder flüchtigen Halbleiterspeicher, wie zum Beispiel ein Direktzugriffsspeicher (RAM), Nur-Lese-Speicher (ROM), ein Flash-Speicher, ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM), ein elektrisch löschbarer programmierbarer Nur-Lese-Speicher (EEPROM), und beinhalten einen Festplattenlaufwerk (HDD), eine Magnetplatte, eine flexible Platte, eine optische Platte, eine Compact Disc, eine Mini-Disc, eine digitale vielseitige Platte (DVD) und einen Treiber dafür.
  • Das Voranstehende hat beschrieben, dass jede Funktion der Erfassungseinheit 11 und der anderen Komponenten durch eine der Hardware, Software und andere Ding implementiert ist. Manches Teil der Erfassungseinheit 11 und der anderen Komponenten können durch spezielle Hardware implementiert werden; und ein anderes Teil durch Software und andere Dinge. Die Funktion der Erfassungseinheit 11 kann zum Beispiel durch eine Prozessschaltung implementiert werden, die spezielle Hardware ist; darüber hinaus können die Funktionen der anderen durch die Prozessschaltung 81 (d.h. der Prozessor 82) implementiert werden, die das in dem Speicher 83 gespeicherte Programm liest und das Programm ausführt.
  • Wie oben beschrieben, implementiert die Prozessschaltung 81 die oben genannten individuellen Funktionen mit Hilfe von Hardware, Software und anderen Dingen, oder mit Hilfe einer Kombination davon.
  • Die Spracherkennungsvorrichtung in der vorangegangenen Beschreibung kann auch als ein Spracherkennungssystem benutzt werden, das als ein System eingerichtet ist durch zusammen Kombinieren, wie benötigt, einer Navigationsvorrichtung (z.B. eine tragbare Navigationsvorrichtung kurz PND), eines Kommunikationsterminals einschließlich eines tragbaren Terminals (z.B. ein Mobiltelefon, ein Smartphone oder ein Tablet), in dem die Funktionen der Anwendungen installiert sind, und eines Servers. Die individuellen Funktionen oder individuellen Komponenten der oben beschriebenen Spracherkennungsvorrichtung können in diesem Fall in den individuellen Vorrichtungen, die dieses System bilden, dezentralisiert sein oder können zentralisiert in einem dieser Vorrichtungen sein.
  • 12 ist ein Blockdiagramm der Konfiguration eines Servers 51 gemäß der vorliegenden Modifikation. Der Server 51 in 12 beinhaltet eine Kommunikationseinheit 51a, eine Schätzeinheit 51b, einen Ausführungshäufigkeitsspeicher 51c und eine Steuerung 51d. Der Server 51 ist in der Lage, mit einer Navigationsvorrichtung 53 kabellos zu kommunizieren, die in einem Fahrzeug 52 angebracht ist.
  • Die Kommunikationseinheit 51a, die eine Erfassungseinheit ist, kommuniziert kabellos mit der Navigationsvorrichtung 53, um eine in der Navigationsvorrichtung 53 erhaltene Stimme zu empfangen.
  • Die Schätzeinheit 51b, der Ausführungshäufigkeitsspeicher 51c und die Steuerung 51d haben dieselben Funktionen wie diese der Schätzeinheit 12, des Ausführungshäufigkeitsspeichers 13 und der Steuerung 14 in 1, wenn ein Prozessor (nicht gezeigt), der zum Beispiel in dem Server 51 beinhaltet ist, ein in einem Speicher, das in dem Server 51 beinhaltet ist, gespeichertes Programm (nicht gezeigt) ausführt. Das heißt, dass die Steuerung 51d auf die Ausführungshäufigkeit einer Schätzsuchfunktion Bezug nimmt, die eine durch die Schätzeinheit 51b geschätzte Suchfunktion ist und dann die Ausführung der Schätzsuchfunktion steuert. Die Steuereinheit 51a sendet zum Beispiel zusätzlich Steuerergebnisse in die Steuerung 51d oder die Suchergebnisse der ausgeführten Suchfunktion an die Navigationsvorrichtung 53.
  • Der Server 51, der solch eine Konfiguration hat, erzielt einen Effekt, der ähnlich ist zu dem, der durch die in der ersten Ausführungsform beschriebene Spracherkennungsvorrichtung 1 erzielt wird.
  • 13 ist ein Blockdiagramm der Konfiguration eines Kommunikationsterminals 56 gemäß der vorliegenden Modifikation. Das Kommunikationsterminal 56 in 13 beinhaltet eine Kommunikationseinheit 56a, eine Schätzeinheit 56b, einen Ausführungshäufigkeitsspeicher 56c und eine Steuerung 56d, die identisch sind mit der Kommunikationseinheit 51a, der Schätzeinheit 51b, des Ausführungshäufigkeitsspeicher 51c und der Steuerung 51d in 12. Das Kommunikationsterminal 56 ist in der Lage, mit einer Navigationsvorrichtung 58 kabellos zu kommunizieren, die in einem Fahrzeug 57 angebracht ist. Ein Beispiel des Kommunikationsterminals 56 ist ein tragbares Terminal, das von dem Fahrer des Fahrzeugs 57 getragen wird, wie zum Beispiel ein Mobiltelefon, ein Smartphone oder ein Tablet. Der Server 56, der solch eine Konfiguration hat, erzielt einen Effekt, der ähnlich ist zu dem, der durch die in der ersten Ausführungsform beschriebene Spracherkennungsvorrichtung 1 erzielt wird.
  • Es ist anzumerken, dass in der vorliegenden Erfindung die individuellen Ausführungsformen frei kombiniert werden können oder modifiziert und gegebenenfalls weggelassen werden können, innerhalb des Umfangs der Erfindung.
  • Während die Erfindung ausführlich dargestellt und beschrieben wurde, ist die vorstehende Beschreibung in allen Aspekten illustrativ und nicht einschränkend. Es versteht sich daher, dass zahlreiche Modifikationen und Variationen vorgenommen werden können, ohne vom Umfang der Erfindung abzuweichen.
  • Bezugszeichenliste
  • 1 Spracherkennungsvorrichtung, 11 Erfassungseinheit, 12 Schätzeinheit, 13 Ausführungshäufigkeitsspeicher, 14 Steuerung, 25 Suchfunktions-Benachrichtigungseinheit, 29 Suchergebnis-Benachrichtigungseinheit.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 200315688 [0004]

Claims (14)

  1. Eine Spracherkennungsvorrichtung umfassend: eine Erfassungseinheit, die konfiguriert ist zum Erfassen einer Stimme; eine Schätzeinheit, die konfiguriert ist zum Schätzen einer auszuführenden Suchfunktion durch Erkennen der durch die Erfassungseinheit erfassten Stimme; einen Ausführungshäufigkeitsspeicher, der konfiguriert ist zum Speichern einer Ausführungshäufigkeit der Suchfunktion; und eine Steuerung, die konfiguriert ist zum Bezug nehmen auf die Ausführungshäufigkeit einer Schätzsuchfunktion, und dann zum Steuern der Ausführung der Schätzsuchfunktion, wobei die Schätzsuchfunktion die durch die Schätzeinheit geschätzte Suchfunktion ist.
  2. Die Spracherkennungsvorrichtung gemäß Anspruch 1, wobei die Ausführungshäufigkeit in eine Vielzahl von Ausführungshäufigkeitslevels klassifiziert ist, und die Steuerung auf das Ausführungshäufigkeitslevel Bezug nimmt, zu der die Ausführungshäufigkeit gehört, und dann die Ausführung der Schätzsuchfunktion steuert.
  3. Die Spracherkennungsvorrichtung gemäß Anspruch 2, wobei die Steuerung auf das Ausführungshäufigkeitslevel Bezug nimmt, zu der die Ausführungshäufigkeit der Schätzsuchfunktion gehört, und dann die Ausführung der Schätzsuchfunktion steuert, und die Steuerung eine Benachrichtigungseinheit steuert, um die Schätzsuchfunktion zu benachrichtigen.
  4. Die Spracherkennungsvorrichtung gemäß Anspruch 3, wobei wenn das Ausführungshäufigkeitslevel ein erstes Level ist, die Steuerung die Benachrichtigungseinheit steuert, um die Schätzsuchfunktion zu benachrichtigen, und auch die Ausführung der Schätzsuchfunktion in Antwort auf eine externe Anweisung steuert, wenn die Ausführungshäufigkeit ein zweites Level höher als das erste Level ist, die Steuerung die Benachrichtigungseinheit steuert, um die Schätzsuchfunktion zu benachrichtigen, und auch die Ausführung der Schätzsuchfunktion ungeachtet der externen Anweisung steuert, und wenn die Ausführungshäufigkeit ein drittes Level höher als das zweite Level ist, die Steuerung die Ausführung der Schätzsuchfunktion ungeachtet der externen Anweisung steuert, ohne dass sie die Benachrichtigungseinheit steuert, die Schätzsuchfunktion zu benachrichtigen.
  5. Die Spracherkennungsvorrichtung gemäß Anspruch 1, wobei die in dem Ausführungshäufigkeitsspeicher gespeicherte Ausführungshäufigkeit einen Initialwert umfasst, der vorher registrierbar ist.
  6. Die Spracherkennungsvorrichtung gemäß Anspruch 1, wobei der Ausführungshäufigkeitsspeicher die Ausführungshäufigkeit der Schätzsuchfunktion auf der Basis von, ob ein Suchergebnis der ausgeführten Schätzsuchfunktion benutzt worden ist, ändert.
  7. Die Spracherkennungsvorrichtung gemäß Anspruch 1, wobei die Steuerung eine Benachrichtigungseinheit steuert, um ein Suchergebnis der ausgeführten Schätzsuchfunktion zu benachrichtigen, und wenn eine Vielzahl der Schätzsuchfunktionen von der Schätzung in der Schätzeinheit erhalten werden, die Steuerung Schalten von Ausführen einer der Vielzahl der Schätzsuchfunktionen, die ursprünglich ausgeführt wird, auf Ausführen einer verschiedenen von der Vielzahl der Schätzsuchfunktionen innerhalb eines Zeitraums von einem Ausführungsstart der einen Schätzsuchfunktion bis zu einem Ausführungsende der einen Schätzsuchfunktion steuert.
  8. Die Spracherkennungsvorrichtung gemäß Anspruch 7, wobei die Steuerung die Benachrichtigungseinheit steuert, um, innerhalb des Zeitraums, die Vielzahl der Schätzsuchfunktionen in einer Reihenfolge der Ausführungshäufigkeiten zu benachrichtigen.
  9. Die Spracherkennungsvorrichtung gemäß Anspruch 7, wobei die Steuerung die Benachrichtigungseinheit steuert, um innerhalb des Zeitraums eine oder mehrere der Schätzsuchfunktionen zu benachrichtigen, und Schalten von Ausführung der einen Schätzsuchfunktion auf Ausführen der anderen Schätzsuchfunktion in Antwort auf eine externe Anweisung innerhalb des Zeitraums steuert.
  10. Die Spracherkennungsvorrichtung gemäß Anspruch 1, wobei, wenn eine Vielzahl der Schätzsuchfunktionen von der Schätzung in der Schätzeinheit erhalten wird, die Steuerung gleichzeitige Ausführung der Vielzahl der Schätzsuchfunktionen steuert und auch eine Benachrichtigungseinheit steuert, um Suchergebnisse, die von der gleichzeitigen Ausführung erhalten werden, in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen benachrichtigt.
  11. Die Spracherkennungsvorrichtung gemäß Anspruch 10, wobei in der Benachrichtigungseinheit Benachrichtigungen der Suchergebnisse von der Vielzahl der Schätzsuchfunktionen in Übereinstimmung mit den jeweiligen Schätzsuchfunktionen gewechselt werden, und das Suchergebnis der Schätzsuchfunktion mit einer höchsten Ausführungshäufigkeit von der Vielzahl der Schätzsuchfunktionen ursprünglich benachrichtigt wird.
  12. Die Spracherkennungsvorrichtung gemäß Anspruch 10, wobei, nach der Steuerung der gleichzeitigen Ausführung der Vielzahl der Schätzsuchfunktionen, die Steuerung die Benachrichtigungseinheit steuert, um zu einem Zeitpunkt, wenn das Suchergebnis der Schätzsuchfunktion mit einer höchsten Ausführungshäufigkeit von der Vielzahl der Schätzsuchfunktionen erhalten wird, die Suchergebnisse der Vielzahl der Schätzsuchfunktionen, die bis zu dem Zeitpunkt erhalten worden sind, zu benachrichtigen.
  13. Die Spracherkennungsvorrichtung gemäß Anspruch 10, wobei eine oder mehrere der Vielzahl der Schätzsuchfunktionen durch eine Vorrichtung ausgeführt werden, die sich außerhalb der Spracherkennungsvorrichtung befindet.
  14. Ein Spracherkennungsverfahren umfassend: Erfassen einer Stimme; Schätzen einer auszuführenden Suchfunktion durch Erkennen der erfassten Stimme; Speichern einer Ausführungshäufigkeit der Suchfunktion; und Bezug nehmen auf die Ausführungshäufigkeit einer Schätzsuchfunktion, und dann Steuern der Ausführung der Schätzsuchfunktion, wobei die Schätzsuchfunktion die als geschätzte Suchfunktion ist.
DE112016007158.2T 2016-10-19 2016-10-19 Spracherkennungsvorrichtung Active DE112016007158B4 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/080919 WO2018073907A1 (ja) 2016-10-19 2016-10-19 音声認識装置及び音声認識方法

Publications (2)

Publication Number Publication Date
DE112016007158T5 true DE112016007158T5 (de) 2019-05-09
DE112016007158B4 DE112016007158B4 (de) 2020-12-03

Family

ID=62018899

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112016007158.2T Active DE112016007158B4 (de) 2016-10-19 2016-10-19 Spracherkennungsvorrichtung

Country Status (5)

Country Link
US (1) US11126661B2 (de)
JP (1) JP6494879B2 (de)
CN (1) CN109891499B (de)
DE (1) DE112016007158B4 (de)
WO (1) WO2018073907A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356275B (zh) * 2021-12-06 2023-12-29 上海小度技术有限公司 交互控制方法、装置、智能语音设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015688A (ja) 2001-07-03 2003-01-17 Matsushita Electric Ind Co Ltd 音声認識方法および装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366906B1 (en) * 1999-07-15 2002-04-02 International Business Machines Corporation Method and apparatus for implementing a search selection tool on a browser
KR20020008848A (ko) * 2000-03-31 2002-01-31 이데이 노부유끼 로봇 장치, 로봇 장치의 행동 제어 방법, 외력 검출 장치및 외력 검출 방법
JP2001306089A (ja) * 2000-04-24 2001-11-02 Alpine Electronics Inc 音声処理装置およびナビゲーション装置
JP2002055871A (ja) * 2000-08-11 2002-02-20 Sony Corp 情報閲覧装置および情報閲覧方法
JP4155383B2 (ja) * 2001-03-05 2008-09-24 アルパイン株式会社 音声認識機器操作装置
US20030172082A1 (en) * 2002-03-06 2003-09-11 Jeffrey Benoit Method and system for accessing action item information
JP3724461B2 (ja) * 2002-07-25 2005-12-07 株式会社デンソー 音声制御装置
US7031915B2 (en) * 2003-01-23 2006-04-18 Aurilab Llc Assisted speech recognition by dual search acceleration technique
US7685254B2 (en) * 2003-06-10 2010-03-23 Pandya Ashish A Runtime adaptable search processor
US20140019542A1 (en) * 2003-08-20 2014-01-16 Ip Holdings, Inc. Social Networking System and Behavioral Web
US9202220B2 (en) * 2003-10-06 2015-12-01 Yellowpages.Com Llc Methods and apparatuses to provide application programming interface for retrieving pay per call advertisements
US20120158695A1 (en) * 2004-09-07 2012-06-21 Mr. Scott P. Stuart More efficient search algorithm (MESA) using: integrated system optimizer
CN101243380A (zh) * 2005-08-15 2008-08-13 皇家飞利浦电子股份有限公司 用于个人卫生保健环境的用户界面***
WO2008011454A2 (en) * 2006-07-18 2008-01-24 Chacha Search, Inc. Anonymous search system using human searchers
US10394771B2 (en) * 2007-02-28 2019-08-27 International Business Machines Corporation Use of search templates to identify slow information server search patterns
JP4436894B2 (ja) * 2007-08-09 2010-03-24 パナソニック株式会社 コンテンツ検索装置
EP2275953B1 (de) * 2009-06-30 2018-10-24 LG Electronics Inc. Mobiles Endgerät
US8209349B2 (en) * 2010-02-01 2012-06-26 Rockmelt, Inc. Integrated saved search results
US9252900B2 (en) * 2012-06-01 2016-02-02 Blackberry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
US8990176B2 (en) * 2012-09-10 2015-03-24 Microsoft Technology Licensing, Llc Managing a search index
KR20140055302A (ko) * 2012-10-31 2014-05-09 엘지전자 주식회사 이동 단말기 및 그 제어 방법
US9886507B2 (en) * 2014-04-30 2018-02-06 International Business Machines Corporation Reranking search results using download time tolerance
US9293132B2 (en) * 2014-08-06 2016-03-22 Honda Motor Co., Ltd. Dynamic geo-fencing for voice recognition dictionary

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015688A (ja) 2001-07-03 2003-01-17 Matsushita Electric Ind Co Ltd 音声認識方法および装置

Also Published As

Publication number Publication date
JP6494879B2 (ja) 2019-04-03
CN109891499A (zh) 2019-06-14
CN109891499B (zh) 2022-12-09
US20200380040A1 (en) 2020-12-03
DE112016007158B4 (de) 2020-12-03
US11126661B2 (en) 2021-09-21
JPWO2018073907A1 (ja) 2019-03-28
WO2018073907A1 (ja) 2018-04-26

Similar Documents

Publication Publication Date Title
DE102014109121B4 (de) Systeme und Verfahren zur Arbitrierung eines Sprachdialogdienstes
DE112010005959B4 (de) Verfahren und System zur automatischen Erkennung eines Endpunkts einer Tonaufnahme
DE102018113034A1 (de) Stimmenerkennungssystem und stimmenerkennungsverfahren zum analysieren eines befehls, welcher mehrere absichten hat
DE112011105407T5 (de) Spracherkennungsvorrichtung und Navigationsvorrichtung
DE102015213715A1 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE102014109122A1 (de) Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
DE112014006614T5 (de) Benutzerschnittstellensystem, Benutzerschnittstellensteuereinrichtung, Benutzerschnittstellensteuerverfahren und Benutzerschnittstellensteuerprogramm
DE102009002402A1 (de) Einrichtung, Verfahren und Programm in einem Fahrzeug
DE102014017384A1 (de) Kraftfahrzeug-Bedienvorrichtung mit Korrekturstrategie für Spracherkennung
EP1926081A1 (de) Verfahren zur Dialoganpassung und Dialogsystem zur Durchführung
DE102017209262A1 (de) Verfahren und Vorrichtung zur automatischen Gestenerkennung
DE102005018174A1 (de) Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
DE112018007847B4 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
DE102014107028A1 (de) Verbesserte biometrische Passwortsicherheit
DE60214850T2 (de) Für eine benutzergruppe spezifisches musterverarbeitungssystem
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE112014007287T5 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
WO2014131763A2 (de) Wortwahlbasierte sprachanalyse und sprachanalyseeinrichtung
EP3095114A1 (de) Verfahren und system zur erzeugung eines steuerungsbefehls
DE102016217026A1 (de) Sprachsteuerung eines Kraftfahrzeugs
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE112016007158T5 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
EP3335405B1 (de) Verfahren zum verarbeiten einer benutzereingabe und kraftfahrzeug mit einer datenverarbeitungseinrichtung
DE102014119335A1 (de) Informationsverarbeitungsverfahren und elektronische Vorrichtung
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0015100000

Ipc: G10L0015220000

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R084 Declaration of willingness to licence
R020 Patent grant now final