JP6611091B2 - 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法 - Google Patents

情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法 Download PDF

Info

Publication number
JP6611091B2
JP6611091B2 JP2019517489A JP2019517489A JP6611091B2 JP 6611091 B2 JP6611091 B2 JP 6611091B2 JP 2019517489 A JP2019517489 A JP 2019517489A JP 2019517489 A JP2019517489 A JP 2019517489A JP 6611091 B2 JP6611091 B2 JP 6611091B2
Authority
JP
Japan
Prior art keywords
keyword
dictionary database
processing device
database
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019517489A
Other languages
English (en)
Other versions
JPWO2018207485A1 (ja
Inventor
頼宣 前田
善成 石橋
昌治 板谷
大輔 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Manufacturing Co Ltd
Original Assignee
Murata Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Manufacturing Co Ltd filed Critical Murata Manufacturing Co Ltd
Application granted granted Critical
Publication of JP6611091B2 publication Critical patent/JP6611091B2/ja
Publication of JPWO2018207485A1 publication Critical patent/JPWO2018207485A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法に関わる。
ソーシャル・ネットワーキング・サービス(SNS)や口コミサイトの普及に伴い、特定の施設や店舗に関する他人のメッセージや評価を参考にする顧客が増加している。例えば、顧客は、SNSで肯定的なメッセージが投稿されている施設への訪問や、口コミサイトで高い評価が付けられている店舗の利用を検討することが有る。このようなSNSや口コミサイトでは、ステルスマーケティングと呼ばれる行為が行われることがある。ステルスマーケティングとは、一般消費者になりすまして口コミや記事を投稿し、商品広告であると気づかれないように、一般消費者向けに宣伝をして商品又はサービスを人為的に流行らせる行為である。このため、SNSや口コミサイトなどのインターネット上での評価を分析するだけでは、インターネット上で高評価を受けている商品又はサービスがインターネット上でのみ流行しているのか、或いは、現実世界でも実際に流行しているのかを判断するのは困難である。一方、引用文献1,2に記載されているように、音声情報をテキスト化してこれを文字情報として認識する音声認識技術が知られている。
国際公開WO2008/072413A1号公報 特開2016−90891号公報
しかし、特許文献1,2に記載の音声認識技術を用いて、顧客の音声からキーワードを抽出し、商品又はサービスが実際に流行しているか否かをキーワードから判断するには、その判断が適切に行われるように、キーワードを登録する辞書データベースを最適化する必要がある。
そこで、本発明は、商品又はサービスが実際に流行しているか否かを適切に判断できるように、辞書データベースを最適化することを課題とする。
上述の課題を解決するため、本発明に関わる情報処理システムは、音声処理装置と情報処理装置とを備える。音声処理装置は、音声を収集する音声収集手段と、キーワードを登録する辞書データベースと、音声収集手段により収集された音声から、辞書データベースに登録されているキーワードを抽出する抽出手段と、辞書データベースの更新指示を作成する指示手段と、抽出手段により抽出されたキーワードと、指示手段により作成された更新指示とを情報処理装置に送信する第1の通信手段と、を備える。情報処理装置は、第1の通信手段から送信されたキーワード及び更新指示を受信する第2の通信手段と、第2の通信手段を通じて受信されたキーワードを格納するキーワードデータベースと、第2の通信手段を通じて受信された更新指示に応答して、キーワードデータベースに格納されているキーワードの関連語を推測する推測手段と、キーワードデータベースに格納されているキーワードと、推測された関連語とに基づいて、更新後の辞書データベースを作成する辞書データベース作成手段と、を備える。第2の通信手段は、更新後の辞書データベースを音声処理装置に送信する。
本発明に関わる情報処理システムによれば、商品又はサービスが実際に流行しているか否かを適切に判断できるように、辞書データベースを最適化することができる。
本実施形態に関わる情報処理システムの構成図である。 本実施形態に関わるキーワード抽出処理の流れを示すフローチャートである。 本実施形態に関わる辞書データベース更新処理の流れを示すフローチャートである。
以下、各図を参照しながら本発明の実施形態について説明する。ここで、同一符号は同一の構成要素を示すものとし、重複する説明は省略する。
図1は、本発明の実施形態に関わる情報処理システム10の構成図である。情報処理システム10は、商品又はサービスが実際に流行しているか否かを音声認識により判断するためのコンピュータシステムである。情報処理システム10は、音声処理装置20と、情報処理装置30とを備えている。音声処理装置20及び情報処理装置30は、通信ネットワーク40を通じて通信可能に接続されている。
音声処理装置20は、顧客の音声を収集し、収集した音声からキーワードを抽出する処理を行うためのコンピュータである。「キーワード」は、商品又はサービスが実際に流行しているか否かを音声認識により判断するための指標となる単語である。顧客の音声から抽出されるキーワードが、例えば、「ハンドル」、「ブレーキ」、「タイヤ」などである場合、「車」に関する話題がなされているものと推測できる。音声処理装置20は、顧客が利用する施設や店舗に設置されているコンピュータでもよいし、或いは、施設や店舗を利用する顧客が所有するコンピュータ(例えば、スマートフォンと呼ばれる多機能携帯電話機や、タブレット端末など)でもよい。
音声処理装置20は、そのハードウエア資源として、プロセッサ21、記憶資源22、通信インタフェース23、及びマイク24を備える。マイク24は、音声処理装置20の内蔵マイクでもよく、或いは外付けマイク(外付け型の有線式マイク又は無線式のマイク)でもよい。例えば、外付けマイクが接続されたタブレット端末は、音声処理装置20として機能する。
プロセッサ21は、算術演算、論理演算、ビット演算などを処理する算術論理演算ユニット及び各種レジスタ(データレジスタ、命令レジスタ、汎用レジスタなど)を備えるCPU(Central Processing Unit)である。プロセッサ21は、記憶資源22に格納されているコンピュータプログラム220を解釈及び実行することにより、音声処理装置20の動作(例えば、音声収集処理、キーワード抽出処理、通信処理など)を制御する。
記憶資源22は、物理デバイスの記憶領域が提供する論理デバイスであり、記憶手段として機能する。物理デバイスとして、例えば、ハードディスクドライブ、ソリッドステートドライブ、メモリカード、光ディスクドライブ、半導体メモリなどのコンピュータ読み取り可能な記録媒体を用いることができる。半導体メモリは、揮発性メモリでもよく、或いは不揮発性メモリでもよい。記憶資源22には、コンピュータプログラム220と、辞書データベース230とが記憶されている。辞書データベース230には、キーワードが登録されている。
通信インタフェース23は、通信ネットワーク40を経由して音声処理装置20と情報処理装置30との間の通信を制御する。通信ネットワーク40は、例えば、有線ネットワーク(例えば、近距離通信網、広域通信網、又は付加価値通信網等)と無線ネットワーク(移動通信網、衛星通信網、ブルートゥース、WiFi(Wireless Fidelity)、HSDPA(High Speed Downlink Packet Access)等)とが混在する通信網である。音声処理装置20と情報処理装置30との間には、両者間の通信プロトコルを変換するゲートウェイサーバが介在してもよい。
マイク24は、例えば、パラボラ付きの集音板を備えた集音マイクであり、音声を収集する音声収集手段として機能する。マイク24は、施設や店舗を利用する顧客の音声を集音し、集音した音声をA/D変換して、記憶資源22の一部の記憶領域(バッファメモリ)に一時的に保存する。
コンピュータプログラム220は、音声処理装置20の動作を制御するためのプログラムであり、メインプログラムの中で呼び出されて実行される複数のソフトウェアモジュールを備える。このようなソフトウェアモジュールは、それぞれ特定の処理(例えば、キーワード抽出処理、辞書データベース更新指示作成処理、通信処理など)を実行するためにモジュール化されたサブプログラムである。ソフトウェアモジュールは、例えば、プロシージャ、サブルーチン、メソッド、関数、又はデータ構造などを用いて作成される。モジュール化されたサブプログラムとして、コンピュータプログラム220は、キーワード抽出モジュール221、辞書データベース更新指示作成モジュール222、及び通信モジュール223を備える。
キーワード抽出モジュール221は、辞書データベース230に登録されているキーワードに一致するキーワードを、マイク24により収集された音声から抽出する処理を記述するサブプログラムである。キーワード抽出モジュール221は、マイク24により収集された音声の情報をテキスト化してこれを文字列情報として認識し、文字列情報とキーワードとを比較することにより、音声からキーワードを抽出する。音声の情報をテキスト化する処理では、マイク24により収集された音声の情報から発話区間が検出され、検出した発話区間について、統計言語モデルに基づくパターンマッチングが行われる。統計言語モデルは、例えば、単語の出現分布や、ある単語の次に出現する単語の分布などの言語表現の出現確率を計算するための確率モデルである。音声処理装置20のハードウエア資源とキーワード抽出モジュール221との協働によって、マイク24により収集された音声から、辞書データベース230に登録されているキーワードを抽出する抽出手段としての機能が実現される。
辞書データベース更新指示作成モジュール222は、辞書データベース230を更新するための指示(辞書データベース更新指示)を作成する処理を記述するサブプログラムである。辞書データベース更新指示は、所定の契機で作成される。ここで、所定の契機は、辞書データベース230のヒット率が予め定められた閾値を下回った時点でもよく、或いは、予め定められた一定間隔でもよい。ヒット率とは、辞書データベース230に登録されている全てのキーワードのうち、顧客の音声に含まれているものと判定されたことのあるキーワードの割合を意味する。音声処理装置20のハードウエア資源と辞書データベース更新指示作成モジュール222との協働によって、辞書データベース更新指示を作成する指示手段としての機能が実現される。
通信モジュール223は、音声処理装置20と情報処理装置30との間の通信プロトコルに従った通信処理を記述するサブプログラムである。音声処理装置20のハードウエア資源と通信モジュール223との協働によって、通信手段としての機能が実現される。キーワード抽出モジュール221によって抽出されたキーワードは、通信インタフェース23を通じて情報処理装置30に送信される。同様に、辞書データベース更新指示作成モジュール222によって作成された辞書データベース更新指示は、通信インタフェース23を通じて情報処理装置30に送信される。
情報処理装置30は、音声処理装置20から送信されるキーワードを受信し、これを蓄積することにより、蓄積されたキーワードから話題を推測するコンピュータである。推測された話題は、例えば、広告業者に提供される。また、情報処理装置30は、辞書データベース230を最適化するために、辞書データベース230を更新する処理をも行う。
情報処理装置30は、そのハードウエア資源として、プロセッサ31、記憶資源32、及び通信インタフェース33を備える。プロセッサ31、記憶資源32、及び通信インタフェース33のハードウエア構成は、プロセッサ21、記憶資源22、及び通信インタフェース23のハードウエア構成と同様であるため、その詳細な説明を省略する。
通信インタフェース33は、音声処理装置20から送信されるキーワード及び辞書データベース更新指示を受信する。記憶資源32には、コンピュータプログラム320と、キーワードデータベース330とが記憶されている。キーワードデータベース330は、通信インタフェース33を通じて受信されたキーワードを格納する。
コンピュータプログラム320は、情報処理装置30の動作を制御するためのプログラムであり、メインプログラムの中で呼び出されて実行される複数のソフトウェアモジュールを備える。このようなソフトウェアモジュールは、それぞれ特定の処理(例えば、関連語推測処理、辞書データベース更新処理、通信処理など)を実行するためにモジュール化されたサブプログラムである。このようなソフトウェアモジュールとして、コンピュータプログラム320は、推測モジュール321、辞書データベース作成モジュール322、及び通信モジュール323を備える。
推測モジュール321は、通信インタフェース33を通じて受信された辞書データベース更新指示に応答して、キーワードデータベース330に格納されているキーワードの関連語を推測するサブプログラムである。キーワードの関連語とは、キーワードと頻繁に同時に使われる語句を意味し、このような語句は、「共起語」とも呼ばれている。共起語は、同意語を必ずしも意味するものではない。推測モジュール321は、例えば、人工知能を応用した共起語検索ツールである。このような共起語検索ツールとして、例えば、グーグルやヤフーなどの検索結果の上位となるウェブページのコンテンツで形態素解析を行い、同一文書に頻出する語句を共起語として提示するものが知られている。形態素解析とは、文法的な情報の注記のない自然言語のテキストデータから、対象言語の文法や、辞書と呼ばれる単語の品詞などの情報に基づき、形態素(言語で意味を持つ最小単位)の列に分解し、それぞれの形態素の品詞などを判別する作業を意味する。情報処理装置30のハードウエア資源と推測モジュール321との協働によって、キーワードの関連語を推測する推測手段としての機能が実現される。
辞書データベース作成モジュール322は、通信インタフェース33を通じて受信された辞書データベース更新指示に応答して、辞書データベース230を更新するサブプログラムである。辞書データベース作成モジュール322は、キーワードデータベース330に格納されているキーワードと、推測モジュール321により推測された関連語とに基づいて、更新後の辞書データベース230を作成する。更新後の辞書データベース230は、顧客の音声から抽出されたことのあるキーワードとその関連語をキーワードとして登録している。更新前の辞書データベース230に登録されているキーワードのうち、顧客の音声から抽出されたことのないキーワードは、更新後の辞書データベース230から削除される。このような更新処理を繰り返すことにより、辞書データベース230のヒット率を高めることができる。情報処理装置30のハードウエア資源と辞書データベース作成モジュール322との協働によって、更新後の辞書データベース230を作成する辞書データベース作成手段としての機能が実現される。
通信モジュール323は、情報処理装置30と音声処理装置20との間の通信プロトコルに従った通信処理を記述するサブプログラムである。情報処理装置30のハードウエア資源と通信モジュール323との協働によって、通信手段としての機能が実現される。通信インタフェース33は、更新後の辞書データベース230を音声処理装置20に送信する。更新後の辞書データベース230を受信した音声処理装置20は、更新前の辞書データベース230を更新後の辞書データベース230に差し替える。
なお、本明細書では、音声処理装置20の通信手段と、情報処理装置30の通信手段とを区別する場合、前者を第1の通信手段と呼び、後者を第2の通信手段と呼ぶ。
説明の便宜上、図1では、単一の音声処理装置20が単一の情報処理装置30に接続している例を示したが、複数の音声処理装置20が複数の情報処理装置30に接続してもよい。また、複数の音声処理装置20が単一の情報処理装置30に接続してもよく、或いは、単一の音声処理装置20が複数の情報処理装置30に接続してもよい。
次に、図2を参照しながら、キーワード抽出処理の流れについて説明する。
音声処理装置20は、マイク24を通じて顧客の音声を収集する(ステップ201)。マイク24は、音声処理装置20が稼働している間に音声を収集し続けてもよく、或いは、間欠的に(一定時間間隔で)音声を収集してもよい。次に、音声処理装置20は、辞書データベース230を参照し(ステップ202)、音声からキーワードを抽出する(ステップ203)。音声処理装置20は、音声処理装置20が稼働している間に、音声からキーワードを抽出し続けてもよい。次に、音声処理装置20は、抽出したキーワードを情報処理装置30に送信する(ステップ204)。音声処理装置20は、音声処理装置20が稼働している間にキーワードを情報処理装置30に送信し続けてもよく、或いは間欠的に(一定時間間隔で)キーワードを情報処理装置30に送信してもよい。なお、マイク24により収集された音声からキーワードが抽出されない場合には、情報処理装置30へのキーワードの送信は行われない。一方、情報処理装置30は、音声処理装置20から送信されるキーワードを受信し(ステップ205)、受信したキーワードをキーワードデータベース330に登録する(ステップ206)。
次に、図3を参照しながら、辞書データベース更新処理の流れについて説明する。
音声処理装置20は、所定の契機で辞書データベース更新指示を作成し(ステップ301)、これを情報処理装置30に送信する(ステップ302)。情報処理装置30は、辞書データベース更新指示を受信すると(ステップ303)、キーワードデータベース330からキーワードを取得し(ステップ304)、キーワードの関連語を推測する(ステップ305)。次に、情報処理装置30は、キーワードとその関連語に基づいて、更新後の辞書データベース230を作成し(ステップ306)、これを音声処理装置20に送信する(ステップ307)。音声処理装置20は、更新後の辞書データベース230を受信すると(ステップ308)、更新前の辞書データベース230を更新後の辞書データベース230に差し替えることにより、辞書データベース230を更新する(ステップ309)。
以上説明したように、音声処理装置20の辞書データベース230に登録されているキーワードに一致するものとして、音声処理装置20が収集した音声から抽出されたキーワードとその関連語とに基づいて辞書データベース230を更新することにより、辞書データベース230のヒット率を高めることができる。これにより、商品又はサービスが実際に流行しているか否かを適切に判断できるように、辞書データベース230を最適化することができる。また、マイク24が収集する音声は、顧客が実際に発話した音声であるため、インターネット上の評価ではなく、現実社会における評価を基礎として、商品又はサービスが実際に流行しているか否かを判断できる。また、辞書データベース230の更新を繰り返すことにより、不要なキーワードは、辞書データベース230から削除されるため、辞書データベース230の記憶容量は少なくてもよい。これにより、音声処理装置20の小型化及び低消費電力化が可能となる。
なお、以上説明した各実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更/改良され得るととともに、本発明にはその等価物も含まれる。即ち、各実施形態に当業者が適宜設計変更を加えたものも、本発明の特徴を備えている限り、本発明の範囲に包含される。また、各実施形態が備える各要素は、技術的に可能な限りにおいて組み合わせることができ、これらを組み合わせたものも本発明の特徴を含む限り本発明の範囲に包含される。
10…情報処理システム 20…音声処理装置 21…プロセッサ 22…記憶資源 23…通信インタフェース 24…マイク 30…情報処理装置 31…プロセッサ 32…記憶資源 33…通信インタフェース 40…通信ネットワーク 220…コンピュータプログラム 221…キーワード抽出モジュール 222…辞書データベース更新指示作成モジュール 223…通信モジュール 230…辞書データベース 320…コンピュータプログラム 321…推測モジュール 322…辞書データベース作成モジュール 323…通信モジュール 330…キーワードデータベース

Claims (4)

  1. 音声処理装置と情報処理装置とを備える情報処理システムであって、
    前記音声処理装置は、
    音声を収集する音声収集手段と、
    キーワードを登録する辞書データベースと、
    前記音声収集手段により収集された前記音声から、前記辞書データベースに登録されている前記キーワードを抽出する抽出手段と、
    前記辞書データベースの更新指示を作成する指示手段と、
    前記抽出手段により抽出された前記キーワードと、前記指示手段により作成された前記更新指示とを前記情報処理装置に送信する第1の通信手段と、を備え、
    前記情報処理装置は、
    前記第1の通信手段から送信された前記キーワード及び前記更新指示を受信する第2の通信手段と、
    前記第2の通信手段を通じて受信された前記キーワードを格納するキーワードデータベースと、
    前記第2の通信手段を通じて受信された前記更新指示に応答して、前記キーワードデータベースに格納されているキーワードの関連語を推測する推測手段と、
    前記キーワードデータベースに格納されているキーワードと、前記推測された関連語とに基づいて、更新後の辞書データベースを作成する辞書データベース作成手段と、を備え、
    前記第2の通信手段は、前記更新後の辞書データベースを前記音声処理装置に送信する、情報処理システム。
  2. 音声処理装置の辞書データベースに登録されているキーワードに一致するものとして、前記音声処理装置が収集した音声から抽出されたキーワードと、前記辞書データベースの更新指示とを前記音声処理装置から受信する通信手段と、
    前記通信手段を通じて受信された前記キーワードを格納するキーワードデータベースと、
    前記通信手段を通じて受信された前記更新指示に応答して、前記キーワードデータベースに格納されているキーワードの関連語を推測する推測手段と、
    前記キーワードデータベースに格納されているキーワードと、前記推測された関連語とに基づいて、更新後の辞書データベースを作成する辞書データベース作成手段と、を備え、
    前記通信手段は、前記更新後の辞書データベースを前記音声処理装置に送信する、情報処理装置。
  3. コンピュータに、
    音声処理装置の辞書データベースに登録されているキーワードに一致するものとして、前記音声処理装置が収集した音声から抽出されたキーワードと、前記辞書データベースの更新指示とを前記音声処理装置から受信するステップと、
    前記受信されたキーワードをキーワードデータベースに格納するステップと、
    前記受信された更新指示に応答して、前記キーワードデータベースに格納されているキーワードの関連語を推測するステップと、
    前記キーワードデータベースに格納されているキーワードと、前記推測された関連語とに基づいて、更新後の辞書データベースを作成するステップと、
    前記更新後の辞書データベースを前記音声処理装置に送信するステップと、
    を実行させる、コンピュータプログラム。
  4. コンピュータが、
    音声処理装置の辞書データベースに登録されているキーワードに一致するものとして、前記音声処理装置が収集した音声から抽出されたキーワードと、前記辞書データベースの更新指示とを前記音声処理装置から受信するステップと、
    前記受信されたキーワードをキーワードデータベースに格納するステップと、
    前記受信された更新指示に応答して、前記キーワードデータベースに格納されているキーワードの関連語を推測するステップと、
    前記キーワードデータベースに格納されているキーワードと、前記推測された関連語とに基づいて、更新後の辞書データベースを作成するステップと、
    前記更新後の辞書データベースを前記音声処理装置に送信するステップと、
    を実行する、辞書データベースの更新方法。
JP2019517489A 2017-05-11 2018-03-27 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法 Active JP6611091B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017094907 2017-05-11
JP2017094907 2017-05-11
PCT/JP2018/012432 WO2018207485A1 (ja) 2017-05-11 2018-03-27 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法

Publications (2)

Publication Number Publication Date
JP6611091B2 true JP6611091B2 (ja) 2019-11-27
JPWO2018207485A1 JPWO2018207485A1 (ja) 2020-02-27

Family

ID=64105194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019517489A Active JP6611091B2 (ja) 2017-05-11 2018-03-27 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法

Country Status (4)

Country Link
US (1) US11289071B2 (ja)
JP (1) JP6611091B2 (ja)
CN (1) CN110574102B (ja)
WO (1) WO2018207485A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002493A1 (ko) * 2019-07-01 2021-01-07 엘지전자 주식회사 지능형 게이트웨이 장치 및 그를 포함하는 제어 시스템

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3956730B2 (ja) * 2002-03-15 2007-08-08 富士ゼロックス株式会社 言語処理装置
US7194460B2 (en) * 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
KR100679051B1 (ko) * 2005-12-14 2007-02-05 삼성전자주식회사 복수의 신뢰도 측정 알고리즘을 이용한 음성 인식 장치 및방법
JP2007171809A (ja) * 2005-12-26 2007-07-05 Canon Inc 情報処理装置及び情報処理方法
DE112007002665B4 (de) * 2006-12-15 2017-12-28 Mitsubishi Electric Corp. Spracherkennungssystem
JP2008242836A (ja) * 2007-03-27 2008-10-09 Toshiba Corp 辞書更新装置およびプログラム
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
JP5042799B2 (ja) * 2007-04-16 2012-10-03 ソニー株式会社 音声チャットシステム、情報処理装置およびプログラム
JP5266761B2 (ja) * 2008-01-10 2013-08-21 日産自動車株式会社 情報案内システムおよびその認識辞書データベース更新方法
CN101231660A (zh) * 2008-02-19 2008-07-30 林超 电话自然对话中关键信息的挖掘***及其方法
JP2009205640A (ja) * 2008-02-29 2009-09-10 Nec Corp 情報収集管理システム、方法、及び、プログラム
JP4388137B2 (ja) * 2008-03-10 2009-12-24 パナソニック株式会社 コンテンツ検索装置及びコンテンツ検索方法
JP4547721B2 (ja) * 2008-05-21 2010-09-22 株式会社デンソー 自動車用情報提供システム
US8352557B2 (en) * 2008-08-11 2013-01-08 Centurylink Intellectual Property Llc Message filtering system
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
KR101643179B1 (ko) * 2010-11-11 2016-07-27 네이버 주식회사 추천 키워드를 제공하는 시스템 및 방법
US8818944B2 (en) * 2011-06-30 2014-08-26 Microsoft Corporation Data change tracking and event notification
CN102915729B (zh) * 2011-08-01 2014-11-26 佳能株式会社 语音关键词检出***、创建用于其的词典的***和方法
US20130084009A1 (en) * 2011-10-03 2013-04-04 Steven W. Lundberg Systems, methods and user interfaces in a patent management system
JP5706384B2 (ja) * 2012-09-24 2015-04-22 株式会社東芝 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JP6205771B2 (ja) * 2013-03-18 2017-10-04 富士通株式会社 議論支援プログラム、議論支援方法及び議論支援サーバ
US9760831B2 (en) * 2013-08-30 2017-09-12 LimeSpot Solutions Inc. Content personalization system
JP5596213B1 (ja) * 2013-09-05 2014-09-24 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP5627750B1 (ja) * 2013-09-11 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118616A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
US9959863B2 (en) * 2014-09-08 2018-05-01 Qualcomm Incorporated Keyword detection using speaker-independent keyword models for user-designated keywords
JP6299563B2 (ja) * 2014-11-07 2018-03-28 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US10102273B2 (en) * 2014-12-30 2018-10-16 Facebook, Inc. Suggested queries for locating posts on online social networks
EP3151131A1 (en) * 2015-09-30 2017-04-05 Hitachi, Ltd. Apparatus and method for executing an automated analysis of data, in particular social media data, for product failure detection
US20170147652A1 (en) * 2015-11-19 2017-05-25 Institute For Information Industry Search servers, end devices, and search methods for use in a distributed network
WO2018043113A1 (ja) * 2016-08-29 2018-03-08 ソニー株式会社 情報処理装置、情報処理方法、プログラム
CN108027820A (zh) * 2016-09-02 2018-05-11 百度时代网络技术(北京)有限公司 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和***
JP2018049230A (ja) * 2016-09-23 2018-03-29 シャープ株式会社 辞書作成装置、辞書作成プログラム、音声認識装置、音声認識プログラムおよび記録媒体
JP6781961B2 (ja) * 2016-09-29 2020-11-11 株式会社村田製作所 送信装置、送信方法及び送信プログラム
EP3526699A1 (en) * 2016-10-11 2019-08-21 Koninklijke Philips N.V. Patient-centric clinical knowledge discovery system
US20180365324A1 (en) * 2017-04-24 2018-12-20 Considdr Inc. Method of data organization and data searching for use in constructing evidence-based beliefs

Also Published As

Publication number Publication date
CN110574102B (zh) 2023-05-16
US20200058292A1 (en) 2020-02-20
WO2018207485A1 (ja) 2018-11-15
US11289071B2 (en) 2022-03-29
JPWO2018207485A1 (ja) 2020-02-27
CN110574102A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
WO2020108063A1 (zh) 特征词的确定方法、装置和服务器
US9720901B2 (en) Automated text-evaluation of user generated text
CN106601237B (zh) 交互式语音应答***及其语音识别方法
WO2018050022A1 (zh) 应用程序的推荐方法及服务器
CN109918485B (zh) 语音识别菜品的方法及装置、存储介质、电子装置
CN109255564B (zh) 一种取件点地址推荐方法及装置
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
WO2019141109A1 (zh) 内容推荐方法及装置
CN103729474A (zh) 用于识别论坛用户马甲账号的方法和***
CN110069769B (zh) 应用标签生成方法、装置及存储设备
CN113051362A (zh) 数据的查询方法、装置和服务器
US10217455B2 (en) Linguistic model database for linguistic recognition, linguistic recognition device and linguistic recognition method, and linguistic recognition system
JP7096199B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN113436614B (zh) 语音识别方法、装置、设备、***及存储介质
JP6611091B2 (ja) 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法
WO2022121152A1 (zh) 智能对话方法、装置、电子设备及存储介质
CN109753646B (zh) 一种文章属性识别方法以及电子设备
CN114065749A (zh) 一种面向文本的粤语识别模型及***的训练、识别方法
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN107688594B (zh) 基于社交信息的风险事件的识别***及方法
CN111209391A (zh) 信息识别模型的建立方法及***、拦截方法及***
JP6855021B2 (ja) 広告システム及び広告方法
US20170293597A1 (en) Methods and systems for data processing
CN112989805A (zh) 一种文本检测方法、装置、设备及存储介质
KR20210063876A (ko) 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190822

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190822

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191007

R150 Certificate of patent or registration of utility model

Ref document number: 6611091

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191020