JP2017134761A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2017134761A
JP2017134761A JP2016016157A JP2016016157A JP2017134761A JP 2017134761 A JP2017134761 A JP 2017134761A JP 2016016157 A JP2016016157 A JP 2016016157A JP 2016016157 A JP2016016157 A JP 2016016157A JP 2017134761 A JP2017134761 A JP 2017134761A
Authority
JP
Japan
Prior art keywords
keyword
information
search
category
agent system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016016157A
Other languages
English (en)
Inventor
謙太郎 中村
Kentaro Nakamura
謙太郎 中村
勝夫 南
Katsuo Minami
勝夫 南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Computer Engineering and Consulting Ltd
Original Assignee
Toyota Motor Corp
Computer Engineering and Consulting Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Computer Engineering and Consulting Ltd filed Critical Toyota Motor Corp
Priority to JP2016016157A priority Critical patent/JP2017134761A/ja
Publication of JP2017134761A publication Critical patent/JP2017134761A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】キーワードの検索において、ユーザが求める応答ができる情報処理装置を提供すること。【解決手段】入力されるキーワードを検索する情報処理装置が、前記キーワードに対する情報を記憶し、前記キーワードに対する前記情報を検索し、前記検索による検索結果に基づいて、前記キーワードに対する情報が未知語であるか既知語であるかを判断し、前記判断によって、前記キーワードが前記未知語であると判断されると、前記キーワードをWeb検索して、前記キーワードが属するカテゴリーを検索し、前記キーワード及び前記カテゴリーを紐付けて登録する。【選択図】図1

Description

本発明は、情報処理装置に関する。
従来、まず、音声情報がテキスト情報に変換され、テキスト情報が検索される。次に、テキスト情報によって検索した結果の情報量が閾値以上であると、情報量を絞り込む音声情報が要求され、テキスト情報から得られる属性に対応する情報を保有するサーバから所定の情報量の情報を検索する方法が知られている(例えば、特許文献1)。このような方法が用いられると、的外れな回答に対して、追随して検索が継続できる。
特開2015−69102号公報
しかしながら、上述の従来の技術では、検索されるキーワードが検索範囲にない場合がある。この場合には、検索結果としてユーザが求める応答ができない場合が多い。
そこで、上記課題に鑑み、キーワードの検索において、ユーザが求める応答ができる情報処理装置を提供することを目的とする。
上記目的を達成するため、一実施形態において、入力されるキーワードを検索する情報処理装置は、
前記キーワードに対する情報を記憶する記憶部と、
前記キーワードに対する前記情報を検索する第1検索部と、
前記第1検索部による検索結果に基づいて、前記キーワードが、前記キーワードに対する情報が前記記憶部にない未知語であるか前記キーワードに対する情報が前記記憶部にある既知語であるかを判断する判断部と、
前記判断部によって、前記キーワードが前記未知語であると判断されると、前記キーワードをWeb検索して、前記キーワードが属するカテゴリーを検索する第2検索部と、
前記キーワード及び前記カテゴリーを紐付けて前記記憶部に登録する登録部と
を含む。
本態様によれば、前記記憶部によって、入力されるキーワードに対する情報を記憶できる。そして、前記第1検索部は、この前記記憶部が記憶する情報を検索することができる。そのため、キーワードに対する情報が前記記憶部に記憶されている、すなわち、前記判断部によって、キーワードが既知語であると判断されると、情報処理装置は、キーワードに対する応答を行うことができる。
一方で、前記記憶部に情報がないキーワードが入力された場合、すなわち、前記判断部によって未知語であると判断される場合には、前記第2検索部は、前記キーワードをWeb検索して、前記キーワードが属する前記カテゴリーを検索する。この前記第2検索部は、Web検索であるため、前記記憶部に情報がなくとも、前記キーワードが属する前記カテゴリーを検索できる場合がある。このように、Web検索によって前記キーワードが属する前記カテゴリーがわかると、前記キーワードが属するカテゴリーが特定できる。そのため、前記登録部は、前記キーワード及び前記カテゴリーを紐付けて前記記憶部に登録できる。そして、前記キーワード及び前記カテゴリーが紐付けて登録されると、前記キーワードが未知語であっても、次回からは、前記記憶部が記憶する情報を検索すると、前記キーワードに対する情報がある。すなわち、情報処理装置は、前記キーワードを既知語と同様に扱うことができる。そのため、登録後、前記第1検索部が、前記記憶部が記憶する情報を検索すると、既知語と同様の検索結果を表示することができる。したがって、情報処理装置は、未知語が入力されても、既知語と同様の検索結果を表示することができ、ユーザが求める応答ができる。
本実施の形態によれば、キーワードの検索において、ユーザが求める応答ができる情報処理装置を提供することができる。
本発明の一実施形態に係る情報処理装置を用いるシステム構成の一例を示す全体構成図である。 本発明の一実施形態に係る情報処理装置によって行われる処理の一例を示すフローチャートである。 本発明の一実施形態に係る情報処理装置の機能構成の一例を示す機能ブロック図である。
以下、図面を参照して発明を実施するための形態について説明する。
図1は、本発明の一実施形態に係る情報処理装置を用いるシステム構成の一例を示す全体構成図である。図示する例では、情報処理装置の例であるエージェントシステム10に対してユーザURがキーワードKEY等を入力し、エージェントシステム10が検索結果を出力する。
情報処理装置は、キーワードKEYを含む言葉を入力するためのマイク又はキーボード等の入力装置を有する。また、情報処理装置は、キーワードKEYを検索する処理を実現するための演算及び制御を行う演算装置並びに制御装置であるCPU(Central Processing Unit)等を有する。さらに、情報処理装置は、ネットワークを介して、外部システム11と接続するためのネットワークI/F(interface)等を有する。さらにまた、情報処理装置は、キーワードに対する情報を示すデータを記憶する記憶装置を有する。
また、図示する構成では、ステップS1では、エージェントシステム10は、キーワードKEYを入力する第1受付処理を行う。これに対して、エージェントシステム10は、入力されるキーワードKEYに対応する情報を記憶するDB(データベース)を有する。
次に、ステップS2では、エージェントシステム10は、ステップS1で入力されたキーワードKEYに対して、DBが記憶する情報を検索する第1検索処理を行う。続いて、検索の結果、DBに該当する情報があると、エージェントシステム10は、ユーザURに該当する情報を出力する。一方で、該当する情報がないと、エージェントシステム10は、外部システム11を用いて、キーワードKEYが属するカテゴリーをWeb検索して特定する。なお、図示する例では、特定されるカテゴリーがPOI(point of interest)カテゴリーの例である。
また、ステップS3では、エージェントシステム10は、第1検索処理の検索結果を表示する第1応答処理を行う。
以下、第1検索処理によって、該当する情報がないとの検索結果となる場合に行われる処理を説明する。なお、以下の説明では、第1検索処理によって、該当する情報がない、すなわち、エージェントシステム10が有するDBに情報がないキーワードを「未知語」といい、一方で、該当する情報がある、すなわち、エージェントシステム10が有するDBに情報があるキーワードを「既知語」という。
図2は、本発明の一実施形態に係る情報処理装置によって行われる処理の一例を示すフローチャートである。
ステップS10では、エージェントシステムは、第1受付処理(図1)によって、キーワード等を受け付ける。例えば、図1に示す例では、キーワードを含む言葉が、ユーザが発する音声で入力される。この例では、エージェントシステムは、音声をマイク等で入力し、電気信号に変換する。そして、ユーザが発した音声を音声認識等によって、キーワードを含む言葉の中からキーワードを抽出する。以下、抽出されるキーワードに対して各処理が行われる。
ステップS11では、エージェントシステムは、ステップS10で入力されるキーワードを第1検索部等によって検索する。なお、検索範囲は、記憶部の例である既知語キーワードDBが記憶する情報の範囲である。すなわち、ステップS11では、エージェントシステムは、入力されるキーワードと、既知語キーワードDBが記憶するそれぞれの情報とを比較する。そして、既知語キーワードDBが記憶する情報に、キーワードに関する情報があると、検索結果は、「該当する情報がある」となる。一方で、既知語キーワードDBが記憶する情報に、キーワードに関する情報がないと、検索結果は、「該当する情報がない」となる。このように、検索結果が「該当する情報がない」となるキーワードが、未知語となる。
ステップS12では、エージェントシステムは、判断部等によって、検索結果に基づいて、該当する情報があるか否か判断する。すなわち、ステップS12では、エージェントシステムは、ステップS11の検索結果に基づいて、既知語キーワードDBが記憶する情報に、キーワードに対する情報があるか否か判断する。次に、該当する情報があると(ステップS12でYES)、エージェントシステムは、ステップS13に進む。一方で、該当する情報がないと(ステップS12でNO)、エージェントシステムは、ステップS14に進む。
ステップS13では、エージェントシステムは、検索結果を表示する。例えば、エージェントシステムは、既知語キーワードDB内にキーワードがあると表示する。他にも、エージェントシステムは、既知語キーワードDB内のキーワードに該当する情報又は候補となる情報等を表示してもよい。
ステップS14では、エージェントシステムは、キーワードを未知語キーワードDBに記憶する。例えば、図1に示す例では、「オムツを買いたい。」との言葉が入力される。このうち、「オムツ」がキーワードであり、かつ、「オムツ」が未知語であるとする。この場合には、「オムツ」が、未知語キーワードDBに記憶される。なお、図1に示すように、ステップS3の第1応答処理のように、キーワードが未知語であることをユーザに知らせるため、エージェントシステムは、「見つかりませんでした。」等の表示を行ってもよい。
ステップS15では、エージェントシステムは、第2検索部等によって、未知語を検索する。具体的には、ステップS15では、エージェントシステムは、Wikipedia(登録商標)等の外部システム11(図1)を利用するWeb検索を行う。なお、ステップS15は、例えば、バッチ起動で行われる。すなわち、ステップS15では、エージェントシステムは、ステップS11で検索する範囲とは異なる範囲を検索する。具体的には、ステップS15では、Wikipedia(登録商標)等の辞書DBが検索に利用されるのが望ましい。例えば、既知語キーワードDBは、エージェントシステムが有する記憶装置等で実現されるため、ステップS11では、記憶装置等が記憶するデータが、検索対象である。一方で、ステップS15では、外部システム11によって実現されるDB等が検索に利用される。すなわち、ステップS15では、ネットワークを介して、Web上のデータが検索対象となる。
ステップS16では、エージェントシステムは、ステップS15による検索結果から未知語が属するカテゴリーを取得する。具体的には、「オムツ」をステップS15で検索した結果から取得されるカテゴリーは、例えば、「オムツ」が使用される場面と同様の場面で使用される他の品物を集めたグループを示す「育児用品」、「福祉用品」又は「日用品」等である。すなわち、カテゴリーは、キーワードが属する分類等を示す言葉である。なお、特定されるカテゴリーは、POIカテゴリーであるのが望ましい。POIカテゴリーであると、地図データ内を検索するのに、検索対象の品物を扱う店舗等が精度良く検索できる。
ステップS17では、エージェントシステムは、既知語キーワードDB内の既知語と、ステップS16で取得されるカテゴリーとを比較する。
ステップS18では、エージェントシステムは、ステップS17の比較の結果、カテゴリーの情報が既知語キーワードDB内にあるか否か判断する。すなわち、ステップS17で、既知語キーワードDB内のいずれかの既知語と、カテゴリーとが一致すると、エージェントシステムは、カテゴリーの情報があると判断する。次に、カテゴリーの情報があると(ステップS18でYES)、エージェントシステムは、ステップS19に進む。一方で、カテゴリーの情報がないと(ステップS18でNO)、エージェントシステムは、ステップS20に進む。
ステップS19では、エージェントシステムは、キーワード等を登録する。すなわち、ステップS19では、エージェントシステムは、ステップS16で取得されたカテゴリーと、未知語であるキーワードとを紐づけて、既知語キーワードDBに登録する。
具体的には、既知語キーワードDBに、あらかじめ「日用品」のデータが記憶されているとする。この場合には、ステップS17では、ステップS16で取得される「日用品」のカテゴリーと、既知語キーワードDB内のデータが示す既知語「日用品」とが一致する。このように、カテゴリーと、既知語とが一致する結果となると、エージェントシステムによって、「オムツ」と、「日用品」とが紐づいて既知語キーワードDBに登録される。
上記のような処理が行われると、未知語であるキーワードが、既知語と同様に検索可能になる。具体的には、図1に示すように、図2に示す処理が行われた後、例えば、ステップS1の第1受付処理と同様に、ステップS4の第2受付処理がエージェントシステムによって行われると、エージェントシステムは、ステップS5の第2検索処理を行う。この第2検索処理では、第1検索処理が行われた際には未知語であったキーワードが登録された後であるため、キーワードは、既知語と同様に処理される。そのため、第2検索処理では、未知語であったキーワードが既知語として検索できる。したがって、エージェントシステムは、ステップS6の第2応答では、既知語を検索した結果と同様の検索を表示することができる。
ステップS20では、エージェントシステムは、ステップS16で取得されたカテゴリーと、未知語であるキーワードとを紐づけて、既知語キーワードDBに新しいカテゴリーの情報を新規に作成する。このようにして、エージェントシステムは、既知語キーワードDBにカテゴリーと、未知語であるキーワードとを紐づけて登録する。
登録後、図1に示すように、ステップS4で、第1受付処理と同様に、「オムツを買いたい。」と入力される第2受付処理が行われると、ステップS5で、エージェントシステムは、第2検索処理によって「日用品」を検索できる。そのため、エージェントシステムは、「日用品」が販売されている日用品店のPOIデータを取得できる。これによって、ステップS6で、エージェントシステムは、第2応答処理によって、「近くの日用品店を検索しました。」等のユーザが求める応答ができる。なお、ステップS6では、POIデータに基づいて、当該日用品店の位置を示す地図又は案内等が、エージェントシステムによって表示されてもよい。
図3は、本発明の一実施形態に係る情報処理装置の機能構成の一例を示す機能ブロック図である。図示するように、情報処理装置は、記憶部FMと、第1検索部F1Sと、判断部FJと、POIカテゴリー特定部等の第2検索部F2Sと、登録部FRとを含む。
記憶部FMは、入力されるキーワードKEYに対する情報を記憶する。なお、記憶部FMは、情報処理装置が有する記憶装置等によって実現される。
第1検索部F1Sは、記憶部FMが記憶する情報から入力されるキーワードKEYに関する情報を検索する。なお、第1検索部F1Sは、情報処理装置が有するCPU及び記憶装置等によって実現される。
判断部FJは、第1検索部F1Sによる検索結果に基づいて、キーワードKEYが、未知語であるか既知語であるかを判断する。なお、判断部FJは、情報処理装置が有するCPU等によって実現される。
判断部FJによってキーワードKEYが未知語と判断されると、第2検索部F2Sは、外部システム11等を利用して、入力されるキーワードKEYをWeb検索する。このWeb検索によって、第2検索部F2Sは、キーワードKEYが属するカテゴリーを検索する。なお、第2検索部F2Sは、情報処理装置が有するCPU及び記憶装置等によって実現される。
登録部FRは、キーワードKEYと、第2検索部F2Sによる検索によって特定されるカテゴリーとを紐づけて登録する。なお、登録部FRは、情報処理装置が有するCPU及び記憶装置等によって実現される。
このように、登録部FRは、第2検索部F2Sによる検索によって特定されるカテゴリーと、未知語のキーワードKEYとを紐づけて登録する。そのため、未知語のキーワードKEYが入力されても、次回からの検索では、キーワードは、既知語と扱われるようになる。ゆえに、未知語であるキーワードが検索されても、キーワードに対してカテゴリーが紐付けられているため、情報処理装置は、既知語と同様に、検索することができる。すなわち、情報処理装置は、キーワードの検索において、キーワードが示す品物を扱う店舗の情報を表示する等のユーザが求める応答ができる。
以上、本発明を実施するための形態について詳述したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形又は変更が可能である。
10 エージェントシステム(情報処理装置例)
11 外部システム
KEY キーワード
FM 記憶部
F1S 第1検索部
F2S 第2検索部
FJ 判断部
FR 登録部

Claims (1)

  1. 入力されるキーワードを検索する情報処理装置であって、
    前記キーワードに対する情報を記憶する記憶部と、
    前記キーワードに対する前記情報を検索する第1検索部と、
    前記第1検索部による検索結果に基づいて、前記キーワードが、前記キーワードに対する情報が前記記憶部にない未知語であるか前記キーワードに対する情報が前記記憶部にある既知語であるかを判断する判断部と、
    前記判断部によって、前記キーワードが前記未知語であると判断されると、前記キーワードをWeb検索して、前記キーワードが属するカテゴリーを検索する第2検索部と、
    前記キーワード及び前記カテゴリーを紐付けて前記記憶部に登録する登録部と
    を含む情報処理装置。
JP2016016157A 2016-01-29 2016-01-29 情報処理装置 Pending JP2017134761A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016016157A JP2017134761A (ja) 2016-01-29 2016-01-29 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016016157A JP2017134761A (ja) 2016-01-29 2016-01-29 情報処理装置

Publications (1)

Publication Number Publication Date
JP2017134761A true JP2017134761A (ja) 2017-08-03

Family

ID=59502878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016016157A Pending JP2017134761A (ja) 2016-01-29 2016-01-29 情報処理装置

Country Status (1)

Country Link
JP (1) JP2017134761A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701119A (zh) * 2014-11-21 2016-06-22 财团法人资讯工业策进会 检索过滤方法及其处理装置
CN108962246A (zh) * 2018-07-11 2018-12-07 深圳创维数字技术有限公司 语音控制方法、装置及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701119A (zh) * 2014-11-21 2016-06-22 财团法人资讯工业策进会 检索过滤方法及其处理装置
CN108962246A (zh) * 2018-07-11 2018-12-07 深圳创维数字技术有限公司 语音控制方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US11275723B2 (en) Reducing processing for comparing large metadata sets
US9973815B2 (en) Apparatus, method, and program for processing information
CN112100396B (zh) 一种数据处理方法和装置
KR20200007969A (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
US11093529B2 (en) Method for displaying landmark data
JP6728178B2 (ja) 検索データを処理するための方法及び装置
KR20150137006A (ko) 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법
KR20210137643A (ko) 쇼핑 검색을 위한 상품 속성 추출 방법
US20190278811A1 (en) Identifying merchant data associated with multiple data structures
CN111401044A (zh) 一种标题生成方法、装置、终端设备及存储介质
Renjit et al. CUSAT NLP@ AILA-FIRE2019: Similarity in Legal Texts using Document Level Embeddings.
JP2017134761A (ja) 情報処理装置
JP2008158564A (ja) 情報検索装置
CN112487159B (zh) 检索方法、检索装置及计算机可读存储介质
KR20220109238A (ko) 사용자의 발화 입력에 관련된 추천 문장을 제공하는 디바이스 및 방법
CN117435685A (zh) 文档检索方法、装置、计算机设备、存储介质和产品
JP6495206B2 (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
US11495225B2 (en) Response device, response method, and storage medium
JP6640519B2 (ja) 情報分析装置及び情報分析方法
CN115576975A (zh) 一种数据查询方法、装置、设备和介质
JP5544003B2 (ja) 情報検索装置、情報検索システム、及び情報検索方法
JP2021163477A (ja) 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
JP2013003830A (ja) コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム
JP2019128914A (ja) 情報処理装置、応答シナリオ生成方法、及び制御プログラム
JP2006065651A (ja) 商標称呼検索プログラム、商標称呼検索装置及び商標称呼検索方法