WO2020230459A1

WO2020230459A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2020230459A1
Application number: PCT/JP2020/013350
Authority: WO
Inventors: 高橋　亮
Original assignee: ソニー株式会社
Priority date: 2019-05-16
Filing date: 2020-03-25
Publication date: 2020-11-19
Also published as: US11861883B2; US20220230423A1

Abstract

所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、認識処理により認識された対象に対するクラスタリング処理の結果に基づき誤認識の可能性があると特定された、所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、を備え、認識器は、少なくとも１の学習データに基づく学習により生成され、少なくとも１の学習データは、所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、特定用データは、前記少なくとも１の学習データのコンテキストと略同一のコンテキストにおけるデータである、情報処理装置、が提供される。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関する。

　近年、教師あり機械学習に関する技術を用いて生成された認識器による、画像や音声、文章などにおける所定の対象を認識する処理を行う装置が普及している。ところで、所定の対象を認識するにあたり、認識精度を高めるためには、より多くの学習用データセットが必要となる。しかし、開発期間に限界があるような状況においては、構築できる学習用データセットの量に限界が存在する。

　上記状況に対し、例えば特許文献１には、ラベル付けの作業を半自動化することにより、学習用データセットの構築の工数を削減する技術が開示されている。

特開２０１８－９６８３４号公報

　しかし、特許文献１に記載の技術では、学習用データセットの量や多様性が十分であるか否かを確認することができず、評価用装置で認識器の認識精度の評価が行われ、学習用データセットの量や多様性が不十分であることが判明した場合、学習用データセットを構築する段階に工程の手戻りが発生する。

　本開示によれば、所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、を備え、前記認識器は、少なくとも１の学習データに基づく学習により生成され、前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、情報処理装置が提供される。

　また、本開示によれば、プロセッサが、所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御すること、を含み、前記認識器は、少なくとも１の学習データに基づく学習により生成され、前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、情報処理方法が提供される。

　また、本開示によれば、コンピュータを、所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、を備え、前記認識器は、少なくとも１の学習データに基づく学習により生成され、前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、情報処理装置、として機能させるためのプログラムが提供される。

本開示に係る教師あり機械学習技術を用いて認識器を開発する場合の開発サイクルの概要について説明するための図である。本実施形態に係るシステム１の全体構成の一例について説明するための図である。同実施形態に係る認識器開発装置２０の機能構成の一例について説明するための図である。同実施形態に係るデータセット管理部２１０によるラベル付け作業用の画面表示制御の一例について説明するための図である。同実施形態に係るデータセット管理部２１０によるラベル付け作業用の画面表示制御の一例について説明するための図である。同実施形態に係る認識器開発部２２０による認識器の評価結果の表示画面の一例について説明するための図である。同実施形態に係る情報処理サーバ４０の機能構成の一例について説明するための図である。同実施形態に係る誤認識対象特定部４２０およびデータ分類部４３０による誤認識対象の特定の一例について説明するための図である。同実施形態に係る誤認識対象特定部４２０およびデータ分類部４３０による誤認識対象の特定の一例について説明するための図である。同実施形態に係る入出力端末１０がスマートフォンやタブレット端末である場合の誤認識対象に係る情報および拡充に係る情報の表示例について説明するための図である。同実施形態に係る認識器の設計、学習時における拡充に係る情報の表示の一例について説明するための図である。同実施形態に係るデータセット管理部２１０による学習データへのラベル付け作業に係る動作の一例について説明するための図である。同実施形態に係る認識器開発部２２０による学習データへのラベル付け作業に係る動作の一例について説明するための図である。同実施形態に係る認識器開発部２２０による学習データへのラベル付け作業に係る動作の一例について説明するための図である。本開示の一実施形態に係る変形例における、学習データがモーションデータである場合の誤認識対象に係る画面表示の一例について説明するための図である。本開示の一実施形態に係る変形例における、出力制御部４４０による特定用データセットＤＢ４７１の更新に係る情報の画面表示の一例について説明するための図である。本開示の一実施形態に係る入出力端末１０、認識器開発装置２０、および情報処理サーバ４０に共通するハードウェア構成例を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．背景
　２．実施形態
　　２．１．システム１の全体構成例
　　２．２．認識器開発装置２０の機能構成例
　　２．３．情報処理サーバ４０の機能構成例
　　２．４．動作例
　　　２．４．１．動作例１
　　　２．４．２．動作例２
　　　２．４．３．動作例３
　　２．５．変形例
　　　２．５．１．変形例１
　　　２．５．２．変形例２
　３．ハードウェア構成例
　４．まとめ

　＜１．背景＞
　まず、本開示に係る背景について説明する。近年、ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）などの分野において、深層学習（Ｄｅｅｐ　Ｌｅａｒｎｉｎｇ）などの所謂教師あり機械学習に関する技術を用いて生成された認識器による、画像や音声、文章などにおける所定の対象を認識する処理を行う装置が普及している。

　深層学習などの教師あり機械学習技術を用いて認識器を開発する場合、学習用データセットの構築、認識器の設計および学習、認識器の評価用装置への移植、および認識器の精度評価から成る開発サイクルを繰り返すのが一般的である。

　ここで、図１を参照して、教師あり機械学習技術を用いて認識器を開発する場合の開発サイクルの概要について説明する。上述したように、一般的に教師あり機械学習技術を用いて認識器を開発する場合、学習用データセットの構築Ｔ１０、認識器の設計および学習Ｔ２０、認識器の評価用装置への移植Ｔ３０、認識器の精度評価Ｔ４０の順に作業が行われる。

　学習用データセットの構築Ｔ１０は、認識器に認識させたい認識対象を含む学習データの収集および学習データが含む認識対象へのラベル付けの作業である。ここで、認識対象は、学習データ中に存在する。例えば、学習データが画像データである場合、認識対象は当該画像データ中の所定領域であり、所定領域はラベル付けが行われる。なお以下、認識対象にラベル付けが行われた学習データを、学習用データセットとも称する。

　認識器の設計および学習Ｔ２０は、学習用データセットの構築Ｔ１０で構築された学習用データセットに基づき、学習データが含む認識対象を認識するように認識器を設計、学習する作業である。また、認識器の評価用装置への移植Ｔ３０は、認識器の精度評価を行う評価用装置へ、認識器を移植する作業である。ここでの評価用装置は、例えば開発が完了した認識器が実際に使用される装置である。また、認識器の精度評価Ｔ４０は、評価用装置での認識器の認識精度を評価する作業である。

　ここで、認識器の認識精度をより高めるためには、学習データの多様性の向上が要求され得る。学習データの多様性が十分でないと、認識器が十分に汎化せずに、例えば、認識したい認識対象以外の、認識対象に似て非なるものである対象が、認識対象として認識されてしまうこと（偽陽性）などが起こり得る。

　ここでの誤認識とは、認識すべき学習データが含む所定の認識対象とは異なるデータが含む対象を、認識器が当該認識対象として認識すること（偽陽性であること）をいう。一例としては、画像データ中の「トマト」部分を認識するように学習された認識器が、ある画像データにおいて「トマト」とは異なる「パプリカ」部分を、「トマト」として認識することを偽陽性という。

　家庭菜園において「トマト」が写されている画像データのみを学習データとした学習により認識器を生成した場合、当該認識器は「トマト」を認識するだけでなく、「トマト」と色が略同一で形状が少し異なる「パプリカ」や「リンゴ」を、「トマト」として認識する状況が発生し得る。このような状況は、例えば認識器が「トマト」の色のみに反応して認識していることなどが要因で起こり得る。「パプリカ」や「リンゴ」を認識せずに「トマト」を認識するような認識器を開発したい場合、「パプリカ」や「リンゴ」が写されている画像データも用いた学習により認識器を生成する必要がある。

　つまり、学習データの多様性を向上させるためには、より多くの学習データを要するのが一般的である。しかし、学習データが含む認識対象へのラベル付けの作業はユーザの手により行われるため、学習データの量が増加するに従って作業時間が増大し、ユーザの負担が増大する。そのため、学習データの多様性の向上には限界があり得る。それ以外にも、所定のコンテキストにおいて用意することが可能な学習データに限界が存在する状況もあり得る。

　上記のような状況に対して、例えば上述した特許文献１には、ラベル付けの作業を半自動化して、学習用データセットの構築の工数を削減する技術が開示されている。しかし、特許文献１には、学習用データセットが含む学習データの量や多様性が十分であるか否かを確認することについては考慮されていない。

　学習用データセットの構築Ｔ１０および認識器の設計および学習Ｔ２０が完了する度、認識器の評価用装置への移植Ｔ３０および認識器の精度評価Ｔ４０を行う必要がある。そして、精度評価を行った結果、認識器の認識精度が十分でない場合は、上記工程を繰り返し行う必要があるため、開発期間が長期化する場合がある。

　本開示に係る技術思想は上記の点に鑑みて発想されたものであり、学習データのコンテキストと略同一のコンテキストのデータを用いて誤認識され得る対象を特定し、ユーザに学習データの多様性について再考を促すことで、認識器の開発工程における手戻りを防止し、開発期間を短縮することが可能となる。なお以下、認識器が画像データ中の所定領域に写されている認識対象の物体を認識する一例について説明していく。

　＜２．実施形態＞
　＜＜２．１．システム１の全体構成例＞＞
　続いて、図２を参照して、本実施形態に係るシステム１の全体構成の一例について説明する。図２に示されるように、システム１は、入出力端末１０、認識器開発装置２０、ネットワーク３０、および情報処理サーバ４０を備える。

　（入出力端末１０）
　入出力端末１０は、ユーザからの入力を受け付ける。また、入出力端末１０は、認識器開発装置２０や情報処理サーバ４０が実行する処理に係る情報をユーザに対し出力する。入出力端末１０は、例えば、パーソナルコンピュータ（ＰＣ：Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）やスマートフォン、タブレット端末などのモバイル端末であってもよい。

　または、入出力端末１０は、液晶ディスプレイ（ＬＣＤ：Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）装置、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）装置、もしくはプロジェクタなどであってもよい。

　（認識器開発装置２０）
　認識器開発装置２０は、入出力端末１０から送信された学習データに基づき学習用データセットを構築する。具体的には、認識器開発装置２０は、ユーザからの入力に基づいて学習データが含む認識対象にラベル付けを行い、学習用データセットを生成する。また、認識器開発装置２０は、学習データに基づく認識器の設計および学習を行う。認識器開発装置２０の詳細な機能構成については後述する。

　（ネットワーク３０）
　ネットワーク３０は、認識器開発装置２０と情報処理サーバ４０とを接続する機能を有する。ネットワーク３０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク３０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク３０は、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

　（情報処理サーバ４０）
　情報処理サーバ４０は、認識器開発装置２０により所定の認識対象を認識するために生成された認識器が誤認識する可能性がある誤認識対象を特定し、特定した誤認識対象に係る情報の出力を制御する情報処理装置の一例である。ここでの誤認識とは、所定の認識対象とは異なる、特定用データが含む対象を、認識器が当該認識対象として認識すること（偽陽性であること）をいう。なお、情報処理サーバ４０は、認識器開発装置２０からネットワーク３０を介して認識器および学習用データセットを受信する。情報処理サーバ４０の詳細な機能構成については後述する。なお、情報処理サーバ４０は、クラウドサービスにおいて利用可能なクラウド上のサーバでもよい。

　以上、本実施形態に係るシステム１の構成例について説明した。なお、図２を用いて説明した上記の構成はあくまで一例であり、本実施形態に係るシステム１の構成は係る例に限定されない。本実施形態に係るシステム１の構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜２．２．認識器開発装置２０の機能構成例＞＞
　続いて、図３を参照して、本実施形態に係る認識器開発装置２０の機能構成の一例について説明する。認識器開発装置２０は、データセット管理部２１０、認識器開発部２２０、通信部２４０、記憶部２５０、および制御部２６０を備える。なお、記憶部２５０は、学習用データセットＤＢ２５１および認識器データベース２５２を含む。学習用データセットＤＢ２５１は学習用データセットの集合であり、また認識器データベース２５２は開発中もしくは開発完了済みの認識器の集合である。

　（データセット管理部２１０）
　データセット管理部２１０は、入出力端末１０を介したユーザからの入力に基づいて、後述する記憶部２５０が記憶する学習用データセットの構築を実行する。具体的には、データセット管理部２１０は、それぞれの学習データに対するラベル付けの作業に際し、ラベル付け作業用の画面を入出力端末１０に表示させ、当該画面に対するユーザからの入力に基づいて、学習データに対するラベル付けを行う。

　ここで、図４および図５を参照して、本実施形態に係るデータセット管理部２１０によるラベル付け作業用の画面表示制御の一例について説明する。図４には、入出力端末１０がパーソナルコンピュータである場合のデータセット管理部２１０によるラベル付け作業用の表示画面ＳＣ１が示されている。

　ラベル付け作業用の表示画面ＳＣ１は、ラベル付け作業状況を表示する表示部分ＳＰ１１、認識対象を含むデータを表示する表示部分ＳＰ１２、後述する情報処理サーバ４０からの制御による誤認識対象に係る情報を表示する表示部分ＳＰ１３、およびラベル付け作業用の表示画面に対する操作に係る情報を表示する表示部分ＳＰ１４を含む。

　表示部分ＳＰ１１では、認識対象に対するラベル付けの作業状況が表示される。図４の一例において、表示部分ＳＰ１１では、表示部分ＳＰ１２に表示された画像データが含む「トマト」画像に対しラベル付けが行われている状況を示す情報が表示されている。表示部分ＳＰ１２では、現在ラベル付け作業を行っている最中の認識対象を含むデータが示される。図４の一例において、「トマト」画像を含む画像データが表示されている。ここで、ラベル付けが行われた「トマト」画像の領域には、当該領域を囲うような表示がされている。

　表示部分ＳＰ１３では、後述する情報処理サーバ４０からの制御により、誤認識対象に係る情報が示される。図４の一例において、現在開発中の認識器が「トマト」であると認識する画像の一例が表示されている。表示部分ＳＰ１４では、ラベル付け作業における表示画面の操作を行うための種々のボタン等が示される。図４の一例において、「領域選択」や「ラベルの削除」、「表示画像の変更」、「表示画像の拡大」、「ラベルの確定」を行うボタンが表示されている。また、図４に示されるように、表示部分ＳＰ１３には、情報出力アバターが表示されてもよい。

　一方、図５には、入出力端末１０がスマートフォンやタブレット端末である場合のデータセット管理部２１０によるラベル付け作業用の表示画面ＳＣ２が示されている。タッチ操作による入力が可能な点および画面の物理的大きさがパーソナルコンピュータと異なる点から、表示画面ＳＣのレイアウトが一部異なる。ラベル付け作業用の表示画面ＳＣ１は、ラベル付け作業状況を表示する表示部分ＳＰ２１、および後述する情報処理サーバ４０からの制御により表示される誤認識対象に係る情報を表示する表示部分ＳＰ２２を含む。

　入出力端末１０がスマートフォンやタブレット端末である場合、例えばタッチパネル上の領域に対するタッチ操作による情報の入力が可能である。そのため、データセット管理部２１０は、図５に示されるように、表示部分ＳＰ２１において、認識対象である「トマト」画像に対しタッチ操作が行われた場合、ラベルを入力するか否かを確認するための吹き出しを表示させてもよい。

　また、データセット管理部２１０は、図５に示されるように、表示部分ＳＰ２２のようにアイコンを表示画面ＳＣ２の右上に表示させておき、誤認識対象に係る情報を表示する際に、当該情報を吹き出しの形式で表示させてもよい。

　このように、データセット管理部２１０によるラベル付け作業用の画面の表示制御が実行される。なお、個々のデータに対するラベル付けの作業が開始される前に、それぞれのデータに対応するコンテキストが設定されてもよい。コンテキストは、「農場」や「家庭菜園」、「スーパーマーケット」、「銀行」、「学校」のような場所を示すものであってもよい。また、コンテキストは、「朝」、「深夜」などの時間帯を示すものでもよいし、「料理中」や「会議中」などのような所定の場面を示すものでもよい。コンテキストは、所望の形式で設定される。

　勿論、ラベル付け作業用の画面の構成は係る例に限定されない。上述した誤認識対象に係る情報の表示については詳細を後述する。

　再び図３に戻って、認識器開発装置２０の機能構成の一例について説明を続ける。

　（認識器開発部２２０）
　認識器開発部２２０は、所定の認識対象を認識するための認識器の開発に係る処理を実行する。具体的には、認識器開発部２２０は、入出力端末１０を介して、認識器の統合開発環境やエディタをユーザに提供し、また、ユーザからの入出力端末１０を介した入力に基づいて、認識器の設計および学習を行う。また、認識器開発部２２０は、認識器の開発に際し、開発される認識器が使用されるコンテキストを設定してもよい。

　また、認識器開発部２２０は、入出力端末１０を介して認識器の評価結果をユーザに表示させてよい。ここで、図６を参照して、本実施形態に係る認識器開発部２２０による認識器の評価結果の画面表示の一例について説明する。図６には、認識器開発部２２０により表示される認識器による学習データの認識の評価結果を表示する表示画面ＳＣ３が示されている。

　図６の一例において、評価結果を表示する表示画面ＳＣ３には、認識対象にラベル付けが行われた学習データと当該認識対象の認識処理における精度の評価が信頼度として示されている。ここで、認識処理における評価は、例えばｍＡＰ（ｍｅａｎ　Ａｖｅｒａｇｅ　Ｐｒｅｃｉｓｉｏｎ）やＩｏＵ（Ｉｎｔｅｒｓｅｃｔｉｏｎ　ｏｖｅｒ　Ｕｎｉｏｎ）などの指標により示される。

　また、図６の一例に示されるように、認識器開発部２２０は、学習データに対する備考としてコンテキストに係る付加情報を表示させてもよい。ここでの付加情報とは、学習データが画像データである場合、撮影された日時や位置情報、場所の名称などをいう。また、認識器開発部２２０は、付加情報として上述した学習データのコンテキストを示す情報を表示させてもよい。

　このように、認識器開発部２２０による認識器の開発に係る処理および表示が行われる。勿論、認識器の評価結果の画面の構成は係る例に限定されない。

　（通信部２４０）
　通信部２４０は、入出力端末１０や情報処理サーバ４０との通信を実行する。例えば、通信部２４０は、データセット管理部２１０や認識器開発部２２０からの指示に基づいて、画面表示に係る情報を入出力端末１０に送信し、入出力端末１０からユーザの入力操作を示す情報を受信する。

　（記憶部２５０）
　記憶部２５０は、データセット管理部２１０および認識器開発部２２０の処理に係る種々の情報を記憶する。上述したように、記憶部２５０は、例えば学習用データセットＤＢ２５１および認識器データベース２５２を含む。記憶部２５０は、データセット管理部２１０や認識器開発部２２０からの要求に基づいて、学習用データセットＤＢ２５１および認識器データベース２５２の種々のデータを提供する。

　（制御部２６０）
　制御部２６０は、本実施形態に係る認識器開発装置２０が備える各構成を制御する機能を有する。制御部２６０は、例えば各構成の起動や停止を制御する。

　以上、本実施形態に係る認識器開発装置２０の構成例について説明した。なお、図３を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る認識器開発装置２０の構成は係る例に限定されない。本実施形態に係る認識器開発装置２０の構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜２．３．情報処理サーバ４０の機能構成例＞＞
　続いて、図７を参照して、本実施形態に係る情報処理サーバ４０の機能構成の一例について説明する。情報処理サーバ４０は、コンテキスト認識部４１０、誤認識対象特定部４２０、データ分類部４３０、出力制御部４４０、拡充支援部４５０、サーバ通信部４６０、記憶部４７０、および制御部４８０を備える。

　（コンテキスト認識部４１０）
　コンテキスト認識部４１０は、認識器開発装置２０から受信された学習データのコンテキストを認識する。例えば、コンテキスト認識部４１０は、学習データに対応する、事前に設定されたコンテキストを認識してもよい。また例えば、コンテキスト認識部４１０は、学習データに基づいて、当該学習データのコンテキストを認識してもよい。例えば学習データが画像データである場合、コンテキスト認識部４１０は、画像データにおける認識器により認識され得る対象とは異なる背景部分に基づいて、学習データのコンテキストを認識してもよい。コンテキスト認識部４１０により学習データのコンテキストが認識されることで、後述する誤認識対象特定部４２０による誤認識対象の特定をより正確に実行される。

　なお、コンテキスト認識部４１０によるコンテキストの認識処理は、係る例に限定されない。コンテキスト認識部４１０は、例えば画像データのコンテキストを認識する際に、画像の背景以外に、画像中の人物の服装や、字幕や看板の文字情報などを利用してもよい。また、コンテキスト認識部４１０は、学習データに付加情報として付加された、画像が作成もしくは撮影された日付や、音声、温度、湿度、場所、国、全地球測位システム（ＧＰＳ：Ｇｌｏｂａｌ　Ｐｏｓｉｔｏｎｉｎｇ　Ｓｙｓｔｅｍ）により取得される位置情報をなどの周囲情報に基づいて、コンテキストを認識してもよい。種々の情報によりコンテキストが認識されることで、ユーザの目的に則するような誤認識対象を特定することが容易となる。

　なお、コンテキスト認識部４１０は、認識器開発装置２０から学習用データセットを受信した際、学習用データセットを構成する学習データに共通するコンテキストを認識する。複数の学習データにおいて、全てのコンテキストが略同一でない場合、例えば複数の学習データでの多数を占めるコンテキストが、学習データ全体のコンテキストとしてコンテキスト認識部４１０により認識されてもよいし、また、複数の学習データのコンテキストの中間概念を示すコンテキストが、学習データ全体のコンテキストとしてコンテキスト認識部４１０により認識されてもよい。

　なお、後述する誤認識対象特定部４２０により、コンテキスト認識部４１０が学習用データセットに基づいて認識したコンテキストと略同一のコンテキストにおけるデータが、後述する記憶部４７０の特定用データセットＤＢ４７１から特定用データとして取得される。その際、コンテキスト認識部４１０は、特定用データセットＤＢ４７１に含まれるデータのコンテキストを認識してもよい。

　（誤認識対象特定部４２０）
　誤認識対象特定部４２０は、認識器を用いて、特定用データへの認識処理による誤認識対象を特定する。

　具体的には、誤認識対象特定部４２０は、認識器を用いた特定用データへの認識処理を実行し、また、当該認識処理の結果に基づいて後述するデータ分類部４３０にクラスタリング処理を実行させた結果を用いることで、誤認識対象を特定する。

　以下、誤認識対象特定部４２０の具体的な処理について説明する。

　誤認識対象特定部４２０は、コンテキスト認識部４１０が認識したコンテキストと略同一のコンテキストにおけるデータを、記憶部４７０の特定用データセットＤＢ４７１から特定用データとして抽出する。ここで、誤認識対象特定部４２０は、特定用データセットＤＢ４７１が含む、データに予め設定されたコンテキストに基づいて特定用データを取得してもよいし、または、コンテキスト認識部４１０にデータのコンテキストを認識させた結果に基づいて特定用データを取得してもよい。

　また、誤認識対象特定部４２０は、認識器による特定用データの認識対象の認識処理およびデータ分類部４３０によるクラスタリング処理の結果に基づいて、認識器が誤認識している特定用データが含む対象を誤認識対象として特定する。データ分類部４３０によるクラスタリング処理の詳細については後述する。

　誤認識対象の特定には、例えば、クラスタリング処理によりそれぞれのクラスタに分類された特定用データ中の対象において、それぞれのクラスタ中の対象の認識器による認識処理の精度評価結果が用いられる。例えば、クラスタ中の特定用データ中の認識器により認識された対象の認識処理の精度評価の平均値に基づき、誤認識対象を特定する。

　（データ分類部４３０）
　データ分類部４３０は、誤認識対象特定部４２０が認識器を用いて認識した特定用データが含む対象に対し、所謂教師なし機械学習の一手法であるクラスタリング処理を実行し、実行したクラスタリング処理により特定用データが含む対象を複数のクラスタに分類する。例えば、特定用データが画像データである場合、データ分類部４３０は、誤認識対象特定部４２０が認識器を用いて認識した特定用データ中の所定領域へのクラスタリング処理を実行し、それぞれの所定領域を複数のクラスタのうちのいずれかに分類する。クラスタリング処理の手法としては、例えば主成分分析法やｋ－ｍｅａｎｓ法などが挙げられる。

　（誤認識対象特定例）
　ここで、図８および図９を参照して、本実施形態に係る誤認識対象特定部４２０およびデータ分類部４３０による誤認識対象の特定例について説明する。

　図８は、誤認識対象特定部４２０による、学習データのコンテキストと略同一のコンテキストのデータを特定用データとして抽出する処理について説明するための図である。図８には、特定用データセットＤＢ４７１における画像データの集合ＤＳ１が示されている。画像データの集合ＤＳ１は、コンテキストが「農場」である画像データの集合でもよいし、また、画像データの集合ＤＳ１は、コンテキストが「農場」以外の画像データが含む集合でもよい。誤認識対象特定部４２０は、画像データの集合ＤＳ１から、コンテキストが野菜等を生産する「菜園」の画像データを特定用データとして抽出する。図８右側に示される画像データの集合ＤＳ２が、コンテキストが「菜園」である特定用データの集合である。

　次に、誤認識対象特定部４２０は、画像データの集合ＤＳ２に対し認識器開発装置２０から受信された認識器を用いた認識処理を実行して対象を認識する。図９左側には、誤認識対象特定部４２０による画像データの集合ＤＳ２に対する認識処理の結果テーブルＴＡが示されている。なお、図８および図９の一例において、「家庭菜園」と「菜園」は、略同一のコンテキストとして扱われている。

　図９左側に示される認識処理の結果に含まれる認識された対象の領域（切り出し画像）に対し、データ分類部４３０は、クラスタリング処理を実行する。データ分類部４３０のクラスタリング処理により、それぞれの切り出し画像が複数のクラスタのいずれかに分類される。また、図９右側に示されるように、誤認識対象特定部４２０は、それぞれのクラスタが含む複数の切り出し画像に対応する認識処理の信頼度の平均を算出する。図９右側に示されるクラスタの列ＣＬＲには、クラスタＣＬ１～ＣＬ５に分類された切り出し画像と、それぞれのクラスタに対応する平均信頼度とが示されている。

　図９右側において、誤認識対象特定部４２０は、算出した認識の精度である平均信頼度に基づいて、誤認識対象を特定する。ここで、平均信頼度が最も高いクラスタＣＬ１の切り出し画像の対象は、認識器が認識すべき認識対象である可能性が高いため、次に平均信頼度が高いクラスタＣＬ２の対象を誤認識対象と特定してよい。図９の一例において、クラスタＣＬ１は「トマト」画像であり、クラスタＣＬ２は「パプリカ」の画像である。ここで、誤認識対象特定部４２０は、信頼度が最も高いクラスタＣＬ１に次いで高いクラスタＣＬ２の対象を誤認識対象と特定する。

　このように、誤認識対象が学習データと略同一のコンテキストにおいて認識器により認識処理を行った際に、誤認識される可能性がある誤認識対象をより特定することが可能である。なお、上述した認識精度に基づく誤認識対象の特定方法は、係る例に限定されない。上記では、２番目に認識精度の平均である平均信頼度が高いクラスタに対応する対象を誤認識対象とする例について説明したが、例えば認識対象が２つ以上のクラスタに分かれて分類される可能性が高い場合などにおいては、認識精度の高さが３番目以下のクラスタに対応する対象が誤認識対象と特定されてもよい。

　再び図７を参照して、本実施形態に係る情報処理サーバ４０の機能構成について説明する。

　（出力制御部４４０）
　出力制御部４４０は、誤認識対象特定部４２０が特定した誤認識対象に係る情報の表示を制御する。

　例えば、誤認識対象に係る情報は、誤認識対象をユーザに通知する通知情報でもよい。出力制御部４４０は、誤認識対象特定部４２０による特定結果に基づいて、通知情報の表示を制御してもよい。通知情報は、視覚情報でもよいし、文字情報でもよい。通知情報は、学習データが画像データである場合、視覚情報として当該画像データのうちの誤認識対象に該当する部分（切り抜き画像）そのものでもよい。また、出力制御部４４０は、クラスタに誤認識対象を示すデータが複数存在する場合、当該データを複数表示させてもよい。

　また、誤認識対象に係る情報は、誤認識対象そのものを示す情報以外にも、誤認識対象に関連する付加的な情報でもよい。例えば、出力制御部４４０は、誤認識対象に係る情報として認識器による特定用データへの認識処理の結果に対する評価を示す情報の表示を制御してもよい。

　また、出力制御部４４０は、学習データのコンテキストを示す情報の表示をさらに制御してもよい。上述したように、コンテキストを示す情報としては、コンテキストそのものを通知する情報や、日付、音声、温度、湿度、ＧＰＳにより取得される位置情報などの周囲情報などが挙げられる。ユーザは、特定用データのコンテキストを把握することで、どのような学習データを用意すればよいのか、または、どの場面や状況での学習データを拡充すればよいのかを検討することが可能となる。

　また、出力制御部４４０は、後述する拡充支援部４５０による学習用データセットの拡充に係る情報の表示を制御してもよい。拡充に係る情報の表示の制御については詳細を後述する。

　なお、出力制御部４４０は、上述した図４～図６に示された表示画面ＳＣ１～ＳＣ３の、誤認識対象に係る情報部分以外の画面全体の表示を認識器開発装置２０の代わりに制御してもよい。

　なお、出力制御部４４０は、上述した視覚情報以外に、音声により誤認識対象に係る情報などをユーザに出力してもよい。また、出力制御部４４０は、音声のみで誤認識対象に係る情報などをユーザに出力してもよい。

　（拡充支援部４５０）
　拡充支援部４５０は、誤認識対象特定部４２０の特定結果に基づいて、学習データの拡充処理を制御する。ここで、学習用データセットＤＢ２５１の拡充処理とは、新たな学習データを学習用データセットＤＢ２５１に追加することをいう。つまり、拡充支援部４５０は、例えば誤認識対象特定部４２０が特定した誤認識対象の学習データと対応するラベルの組み合わせを、学習用データセットとして学習用データセットＤＢ２５１に追加してよい。ここで、当該ラベルは、ユーザにより付与されてもよいし、拡充支援部４５０により自動的に付与されてもよい。

　（出力制御例および拡充処理例）
　上述したように、拡充支援部４５０は、出力制御部４４０が学習データの拡充に係る情報の表示を制御し、拡充に係る情報に対するユーザからのフィードバックに基づいて、学習データの拡充処理を実行してよい。

　例えば、拡充支援部４５０は、出力制御部４４０が表示させた誤認識対象が誤認識であるか否かの確認に係る情報に対するユーザからのフィードバックに基づいて、学習用データセットの拡充処理を実行してもよい。その際、学習用データセットＤＢ２５１に拡充される学習用データセットは、誤認識対象のデータと同一でもよい。誤認識対象のデータが認識対象とは異なるラベル付けがされ学習データとして拡充されることで、認識器の誤認識の可能性を減少させ、結果としてより精度の高い認識器を開発することが可能となる。

　例えば、上述の図４に示されたように、出力制御部４４０は、認識器開発装置２０を介して、誤認識対象は認識させたい対象なのか否かを確認する画像および文章を、表示部分ＳＰ１３に含まれるように表示させている。ユーザは、表示部分ＳＰ１３に対し「はい」もしくは「いいえ」の入力を行うことで、表示された画像（対象）を認識器が認識させるのか否かを決定することができる。

　誤認識対象に係る情報および拡充に係る情報の表示例は、係る例に限定されない。図４には入出力端末１０がパーソナルコンピュータである場合の表示画面例が示されたが、ここで、図１０を参照して、本実施形態に係る入出力端末１０がスマートフォンやタブレット端末である場合の誤認識対象に係る情報および拡充に係る情報の表示例について説明する。

　図１０において、ラベル付け作業用の表示画面ＳＣ４は、ラベル付け作業状況を表示する表示部分ＳＰ４１、および誤認識対象に係る情報を表示する表示部分ＳＰ４２を含む。図５の表示画面ＳＣ２と異なり、表示部分ＳＰ４２を基準として、誤認識対象を示す情報と誤認識対象に関する確認をする情報とを表示する部分ＳＰ４３が、吹き出しの形式で示されている。このように、入出力端末１０の種別に応じて、各種表画面のレイアウトは変更され得る。

　また、例えば、ラベル付け作業用の表示画面ＳＣ４において、出力制御部４４０は、「この物体を検出しないよう学習することで、認識精度が上がりますよ」というような積極的に学習データの拡充を提案するメッセージを表示させてもよい。

　図４および図１０で示された表示画面は、学習用データセットの構築時の表示画面であるが、一方で、認識器の設計、学習時にも出力制御部４４０は、拡充支援部４５０による拡充に係る情報の表示を制御してもよい。ここで、図１１を参照して、本実施形態に係る認識器の設計、学習時における拡充に係る情報の表示の一例について説明する。図１１には、認識器の評価結果の表示画面ＳＣ５が示されている。

　上述した図６に示された認識器の評価結果の表示画面ＳＣ３は学習データへの認識処理の評価結果である一方で、図１１に示される表示画面ＳＣ５は誤認識対象を含む特定用データへの認識処理の評価結果である。図１１の一例において、表示画面ＳＣ５には２つの誤認識対象（認識対象のトマトとは異なるパプリカ）が示されている。

　ここで、ユーザは、表示画面ＳＣ５に示された精度評価結果に対しフィードバックを入力することができる。例えば、拡充支援部４５０は、ユーザからの、精度評価結果が期待通りであるか否かの入力に基づいて、学習用データセットＤＢ２５１の拡充処理を制御してもよい。

　拡充支援部４５０は、表示部分ＳＰ４３において「期待通りの検出である」が入力された場合、表示された誤認識対象を実際は認識対象であると判断して、認識対象と同一のラベル付けで学習用データセットＤＢ２５１に学習データとして追加してよい。一方で、拡充支援部４５０は、表示部分ＳＰ４３において「期待していない検出である」が入力された場合、誤認識対象が実際に誤認識された対象であると判断して他のラベル付けを行い、学習用データセットＤＢ２５１に追加してよい。なお、ユーザからの入力の形式は、図１１に示されるような所定の選択肢から選択する形式でもよいし、入出力端末１０のキーボードショートカットにより入力される形式でもよい。

　このように、出力制御部４４０により誤認識対象に係る情報が表示されることで、ユーザは現在の学習用データセットおよび認識器でどのような対象を誤認識してしまうのか、また、どのようなデータを学習データとして追加すればよいのかを早期に確認することが可能となる。また、拡充支援部４５０により、誤認識対象特定部４２０が特定した誤認識対象に応じた学習データの拡充が実現される。

　また、出力制御部４４０および拡充支援部４５０によれば、誤認識対象が実際に誤認識された対象であるか否かに基づいて学習データの拡充を、学習用データセットの構築や認識器の設計、開発の段階で行うことができ、開発期間の短縮が可能となる。また、出力制御部４４０および拡充支援部４５０により、ユーザが認識器の開発における学習データの量や多様性を確保することの重要性を能動的に理解するアクティブラーニングが実現される。

　出力制御部４４０による入出力端末１０を介したユーザとの情報のやり取りは、複数回行われてもよい。例えば、ユーザとの情報のやり取りにより、認識器が使用される、より詳細なコンテキストを把握することで、拡充支援部４５０が学習用データセットとして拡充すべきデータをより正確に特定することも可能となる。

　以上、出力制御例および拡充処理例について説明した。再び図７に戻って、情報処理サーバ４０の機能構成について説明する。

　（サーバ通信部４６０）
　サーバ通信部４６０は、ネットワーク３０を介して認識器開発装置２０との通信を実行する。例えば、サーバ通信部４６０は、ネットワーク３０を介して、認識器開発装置２０から認識器および学習用データセットを受信し、誤認識対象に係る情報や誤認識対象を含む特定用データを認識器開発装置２０へ送信する。

　（記憶部４７０）
　記憶部４７０は、特定用データセットＤＢ４７１などを記憶する。特定用データセットＤＢ４７１は、データと当該データに付随する情報の集合である。データに付随する情報は、例えばデータのコンテキストを示す情報である。データとコンテキストを示す情報等との組み合わせは、特定用データセットとも呼ばれる。

　記憶部４７０は、コンテキスト認識部４１０からの要求およびコンテキストを示す情報に基づいて、所定のコンテキストにおけるデータを提供してよい。ここで、提供される所定のコンテキストにおけるデータは、上述した特定用データである。また、記憶部４７０は、コンテキスト認識部４１０からの要求に基づいて、特定用データセットＤＢ４７１のデータを、コンテキストを認識させるためにコンテキスト認識部４１０へ提供してもよい。

　なお、特定用データセットＤＢ４７１のそれぞれのデータは、認識器の開発用に用意されたデータでなくてもよい。すなわち、誤認識対象の特定において、誤認識対象特定部４２０は、他の用途で使用されているデータを取得して利用してもよい。

　（制御部４８０）
　制御部４８０は、本実施形態に係る情報処理サーバ４０が備える各構成を制御する機能を有する。制御部２６０は、例えば各構成の起動や停止を制御する。

　＜＜２．４．動作例＞＞
　［２．４．１．動作例１］
　続いて、本実施形態に係るデータセット管理部２１０による学習データへのラベル付け作業に係る動作の一例について説明する。図１２を参照すると、まず、認識器開発装置２０のデータセット管理部２１０は、ラベル付けを行うアプリケーションの起動後、学習用データセットＤＢ２５１を保存する場所の指定を促す画面を入出力端末１０に表示させる（Ｓ１０１）。

　学習用データセットＤＢ２５１を保存する場所が指定されない場合（Ｓ１０２：Ｎｏ）、ラベル付け作業が行わないものと判断し、データセット管理部２１０は動作を終了する。一方、学習用データセットＤＢ２５１を保存する場所が指定された場合（Ｓ１０２：Ｙｅｓ）、データセット管理部２１０はラベル付け用の画面を入出力端末１０に表示させる（Ｓ１０３）。

　次に、ステップＳ１０３で表示されたラベル付け用の画面に表示された学習データの画像にラベル付けされる操作が入力されない場合（Ｓ１０４：Ｎｏ）、ステップＳ１０４へ復帰する。一方、ステップＳ１０３で表示されたラベル付け用の画面に表示された学習データの画像にラベル付けされる操作が入力された場合（Ｓ１０４：Ｙｅｓ）、データセット管理部２１０はラベル付けされた結果を学習用データセットとして登録する（Ｓ１０５）。

　次に、ラベル付けが継続される場合（Ｓ１０６：Ｎｏ）、ステップＳ１０３へ復帰する。一方、ラベル付けが終了する場合（Ｓ１０６：Ｙｅｓ）、データセット管理部２１０は動作を終了する。

　［２．４．２．動作例２］
　続いて、本実施形態に係る認識器開発部２２０による学習データへのラベル付け作業に係る動作の一例について説明する。図１３を参照すると、まず、認識器開発装置２０の認識器開発部２２０は認識器開発のためのプロジェクトファイルを新規作成する（Ｓ２０１）。次に、認識器開発部２２０は認識器と学習データのコンテキストを設定する（Ｓ２０２）。次に、認識器開発部２２０はユーザからの入力などに基づいて認識器の設計処理を実行する（Ｓ２０３）。

　次に、認識器開発部２２０は学習データに基づいて認識器の学習を実行する（Ｓ２０４）。次に、認識器開発部２２０はステップＳ２０４で学習が実行された認識器の認識処理の精度を評価する（Ｓ２０５）。次に、ユーザからの入力に基づき認識器の開発を継続する場合（Ｓ２０６：Ｙｅｓ）、ステップＳ２０３へ復帰する。一方、次に、ユーザからの入力に基づき認識器の開発を終了するする場合（Ｓ２０６：Ｎｏ）、認識器開発部２２０は認識器を開発者や顧客にリリースし（Ｓ２０７）、認識器開発部２２０は動作を終了する。

　［２．４．３．動作例３］
　続いて、本実施形態に係る情報処理サーバ４０による誤認識対象の特定、誤認識対象に係る情報の提示、および学習用データセットの拡充に係る動作の一例について説明する。図１４を参照すると、まず、サーバ通信部４６０が所定のイベントの発生を示す情報を認識器開発装置２０から受信していない場合（Ｓ３０１：Ｎｏ）、ステップＳ３０１へ復帰する。ここでの所定のイベントとしては、認識器開発装置２０による認識器の設計および学習の完了や認識器開発のためのプロジェクトファイルの設定変更などが挙げられる。一方、サーバ通信部４６０が所定のイベントの発生を示す情報を認識器開発装置２０から受信した場合（Ｓ３０１：Ｙｅｓ）、誤認識対象特定部４２０は、サーバ通信部４６０を介して認識器および学習用データセットを取得する（Ｓ３０２）。

　次に、コンテキスト認識部４１０は、ステップＳ３０２で取得された学習データのコンテキストを認識する（Ｓ３０３）。次に、誤認識対象特定部４２０は、記憶部４７０の特定用データセットＤＢ４７１からステップＳ３０３で認識されたコンテキストと略同一のコンテキストのデータを特定用データとして取得する（Ｓ３０４）。次に、誤認識対象特定部４２０は、ステップＳ３０４で取得された特定データに対しステップＳ３０２で取得された認識器を適用する（Ｓ３０５）。

　次に、データ分類部４３０は、ステップＳ３０５で認識された対象に対してクラスタリング処理を実行する（Ｓ３０６）。次に、誤認識対象特定部４２０は、ステップＳ３０６で実行されたクラスタリング処理の結果に基づいて、誤認識対象を特定する（Ｓ３０７）。次に、出力制御部４４０は、ステップＳ３０７で特定された誤認識対象に係る情報を入出力端末１０に表示させる（Ｓ３０８）。

　誤認識対象が実際に誤認識された対象であるとステップＳ３０８で表示された誤認識対象に係る情報に対するユーザからの入力があった場合（Ｓ３０９：Ｙｅｓ）、拡充支援部４５０はステップＳ３０７で特定された誤認識対象を含む特定用データを学習用データセットに追加する（Ｓ３１０）。一方、誤認識対象が実際に誤認識された対象でないと、ステップＳ３０８で表示された誤認識対象に係る情報に対するユーザからの入力があった場合（Ｓ３０９：Ｎｏ）、ステップＳ３１１へ進む。次に、認識器の設計および開発が継続される場合（Ｓ３１１：Ｎｏ）、ステップＳ３０１へ復帰する。一方、認識器の設計および開発が終了になる場合（Ｓ３１１：Ｙｅｓ）、情報処理サーバ４０は動作を終了する。

　＜＜２．５．変形例＞＞
　［２．５．１．変形例１］
　続いて、本開示の一実施形態に係る変形例について説明する。上記では、認識器が認識する対象は、静止画中の部分であった。言い換えれば、上記までは、認識器が認識する対象は、物体の種別そのものであった。しかし、本開示係る技術思想の適用範囲は、係る例に限定されない。本開示に係る技術思想は、種々の認識処理に適用可能である。例えば、学習データは音声データでもよく、その場合の認識対象は音声データ中の所定のフレーズや単語部分などである。

　また、例えば、学習データはモーションデータや行動データでもよく、認識対象は動画データ中の、人が行う所定のジェスチャでもよい。その場合、学習データは、例えば慣性計測装置（ＩＭＵ：Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）により収集される。ＩＭＵは、例えば人の腕に装着される。また、ジェスチャは、例えば腕を振り上げる動作などである。

　ここで、図１５を参照して、本開示の一実施形態に係る変形例における、学習データがモーションデータである場合の誤認識対象に係る画面表示の一例について説明する。図１５には、出力制御部４４０により表示される表示画面ＳＣ６が示されている。表示画面ＳＣ６には、上記までの例で表示されていた静止画に代わり、モーションデータとしてＩＭＵの時系列順データ、時系列データに時間同期された動画、所定のジェスチャが実行中である確率、および認識精度としてのジェスチャの平均確率が表示されている。

　ユーザは、表示画面ＳＣ６に表示された動画を確認しながら、認識されたジェスチャが誤認識されたものであるか否かを確認する。例えば、表示された認識結果に対しポインティング操作が行われた場合、操作された箇所に対応する箇所の動画が再生されてもよい。また、上記までと同様に、認識結果に対するユーザからのフィードバックに基づいて、学習データが拡充されてもよい。

　なお、本開示において認識器が認識の対象とするものは、係る例に限定されない。認識器が認識する対象は、例えば文書データでもよい。その場合、認識される対象は、文書データ中の所定の文やフレーズ、単語などである。その際、データ分類部４３０は、クラスタリング処理に際し、例えば分類語彙表を利用してよい。

　［２．５．２．変形例２］
　ところで、所定のコンテキストにおいて認識対象を認識する認識器の開発が完了した後で、当該所定のコンテキストにおける認識対象が変わった場合に、認識器の精度が低下する可能性がある。

　認識対象の変化が発生し認識器の精度が低下する状況としては、以下のようなものが挙げられる。

　例えば、菜園で栽培されている野菜の品種が変化した場合や、人の服装の流行、音楽の流行などが変化した場合などにおいて、それぞれ野菜を認識する認識器や、人の服装、音楽を認識する認識器の精度が低下する可能性がある。他にも、例えば、菜園で栽培されている野菜の品種が変化しない場合においても、季節の変化など時間の経過に伴って野菜の見た目が変化する可能性もあり、ある時点での野菜の画像データのみに基づいて認識器が開発された場合でも、認識器の精度が低下する可能性がある。

　また、認識対象のコンテキストが変化する場合でも認識器の精度低下が起こり得る。例えば、野菜などのものが主に生産される場所が変わった場合（菜園から工場へ変わった場合）や、国が変化した場合などにおいても、コンテキストの変化に合わせて、認識対象自体が変化したり、また誤認識され易い対象が変化したりすることで、認識器の精度が低下する可能性がある。

　従って、上記状況に対して、拡充支援部４５０は、特定用データセットＤＢ４７１の更新に基づいて、学習用データセットの拡充処理を制御してもよい。

　具体的には、拡充支援部４５０は、特定用データセットＤＢ４７１を構成するデータに変化が生じた場合、誤認識対象特定部４２０が新たに特定した誤認識対象に基づき拡充処理を制御してもよい。例えば、特定用データセットＤＢの内容が変更された場合に、当該変更に合わせて認識器の認識処理の精度変化が表示されてもよく、また、精度変化に合わせて学習用データセットが拡充されてもよい。

　また、出力制御部４４０は、特定用データセットＤＢ４７１の更新に係る情報の表示を制御してもよい。拡充支援部４５０は、出力制御部４４０が表示させた特定用データセットＤＢ４７１の更新に係る情報に対するフィードバックに基づいて、拡充処理を制御してもよい。

　ここで、図１６を参照して、本開示の一実施形態に係る変形例における、出力制御部４４０による特定用データセットＤＢ４７１の更新に係る情報の画面表示の一例について説明する。図１６には、特定用データセットＤＢ４７１の更新に係る情報を表示する表示画面ＳＣ７が示されている。

　表示画面ＳＣ７では、開発中もしくは開発済みの認識器および対応する特定用データセットＤＢに係る情報が表示されている。また、表示画面ＳＣ７では、それぞれの認識器および特定用データセットＤＢの組み合わせに対応するステータスも表示されている。ステータスは、認識器の状態を示している。ここでの認識器の状態とは、認識器の認識処理の精度などである。

　例えば、ステータスが「実行中」である場合、対応する認識器の精度評価が実行されている最中であることを示す。また、例えば、ステータスが「精度維持」である場合、特定用データセットＤＢ４７１の更新によって、認識器の認識処理の精度が変化していないことを示す。また、例えば、ステータスが「精度低下」である場合、特定用データセットＤＢ４７１の更新によって、認識器の認識処理の精度が低下したことを示す。

　このように、特定用データセットＤＢ４７１の更新に係る情報が表示されることで、例えば、流行の変化などの認識器が使用されるコンテキストにおける状況が変化したことを確認させることができ、学習データの補充や認識器の設計の段階を早期に行うことが可能となる。また、ユーザが所望すれば、特定用データセットＤＢ１２４の更新に基づき学習用データセットを自動的に拡充させることも可能となる。

　以上、本開示に係る変形例について説明したが、他にも、出力制御部４４０は、学習用データセットの拡充に関し、特定用データの購買提案や証券の譲渡提案などのユーザに対し行ってもよい。また、出力制御部４４０は、認識器が認識する対象が３次元データである場合、誤認識対象などに対応する３次元データに基づいて認識器開発装置２０に接続された３Ｄプリンタにモデルを生成させてもよい。

　＜３．ハードウェア構成例＞
　次に、本開示の一実施形態に係る入出力端末１０、認識器開発装置２０、および情報処理サーバ４０に共通するハードウェア構成例について説明する。図１７は、本開示の一実施形態に係る入出力端末１０、認識器開発装置２０、および情報処理サーバ４０のハードウェア構成例を示すブロック図である。図１７を参照すると、入出力端末１０、認識器開発装置２０、および情報処理サーバ４０は、例えば、プロセッサ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　（プロセッサ８７１）
　プロセッサ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

　（ＲＯＭ８７２、ＲＡＭ８７３）
　ＲＯＭ８７２は、プロセッサ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、プロセッサ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

　（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
　プロセッサ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

　（入力装置８７８）
　入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

　（出力装置８７９）
　出力装置８７９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

　（ストレージ８８０）
　ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

　（ドライブ８８１）
　ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

　（リムーバブル記録媒体９０１）
　リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

　（接続ポート８８２）
　接続ポート８８２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

　（外部接続機器９０２）
　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

　（通信装置８８３）
　通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等である。

　＜４．まとめ＞
　上述したように、本開示に係るシステム１は、認識器の開発サイクルにおいて早期に誤認識対象に係る情報を出力することにより、認識器の開発における手戻りを防止し開発期間を短縮することを可能とするような情報の出力および他の処理を行うことができる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、
　を備え、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理装置。
（２）
　前記誤認識対象に係る情報は、前記誤認識対象を通知する通知情報であり、
　前記出力制御部は、前記通知情報の表示を制御する、
　前記（１）に記載の情報処理装置。
（３）
　前記誤認識対象に係る情報は、前記誤認識対象に対する前記認識処理の評価を示す情報であり、
　前記出力制御部は、前記評価を示す情報の表示を制御する、
　前記（１）または（２）に記載の情報処理装置。
（４）
　前記出力制御部は、前記学習データの前記コンテキストを示す情報の表示をさらに制御する、
　前記（１）～（３）のいずれか一項に記載の情報処理装置。
（５）
　前記出力制御部は、前記コンテキストに係る付加情報の表示をさらに制御する、
　前記（４）に記載の情報処理装置。
（６）
　前記誤認識対象に係る情報は、前記誤認識対象が前記誤認識された対象であるか否かの確認に係る情報であり、
　前記出力制御部は、前記確認に係る情報の表示を制御する、
　前記（１）～（５）のいずれか一項に記載の情報処理装置。
（７）
　前記出力制御部は、前記学習データの拡充に係る情報の表示をさらに制御する、
　前記（１）～（６）のいずれか一項に記載の情報処理装置。
（８）
　前記誤認識対象の特定結果に基づいて、前記少なくとも１の学習データの拡充処理を制御する拡充支援部、
　をさらに備える、
　前記（７）に記載の情報処理装置。
（９）
　前記誤認識対象に係る情報は、前記誤認識対象が前記誤認識された対象であるか否かの確認に係る情報であり、
　前記出力制御部は、前記確認に係る情報の表示を制御し、
　前記拡充支援部は、前記確認に係る情報に対するフィードバックに基づいて、前記学習データの拡充処理を制御する、
　前記（８）に記載の情報処理装置。
（１０）
　前記拡充支援部は、前記誤認識対象を含む前記特定用データを前記学習データとして拡充するように制御する、
　前記（９）に記載の情報処理装置。
（１１）
　前記特定用データは、前記学習データの前記コンテキストに基づいて特定用データセットから取得されたデータである、
　前記（８）に記載の情報処理装置。
（１２）
　前記拡充支援部は、前記特定用データセットの更新に基づいて、前記学習データの拡充処理を制御する、
　前記（１１）に記載の情報処理装置。
（１３）
　前記出力制御部は、前記特定用データセットの更新を示す情報の表示をさらに制御し、
　前記拡充支援部は、前記更新を示す情報に対するフィードバックに基づいて、前記学習データの拡充処理を制御する、
　前記（１２）に記載の情報処理装置。
（１４）
　前記出力制御部は、前記特定用データセットの更新による前記認識器の認識精度の変化を示す情報の表示をさらに制御する、
　前記（１２）に記載の情報処理装置。
（１５）
　前記認識器による前記少なくとも１の特定用データへの前記認識処理の結果、および、前記認識処理により認識した対象に対する前記クラスタリング処理の結果に基づいて、前記誤認識対象を特定する誤認識対象特定部、
　をさらに備え、
　前記出力制御部は、前記誤認識対象特定部が特定した前記誤認識対象に係る情報の表示を制御する、
　前記（１）～（１４）のいずれか一項に記載の情報処理装置。
（１６）
　前記認識処理により認識された前記対象への前記クラスタリング処理を実行し、前記認識された対象を複数のクラスタのいずれかに分類するデータ分類部、
　をさらに備え、
　前記誤認識対象特定部は、前記認識処理の結果、および、前記データ分類部による前記対象の前記複数のクラスタへの分類結果に基づいて、前記誤認識対象を特定する、
　前記（１５）に記載の情報処理装置。
（１７）
　前記誤認識対象特定部は、前記複数のクラスタのうち、前記認識処理の精度が、前記精度が最も高いクラスタ以外で、他の前記クラスタよりも高いクラスタに対応する対象を前記誤認識対象と特定する、
　前記（１６）に記載の情報処理装置。
（１８）
　前記学習データの前記コンテキストを認識するコンテキスト認識部、
　をさらに備える、
　前記（１）～（１７）のいずれか一項に記載の情報処理装置。
（１９）
　プロセッサが、
　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御すること、
　を含み、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理方法。
（２０）
　コンピュータを、
　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、
　を備え、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理装置、
　として機能させるためのプログラム。

　１　　　　システム
　１０　　　入出力端末
　２０　　　認識器開発装置
　２１０　　データセット管理部
　２２０　　認識器開発部
　２４０　　通信部
　２５０　　記憶部
　２６０　　制御部
　３０　　　ネットワーク
　４０　　　情報処理サーバ
　４１０　　コンテキスト認識部
　４２０　　誤認識対象特定部
　４３０　　データ分類部
　４４０　　出力制御部
　４５０　　拡充支援部
　４６０　　サーバ通信部
　４７０　　記憶部
　４８０　　制御部

Claims

　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、
　を備え、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理装置。
　前記誤認識対象に係る情報は、前記誤認識対象を通知する通知情報であり、
　前記出力制御部は、前記通知情報の表示を制御する、
　請求項１に記載の情報処理装置。
　前記誤認識対象に係る情報は、前記誤認識対象に対する前記認識処理の評価を示す情報であり、
　前記出力制御部は、前記評価を示す情報の表示を制御する、
　請求項１に記載の情報処理装置。
　前記出力制御部は、前記学習データの前記コンテキストを示す情報の表示をさらに制御する、
　請求項１に記載の情報処理装置。
　前記出力制御部は、前記コンテキストに係る付加情報の表示をさらに制御する、
　請求項４に記載の情報処理装置。
　前記誤認識対象に係る情報は、前記誤認識対象が前記誤認識された対象であるか否かの確認に係る情報であり、
　前記出力制御部は、前記確認に係る情報の表示を制御する、
　請求項１に記載の情報処理装置。
　前記出力制御部は、前記学習データの拡充に係る情報の表示をさらに制御する、
　請求項１に記載の情報処理装置。
　前記誤認識対象の特定結果に基づいて、前記少なくとも１の学習データの拡充処理を制御する拡充支援部、
　をさらに備える、
　請求項７に記載の情報処理装置。
　前記誤認識対象に係る情報は、前記誤認識対象が前記誤認識された対象であるか否かの確認に係る情報であり、
　前記出力制御部は、前記確認に係る情報の表示を制御し、
　前記拡充支援部は、前記確認に係る情報に対するフィードバックに基づいて、前記学習データの拡充処理を制御する、
　請求項８に記載の情報処理装置。
　前記拡充支援部は、前記誤認識対象を含む前記特定用データを前記学習データとして拡充するように制御する、
　請求項９に記載の情報処理装置。
　前記特定用データは、前記学習データの前記コンテキストに基づいて特定用データセットから取得されたデータである、
　請求項８に記載の情報処理装置。
　前記拡充支援部は、前記特定用データセットの更新に基づいて、前記学習データの拡充処理を制御する、
　請求項１１に記載の情報処理装置。
　前記出力制御部は、前記特定用データセットの更新を示す情報の表示をさらに制御し、
　前記拡充支援部は、前記更新を示す情報に対するフィードバックに基づいて、前記学習データの拡充処理を制御する、
　請求項１２に記載の情報処理装置。
　前記出力制御部は、前記特定用データセットの更新による前記認識器の認識精度の変化を示す情報の表示をさらに制御する、
　請求項１２に記載の情報処理装置。
　前記認識器による前記少なくとも１の特定用データへの前記認識処理の結果、および、前記認識処理により認識した対象に対する前記クラスタリング処理の結果に基づいて、前記誤認識対象を特定する誤認識対象特定部、
　をさらに備え、
　前記出力制御部は、前記誤認識対象特定部が特定した前記誤認識対象に係る情報の表示を制御する、
　請求項１に記載の情報処理装置。
　前記認識処理により認識された前記対象への前記クラスタリング処理を実行し、前記認識された対象を複数のクラスタのいずれかに分類するデータ分類部、
　をさらに備え、
　前記誤認識対象特定部は、前記認識処理の結果、および、前記データ分類部による前記対象の前記複数のクラスタへの分類結果に基づいて、前記誤認識対象を特定する、
　請求項１５に記載の情報処理装置。
　前記誤認識対象特定部は、前記複数のクラスタのうち、前記認識処理の精度が、前記精度が最も高いクラスタ以外で、他の前記クラスタよりも高いクラスタに対応する対象を前記誤認識対象と特定する、
　請求項１６に記載の情報処理装置。
　前記学習データの前記コンテキストを認識するコンテキスト認識部、
　をさらに備える、
　請求項１に記載の情報処理装置。
　プロセッサが、
　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御すること、
　を含み、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理方法。
　コンピュータを、
　所定の認識対象を認識するために生成された認識器による少なくとも１の特定用データへの認識処理の結果、および、前記認識処理により認識された対象に対するクラスタリング処理の結果、に基づき誤認識の可能性があると特定された、前記所定の認識対象と異なる誤認識対象に係る情報の表示を制御する出力制御部、
　を備え、
　前記認識器は、少なくとも１の学習データに基づく学習により生成され、
　前記少なくとも１の学習データは、前記所定の認識対象を含み、かつ、それぞれ略同一のコンテキストにおけるデータであり、
　前記特定用データは、前記少なくとも１の学習データの前記コンテキストと略同一のコンテキストにおけるデータである、
　情報処理装置、
　として機能させるためのプログラム。