JP2018537734A - ファクトリーオートメーションシステムおよびリモートサーバ - Google Patents
ファクトリーオートメーションシステムおよびリモートサーバ Download PDFInfo
- Publication number
- JP2018537734A JP2018537734A JP2017535120A JP2017535120A JP2018537734A JP 2018537734 A JP2018537734 A JP 2018537734A JP 2017535120 A JP2017535120 A JP 2017535120A JP 2017535120 A JP2017535120 A JP 2017535120A JP 2018537734 A JP2018537734 A JP 2018537734A
- Authority
- JP
- Japan
- Prior art keywords
- programmable logic
- logic controller
- remote server
- command
- device command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 238000013507 mapping Methods 0.000 claims description 9
- 230000000007 visual effect Effects 0.000 claims description 5
- 238000012790 confirmation Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 208000032368 Device malfunction Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/4185—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/35—Nc in input of data, input till input file format
- G05B2219/35453—Voice announcement, oral, speech input
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Programmable Controllers (AREA)
Abstract
ファクトリーオートメーションシステム1は、プログラマブルロジックコントローラ3、5、7と、マイクロフォン15と、ネットワーク9を介して接続されたリモートサーバ10とを備える。マイクロフォン15はプログラマブルロジックコントローラ3に接続されており、デバイス13はプログラマブルロジックコントローラ3、5、7に接続され、プログラマブルロジックコントローラ3、5、7によって制御される。プログラマブルロジックコントローラ3は、マイクロフォン15によって録音されたユーザ19の話し言葉を符号化して電子音声表現にする。電子音声表現はリモートサーバ10へ送信される。リモートサーバ10は、電子音声表現に基づいてデバイスコマンドを決定し、デバイスコマンドをプログラマブルロジックコントローラ3へ送信する。プログラマブルロジックコントローラ3は受信したデバイスコマンドに基づいてデバイス13を制御する。
Description
本発明は、ファクトリーオートメーションシステムおよびプログラマブルロジックコントローラに関する。
プログラマブルロジックコントローラは、モータ、センサ、エネルギー供給などを制御することによって製造プロセスなどの産業プロセスを制御するためのファクトリーオートメーションシステムにおいて一般に用いられている。プログラマブルロジックコントローラは、例えば、電子ラック間の空きスペースが狭いなどの理由で、ユーザがアクセスするのが困難な環境に収容されることが多い。さらに、プログラマブルロジックコントローラは、コストを下げるためと、主目的であるデバイスのリアルタイム制御のために最適化される。したがって、プログラマブルロジックコントローラは、通常、今日の汎用コンピュータで見られるような強力なプロセッサやメモリは含んでいない。プログラマブルロジックコントローラの計算処理リソースおよびプログラマブルロジックコントローラの周囲の空きスペースは限られているため、コントローラは、通常、例えば、大画面やキーボードやコンピュータマウスを含む快適なユーザインターフェースを含まない。したがって、ユーザがプログラマブルロジックコントローラと対話する可能な方法を拡張することが求められている。
米国特許第7,249,023号には、ヒューマンマシンインターフェースのスピーチプロセッサによって解析された音声コマンドによる表示メニューのナビゲーションの制御を可能にする産業用ヒューマンマシンインターフェースが開示されている。しかし、そのような音声認識は、集中的な計算と、絶えず変化する大量の語彙データおよび言語情報とを必要とする。これには、上述の理由により通常のプログラマブルロジックコントローラでは利用できない強力なプロセッサとメモリとが必要である。
それゆえ、本発明の目的は、プログラマブルロジックコントローラのための代替ユーザインターフェースを提供することである。
本発明は、ユーザからの音声コマンドを受け入れるユーザインターフェースを有するファクトリーオートメーションシステムおよびプログラマブルロジックコントローラを提供する。
例示的実施形態によれば、ファクトリーオートメーションシステムは、複数のプログラマブルロジックコントローラと、マイクロフォンと、ネットワークを介して複数のプログラマブルロジックコントローラに接続されたリモートサーバと、を含み、マイクロフォンは複数のプログラマブルロジックコントローラのうちの第1のプログラマブルロジックコントローラに接続されており、1台または複数のデバイスが第1のプログラマブルロジックコントローラに接続され、第1のプログラマブルロジックコントローラによって制御され、第1のプログラマブルロジックコントローラはマイクロフォンによって録音されたユーザの話し言葉を符号化して電子音声表現にするように構成されており、第1のプログラマブルロジックコントローラは電子音声表現をネットワークを介してリモートサーバへ送信するように構成されており、リモートサーバは、第1のプログラマブルロジックコントローラによって送信された電子音声表現に基づいて少なくとも1つのデバイスコマンドを決定し、決定された少なくとも1つのデバイスコマンドを第1のプログラマブルロジックコントローラへ送信するように構成されており、第1のプログラマブルロジックコントローラは、リモートサーバによって送信された少なくとも1つのデバイスコマンドに基づいて1台または複数のデバイスを制御するようにさらに構成されている。
そのようなシステムは、ユーザが、システムによって認識され、第1のプログラマブルロジックコントローラに接続されたデバイスを制御するのに適したデバイスコマンドに変換される言葉を話すことを可能にする第1のプログラマブルロジックコントローラへのユーザインターフェースを提供する。このために、第1のプログラマブルロジックコントローラは、ユーザの話し言葉を符号化して電子音声表現にするように構成されている。この機能を果たすのに必要なハードウェアはマイクロフォンおよび適切な符号器を含み、これらはどちらも特に高価なものではない。計算集約型音声認識タスクである電子音声表現に基づいてデバイスコマンドを決定する主タスクは、リモートサーバ上で実行される。このために、リモートサーバ上で音声認識ソフトウェアが動作しており、リモートサーバは音声認識を実行するのに必要な計算能力およびメモリを有している。リモートサーバには多くのプログラマブルロジックコントローラを接続することができるため、それらのプログラマブルロジックコントローラはリモートサーバが提供する音声認識機能を共有することができる。それゆえ、プログラマブルロジックコントローラのハードウェア要件を実質的に増加させることなく、ユーザインターフェースで音声認識を提供するプログラマブルロジックコントローラを提供することが可能である。さらに、リモートサーバ上で動作する音声認識ソフトウェアの頻繁な更新を、リモートサーバに接続されたすべてのプログラマブルロジックコントローラが直ちに利用できる。
例示的実施形態によれば、リモートサーバは、電子音声表現から複数の事前定義された第1のデバイスコマンドへの第1のマッピングを提供する第1の変換モジュールと、電子音声表現から複数の事前定義された第2のデバイスコマンドへの第2のマッピングを提供する第2の変換モジュールとを含み、複数の事前定義された第2のデバイスコマンドはユーザが編集することができ、リモートサーバは、電子音声表現との最善の相関性を有する第2のデバイスコマンドを決定し、電子音声表現と決定された第2のデバイスコマンドとの間の相関性の品質を表す信頼値を決定するために、第2のマッピングを電子音声表現に適用するように構成されており、リモートサーバは、決定された信頼値が事前定義要件を満たす場合には、決定された第2のデバイスコマンドを第1のプログラマブルロジックコントローラへ送信し、決定された信頼値が事前定義要件を満たさない場合には、電子音声表現との最善の相関性を有する第1のデバイスコマンドを決定するために第1のマッピングを電子音声表現に適用し、決定された第1のデバイスコマンドを第1のプログラマブルロジックコントローラへ送信するように構成されている。
第2の変換モジュールはユーザが構成することができ、ユーザは、特に、ユーザがシステムに認識させたいデバイスコマンドを定義することができる。異なる種類のプログラマブルロジックコントローラおよび被制御デバイスの総数と比較して、特定のユーザは相対的に少数の異なるプログラマブルロジックコントロールおよびデバイスを操作する。したがって、特定のユーザが認識させたいデバイスコマンドの数は、多くの異なる種類のプログラマブルロジックコントローラおよびデバイスを操作するすべての可能なユーザが必要とするデバイスコマンドの総数よりもはるかに少ない。リモートサーバはまず、ユーザ固有の第2の変換モジュールを用いてユーザが話したコマンドを認識しようとするので、認識品質は高い。これは、認識されるべきデバイスコマンドの数が比較的少ないので音声認識プロセスにおける探索空間が比較的小さくてすむからである。
第1の変換モジュールは、ユーザ固有ではなく、システムのすべての可能なユーザによって共有され、その場合、システムと共に用いられることになるすべてのデバイスおよびプログラマブルロジックコントローラのためのより多数の可能なデバイスコマンドの定義を含むことができる。
音声認識プロセスは、第1の変換モジュールまたは第2の変換モジュールを用いて、話し言葉をデバイスコマンドに変換する。変換ごとに、プロセスにおいて、話し言葉と決定されたデバイスコマンドとの間の相関性の品質を表す信頼値の生成も行う。この信頼値はまた、ユーザが話した言葉が決定されたデバイスコマンドとして正しく認識される推定確率として理解することもできる。通常、ユーザが静かな環境で大声ではっきりと話す場合には信頼値は高くなり、ユーザが騒々しい環境で静かに話し、またはつぶやく場合には、信頼値は低くなる。
一例示的態様によれば、リモートサーバはまず、ユーザ固有の第2の変換モジュールを用いて話し言葉を認識されたデバイスコマンドに変換しようと試み、第2の変換モジュールで定義されたデバイスコマンドを十分に高い信頼値で識別できない場合、リモートサーバは同じ話し言葉を、第1の変換モジュールを用いてデバイスコマンドに変換しようと試みる。第1の変換モジュールで定義されたデバイスコマンドを十分に高い信頼値で識別できた場合、このデバイスコマンドは、リモートサーバによって第1のプログラマブルロジックコントローラへ送信される。十分に高い信頼値を有するデバイスコマンドを決定することができない場合、リモートサーバは、話し言葉のデバイスコマンドへの変換に失敗したことを示す電子データを第1のプログラマブルロジックコントローラへ送信する。
例示的実施形態によれば、1台または複数のデバイスが複数のプログラマブルロジックコントローラのうちの第2のプログラマブルロジックコントローラに接続され、第2のプログラマブルロジックコントローラによって制御され、少なくとも1つのデバイスコマンドは、第2のプログラマブルロジックコントローラに接続された1台または複数のデバイスを制御するための少なくとも1つのコマンドを含む。
これによりユーザが、第1のプログラマブルロジックコントローラの音声認識インターフェースを用いて、話し言葉を符号化して電子音声表現にするためのマイクロフォンや符号器を備えていないために音声認識を提供するユーザインターフェースを有していない可能性のある他のプログラマブルロジックコントローラに接続されたデバイスを制御することが可能になる。
特定の実施形態によれば、第1のプログラマブルロジックコントローラにはディスプレイが接続されており、第1のプログラマブルロジックコントローラは少なくとも1つのデバイスコマンドの視覚表現を表示するように構成されている。視覚表現は、例えば、複数のコマンドが異なる行または枠に記載されており、選択され、または認識されたコマンドが強調表示されるメニューとすることができる。これにより、どのコマンドが利用可能であるか、ユーザの話し言葉が正しく認識されたかがユーザにわかるように、ユーザへの視覚フィードバックが提供される。
例示的実施形態によれば、少なくとも1つのデバイスコマンドは、デバイスの動作パラメータをユーザ決定値に設定するためのコマンドを含む。動作パラメータには、例えば、ボーレートやネットワークアドレスといったネットワークモジュールの設定、最大周波数といったモータドライバの設定などが含まれうる。
少なくとも1つのデバイスコマンドはその場合、動作パラメータの設定のリモートサーバへの格納をトリガするコマンドを含んでいてよい。リモートサーバに格納された設定はその場合、システムに接続された新しいプログラマブルロジックコントローラまたはデバイスを初期設定するために後で再利用することができる。
別の実施形態によれば、プログラマブルロジックコントローラが提供され、本プログラマブルロジックコントローラは、プログラマブルロジックコントローラによって制御されるべきマイクロフォン、リモートサーバおよび1台または複数のデバイスに接続され、マイクロフォンによって検出されたユーザの話し言葉を符号化して電子音声表現にし、電子音声表現をリモートサーバへ送信し、電子音声表現の送信に応答してリモートサーバから少なくとも1つのデバイスコマンドを受信し、受信した少なくとも1つのデバイスコマンドに基づいて1台または複数のデバイスを制御するように構成されている。
本開示の上記その他の有利な特徴は、添付の図面に関連した例示的実施形態の以下の詳細な説明を読めばより明らかになるであろう。あらゆる可能な実施形態が必ずしも本明細書で特定される利点のそれぞれ、すべて、またはいずれかを示すわけではないことに留意されたい。
以下で説明する例示的実施形態において、機能および構造が類似した構成要素は可能な限り類似した参照番号で指定されている。したがって、特定の実施形態の個々の構成要素の特徴を理解するには、本開示の他の実施形態および要約を参照すべきである。
図1は、一実施形態によるファクトリーオートメーションシステム1を示す概略図である。ファクトリーオートメーションシステム1は、インターネットなどのネットワーク9に接続された複数のプログラマブルロジックコントローラ3、5、7を含む。ネットワーク9には、プログラマブルロジックコントローラ3がネットワーク9を介してリモートサーバ10および他のプログラマブルロジックコントローラ5、7と通信できるように、リモートサーバ10も接続されている。
プログラマブルロジックコントローラ3はPROFIBUSモジュールのような複数のネットワークモジュール11を含み、各ネットワークモジュール11には複数のデバイス13を接続することができる。デバイス13は、機械、ロボット、モータ、センサなどを含んでいてよく、それらが接続されているプログラマブルロジックコントローラによって制御される。このために、プログラマブルロジックコントローラはデバイスコマンドを含むプログラムを実行する。プログラマブルロジックコントローラ3は、デバイスコマンドを実行するときに、各デバイス13がデバイスコマンドと関連付けられた機能を果たすように各デバイス13へ電子信号を送信する。
デバイス13は、プログラマブルロジックコントローラ5およびプログラマブルロジックコントローラ7にも接続されており、プログラマブルロジックコントローラ5、7のネットワークモジュールは図1には示されていない。
ファクトリーオートメーションシステム1は、ユーザ19にプログラマブルロジックコントローラ3のユーザインターフェースを提供するためにプログラマブルロジックコントローラ3に接続されているマイクロフォン15およびディスプレイ17をさらに含む。このユーザインターフェースは、特に、音声認識を実行し、ユーザ19の話し言葉を、プログラマブルロジックコントローラ3によって実行されるデバイスコマンドに変換することができる。音声認識を実行するために、プログラマブルロジックコントローラ3は、プログラマブルロジックコントローラ3では利用できないが音声認識タスクを実行するのに必要なプロセッサとメモリとを含むリモートサーバ10と協働する。
音声認識タスクは、プログラマブルロジックコントローラ3によって実行されるプロセスと、リモートサーバ10によって実行されるプロセスとを含む。図2に、プログラマブルロジックコントローラ3によって実行されるプロセスを示すフローチャートを示し、図3に、リモートサーバ10によって実行されるプロセスを示すフローチャートを示す。
マイクロフォン15は、別個の入力を介してプログラマブルロジックコントローラ3に接続されたケーブルを介してプログラマブルロジックコントローラ3に接続されている。しかし、マイクロフォンは、プログラマブルロジックコントローラ3のネットワークモジュール11のうちの1つに接続することもできる。同様に、ディスプレイ17もプログラマブルロジックコントローラ3に接続されている。
プログラマブルロジックコントローラ3は、マイクロフォン15によって検出されたユーザ19の話し言葉を符号化して電子音声表現にする(図2に示すフローチャートのステップ31およびステップ33)ように構成されている符号器21をさらに含む。プログラマブルロジックコントローラ3は次いで、ネットワーク9を介してリモートサーバ10へ電子音声表現を送信する(図2に示すフローチャートのステップ35)。
リモートサーバ10は、プログラマブルロジックコントローラ3によって送信された電子音声表現を受信する(図3のフローチャートのステップ51)。電子音声表現の受信後、リモートサーバ10は、プログラマブルロジックコントローラ3によって符号化されて電子音声表現になったユーザの話し言葉に対応する1つまたは複数のデバイスコマンドを決定するために、電子音声表現を解析する。
リモートサーバ10は第1の変換モジュール23と第2の変換モジュール25とを含み、各変換モジュール23、25は、電子音声表現から複数の事前定義されたデバイスコマンドへのマッピングを提供する。変換モジュール23、25のうちの1つを受信された電子音声表現の解析に用いると、各々が解析された電子音声表現として符号化されたユーザの話し言葉に対応する可能性のある複数のデバイスコマンド候補を決定することができる。ここで、デバイスコマンド候補ごとに信頼値が決定され、信頼値は、電子音声表現とそれぞれのデバイスコマンド候補との間の相関性の品質を表す。通常、リモートサーバ10は、最高の信頼値を有するデバイスコマンド候補を、電子音声表現に基づいて決定されたデバイスコマンドとして選択することになる。
上述した限りでは、話し言葉をいくつかの事前定義されたデバイスコマンドに変換するのに1つの変換モジュールがあれば十分である。
図示例では、リモートサーバ10は2つの変換モジュール23、25を含み、変換モジュール25は特定のユーザ19に固有であるが、変換モジュール23はユーザ19に固有ではない。リモートサーバ10は複数の変換モジュール25を含むことができ、変換モジュール25は各々、ファクトリーオートメーションシステムと対話するために登録された複数のユーザのうちの1人のユーザに固有のものである。これらのユーザのうちの1人がファクトリーオートメーションシステムと対話する場合、リモートサーバ10は、特定のユーザに固有の変換モジュール25と、登録ユーザのいずれにも固有のものではない変換モジュール23とを用いる。
ユーザ19に固有の変換モジュール25はユーザ19が編集することができる。ユーザは、特に、変換モジュール25が用いられるときに認識される事前定義されたコマンドセットを編集することができる。例えば、ユーザは、リモートサーバ10に格納されたテキストファイルを編集することによって事前定義されたコマンドを編集することができ、テキストファイルの各行はデバイスコマンドの書かれた表現を含み、デバイス13またはコマンドを実行すべきであるデバイス13のグループの識別子も含んでいてよい。ユーザ19は、ユーザ19によってのみ用いられる固有のコマンドをさらに登録することができる。例えば、ユーザは、光学文字認識を用いて、デバイスの操作マニュアルから書かれた表現を生成することができる。このような編集は、ネットワーク9を介してリモートサーバ10に接続されたラップトップコンピュータ27などのコンピュータを用いて実行することができる。
電子音声表現の受信後、リモートサーバ10は、ユーザ固有の変換モジュール25を用いて少なくとも1つのデバイスコマンドを決定し、電子音声表現から少なくとも1つのデバイスコマンドへの変換と関連付けられた信頼値も決定する(図3のステップ53)。リモートサーバ10は次いで、信頼値が事前定義要件を満たすかどうか判断する。信頼値が数値である場合、この決定は、信頼値を事前定義閾値と比較することによって行うことができる(図3のステップ55)。信頼値が事前定義要件を満たす場合、リモートサーバ10は、決定された少なくとも1つのデバイスコマンドをプログラマブルロジックコントローラ3へ送信する(図3のステップ57参照)。
信頼値が事前定義要件を満たさない場合、リモートサーバ10は、変換モジュール23を用いて解析された電子音声表現に対応する少なくとも1つのデバイスコマンドを決定する(図3のステップ59)。電子音声表現と、変換モジュール23を用いたときに決定された少なくとも1つのデバイスコマンドとの間の相関性の品質を示す信頼値が事前定義要件を満たす場合(図3のステップ61)、変換モジュール23を用いて決定された少なくとも1つのデバイスコマンドはプログラマブルコントローラ3へ送信される(図3のステップ63)。
ユーザ19の録音された話し言葉に対応する少なくとも1つのデバイスコマンドを受信した(図2のステップ37)後で、プログラマブルロジックコントローラ3は、受信した少なくとも1つのデバイスコマンドを、対応する電子信号を接続された1台または複数のデバイス13へ送信することによって実行する(図2のステップ39)。
信頼値が事前定義要件を満たさない場合、リモートサーバ10は、電子音声表現のデバイスコマンドへの変換を十分な正確さで行うことができなかったことを示すエラー情報を生成し、このエラー情報をプログラマブルロジックコントローラ3へ送信する(図3のステップ65)。プログラマブルロジックコントローラ3は次いで、ユーザがコマンドを繰り返すように、すなわち再び言葉を発するように、ユーザにエラーを知らせることができる。
プログラマブルロジックコントローラ3は、ディスプレイ17を用いてユーザ19にユーザインターフェースを提供することができる。例えば、ディスプレイ17はメニュー31(図4参照)を表示することができ、メニュー31は所与の状況においてプログラマブルロジックコントローラ3が実行することのできるデバイスコマンドのセットの視覚表現を示す。図4に示す例では、これらのコマンドは、「制御/コマンド」32、「プログラミング」33、「ステータス」34、「構成」35、「その他」36、および「追加」37である。
音声認識システムは、モータに物体を移動させるよう命令する、センサに測定値を提供するよう命令するなど、即時の動作を実行するようにデバイス13を制御するのに用いることができる。さらに、音声認識システムを他の目的に用いることもできる。例えば、ユーザ19が「構成」35という言葉を発した場合、プログラマブルロジックコントローラ3は、話し言葉がプログラマブルロジックコントローラ3、5、7およびデバイス13を構成するためのデバイスコマンドとして認識されるモードに入ることができる。デバイスコマンドはその場合、プログラマブルロジックコントローラ3、5、7およびデバイス13の動作パラメータを設定し、または変更するためのコマンドを含むことになる。例えば、動作パラメータは、プログラマブルロジックコントローラ3のネットワークモジュール11の設定を含むことができ、それらの設定にはネットワークアドレス、ボーレートなどが含まれる。
デバイスコマンドは、例えばファクトリーオートメーションシステム1に接続された新しいプログラマブルロジックコントローラや新しいデバイスを初期設定するために動作パラメータを後で再利用できるように、動作パラメータをリモートサーバ10へ送信するようプログラマブルロジックコントローラ3に命令するコマンドをさらに含むことができる。
さらに、デバイスコマンドは、リモートサーバ10から、プログラマブルロジックコントローラ3にすでに接続されているデバイス13または新たに接続されたデバイスのための設定情報を含むファイルを取得するようプログラマブルロジックコントローラ3に命令するコマンドをさらに含むことができる。プログラマブルロジックコントローラ3は、リモートサーバ10からの受信後にそのようなファイルで定義された設定をデバイス13に適用することができる。
デバイスコマンドは、オブジェクトをある距離だけ移動させるようにモータなどの作動デバイスを制御するようプログラマブルロジックコントローラ3に命令するコマンドをさらに含むことができる。この移動は、不適切な時間に実行された場合に別の物体との衝突を発生させる可能性があり、またユーザによって与えられた音声コマンドがファクトリーオートメーションシステムによって誤解される可能性もあるため、このコマンドは潜在的に有害である。プログラマブルロジックコントローラは、潜在的に有害なコマンドを実行する前に、ユーザに事前定義信号を出力するように構成することができる。この信号は、例えば、ブザーからの音であってもよく、スピーカによって生成された人工的な音声であってもよい。プログラマブルロジックコントローラは次いで、ユーザがさらなる確認コマンドを発行するまで待機し、ユーザからの確認コマンドの受け取った後で初めてコマンドを実行する。
図5に、ファクトリーオートメーションシステム1のプログラマブルロジックコントローラと共に用いることができる音声コマンドの表の例を示す。表は、「番号」、「PLC番号」、「自動/手動」、「音声コマンド」、「リンク」の5列を有する。列「番号」は、表の行番号またはレコード番号を示す。列「PLC番号」は、表の行が関連するプログラマブルロジックコントローラの識別子を示す。例えば、識別子「1」はプログラマブルロジックコントローラ3を表し、識別子「2」はプログラマブルロジックコントローラ5を表し、識別子「3」はプログラマブルロジックコントローラ7を表す。一般に、プログラマブルロジックコントローラは、プログラマブルロジックコントローラの記憶領域に格納されたシーケンスプログラムに従って一連のステップを実行する。しかし、プログラマブルロジックコントローラに接続されたデバイスの1台が障害を有する場合、ユーザは、シーケンスプログラムのどのステップが正しく実行されるか、または正しく実行されないかを確かめるために、シーケンスをステップごとに実行する必要がある。列「自動/手動」において、カテゴリ「自動」は、音声コマンドがシーケンスのすべてのステップを自動的に実行できることを意味する。他方、カテゴリ「手動」は、音声コマンドがシーケンス内の1つのステップだけを実行できることを意味する。
列「音声コマンド」に示すように、異なるプログラマブルロジックコントローラが、同じ意味を有し、同じデバイスコマンドを表すが、異なる音声表現を有する音声コマンドによって操作される場合もある。例えば、「プロセス1」(行番号1)、「プロセス」(行番号51)、および「自動プロセス」(行番号101)という話し言葉は異なる音であるが、同じデバイスコマンドを示している。このため、列「リンク」は、異なる可能性のある音声表現を有する同じデバイスコマンドを含む表の行またはレコードの番号のリストを示している。列「リンク」は、同じ音声表現を有するが、異なるデバイスコマンドに関連している音声コマンドを識別するのに用いることもできる。例えば、「位置決め」(行番号1および行番号102)と「位置決め」(行番号52)とは、同じ音声表現を有するが、異なるデバイスコマンドに関連している。上記の表は、意図しない音声入力によるデバイスの誤動作を防ぐのに役立つ。
図6に、「PLC番号」4を有する新しいプログラマブルロジックコントローラがファクトリーオートメーションシステム1に接続されている場合の、図5に示す表の別の図を示す。ユーザは、行151の列「音声コマンド」に新しいプログラマブルロジックコントローラと共に用いられるべきコマンドの書かれた音声表現として「プロセス」を入力し、ユーザは同じ行の列「リンク」に番号「1」を入力する。番号「1」にすでに連結されている番号「51」、番号「101」、番号「151」はシステムによって自動的に追加され、行番号151の列「リンク」のセルに表示され、「番号1」、「番号51」、「番号101」といった、同じデバイスコマンドに関連する各行に番号「151」が追加される。このような手順によりリンク属性の不一致の発生が防止される。
図7に、動作時のローカル制御における「PLC番号1」の例を示す。まず、ユーザ19は、プログラマブルロジックコントローラ3に接続されたマイクロフォン15に、ディスプレイ17上に「音声メニュー」31(図4)を提示する「制御およびコマンド」を言う。するとディスプレイ17はメニュー40を示す。ユーザ19は次いで、「ローカル」、「自動」、および「プロセス1」を、対応する言葉を言って選択する。「ローカル」を選択すると、「PLC番号」が「1」に固定される。
図8に、グローバル制御における「PLC番号1」のディスプレイ17上のメニュー41の例を示す。上記図7に関連して示した例と同様に、「グローバル」および「プロセス1」を選択すると、ユーザ19は、表で音声コマンド「プロセス1」にリンクされている他のリモートのプログラマブルロジックコントローラ(例えば、「PLC番号2」、「PLC番号3」、「PLC番号4」)を指定することができる。
図9に、ユーザがディスプレイ17上の「音声メニュー」31(図4)の中から「ステータス」34のエントリを選択したときのディスプレイ17上のメニュー42の例を示す。ディスプレイ17には、番号1〜8および番号10〜20を有するプログラマブルロジックコントローラは音声コマンド「プロセス1」によって操作されること、番号7および番号9を有するプログラマブルロジックコントローラは別の音声コマンドによって操作されること、ならびに番号8を有するプログラマブルロジックコントローラは異常により停止していることを意味するメニューが表示されている。
図10に、ユーザがディスプレイ17上の「音声メニュー」31(図4)の中から「構成」35のエントリを選択した場合の例を示す。ディスプレイ17にはその場合、ユーザ19がローカル制御を選択し、ファイル名「******」を有する構成ファイルの番号1を有するプログラマブルロジックコントローラへのダウンロードを指示したことを意味するメニュー43が表示される。
同様に、図11に、ユーザがディスプレイ17上の「音声メニュー」31(図4)の中から「構成」35のエントリを選択した場合の例を示す。ディスプレイ17にはその場合、ユーザ19が「グローバル」制御を選択し、ファイル名「******」を有する構成ファイルの番号1〜4を有するプログラマブルロジックコントローラへのダウンロードを指示したことを意味するメニュー44が表示される。
本開示は、本開示のいくつかの例示的実施形態に関連して説明されているが、当業者には多くの代替、改変および変形が明らかであることは明白である。それゆえ、本明細書に記載されている本開示の例示的実施形態は例示的のためのものであり、いかなる点においても限定するものではない。特許請求の範囲で定義される本開示の趣旨および範囲を逸脱することなく様々な変更を行うことができる。
本発明は、ファクトリーオートメーションシステムおよびリモートサーバに関する。
本発明は、ユーザからの音声コマンドを受け入れるユーザインターフェースを有するファクトリーオートメーションシステムおよびリモートサーバを提供する。
Claims (8)
- 複数のプログラマブルロジックコントローラと、
マイクロフォンと、
ネットワークを介して前記複数のプログラマブルロジックコントローラに接続されたリモートサーバと、
を含み、
前記マイクロフォンは前記複数のプログラマブルロジックコントローラのうちの第1のプログラマブルロジックコントローラに接続されており、
1台または複数のデバイスが前記第1のプログラマブルロジックコントローラに接続され、前記第1のプログラマブルロジックコントローラによって制御され、
前記第1のプログラマブルロジックコントローラは前記マイクロフォンによって録音されたユーザの話し言葉を符号化して電子音声表現にするように構成されており、
前記第1のプログラマブルロジックコントローラは前記電子音声表現を前記ネットワークを介して前記リモートサーバへ送信するように構成されており、
前記リモートサーバは、前記第1のプログラマブルロジックコントローラによって送信された前記電子音声表現に基づいて少なくとも1つのデバイスコマンドを決定し、前記決定された少なくとも1つのデバイスコマンドを前記第1のプログラマブルロジックコントローラへ送信するように構成されており、
前記第1のプログラマブルロジックコントローラは、前記リモートサーバによって送信された前記少なくとも1つのデバイスコマンドに基づいて前記1台または複数のデバイスを制御するようにさらに構成されていることを特徴とするファクトリーオートメーションシステム。 - 前記リモートサーバは、電子音声表現から複数の事前定義された第1のデバイスコマンドへの第1のマッピングを提供する第1の変換モジュールと、電子音声表現から複数の事前定義された第2のデバイスコマンドへの第2のマッピングを提供する第2の変換モジュールとを含み、
前記複数の事前定義された第2のデバイスコマンドは前記ユーザが編集することができ、
前記リモートサーバは、前記電子音声表現との最善の相関性を有する前記第2のデバイスコマンドを決定し、前記電子音声表現と前記決定された第2のデバイスコマンドとの間の前記相関性の品質を表す信頼値を決定するために、前記第2のマッピングを前記電子音声表現に適用するように構成されており、
前記リモートサーバは、前記決定された信頼値が事前定義要件を満たす場合には、前記決定された第2のデバイスコマンドを前記第1のプログラマブルロジックコントローラへ送信し、前記決定された信頼値が前記事前定義要件を満たさない場合には、前記電子音声表現との最善の相関性を有する前記第1のデバイスコマンドを決定するために前記第1のマッピングを前記電子音声表現に適用し、前記決定された第1のデバイスコマンドを前記第1のプログラマブルロジックコントローラへ送信するように構成されていることを特徴とする請求項1に記載のファクトリーオートメーションシステム。 - 前記リモートサーバは、前記決定された信頼値が前記事前定義要件を満たす場合には、前記電子音声表現と前記決定された第1のデバイスコマンドとの間の前記相関性の前記品質を表す前記信頼値を決定し、前記決定された第1のデバイスコマンドを送信し、前記信頼値が前記事前定義要件を満たさない場合には、前記デバイスコマンドの前記決定ができなかったことを示す電子データを前記第1のプログラマブルロジックコントローラへ送信するように構成されていることを特徴とする請求項2に記載のファクトリーオートメーションシステム。
- 1台または複数のデバイスが前記複数のプログラマブルロジックコントローラのうちの第2のプログラマブルロジックコントローラに接続され、前記第2のプログラマブルロジックコントローラによって制御され、
前記少なくとも1つのデバイスコマンドは、前記第2のプログラマブルロジックコントローラに接続された前記1台または複数のデバイスを制御するための少なくとも1つのコマンドを含むことを特徴とする請求項1から3の何れか一項に記載のファクトリーオートメーションシステム。 - 前記第1のプログラマブルロジックコントローラに接続されたディスプレイをさらに含み、前記第1のプログラマブルロジックコントローラは前記少なくとも1つのデバイスコマンドの視覚表現を表示するように構成されていることを特徴とする請求項1から4の何れか一項に記載のファクトリーオートメーションシステム。
- 前記少なくとも1つのデバイスコマンドは、前記少なくとも1台のデバイスの動作パラメータをユーザ決定値に設定するための少なくとも1つのコマンド、および前記少なくとも1台のデバイスの前記動作パラメータの前記設定を前記リモートサーバに格納するためのコマンドを含むことを特徴とする請求項1から5の何れか一項に記載のファクトリーオートメーションシステム。
- 前記少なくとも1台のデバイスはモータを含み、前記少なくとも1つのデバイスコマンドは前記モータに物体を移動させるよう命令するコマンドを含み、前記第1のプログラマブルロジックコントローラは、前記ユーザに事前定義信号を出力し、前記移動を実行するよう前記モータを制御する前に前記ユーザから確認を受け取るように構成されていることを特徴とする請求項1から5の何れか一項に記載のファクトリーオートメーションシステム。
- プログラマブルロジックコントローラであって、
前記プログラマブルロジックコントローラは、
前記プログラマブルロジックコントローラによって制御されるべきマイクロフォン、リモートサーバおよび1台または複数のデバイスに接続され、
前記マイクロフォンによって検出されたユーザの話し言葉を符号化して電子音声表現にし、
前記電子音声表現を前記リモートサーバへ送信し、
前記電子音声表現の前記送信に応答して前記リモートサーバから少なくとも1つのデバイスコマンドを受信し、
前記受信した少なくとも1つのデバイスコマンドに基づいて前記1台または複数のデバイスを制御するように構成されていることを特徴とするプログラマブルロジックコントローラ。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/003888 WO2018037435A1 (en) | 2016-08-26 | 2016-08-26 | Factory automation system and programmable logic controller |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018537734A true JP2018537734A (ja) | 2018-12-20 |
JP6452826B2 JP6452826B2 (ja) | 2019-01-16 |
Family
ID=56958983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017535120A Expired - Fee Related JP6452826B2 (ja) | 2016-08-26 | 2016-08-26 | ファクトリーオートメーションシステムおよびリモートサーバ |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3485491A1 (ja) |
JP (1) | JP6452826B2 (ja) |
WO (1) | WO2018037435A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4293440A1 (en) * | 2022-06-15 | 2023-12-20 | Abb Schweiz Ag | Programmable logic controller with voice control |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20040260538A1 (en) * | 2003-06-19 | 2004-12-23 | Schneider Automation Inc. | System and method for voice input to an automation system |
JP2005181439A (ja) * | 2003-12-16 | 2005-07-07 | Nissan Motor Co Ltd | 音声認識装置 |
JP2010197607A (ja) * | 2009-02-24 | 2010-09-09 | Toshiba Corp | 音声認識装置、音声認識方法およびプログラム |
US20120245940A1 (en) * | 2009-12-08 | 2012-09-27 | Nuance Communications, Inc. | Guest Speaker Robust Adapted Speech Recognition |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
JP2014062944A (ja) * | 2012-09-20 | 2014-04-10 | Sharp Corp | 情報処理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6386107B1 (en) * | 1999-08-02 | 2002-05-14 | Heidelberger Druckmaschinen Ag | Voice based interface for a printing press |
US7249023B2 (en) | 2003-03-11 | 2007-07-24 | Square D Company | Navigated menuing for industrial human machine interface via speech recognition |
-
2016
- 2016-08-26 WO PCT/JP2016/003888 patent/WO2018037435A1/en active Application Filing
- 2016-08-26 JP JP2017535120A patent/JP6452826B2/ja not_active Expired - Fee Related
- 2016-08-26 EP EP16767386.2A patent/EP3485491A1/en not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20040260538A1 (en) * | 2003-06-19 | 2004-12-23 | Schneider Automation Inc. | System and method for voice input to an automation system |
JP2005181439A (ja) * | 2003-12-16 | 2005-07-07 | Nissan Motor Co Ltd | 音声認識装置 |
JP2010197607A (ja) * | 2009-02-24 | 2010-09-09 | Toshiba Corp | 音声認識装置、音声認識方法およびプログラム |
US20120245940A1 (en) * | 2009-12-08 | 2012-09-27 | Nuance Communications, Inc. | Guest Speaker Robust Adapted Speech Recognition |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
JP2014062944A (ja) * | 2012-09-20 | 2014-04-10 | Sharp Corp | 情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2018037435A1 (en) | 2018-03-01 |
EP3485491A1 (en) | 2019-05-22 |
JP6452826B2 (ja) | 2019-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7297836B2 (ja) | アシスタントアプリケーションのための音声ユーザインタフェースショートカット | |
JP3662780B2 (ja) | 自然言語を用いた対話システム | |
KR102429436B1 (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
JP4854259B2 (ja) | 音声コマンドを明瞭化する集中化された方法およびシステム | |
JP4942970B2 (ja) | 音声認識における動詞誤りの回復 | |
JP2017058673A (ja) | 対話処理装置及び方法と知能型対話処理システム | |
JP2006146887A (ja) | キャラクタの制御された操作 | |
US20080255852A1 (en) | Apparatuses and methods for voice command processing | |
JP6675078B2 (ja) | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム | |
CN109144458B (zh) | 用于执行与语音输入相对应的操作的电子设备 | |
US11615788B2 (en) | Method for executing function based on voice and electronic device supporting the same | |
JP2010055375A (ja) | 電子機器操作指示装置およびその操作方法 | |
US10952075B2 (en) | Electronic apparatus and WiFi connecting method thereof | |
JP6452826B2 (ja) | ファクトリーオートメーションシステムおよびリモートサーバ | |
US11769490B2 (en) | Electronic apparatus and control method thereof | |
US11314221B2 (en) | Machine tool and management system | |
Oyucu | Integration of cloud-based speech recognition system to the Internet of Things based smart home automation | |
JP4537755B2 (ja) | 音声対話システム | |
CN112669848B (zh) | 一种离线语音识别方法、装置、电子设备及存储介质 | |
US20240020139A1 (en) | Configuration of a virtual assistant | |
WO2023139770A1 (ja) | 文法作成支援装置、及びコンピュータが読み取り可能な記憶媒体 | |
Pai et al. | Implementation of a Voice-ControlSystem for Issuing Commands in a Virtual Manufacturing Simulation Process | |
KR20230064504A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 이의 동작 방법 | |
JP2013122521A (ja) | 音声処理装置及び音声処理装置の制御方法 | |
TR201904075A2 (tr) | Web tabanlı yönetim arayüzleri aracılığıyla kullanıcı talepleri almak için bir usul ve bir sistem. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6452826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |