JP7502449B2 - 情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体 - Google Patents

情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP7502449B2
JP7502449B2 JP2022540600A JP2022540600A JP7502449B2 JP 7502449 B2 JP7502449 B2 JP 7502449B2 JP 2022540600 A JP2022540600 A JP 2022540600A JP 2022540600 A JP2022540600 A JP 2022540600A JP 7502449 B2 JP7502449 B2 JP 7502449B2
Authority
JP
Japan
Prior art keywords
time
specified
date
specified time
determination result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022540600A
Other languages
English (en)
Other versions
JP2023509651A (ja
Inventor
永楷 林
帥 樊
鵬 楊
瑞▲てい▼ 徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Publication of JP2023509651A publication Critical patent/JP2023509651A/ja
Application granted granted Critical
Publication of JP7502449B2 publication Critical patent/JP7502449B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G04HOROLOGY
    • G04GELECTRONIC TIME-PIECES
    • G04G13/00Producing acoustic time signals
    • G04G13/02Producing acoustic time signals at preselected times, e.g. alarm clocks
    • GPHYSICS
    • G04HOROLOGY
    • G04GELECTRONIC TIME-PIECES
    • G04G13/00Producing acoustic time signals
    • G04G13/02Producing acoustic time signals at preselected times, e.g. alarm clocks
    • G04G13/021Details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Electric Clocks (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、音声処理技術分野に関し、特に情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体に関する。
アラームと時間を手動でしか設定することができない従来の目覚ましとは異なり、スマート目覚ましは、音声インタラクションの方法により目覚ましタスクの設定を実現することができる。しかし現在、クライアント自身のデータ処理能力の制限により、クライアントはユーザの真に設定しようとする時間を理解することが困難であり、ユーザが音声インタラクションを介して時間を設定する場合、クライアントが対応するタスクを設定するには、時間の日付と時刻を正確に提供する必要があり、これはユーザ体験に影響を与える。
本発明の実施例は、音声信号の時間に対して時間推定を行い、ニーズに合う意図時間を確定できる情報処理方法、情報制御センター装置及びコンピュータ読み取り可能な記憶媒体を提供する。
本発明の一態様によれば、情報制御センター装置に用いられる情報処理方法であって、対応する音声信号の、指定時間が含まれるセマンティック解析情報を取得するステップと、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するステップと、意図時間に基づいて対応する音声信号の目標命令を生成するステップと、を含むことを特徴とする情報処理方法を提供する。
一実施形態では、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するステップにおいては、指定時間に指定時刻が含まれているかどうかを判断して、第1の判断結果を取得し、第1の判断結果として指定時間に指定時刻が含まれている場合、指定時間に指定日付が含まれているかどうかを判断して、第2の判断結果を取得し、第2の判断結果として指定時間に指定日付が含まれている場合、指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得し、第3の判断結果として指定日付が現在日付より遅い場合、指定時刻と指定日付を意図時間として確定する。
一実施形態では、前記情報処理方法には、前記第2の判断結果として前記指定時間に指定日付が含まれていない場合、前記現在日付を暫定日付として確定するステップと、前記暫定日付と前記指定時刻を暫定時間として確定するステップと、前記暫定時間が現在時間より早くないか否かを判断して、第4の判断結果を取得するステップと、第4の判断結果として前記暫定時間が現在時間より早くない場合、前記暫定時間を意図時間として確定するステップと、をさらに含まれる。
一実施形態では、前記情報処理方法には、前記第4の判断結果として前記暫定時間が現在時刻より早い場合、時間近接原則に基づいて前記暫定時間を訂正して、訂正時間を取得するステップと、前記訂正時間を意図時間として確定するステップと、をさらに含まれる。
一実施形態では、前記時間近接原則には、暫定時刻を訂正するための第1の原則と、暫定日付を訂正するための第2の原則と、暫定時間を訂正するための第3の原則と、の少なくとも一つが含まれる。
一実施形態では、前記情報処理方法には、前記指定時刻に指定時間帯が含まれているか否かを判断して、第5の判断結果を取得するステップと、前記第5の判断結果として前記指定時刻に指定時間帯が含まれている場合、時刻変換規則に基づいて前記指定時刻に対してタイプ変換を行い、変換時刻を取得するステップと、前記変換時刻が前記暫定時間を確定するために用いられ、前記変換時刻に指定時間帯が含まれておらず、前記変換時刻と前記指定時刻が同一時間を表すために用いられるようにするステップと、をさらに含まれる。
一実施形態では、前記時刻変換規則には、時刻タイプを変換するための第1の変換規則と、言い間違いを訂正するための第2の変換規則と、時刻臨界点を処理するための第3の変換規則と、の少なくとも1つが含まれる。
一実施形態では、前記情報処理方法は、前記指定時間に指定時刻が含まれているか否かを判断する前に、セマンティック解析情報に基づいて指定時間を取得し、前記指定時間が時間規則に合致するか否かを検証して、検証結果を取得し、前記検証の結果として前記指定時間が時間規則に合致する場合、前記指定時間に指定時刻が含まれているか否かを判断する。
本発明の他の態様によれば、対応する音声信号の、指定時間が含まれるセマンティック解析情報を取得するために用いられる取得モジュールと、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するための推定モジュールと、意図時間に基づいて対応する音声信号の目標命令を生成するための生成モジュールと、を含むことを特徴とする情報制御センター装置を提供する。
一実施形態では、前記推定モジュールには、前記指定時間に指定時刻が含まれているかどうかを判断して、第1の判断結果を取得するための第1の判断サブモジュールと、前記第1の判断結果として前記指定時間に指定時刻が含まれていると判断された場合、前記指定時間に指定日付が含まれているかどうかを判断して、第2の判断結果を取得するための前記第2の判断サブモジュールと、前記第2の判断結果として前記指定時間に指定日付が含まれていると判断された場合、前記指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得するための第3の判断サブモジュールと、前記第3の判断結果として前記指定日付が現在日付より遅いと判断された場合、前記指定時刻と前記指定日付を意図時間として確定するための確定サブモジュールと、が含まれる。
一実施形態では、前記確定サブモジュールはさらに、前記第2の判断結果として前記指定時間に指定日付が含まれていないと判断された場合、現在日付を暫定日付として確定するために用いられる。前記確定サブモジュールはさらに、前記暫定日付と前記指定時刻を暫定時間として確定するために用いられる。前記推定モジュールには、前記暫定時間が現在時間より早くないか否かを判断して、第4の判断結果を取得するための第4の判断サブモジュールが含まれる。前記確定サブモジュールはさらに、前記第4の判断結果として前記暫定時間が現在時刻より早くないと判断された場合、前記暫定時間を意図時間として確定するために用いられる。
本発明の実施例において、前記推定モジュールには、前記第4の判断結果として前記暫定時間が現在時刻より早いと判断された場合、時間近接原則に基づいて前記暫定時間を訂正し、訂正時間を取得するための訂正サブモジュールがさらに含まれる。前記確定サブモジュールはさらに、訂正時間を意図時間として確定するために用いられる。
一実施形態では、前記推定モジュールには、前記指定時刻に指定時間帯が含まれているか否かを判断して、第5の判断結果を取得するための第5の判断サブモジュールと、前記第5の判断結果として前記指定時刻に指定時間帯が含まれていると判断された場合、時刻変換規則に基づいて前記指定時刻に対してタイプ変換を行い、前記変換時刻を取得するための変換サブモジュールと、がさらに含まれている。前記変換時刻が暫定時間を確定するために用いられ、前記変換時刻に指定時間帯が含まれておらず、前記変換時刻と前記指定時刻が同一時間を表すために用いられる。
本発明の実施例において、前記取得モジュールにはさらに、セマンティック解析情報に基づいて前記指定時間を取得するために用いられる。前記装置には、前記指定時間が時間規則に合致するか否かを検証して、前記検証結果を取得するための検証モジュールがさらに含まれる。前記検証の結果として前記指定時間が時間規則に合致すると検証された場合、前記指定時間に指定時刻が含まれているか否かを判断する。
本発明の他の態様によれば、コンピュータによって実行可能な命令が記憶されており、前記命令が実行されると、上記のいずれか1項の情報処理方法が実行できるように構成されることを特徴とするコンピュータ読み取り可能な記録媒体を提供する。
本発明は、情報制御センター方法、情報制御センター装置、及びコンピュータ読み取り可能な記録媒体を提供する。情報制御センター装置は、本発明の実施例によって提供される情報処理方法を適用することにより、複雑で多様な音声信号を処理することができ、セマンティック解析情報から音声信号の指定時間と目標意図を抽出することができ、指定時間によりセマンティック解析情報に対して時間推定を行うことで、音声信号における指定時間をより正確に処理し、音声インタラクションプロセスをより正確にさせることができる。
上記および他の目的、特徴、および利点は、添付の図面を参照して以下の本発明の例示的な実施形態を読むことにより、よりよく理解することができる。添付の図面は、本発明のいくつかの実施形態を限定するものではなく例示的に示すものであり、同一又は対応する符号は、同一又は対応する部分を示す。
本発明の実施例に係る情報処理方法を実現するためのフローチャートである。 本発明の実施例に係る情報処理方法の時間推定のフローチャートである。 本発明の実施例に係る情報処理方法の時刻変換のフローチャートである。 本発明の実施例に係る情報処理方法の時間規則検証のフローチャートである。 本発明の実施例に係る情報処理方法を適用するシーンの概略図である。 本発明の実施例に係る情報処理方法を適用するシーンにおける時間推定のフローチャートである。 本発明の実施例に係る情報制御センター装置のモジュールの概略図である。
本発明の目的、特徴および利点をより明確かつ理解しやすくするために、以下では、本発明の実施例における図面と併せて、本発明の実施例の技術案を明確かつ完全に説明する。もちろん、説明される実施形態は本発明の一部の実施形態にすぎず、本発明の全部の実施形態ではない。本発明の実施形態に基づいて、当業者が創造的な努力なしに得られる他の全ての実施形態も本発明の保護範囲に含まれるべきである。
図1は、本発明の実施例に係る情報処理方法のフローチャートである。
図1を参照すると、本発明の実施例に係る情報処理方法は、情報制御センター装置に用いられる。情報制御センター装置は、例えば、クラウドサーバであってもよい。この方法は、対応する音声信号の、指定時間が含まれるセマンティック解析情報を取得するステップ101と、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するステップ102と、意図時間に基づいて対応する音声信号の目標命令を生成するステップ103と、を含む。
本実施例によって提供される情報処理方法は、情報制御センター装置に用いられる、複雑で多様な音声信号を処理することができる。音声信号は音声識別とセマンティック解析を経て、取得したセマンティック解析情報には指定時間と指定タスクが含まれる。指定タスクは、音声信号における対応する目標意図であり、指定時間は、音声信号における目標意図の実行に対応する実行時間である。指定時間が正確でない場合、現在時間から指定時間に対して時間推定を行うことにより、指定タスクに対応する意図時間を正確に確定することができる。情報制御センター装置は、意図時間に基づいて目標命令を設定し、意図時間にユーザの指定タスクを実行するようクライアントに指示し、音声インタラクションに対応する結果をより正確にさせる。
情報制御センター装置は、データ処理能力を有する装置である。本実施例において、情報制御センター装置はクラウドサーバであり、クラウドサーバを介した音声信号に対する音声処理により、クライアントのハードウェアに対する要求を大幅に低減させることができ、クライアントにて複雑なセマンティック規則のカスタマイズ作業を行う必要がない。クラウドサーバがセマンティックアップグレードを行う時にも、クライアントを更新する必要がない。本実施例のクライアントは、情報制御センター装置(例えばクラウドサーバ)と信号伝送を行う端末であり、クライアントは、目標命令を実行する対応機能を有する。即ち、目標命令は、クライアントの機能に基づいて設定することができ、クライアントは目覚ましである。
本方法は、対応する音声信号の、指定時間が含まれるセマンティック解析情報を取得するステップを含む。音声信号は、オーディオ収集装置により収集することができる。本実施例において、音声信号を収集するオーディオ収集装置は、一定数のマイクロフォンで構成されるマイクロフォンアレイを選択して使用し、クライアントに装着される。セマンティック解析情報は、音声信号が音声識別処理及びセマンティック解析処理を経て得られた情報である。マイクロフォンアレイは、信号処理アルゴリズムにより音声信号を収集し、音源方向を識別すると同時に、背景音をある程度除去して、その後の音声識別の精度を向上させることもできる。ネットワークを利用して音声信号を情報制御センター装置に送信し、情報制御センター装置はASR音声識別技術により音声信号に対して音声識別を行い、音声信号を音声に対応するテキスト情報に変換する。本方法において、ASR音声識別技術は、家庭環境における音響モデル及び言語モデルに基づいてトレーニングし、家庭シーンにより適応することができ、騒がしいシーンにおいても音声信号を正確に識別し、正確なテキスト情報を取得することができる。テキスト情報は、セマンティック解析モジュールによりセマンティック解析を行い、セマンティック解析モジュールはテキスト情報をセマンティック解析情報に解析する。例えば、ある状況では、「7時に列車のチケットを購入するようにリマインドしてください」というテキスト情報は、以下のセマンティック解析情報の構造に解析される{時間=07:00、リマインダ事件=列車のチケットの購入、タスク対象=リマインド}。別の状況では、「5時の目覚まし」というテキスト情報は、以下の構造に解析される{時間=05:00、タスク対象=目覚まし}。
本方法は、情報制御センター装置が現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するステップをさらに含む。セマンティック解析モジュールは、セマンティック解析情報を対話管理システムに送信する。対話管理システムは、指定時間に基づいてセマンティック解析情報に対して時間推定を行い、意図時間を取得する。セマンティック解析情報を直接クライアントに返信しないことで、クライアントが何度も情報制御センター装置に要求を発信する必要があることを回避し、クライアントの性能と応答時間を向上させることができる。
目標命令を生成するための意図時間は、日付情報や時刻情報を含む必要がある。時刻情報には、12時間制と24時間制が存在するため、時刻情報には、時間帯情報と時間情報とがさらに含まれる。例えば、意図時間の正確性要求を満たす時間情報には、{日付=20190305、時間帯=午後、時間=5:00}が含まれる。
音声信号から解析される指定時間には通常、時間情報しかなく、上記の要求を完全に満たさない。従って、意図時間を満たすために必要な時間情報を得るために、現在時間に基づいて指定時間に対して時間推定を行う必要がある。例えば、セマンティック解析情報から取得した指定時間が{時間=5:00}である場合、現在時間に基づいて指定時間に対して時間推定を行う。現在時間が{日付=20190305、時間帯=午後、時間=4:00}である場合、取得される意図時間は、{日付=20190305、時間帯=午後、時間=17:00}である。即ち、現在時間に最も近く、且つ指定時間の記述に適合できる未来時間を意図時間として選択する。
本方法は、情報制御センター装置が意図時間に基づいて対応する音声信号の目標命令を生成するステップをさらに含む。指定タスクと意図時間とに基づいて、音声信号中の指定タスクの実行を指示するための、対応する音声信号の目標命令を生成することができる。例えば、音声信号が「7:00に列車のチケットを購入するようリマインドしてください」である場合、情報制御センター装置がセマンティック解析により取得したセマンティック解析情報において、指定時間は「7:00」であり、タスク対象は「リマインド」であり、リマインダ事件は「列車のチケットの購入」である。指定時間「7:00」に対して時間推定を行い、時間近接原則に基づいて、現在時間が「2019年12月26日、8時」であると確定された場合、意図時間は「2019年12月27日、7:00」であると確定される。その後、クライアントが2019年12月27日7:00に、音声再生を介して列車のチケットの購入をリマインドするように、対応する意図時間が「2019年12月27日、7:00」であり、タスク対象が「リマインド」であり、リマインダ事件が「列車のチケットの購入」である目標命令を生成して、クライアントに送信する。なお、目標命令を受信する対象はクライアントに限定されず、目標命令の指定タスクが情報制御センター装置の変更である場合、目標命令の受信対象は情報制御センター装置である。目標命令の指定タスクが第三者端末を制御することである場合、目標命令の受信対象はさらに第三者端末であってもよい。
本方法は、情報制御センター装置が意図時間と指定タスクに基づいてタスク命令を生成し、意図時間に基づいて音声合成処理を行うことで、対応する指定タスクのオーディオ信号を取得するステップと、タスク命令とオーディオ信号を目標命令として確定するステップと、クライアントがタスク命令を実行してオーディオ信号を再生するように、目標命令をクライアントに送信するステップと、をさらに含む。
意図時間を取得した後、対話管理モジュールにより意図時間と指定タスクを処理することにより、オーディオ信号及びタスク命令を含む目標命令を取得し、その後、目標命令をクライアントに送信し、クライアントは目標命令を解析することにより、タスク命令を実行してオーディオ信号を再生し、ユーザとの音声インタラクションを形成する。具体的には、対話管理システムは意図時間を受信した後、対話状態に応じて、音声合成技術により異なるオーディオ返信情報を返す。例えば、対話管理システムが{日付=20190305、時間帯=午後、時間=05:00、タスク対象=目覚まし}である意図時間を受信した場合、目覚ましを設定するタスク命令をクライアントに送信すると同時に、「5時の目覚ましが正常に設定されました」というテキスト応答を生成する。このテキスト応答は、音声合成技術によりオーディオ信号を合成してクライアントに送信される。目覚ましがすでに正常に設定されているため、対話管理システムは返信されデータに対話終了の状態も含む。
図2は、本発明の実施例に係る情報処理方法の時間推定を実現するフローチャートである。この方法は、情報制御センター装置に用いられる。
図2を参照すると、本発明の実施例において、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するステップ102は、指定時間に指定時刻が含まれているかどうかを判断して、第1の判断結果を取得するステップ1021と、第1の判断結果として指定時間に指定時刻が含まれている場合、指定時間に指定日付が含まれているかどうかを判断して、第2の判断結果を取得するステップ1022と、第2の判断結果として指定時間に指定日付が含まれている場合、指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得するステップ1023と、第3の判断結果として指定日付が現在日付より遅い場合、指定時刻と指定日付を意図時間として確定するステップ1024と、を含む。
セマンティック解析により得られた指定時間には、以下の二つの状況が含まれる可能性がある。一つの状況は、解析情報に指定時間が存在する状況である。もう一つの状況は、解析情報に指定時間が存在しない状況である。解析情報に指定時間が存在しない場合、装置は、意図時間と指定タスクを有する目標命令を生成することができず、指定時間を取得するために、音声合成技術により複数ラウンドの対話インタラクションを行う必要がある。具体的には、解析情報に指定時間が存在しない場合には、情報制御センター装置は問い合わせ命令を生成してクライアントに送信することができる。問い合わせ命令は音声合成技術で生成され、クライアントを介して再生され、指定時間を問い合わせるために用いられる。例えば、「どれくらいの時間が経過した後にリマインドしてほしいですか?」、その後、再び音声信号を収集し、当該音声信号を音声識別及びセマンティック分析することにより、当該音声信号における補充時間を取得する。補充時間は、指定時間を補充するために用いられる。補充時間を指定時間として確定することができる。
例えば、音声信号が「目覚ましを設定する」である場合、セマンティック解析情報は{タスク対象=目覚まし、操作=設定}であり、指定時間が存在しない。対話管理システムは、「はい、目覚ましを何時に設定しますか?」というテキスト応答を生成し、音声合成技術によりテキストをオーディオに変換した後にクライアントに送信し、対話状態がまだ終了していない情報もクライアントに返信する。クライアントは、このオーディオを再生した後、マイクロフォンアレイを介してユーザの音声情報を収集して、目覚ましの指定時間を確定する。
さらに、解析情報に指定時間が存在する場合、指定時間に指定日付と指定時刻が含まれる可能性がある。セマンティック解析情報に指定時刻が存在しない場合、装置は指定タスクを実行する指定時間を確定できない。上記の状況を区別するために、指定時間に指定時刻が含まれているかどうかを判断する必要がある。第1の判断結果としてセマンティック解析情報に指定時刻が存在しない場合、指定時刻を含む指定時間を取得するために、装置は音声合成技術により複数ラウンドの対話インタラクションを行う必要がある。
第1の判断結果としてセマンティック解析情報に指定時刻が存在する場合、指定時間に指定日付が含まれているかどうかをさらに判断して、第2の判断結果を取得する。一つの状況は、第2の判断結果として指定時間に指定日付が含まれていることである。もう一つの状況は、指定時間に指定日付が含まれていないことである。指定時間に指定日付が含まれている状況である場合、指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得する必要がある。第3の判断結果として指定日付が現在日付より遅い場合には、指定時刻と指定日付を意図時間として確定する。
第3の判断結果として指定日付が現在日付より遅くなく、且つ指定日付が現在日付より早い場合、指定時間は現在日付より早く、装置は過去の時間に指定タスクの実行を指示することができないため、当該セマンティック解析情報が無効であると判定するか、又は、音声合成技術により音声を生成し、複数ラウンドの対話インタラクションを行うことにより、指定時間を再度取得することができる。第3の判断結果として指定日付が現在日付より遅くなく、且つ指定日付と現在日付が同日である場合、指定時刻をさらに比較して推定する必要がある。ステップ10211に示すように、第3の判断結果として現在日付より遅くなく且つ現在日付と同じである場合、指定日付を暫定日付として確定する。
本発明の実施例において、方法には、第2の判断結果として指定時間に指定日付が含まれていない場合、現在日付を暫定日付として確定するステップ1025と、暫定日付と指定時刻を暫定時間として確定するステップ1026と、暫定時間が現在時間より早くないか否かを判断して、第4の判断結果を取得するステップ1027と、第4の判断結果として暫定時間が現在時間より早くない場合、暫定時間を意図時間として確定するステップ1028と、がさらに含まれる。
現在日付を指定日付として確定した後、ここでの指定日付は、上記第3の判断結果により判断された指定日付及び現在日付と同じである。この場合、指定日付は同じであり、即ち、いずれも指定日付と現在日付とが同日である。以下、同様の方法で比較判断することができる。即ち、指定日付と現在日付とが同日である場合、現在日付を暫定日付として確定し、暫定日付と指定時刻を暫定時間として確定し、暫定時間が現在時間より早くないかどうかを判断して、第4の判断結果を取得する。第4の判断結果に基づいて意図時間を確定する。第4の判断結果として暫定時間が現在時間より早くない場合、即ち、装置は、暫定時間の目標命令に対応して、指定タスクを暫定時間に実行するように指示することができ、即ち、暫定時間を意図時間として確定することができる。特別な場合、暫定時間は現在時間と同じであり、この時、同様に目標命令を生成して、意図時間に指定タスクを実行するように指示することができる。即ち、この時、意図時間は現在時間と同じである。
本発明の実施例において、方法には、第4の判断結果として暫定時間が現在時刻より早い場合、時間近接原則に基づいて暫定時間を訂正して、訂正時間を取得するステップ1029と、訂正時間を意図時間として確定するステップ10210と、がさらに含まれる。
第4の判断結果として暫定時間が現在時刻より早い場合、依然として暫定時間を意図時間として確定すると、意図時間が現在時間より早くて時間規則に適合せず、装置は、意図時間に指定タスクを実行するようにクライアントに指示することができなくなる。従って、装置は暫定時間を訂正する必要があり、訂正時間が現在時間より早くならないようにし、さらに装置は、意図時間に指定タスクを実行するようにクライアントに指示することができる。時間近接原則とは、意図時間を現在時間に最も近く且つ指定時間の記述を満たす未来時刻として確定するために用いられるものである。
図3は、本発明の実施例に係る情報処理方法の時刻変換実現のフローチャートである。この方法は、情報制御センター装置に用いられる。
図3を参照すると、本発明の実施例において、方法には、指定時刻に指定時間帯が含まれているかどうかを判断して、第5の判断結果を取得するステップ301と、第5の判断結果として指定時刻に指定時間帯が含まれている場合、時刻変換規則に基づいて指定時刻に対してタイプ変換を行い、変換時刻を取得するステップ302と、変換時刻が暫定時間を確定するために用いられ、変換時刻に指定時間帯が含まれておらず、変換時刻と指定時刻が同一時間を表すために用いられるようにするステップ303と、がさらに含まれる。
音声信号から取得された指定時刻には24時間制と12時間制の二種類があり、時間帯に対する理解方法は人によって異なるため、例えば、夜の0:00をある人は翌日の0:00に表示し、ある人は24:00に表示する可能性があり、12:30をある人は00:30に表示する可能性がある。暫定時間の比較を容易にするために、指定時刻を24時間制に変換する必要がある。同様に、取得した現在時刻も24時間制である。このステップは、指定時刻が現在時刻よりも早くないか否かを判断するいずれかの先行ステップの際に行うことができる。さらに、現在時刻は、情報制御センター装置がクライアントから収集した現在時刻であってもよく、情報制御センター装置がネットワークから収集したタイムゾーン標準時間であってもよい。
具体的に、12時間制の表現には「午前7:00」のように通常時間帯と時間が含まれており、ここで、指定時間帯は、「午前」、「午後」などのような時間帯表現を行うための単語を指す。指定時刻を取得した後、指定時刻に指定時間帯が含まれるか否かを判断する。指定時間帯が含まれている場合、指定時刻が12時間制を採用するとみなされ、24時間制表現の指定時刻を取得するために、指定時刻を変換する必要がある。
変換規則には、指定時刻を24時間化するための第1の変換規則と、言い間違いを訂正するための第2の変換規則と、日付臨界点を処理するための第3の変換規則と、が含まれる。比較の便宜上、24時間制変換を行った後、依然として時間帯情報を保持し、時間帯情報は時間情報に基づいて調整される。
ここで、指定時刻を24時間化するための第1の変換規則は、以下のとおりであってもよい。
1、指定時間が1:00から12:00の間であり、指定時間帯が正午、午後、または夜およびそれらの同義語である場合、指定時間に12時間を加算して、24時間制の変換時刻を得る。例えば、「午後7:00」は「午後19:00」に変換される。
2、指定時間が1:00から日の出時間までの間(例えば6:00)であり、指定時間帯が昼間及びその同義語である場合、指定時間に12時間を加算して、24時間制の変換時刻を得る。日の出時間は、地域に応じて動的に調整できる。例えば、「昼間3:00」は「午後15:00」に変換される。
3、指定時間が日没時間から12:00までの間であり、指定時間帯が夜及びその同義語である場合、指定時間に12時間を加算して、24時間制の変換時刻を得る必要がある。日没時刻は、地域に応じて動的に調整できる。例えば、「夜10:00」は「夜22:00」に変換される。
言い間違いを訂正するための第2の変換規則は、以下のとおりであってもよい。
1、指定時間が0:00から日の出時間までの間であり、指定時間帯が夜及びその同義語である場合、指定時間帯を早朝にリセットし、指定時間を変換時間として確定し、異常フラグを設定する。その後、時間近接原則により再確定される。例えば、「夜、1:00」は「早朝、1:00、異常」に変換される。
2、指定時間が12:00より大きく、指定時間帯が朝、午前、または早朝とその同義語である場合、指定時間帯をリセットする必要がある。指定時間を変換時間として確定し、異常フラグを設定することで、言い間違いや誤識別による影響を避ける。例えば: 「午前、15:00」は「午後、15:00、異常」に変換される。
時刻臨界点を処理するための第3の変換規則は、以下のとおりであってもよい。
1、指定時間が24:00に等しい場合、指定時間を0:00に設定し、指定時間帯を早朝にリセットし、異常フラグを設定する必要がある。例えば、「24:00」は「早朝、0:00、異常」に変換される。
2、指定時間が12:00に等しく、指定時間帯が夜又は早朝及びその同義語である場合、指定時間を0:00に設定し、指定時間帯を早朝にリセットし、異常フラグを設定する必要がある。例えば、「夜、12:00」は「早朝、0:00、異常」に変換される。
実施例において、時間近接原則には、暫定時刻を訂正するための第1の原則と、暫定日付を訂正するための第2の原則と、暫定時間を訂正するための第3の原則と、の少なくとも一つが含まれる。暫定時間には、暫定時刻、暫定日付及び暫定時の三つの部分が含まれる。暫定時間を訂正して得られる訂正時間には、訂正時刻、訂正日付、訂正時の三つの部分が同様に含まれる。
暫定時刻を訂正するための第1の原則は、以下のとおりであってもよい。
1、暫定時に暫定時間帯が含まれておらず、暫定時が12:00より小さい場合、暫定時に12時間を加算して、プリセット時間を得る。プリセット時間が現在時間より早くないか否かを判断し、プリセット時間が現在時間より早くない場合、プリセット時間を訂正時間として確定する。プリセット時間が現在時間より早い場合、暫定時間の訂正をキャンセルする。
暫定日付を訂正するための第2の原則は、以下のとおりであってもよい。
1、暫定時間に異常フラグが有り、暫定時が6:00以下の場合、現在日付の翌日を訂正日付として確定する。
2、暫定時に暫定時間帯が含まれておらず、暫定時が12:00より小さい場合、現在日付の翌日を訂正日付として確定する。
3、暫定時が12:00から24:00の間であり、対応する音声信号に指定日付が含まれていない場合、現在日付の翌日を訂正日付として確定する。
4、暫定時間帯と暫定時の両方が明確であり、対応する音声信号に指定日付が含まれていない場合、現在日付の翌日を訂正日付として確定する。
5、暫定日付が現在日付よりも遅くて、異常フラグがある場合、現在日付の翌日を訂正日付として確定する。
暫定時間を訂正するための第3の原則は、以下のとおりであってもよい。
1、暫定時が12:00であり、暫定時間が現在時間より早い場合、暫定時を0:00に訂正し、0:00を訂正時として確定し、現在日付の翌日を訂正日付として確定する。
暫定時が既に24時間制である場合、暫定時間が依然として現在時間より小さいと、暫定日付をさらに訂正する必要があることを示す。現在時間が「夜の7時」である場合、収集された音声信号は「午後5時の目覚まし」である。変換によって時間「午後5時」を「17:00」に変換したとしても、依然として時間近接原則に従って暫定日付に対して+1日の操作を行う必要がある。
図4は、本発明の実施例に係る情報処理方法の時間規則検証のフローチャートである。
図4を参照すると、当該実施例において、指定時間に指定時刻が含まれているか否かを判断する前に、方法には、セマンティック解析情報に基づいて指定時間を取得するステップ401と、指定時間が時間規則に合致するか否かを検証して、検証結果を取得するステップ402と、検証の結果として指定時間が時間規則に合致すると検証された場合、指定時間に指定時刻が含まれているか否かを判断するステップ403と、がさらに含まれる。
不合理な時間に対してヒントを与えるために、例えば「2月35日46時の目覚まし」には、存在しない指定日付と指定時刻が含まれている場合、指定時間に指定時刻が含まれているか否かを検証する前に、本方法は、指定時間に対して時間規則に合致するか否かの検証を行うステップをさらに含む。指定時間のフォーマット内容が合理的であるか否かを検証し、指定時間のフォーマット内容が合理的であると判断された場合、指定時間に指定時刻が含まれているか否かを判断する。指定時間に指定日付及び/又は指定時刻が存在しない場合、指定時間のフォーマット内容が合理的であると判断される。指定時間のフォーマット内容が合理的ではないと判断された場合、対話管理システムによりオーディオ信号を合成し、クライアントを介して問い合わせを行うことで、合理的な指定時間を得る。
さらに、クライアントが目覚ましである場合、目覚ましの機能に応じて、セマンティック解析情報に含まれる指定タスクは目標命令を生成するために用いられ、指定タスクのタイプには、アラームタスクを表すための第1のタイプと、リマインダタスクを表すための第2のタイプと、メモタスクを表す第3のタイプと、タイミングタスクを表すための第4のタイプと、の少なくとも一つが含まれる。目覚ましの機能に応じて、指定タスクには以上の4種類が含まれるがこれらに限定されず、さらに、削除を表すために用いられる第5のタイプ等であってもよく、以下では説明を省略する。
以下、いくつかの具体的なシーンを提供して説明する。
音声信号「5時の目覚ましを設定する」を収集すると、情報制御センター装置は時間推定を行う。現在時間が午後5時以降である場合、翌日朝5時の目覚ましに対応する目標命令を生成する。現在時間が午後5時以前である場合、その日の午後5時の目覚ましに対応する目標命令を生成する。
アラームタスクを表すための第1のタイプのタスクについて、ユーザが複数のタスクを設定することをさらに容易にするために、情報制御センター装置はセマンティック解析により、指定タスクを通常の単一タスク又は周期型タスクとして確定する。タスクは目覚ましを指すことができる。周期型タスクは、曜日に応じて繰り返し鳴動することが考えられる。例えば、ユーザが「毎週月曜日から水曜日までの午前8時に起こしてください」」と発話すると、装置は繰り返し周期型の目覚まし設定命令{TIME=08:00、REPEAT=W1|W2|W3、対象=目覚まし}を生成する。他の周期型タスクは、日付に応じて繰り返し応答することであってもよい。ユーザが「8月1日から10日まで毎日朝8時に起こしてください」と発話すると、装置は対応する目覚まし設定命令{TIME=08:00、REPEAT=20190801<20190810、対象=目覚まし}を生成する。
メモタスクを表すための第3のタイプのタスクについて、ユーザが「メモを設定する」と発話すると、装置はユーザに「メモの内容を教えてください」と提示し、続いてユーザはメモの内容を装置又はクライアントに記録することができる。
タイミングタスクを表すための第4のタイプのタスクについて、例えば、指定タスクが「カウントダウンで年越し時間を設定する」である場合、収集される音声信号は「0時のカウントダウン」であり、又は「新年のカウントダウンを設定する」と発話した場合、0時又は新年に対する目標命令を生成することができる。
リマインダタスクと目覚ましタスクの違いは、セマンティック解析情報にリマインダ事件や明らかなリマインダキーワードが含まれているか否かで判断される。例えば、「5時に呼んでください」のセマンティック解析結果は{時間=05:00、対象=目覚まし}であり、「5時に会議のリマインドをしてください」のセマンティック解析結果は{時間=05:00、対象=日程、事項=会議}である。解析対象に対する区別により、情報制御センター装置は、目覚まし、リマインド、メモ、カウントダウンの4種類の時間に関連する機能に係るセマンティックスロットを同時に理解し、対話状態とポリシーに基づいて異なる対話状態と返信テキストを返すことができる。
設定された目覚ましとリマインド、特に周期型の目覚ましは、いくつかのシーンにおいてユーザが特定の目覚ましを削除できる必要がある。このような操作は、同様に音声によって操作することができる。例えば、目覚ましの削除、リマインドの削除、メモの削除、カウントダウンのキャンセルなどである。削除の操作は、特定の目覚ましの条件付き削除をサポートできる。もともと明日と明後日の目覚ましが3つずつ設定されている場合、ユーザは以下のような発話で削除することができる。「明日の目覚ましを削除する」を音声入力すると、対応するセマンティックは{操作=削除、日付=20190817}である。又は、「明日の朝の目覚ましを削除する」を音声入力すると、対応するセマンティックは{操作=削除、日付=20190817、時間=06:00<12:00}である。また、「明日の朝8時から10時の間の目覚ましを削除する」を音声入力すると、対応するセマンティックは{操作=削除、日付=20190817、時間=08:00<10:00}である。目覚まし又は他のタスクの区別を容易にするために、タスクを設定する時に、タスクに対して特定IDの命名を行って記憶する。
装置はこれらの音声を受信すると、クラウドに記録されている目覚まし記録を照会することにより、目覚ましID付きの目標命令を装置側に返信し、クライアントにより目覚ましを削除する。これにより、クライアントがユーザの発話に対して目覚ましを照会、フィルタリング、および削除するプロセスを効果的に回避することができる。
図5は、本発明の実施例に係る情報処理方法を適用するシーンの概略図である。図6は、本発明の実施例に係る情報処理方法を適用するシーンにおける時間推定のフローチャートである。
図5及び図6を参照すると、実施例の理解を容易にするために、一つの全体的なフローシーンで説明する。
このシーンには、クライアント501と、情報制御センター装置502とが含まれ、クライアント501と情報制御センター装置502とは通信可能に接続されている。クライアント501には、マイクロフォンアレイ5011と、指定タスクを実行するための実行モジュール5012とが設けられている。情報制御センター装置502には、自動音声識別(Automatic Speech Recognition、ASR)モジュール5021と、自然言語理解(Natural Language Understanding、NLU)モジュール5022と、対話管理(Dialog Management、DM)モジュール5023と、テキスト読み上げ(Text To Speech、TTS)モジュール5024と、が含まれる。NLUモジュールは、セマンティック解析を行うために用いられる。DMモジュールには、時間推定サブモジュール50231がさらに含まれる。
クライアントは、マイクロフォンアレイにより音声信号を収集し、音声信号を情報制御センター装置に送信する。情報制御センター装置は、ASRモジュールにより音声信号に対して音声識別を行い、テキスト情報を取得し、さらにテキスト情報結果をNLUモジュールでセマンティック解析し、対応する音声信号のセマンティック解析情報を取得する。音声解析情報を時間推定サブモジュールにより推定する。
まず、セマンティック解析情報から指定日付と指定時刻とを含む指定時間を取得する。次に、指定日付と指定時刻が時間規則に合致するか否かを検証する。時間規則に合致しない場合、DMモジュールにより複数ラウンドの対話を行い、規則に合致する指定時間をさらに取得する。時間規則に合致する場合、セマンティック解析情報に指定時刻が含まれているか否かを判断する。セマンティック解析情報に指定時刻が含まれていないと判断された場合、DMモジュールにより複数ラウンドの対話を行って指定時刻をさらに取得する。セマンティック解析情報に指定時刻が含まれていると判断された場合、セマンティック解析情報に指定日付が含まれているか否かを判断し、指定日付が含まれていないと判断された場合、暫定日付を現在日付に設定する。指定日付が含まれている場合、指定日付が現在日付より早いか否かを判断し、指定日付が現在日付より早いと判断された場合、時間推定を終了し、その結果をクライアントに返信し、DMモジュールによりオーディオ信号を生成して音声再生をする。指定日付が現在日付より早くないと判断された場合、指定日付が現在日付より遅いか否かを判断し、指定日付が現在日付より遅いと判断された場合、指定日付をマークし、当該日付が未来日付であることを明記する。指定日付が現在日付より遅くないと判断された場合、マークしない。そして、指定時刻に指定時間帯と指定時間が含まれているか否かを判断する。指定時刻に指定時間帯と指定時間が含まれていると判断された場合、指定時刻を変換して変換時刻を得る。指定日付と変換時刻を暫定時間として確定する。指定時刻に指定時間帯が含まれていないと判断された場合、指定日付と指定時刻を暫定時間として確定する。暫定時間が現在時間より早いか否かを判断する。暫定時間が現在時間より早いと判断された場合、時間近接原則に基づいて暫定日付を訂正し、意図時間を取得する。そして、意図時間の意図時刻に基づいて意図時間帯を生成し、意図日付、意図時間帯、意図時を含む意図時間を対話管理システムで変換し、オーディオ信号や指定タスクを含む目標命令を取得する。目標命令をクライアントに送信する。クライアントは実行モジュールにより指定タスクを実行し、対応するオーディオ信号のオーディオを再生する。
図7は、本発明の実施例に係る情報制御センター装置を実現するモジュールの概略図である。
当該実施例によって提供される情報制御センター装置は、対応する音声信号の、指定時間が含まれるセマンティック解析情報を取得するための取得モジュール701と、現在時間に基づいて指定時間に対して時間推定を行い、意図時間を確定するための推定モジュール702と、意図時間に基づいて対応する音声信号の目標命令を生成するための生成モジュール703と、を含む。
本発明の実施例において、推定モジュール702には、指定時間に指定時刻が含まれているかどうかを判断して、第1の判断結果を取得するための第1の判断サブモジュール7021と、第1の判断結果として指定時間に指定時刻が含まれていると判断された場合、指定時間に指定日付が含まれているかどうかを判断して、第2の判断結果を取得するための第2の判断サブモジュール7022と、第2の判断結果として指定時間に指定日付が含まれていると判断された場合、指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得するための第3の判断サブモジュール7023と、第3の判断結果として指定日付が現在日付より遅いと判断された場合、指定時刻と指定日付を意図時間として確定するための確定サブモジュール7024と、が含まれる。
本発明の実施例において、確定サブモジュール7024はさらに、第2の判断結果として指定時間に指定日付が含まれていないと判断された場合、現在日付を暫定日付として確定するために用いられる。確定サブモジュール7024はさらに、暫定日付と指定時刻を暫定時間として確定するために用いられる。推定モジュール702には、暫定時間が現在時間より早くないか否かを判断して、第4の判断結果を取得するための第4の判断サブモジュール7025が含まれる。確定サブモジュール7024はさらに、第4の判断結果として暫定時間が現在時刻より早くないと判断された場合、暫定時間を意図時間として確定するために用いられる。
本発明の実施例において、推定モジュール702には、第4の判断結果として暫定時間が現在時刻より早いと判断された場合、時間近接原則に基づいて暫定時間を訂正し、訂正時間を取得するための訂正サブモジュール7026がさらに含まれる。確定サブモジュール7024はさらに、訂正時間を意図時間として確定するために用いられる。
本発明の実施例において、推定モジュール702には、指定時刻に指定時間帯が含まれているか否かを判断して、第5の判断結果を取得するための第5の判断サブモジュール7027と、第5の判断結果として指定時刻に指定時間帯が含まれていると判断された場合、時刻変換規則に基づいて指定時刻に対してタイプ変換を行い、変換時刻を取得するための変換サブモジュール7028と、がさらに含まれている。変換時刻が暫定時間を確定するために用いられ、変換時刻に指定時間帯が含まれておらず、変換時刻と指定時刻が同一時間を表すために用いられる。
本発明の実施例において、取得モジュール701はさらに、セマンティック解析情報に基づいて指定時間を取得するために用いられる。装置には、指定時間が時間規則に合致するか否かを検証して、検証結果を取得するための検証モジュール704がさらに含まれる。検証の結果として指定時間が時間規則に合致すると検証された場合、指定時間に指定時刻が含まれているか否かを判断する。
本発明の別の態様は、コンピュータによって実行可能な命令が記憶されており、この命令が実行されると、上記のいずれかの情報処理方法が実行できるよう構成されることを特徴とするコンピュータ読み取り可能な記録媒体を提供する。
本明細書の記載において、「一実施例」、「いくつかの実施例」、「例」、「具体的な例」、または「いくつかの例」などの参照用語に関する記載は、その実施例または例に関連して記載された具体的な特徴、構造、材料または特性が、本発明の少なくとも1つの実施例または例に含まれることを意味する。そして、記載された具体的な特徴、構造、材料、または特性は、いずれかの1つまたは複数の実施例または例において、適切な方法で組み合わせることができる。また、互いに矛盾しない限り、当業者は本明細書に記載された異なる実施例又は例、及び異なる実施例又は例の特徴を結合および組み合わせることができる。
また、「第1の」、「第2の」という用語は、説明の目的に使用されるだけであり、相対的な重要性を示したり示唆したり、または示された技術特徴の数を暗黙的に示したりするものとして理解されるべきではない。これにより、「第1の」、「第2の」と限定された特徴は、少なくとも一つの当該特徴を明示的又は暗黙的に含むことができる。本発明の説明において、「複数」は、特に明確的且つ具体的に限定されない限り、2つ又は2つ以上を意味する。
以上は、本発明の具体的な実施形態に過ぎず、本発明の範囲に対する限定ではない。上記の開示内容に基づいて当業者が容易に想到できる変更又は置換は、いずれも特許請求の範囲に限定された本発明の保護範囲に属するべきである。

Claims (10)

  1. 目覚ましに用いられる情報処理方法であって、
    前記方法はクラウドサーバに適用され、前記目覚ましは前記クラウドサーバに通信可能に接続されており、
    目覚ましによって収集された音声信号を受信するステップと、
    前記音声信号に対して音声識別及びセマンティック解析を行い、前記音声信号に対応するセマンティック解析情報を取得し、前記セマンティック解析情報に基づいて指定時間を取得するステップと、
    前記指定時間が時間規則に合致するか否かを検証して、検証結果を取得するステップと、
    前記検証の結果として前記指定時間が時間規則に合致しないと検証された場合、音声合成技術により複数ラウンドの対話インタラクションを行い、時間規則に合致する指定時間を取得するステップと、
    現在時間に基づいて前記指定時間に対して時間推定を行い、意図時間を確定するステップと、
    前記意図時間に基づいて対応する音声信号の目標命令を生成するステップと、
    目標命令を前記目覚ましに送信し、前記目覚ましに対応する指定タスクを実行させるステップと、
    を含み、
    前記時間規則は現実に存在する日付と時刻を指示するために用いられ、
    前記指定タスクは、前記音声信号における対応する目標意図であり、前記意図時間は、前記音声信号における前記目標意図の実行に対応する実行時間である、
    ことを特徴とする情報処理方法。
  2. 現在時間に基づいて前記指定時間に対して時間推定を行い、意図時間を確定するステップにおいては、
    前記指定時間に指定時刻が含まれているかどうかを判断して、第1の判断結果を取得し、
    前記第1の判断結果として前記指定時間に指定時刻が含まれている場合、前記指定時間に指定日付が含まれているかどうかを判断して、第2の判断結果を取得し、
    前記第2の判断結果として前記指定時間に指定日付が含まれている場合、前記指定日付が現在日付より遅いか否かを判断して、第3の判断結果を取得し、
    前記第3の判断結果として前記指定日付が現在日付より遅い場合、前記指定時刻と前記指定日付を意図時間として確定する、
    ことを特徴とする請求項1に記載の情報処理方法。
  3. 前記第2の判断結果として前記指定時間に指定日付が含まれていない場合、前記現在日付を暫定日付として確定するステップと、
    前記暫定日付と前記指定時刻を暫定時間として確定するステップと、
    前記暫定時間が現在時間より早くないか否かを判断して、第4の判断結果を取得するステップと、
    前記第4の判断結果として前記暫定時間が現在時間より早くない場合、前記暫定時間を意図時間として確定するステップと、
    をさらに含むことを特徴とする請求項2に記載の情報処理方法。
  4. 前記第4の判断結果として前記暫定時間が現在時刻より早い場合、時間近接原則に基づいて前記暫定時間を訂正して、訂正時間を取得するステップと、
    前記訂正時間を意図時間として確定するステップと、
    をさらに含むことを特徴とする請求項3に記載の情報処理方法。
  5. 前記時間近接原則には、暫定時刻を訂正するための第1の原則と、暫定日付を訂正するための第2の原則と、暫定時間を訂正するための第3の原則と、の少なくとも一つが含まれることを特徴とする請求項4に記載の情報処理方法。
  6. 前記指定時刻に指定時間帯が含まれているか否かを判断して、第5の判断結果を取得するステップと、
    前記第5の判断結果として前記指定時刻に指定時間帯が含まれている場合、時刻変換規則に基づいて前記指定時刻に対してタイプ変換を行い、変換時刻を取得するステップと、
    前記変換時刻が前記暫定時間を確定するために用いられ、前記変換時刻に指定時間帯が含まれておらず、前記変換時刻と前記指定時刻が同一時間を表すために用いられるようにするステップと、
    をさらに含むことを特徴とする請求項4に記載の情報処理方法。
  7. 前記時刻変換規則には、時刻タイプを変換するための第1の変換規則と、言い間違いを訂正するための第2の変換規則と、時刻臨界点を処理するための第3の変換規則と、の少なくとも1つが含まれることを特徴とする請求項6に記載の情報処理方法。
  8. 前記指定時間に指定時刻が含まれているか否かを判断する前に得られた前記検証の結果として前記指定時間が時間規則に合致する場合、前記指定時間に指定時刻が含まれているか否かを判断することを特徴とする請求項2に記載の情報処理方法。
  9. 目覚ましと通信可能に接続されるクラウドサーバであって、
    目覚ましによって収集された音声信号を受信し、前記音声信号に対して音声識別及びセマンティック解析を行い、前記音声信号に対応するセマンティック解析情報を取得し、前記セマンティック解析情報に基づいて指定時間を取得するための取得モジュールと、
    前記指定時間が時間規則に合致するか否かを検証して、検証結果を取得し、前記検証の結果として前記指定時間が時間規則に合致しないと検証された場合、音声合成技術により複数ラウンドの対話インタラクションを行い、時間規則に合致する指定時間を取得するための検証モジュールと、
    現在時間に基づいて前記指定時間に対して時間推定を行い、意図時間を確定するための推定モジュールと、
    前記意図時間に基づいて対応する音声信号の目標命令を生成し、目標命令を前記目覚ましに送信し、前記目覚ましに対応する指定タスクを実行させるための生成モジュールと、
    を含み、
    前記時間規則は現実に存在する日付と時刻を指示するために用いられ、
    前記指定タスクは、前記音声信号における対応する目標意図であり、前記意図時間は、前記音声信号における前記目標意図の実行に対応する実行時間である、
    ことを特徴とするクラウドサーバ。
  10. コンピュータによって実行可能な命令が記憶されており、
    前記命令が実行されると、請求項1~8のいずれか1項に記載の目覚ましに用いられる情報処理方法が実行できるように構成されることを特徴とするコンピュータ読み取り可能な記録媒体。
JP2022540600A 2019-12-30 2020-11-09 情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体 Active JP7502449B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911396185.1A CN111192579B (zh) 2019-12-30 2019-12-30 信息处理方法、信息控制中心设备及计算机可读存储介质
CN201911396185.1 2019-12-30
PCT/CN2020/127639 WO2021135652A1 (zh) 2019-12-30 2020-11-09 信息处理方法、信息控制中心设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2023509651A JP2023509651A (ja) 2023-03-09
JP7502449B2 true JP7502449B2 (ja) 2024-06-18

Family

ID=70707791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022540600A Active JP7502449B2 (ja) 2019-12-30 2020-11-09 情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体

Country Status (5)

Country Link
US (1) US20230032792A1 (ja)
EP (1) EP4086895A4 (ja)
JP (1) JP7502449B2 (ja)
CN (1) CN111192579B (ja)
WO (1) WO2021135652A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192579B (zh) * 2019-12-30 2022-09-23 思必驰科技股份有限公司 信息处理方法、信息控制中心设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194386A (ja) 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2006292633A (ja) 2005-04-13 2006-10-26 Nec Corp 時刻表記変換方法、制御方法、電子機器、プログラム、及び記録媒体
WO2014176750A1 (en) 2013-04-28 2014-11-06 Tencent Technology (Shenzhen) Company Limited Reminder setting method, apparatus and system
CN106020953A (zh) 2016-05-12 2016-10-12 青岛海信移动通信技术股份有限公司 一种在电子日历中建立日程的方法和装置
WO2019167373A1 (ja) 2018-02-27 2019-09-06 株式会社Nttドコモ 機能実行指示システム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6315190A (ja) * 1986-07-08 1988-01-22 Citizen Watch Co Ltd 音声入力電子時計
JP2007133033A (ja) * 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
US20100318398A1 (en) * 2009-06-15 2010-12-16 Xerox Corporation Natural language interface for collaborative event scheduling
CN103440866B (zh) * 2013-07-30 2016-03-09 广东明创软件科技有限公司 根据通话信息执行任务的方法及移动终端
US9747280B1 (en) * 2013-08-21 2017-08-29 Intelligent Language, LLC Date and time processing
US10832005B1 (en) * 2013-11-21 2020-11-10 Soundhound, Inc. Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences
US10261752B2 (en) * 2016-08-02 2019-04-16 Google Llc Component libraries for voice interaction services
CN106941619A (zh) * 2017-03-16 2017-07-11 百度在线网络技术(北京)有限公司 基于人工智能的节目提醒方法、装置以及***
CN107465599A (zh) * 2017-08-15 2017-12-12 竞技世界(北京)网络技术有限公司 一种即时通讯中的日程设置方法及装置
US10956680B1 (en) * 2018-10-01 2021-03-23 Knexus Research Corporation System and method for temporal expressions processing
CN111192579B (zh) * 2019-12-30 2022-09-23 思必驰科技股份有限公司 信息处理方法、信息控制中心设备及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194386A (ja) 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2006292633A (ja) 2005-04-13 2006-10-26 Nec Corp 時刻表記変換方法、制御方法、電子機器、プログラム、及び記録媒体
WO2014176750A1 (en) 2013-04-28 2014-11-06 Tencent Technology (Shenzhen) Company Limited Reminder setting method, apparatus and system
CN106020953A (zh) 2016-05-12 2016-10-12 青岛海信移动通信技术股份有限公司 一种在电子日历中建立日程的方法和装置
WO2019167373A1 (ja) 2018-02-27 2019-09-06 株式会社Nttドコモ 機能実行指示システム

Also Published As

Publication number Publication date
CN111192579A (zh) 2020-05-22
CN111192579B (zh) 2022-09-23
US20230032792A1 (en) 2023-02-02
WO2021135652A1 (zh) 2021-07-08
EP4086895A1 (en) 2022-11-09
JP2023509651A (ja) 2023-03-09
EP4086895A4 (en) 2023-06-14

Similar Documents

Publication Publication Date Title
US11100384B2 (en) Intelligent device user interactions
CN1938757B (zh) 用于驱动多个应用的方法和对话管理***
US20180232662A1 (en) Parsers for deriving user intents
US7966171B2 (en) System and method for increasing accuracy of searches based on communities of interest
US20210056950A1 (en) Presenting electronic communications in narrative form
JPWO2019087811A1 (ja) 情報処理装置、及び情報処理方法
US11250836B2 (en) Text-to-speech audio segment retrieval
US10891959B1 (en) Voice message capturing system
JP5753212B2 (ja) 音声認識システム、サーバ、および音声処理装置
WO2019031268A1 (ja) 情報処理装置、及び情報処理方法
JP7502449B2 (ja) 情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体
CN111402888B (zh) 语音处理方法、装置、设备及存储介质
CN111081254A (zh) 一种语音识别方法和装置
WO2019221894A1 (en) Intelligent device user interactions
US11347379B1 (en) Captions for audio content
US11990115B2 (en) Road map for audio presentation of communications
WO2019244455A1 (ja) 情報処理装置及び情報処理方法
US11853650B2 (en) Audio presentation of conversation threads
CN116016779A (zh) 语音通话翻译辅助方法、***、计算机设备和存储介质
US8219402B2 (en) Asynchronous receipt of information from a user
JP2019109780A (ja) 情報提供装置、情報提供方法、および情報提供プログラム
CN112802474A (zh) 语音识别方法、装置、设备及存储介质
US11463507B1 (en) Systems for generating captions for audio content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240606

R150 Certificate of patent or registration of utility model

Ref document number: 7502449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150