JP2023527100A

JP2023527100A - イベント検出方法、装置、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム

Info

Publication number: JP2023527100A
Application number: JP2022543087A
Authority: JP
Inventors: ジャン、ビン; ワン、ユンハオ; シン、イン; フェン、ユアン; ワン、シャオディ; ロン、シャン; ジア、ジュアン; ペン、ヤン; ジェン、ホンフイ; グ、イ; リ、チャオ; ハン、シュミン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-04-28
Filing date: 2022-01-29
Publication date: 2023-06-27
Also published as: KR20220149508A; CN113205037A; WO2022227764A1; CN113205037B

Abstract

本開示は、人工知能技術の分野に関し、具体的には、コンピュータビジョンとディープラーニング技術の分野に関し、スマートシティシーンに適用できるイベント検出方法を開示する。イベント検出方法は、画像データを取得し、前記画像データの都市シーンを認識するステップと、前記都市シーンに対応する検出対象ターゲットと検出対象イベントを決定するステップと、前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するステップと、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得するステップと、を含む。本開示は、イベント検出の精度及び効率を向上させることができる。

Description

本開示は、出願日が２０２１年０４月２８日であり、出願番号が２０２１１０４６６７８１．３であり、発明の名称が「イベント検出方法、装置、電子機器、及び読み取り可能な記憶媒体」である中国特許出願の優先権を主張する。
本開示は、人工知能技術の分野に関し、具体的には、コンピュータビジョン及びディープラーニング技術の分野に関し、スマートシティシーンに適用できる。イベント検出方法、装置、電子機器、及び読み取り可能な記憶媒体を提供する。

現在、都市管理の計画構成に従って、都市の各位置に大量のビデオデバイスが取付けられて監視する。これらの大量のデータを使用することによって、都市管理の規範化、都市グリッドのインテリジェント化に対してすべて積極的な役割を果たす。しかしながら、従来技術では、監視ビデオストリームデータを用いてイベント検出を行う際、安定性が悪く、検出結果の精度が低いという技術的問題がある。

本開示は、イベント検出の精度及び効率を向上させるために用いられるイベント検出方法、装置、電子機器、及び読み取り可能な記憶媒体を提供する。

本開示の第１の態様によれば、イベント検出方法を提供し、画像データを取得し、前記画像データの都市シーンを認識するステップと、前記都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定するステップと、前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するステップと、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得するステップと、を含む。

本開示の第２の態様によれば、イベント検出装置を提供し、画像データを取得し、前記画像データの都市シーンを認識するための取得ユニットと、前記都市シーンに対応する検出対象ターゲットと検出対象イベントを決定するための決定ユニットと、前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するための検出ユニットと、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得するための処理ユニットと、を含む。

本開示の第３の態様によれば、電子機器を提供し、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる。

本開示の第４の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記の方法を実行させる。

本開示の第５の態様によれば、コンピュータプログラム製品を提供し、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行される際に上記の方法を実現する。

上記の技術案から分かるように、本開示は、まず、取得された画像データの都市シーンを認識し、次に、都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定し、最後に、画像データにおける検出対象ターゲットを検出して、取得された検出対象イベントの検出状態に基づいて画像データのイベント検出結果を取得し、異なる都市シーンを異なる検出対象ターゲットと検出対象イベントと対応するため、本開示は、イベント検出の精度及び効率を向上させることができる。

本明細書で説明された内容は、本開示の実施例のキー又は重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。

図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示の第１の実施例による概略図である。本開示の第２の実施例による概略図である。本開示の第３の実施例による概略図である。本開示の第４の実施例による概略図である。本開示の実施例のイベント検出方法を実現するための電子機器のブロック図である。

以下、図面に基づいて、本開示の例示的な実施例を説明する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

図１は本開示の第１の実施例による概略図である。図１に示すように、本実施例のイベント検出方法は、具体的には、以下のステップを含むことができ、
Ｓ１０１、画像データを取得し、前記画像データの都市シーンを認識し、
Ｓ１０２、前記都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定し、
Ｓ１０３、前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得し、
Ｓ１０４、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得する。

本実施例のイベント検出方法は、まず、取得された画像データの都市シーンを認識し、次に、都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定し、最後に、画像データにおける検出対象ターゲットを検出して、取得された検出対象イベントの検出状態に基づいて画像データのイベント検出結果を取得し、異なる都市シーンを異なる検出対象ターゲットと検出対象イベントと対応するため、本実施例は、イベント検出の精度及び効率を向上させることができる。

本実施例でＳ１０１を実行して取得された画像データは、都市のある監視区域の撮影装置によってリアルタイムに撮影されたビデオストリームデータから抽出して取得するものであってもよく、取得された画像データは、少なくとも１つの都市画像を含み、含まれる都市画像は、道路、広場、学校などの都市シーン内の少なくとも１つに対応することができる。

本実施例でＳ１０１を実行して画像データを取得する際、採用できる選択可能な実現方式は、都市のビデオストリームデータを取得し、異なるビデオストリームデータは、異なる都市シーンに対応し、取得されたビデオストリームデータから少なくとも１つのキーフレーム画像を画像データとして抽出する。

本実施例でＳ１０１を実行して画像データを取得した後、取得された画像データの都市シーンを認識する。通常の状況において、本実施例で認識された都市シーンは、道路、広場、学校などのうとの１つに過ぎないが、画像データを認識することによって複数の都市シーンを取得する場合がある。

本実施例でＳ１０１を実行して画像データの都市シーンを認識する際、採用できる選択可能な実現方式は、取得された画像データを第１の認識モデルに入力し、第１の認識モデルの出力結果に基づいて画像データの都市シーンを取得し、本実施例の第１の認識モデルは、予めトレーニングして取得しており、画像データに対応する都市シーンを認識することができる。

また、本実施例でＳ１０１を実行して画像データの都市シーンを認識する際、画像データと異なる基準画像との間の類似度を計算する方式によって、画像データと最も類似した基準画像に対応する都市シーンを、取得された画像データの都市シーンとすることもできる。

本実施例でＳ１０１を実行して取得された画像データの都市シーンを認識した後、Ｓ１０２を実行して認識された都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定する。その中、本実施例でＳ１０２を実行して決定された検出対象ターゲットは、１つであってもよく、複数であってもよい。決定された検出対象イベントは、１つであってもよく、複数であってもよい。

本実施例の異なる都市シーンは、異なる検出対象ターゲットと異なる検出対象イベントに対応し、都市シーンに対応する検出対象を区別する方式によって、画像データ内の特定の検出対象のみを検出する目的を実現し、検出の盲目性を効果的に回避し、イベント検出の効率を向上させることができる。

例えば、都市シーンが市場である場合、市場に対応する検出対象ターゲットは、人、ブース、テーブルと椅子、看板、ゴミ、及び水たまりなどを含むことができ、市場に対応する検出対象イベントは、規則違反経営イベント、及び水たまりイベントなどを含むことができ、都市シーンが道路である場合、道路に対応する検出対象ターゲットは、車両、オートバイ、人力車、道路標識、緑地、及び水たまりなどを含むことができ、道路に対応する検出対象イベントは、違法駐車イベント、道路占有イベント、及び水たまりイベントなどを含むことができる。

本実施例でＳ１０２を実行して都市シーンに対応する検出対象ターゲットと検出対象イベントを決定する際、予め設定された対応関係に基づいて決定することができ、当該予め設定された対応関係は、各都市シーン、及び各都市シーンに対応する検出対象ターゲットと検出対象イベントとを含む。

本実施例でＳ１０２を実行して都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定した後、Ｓ１０３を実行して画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する。その中、本実施例Ｓ１０３を実行して取得された検出対象イベントの検出状態は、正常状態及び異常状態のうちの１つである。

理解できることは、本実施例でＳ１０２を実行して複数の検出対象イベントを決定した場合、本実施例Ｓ１０３を実行して各検出対象イベントに対応する検出状態をそれぞれ取得することができる。

具体的には、本実施例でＳ１０３を実行して画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する際、採用できる選択可能な実現方式は、取得された画像データと決定された検出対象ターゲットを第２の認識モデルに入力し、第２の認識モデルの出力結果に基づいて検出対象イベントの検出状態を取得し、本実施例の第２の認識モデルは、予めトレーニングして取得しており、画像データと検出対象ターゲットとに基づいて、画像データに対応する各検出対象イベントの検出状態を取得することができる。

また、本実施例でＳ１０３を実行して画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する際、画像データに検出対象ターゲットの検出結果が存在するか否かに基づいて、検出対象イベントの検出状態を取得することもでき、例えば、対応する道路の画像データに水たまりが存在する場合、水たまりイベントが異常状態にあると決定する。

本実施例でＳ１０３を実行して検出対象イベントの検出状態を取得した後、Ｓ１０４を実行して取得された検出対象イベントの検出状態に基づいて、画像データのイベント検出結果を取得する。

本実施例でＳ１０４を実行する際、直接に取得された検出対象イベントの検出状態を画像データのイベント検出結果とすることができる。

本実施例でＳ１０３を実行する際に取得された検出対象イベントの検出状態にエラーが存在する可能性があるので、取得されたイベント検出結果の精度を向上させるために、本実施例でＳ１０４を実行して検出対象イベントの検出状態に基づいて、画像データのイベント検出結果を取得する際、採用できる選択可能な実現方式は、取得された画像データと取得された検出対象イベントのイベント状態をユーザに送信して、ユーザが検出対象イベントのイベント状態を確認するために用いられ、ユーザから返された確認結果に基づいて、画像データのイベント検出結果を取得する。

つまり、本実施例ではユーザが取得された検出対象イベントのイベント状態をチェックすることによって、検出対象イベントの誤ったイベント状態を可能な限り除去し、取得されたイベント検出結果の精度をさらに向上させることもできる。本実施例ではユーザから返された確認結果を使用して第２の認識モデルを最適化することもでき、すなわち画像データ、画像データの検出対象ターゲット、及び確認結果をトレーニングデータとし、第２の認識モデルの更新を続けて、第２の認識モデルがより正確な検出対象イベントの検出状態を出力できるようにする。

また、本実施例でＳ１０４を実行して取得された画像データのイベント検出結果を取得した後、以下の内容をさらに含むことができ、取得されたイベント検出結果に異常状態にある検出対象イベントが存在するか否かを決定し、イベント検出結果に異常状態にある検出対象イベントが存在すると決定された場合、アラーム情報を発行し、発行されたアラーム情報には、検出対象イベントの異常状態と異常状態にある検出対象イベントの位置情報が含まれて、アラームの精度及び異常イベントの処理効率を向上させる。

理解できることは、本実施例では、関連部門の人が都市で発生する異常イベントを迅速に処理できるように、関連部門の人にアラーム情報を発行する。

図２は本開示の第２の実施例による概略図である。図２はイベント検出システム２００を示し、基礎構成モジュール、ビデオ再生記憶モジュール、ビデオ分析モジュール、アラーム情報記憶モジュール、及び情報処理モジュールを含む。その中、基礎構成モジュールは、ユーザのニーズに応じて異なるビデオデータストリームの処理ルールを柔軟に構成するため用いられ、ビデオデータストリームがタイムシェアリングで処理することができ、バッチで処理することもでき、ビデオ再生記憶モジュールは、ビデオデータストリームのリアルタイム再生及び記憶を完了し、ビデオデータストリームの呼び出し及び閲覧をサポートするために用いられ、ビデオ分析モジュールは、上記の実施例のイベント検出及び異常イベントのアラームを完了するために用いられ、アラーム情報記憶モジュールは、アラーム情報の分類検索及び照会展示を実現するために用いられ、情報処理モジュールは、異常イベントに対する処理を実現するために用いられる。

図３は本開示の第３の実施例による概略図である。図３は情報処理ユニットの処理フローチャートを示し、ビデオデータストリームをビデオ分析モジュールに入力した後、ビデオ分析モジュールがイベント検出を行い、ビデオ分析モジュールが、異常イベントを検出した後、アラーム情報を生成し、情報処理ユニットに報告し、情報処理ユニットがアラーム情報を関連部分の人に送信して確認し、異常イベントがエラーを検出した場合、確認結果をビデオ分析モジュールに返し、異常イベントを処理する必要がない場合、プロセスを終了し、異常イベントを処理する必要がある場合、処理を伝達し、処理が既に完了したと決定した場合、チェックして異常イベントが処理を既に完了したか否かを決定し、チェックしてない場合、処理を伝達するのを実行することに移動する。

図４は本開示の第４の実施例による概略図である。図４に示すように、本実施例のイベント検出装置４００は、取得ユニット４０１、決定ユニット４０２、検出ユニット４０３、及び処理ユニット４０４を含み、
取得ユニット４０１は、画像データを取得し、前記画像データの都市シーンを認識するために用いられ、
決定ユニット４０２は、前記都市シーンに対応する検出対象ターゲットと検出対象イベントを決定するために用いられ、
検出ユニット４０３は、前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するために用いられ、
処理ユニット４０４は、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得するために用いられる。

取得ユニット４０１によって取得された画像データは、都市のある監視区域の撮影装置によってリアルタイムに撮影されたビデオストリームデータから抽出して取得するものであってもよく、取得された画像データは、少なくとも１つの都市画像を含み、含まれる都市画像は、道路、広場、学校などの都市シーン内の少なくとも１つに対応することができる。

取得ユニット４０１は、画像データを取得する際、採用できる選択可能な実現方式は、都市のビデオストリームデータを取得し、取得されたビデオストリームデータから少なくとも１つのキーフレーム画像を画像データとして抽出する。

取得ユニット４０１は、画像データを取得した後、取得された画像データの都市シーンを認識する。通常の状況において、取得ユニット４０１によって認識された都市シーンは、道路、広場、学校などのうちの１つに過ぎないが、画像データを認識することによって複数の都市シーンを取得する場合がある。

取得ユニット４０１は、画像データの都市シーンを認識する際、採用できる選択可能な実現方式は、取得された画像データを第１の認識モデルに入力し、第１の認識モデルの出力結果に基づいて画像データの都市シーンを取得する。

また、取得ユニット４０１は、画像データの都市シーンを認識する際、画像データと異なる基準画像との間の類似度を計算する方式によって、画像データと最も類似した基準画像に対応する都市シーンを、取得された画像データの都市シーンとすることもできる。

本実施例では、取得ユニット４０１によって取得された画像データの都市シーンを認識した後、決定ユニット４０２から認識された都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定する。その中、決定ユニット４０２によって決定された検出対象ターゲットは、１つであってもよく、複数であってもよい。決定された検出対象イベントは、１つであってもよく、複数であってもよい。

決定ユニット４０２は、都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定する際、予め設定された対応関係に基づいて決定することができ、当該予め設定された対応関係は、各都市シーン、及び各都市シーンに対応する検出対象ターゲットと検出対象イベントとを含む。

本実施例では、決定ユニット４０２から都市シーンに対応する検出対象ターゲットと検出対象イベントを決定した後、検出ユニット４０３から画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する。その中、検出ユニット４０３によって取得された検出対象イベントの検出状態は、正常状態及び異常状態のうちの１つである。

理解できることは、決定ユニット４０２が複数の検出対象イベントを決定する場合、検出ユニット４０３は各検出対象イベントに対応する検出状態をそれぞれ取得することができる。

具体的には、検出ユニット４０３は、画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する際、採用できる選択可能な実現方式は、取得された画像データと決定された検出対象ターゲットを第２の認識モデルに入力し、第２の認識モデルの出力結果に基づいて検出対象イベントの検出状態を取得する。

また、検出ユニット４０３は、画像データにおける検出対象ターゲットを検出して、検出対象イベントの検出状態を取得する際、画像データに検出対象ターゲットの検出結果が存在するか否かに基づいて、検出対象イベントの検出状態を取得することもでき、例えば、対応する道路の画像データに水たまりが存在する場合、水たまりイベントが異常状態にあると決定する。

本実施例では検出ユニット４０３から検出対象イベントの検出状態を取得した後、処理ユニット４０４から取得された検出対象イベントの検出状態に基づいて、画像データのイベント検出結果を取得する。

処理ユニット４０４は、直接に検出ユニット４０３によって取得された検出対象イベントの検出状態を画像データのイベント検出結果とすることができる。

検出ユニット４０３によって取得された検出対象イベントの検出状態にエラーが存在する可能性があるので、取得されたイベント検出結果の精度を向上させるために、処理ユニット４０４は、検出対象イベントの検出状態に基づいて、画像データのイベント検出結果を取得する際、採用できる選択可能な実現方式は、取得された画像データと取得された検出対象イベントのイベント状態をユーザに送信して、ユーザが検出対象イベントのイベント状態を確認するために用いられ、ユーザから返された確認結果に基づいて、画像データのイベント検出結果を取得する。

つまり、処理ユニット４０４によってユーザが取得された検出対象イベントのイベント状態をチェックすることによって、検出対象イベントのエラーのイベント状態を可能な限り除去し、取得されたイベント検出結果の精度をさらに向上させることもできる。処理ユニット４０４によってユーザから返された確認結果を使用して第２の認識モデルを最適化することもでき、すなわち画像データ、画像データの検出対象ターゲット、及び確認結果をトレーニングデータとし、第２の認識モデルの更新を続けて、第２の認識モデルがより正確な検出対象イベントの検出状態を出力できるようにする。

また、本実施例のイベント検出装置４００は、アラームユニット４０５をさらに含むことができ、前記アラームユニット４０５は、取得された画像データのイベント検出結果を取得した後、取得されたイベント検出結果に異常状態にある検出対象イベントが存在するか否かを決定し、イベント検出結果に異常状態にある検出対象イベントが存在すると決定された場合、アラーム情報を発行するために用いられ、発行されたアラーム情報には、検出対象イベントの異常状態と異常状態にある検出対象イベントの位置情報が含まれる。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。

図５は、本開示の実施例に係るイベント検出方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様の計算デバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図５に示すように、機器５００は計算ユニット５０１を含み、計算ユニット５０１は、読み取り専用メモリ（ＲＯＭ）５０２に記憶されているコンピュータプログラム又は記憶ユニット５０８からランダムアクセスメモリ（ＲＡＭ）５０３にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行することができる。ＲＡＭ５０３には、機器５００が動作するに必要な様々なプログラムとデータも記憶することができる。計算ユニット５０１、ＲＯＭ５０２、及びＲＡＭ５０３は、バス５０４を介してお互いに接続される。入出力（Ｉ／Ｏ）インターフェース５０５もバス５０４に接続される。

機器５００内の複数のコンポーネントは、Ｉ／Ｏインターフェース５０５に接続されており、キーボード、マウスなどの入力ユニット５０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット５０７と、ディスク、光ディスクなどの記憶ユニット５０８と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット５０９と、を含む。通信ユニット５０９は、機器５００が、インターネットなどのコンピュータネットワーク、及び／又は様々な電気通信ネットワークを介して他の機器と情報／データを交換することを可能にする。

計算ユニット５０１は、様々な処理と計算能力を備える汎用及び／又は専用の処理コンポーネントである。計算ユニット５０１のいくつかの例は、中央処理装置（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット５０１は、イベント検出方法などの上記の様々な方法と処理を実行する。例えば、いくつかの実施例では、イベント検出方法は、記憶ユニット５０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。

いくつかの実施例では、コンピュータプログラムの一部又は全部は、ＲＯＭ５０２及び／又は通信ユニット５０９を介して機器５００にローディング及び／又はインストールされる。コンピュータプログラムがＲＡＭ５０３にローディングされて計算ユニット５０１によって実行される場合、上記のイベント検出方法の一つ又は複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット５０１は、他の任意の適切な方式（例えば、ファームウェアによって）を介してイベント検出方法を実行するように構成されることができる。

本明細書で説明されるシステム及び技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ローディングプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。

本開示の方法を実施するためのプログラムコードは、一つ又は複数のプログラミング言語の任意の組み合わせを使用して作成することができる。これらのプログラムコードは、プログラムコードがプロセッサ又はコントローラによって実行される際にフローチャート及び／又はブロック図に規定された機能／動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサ又はコントローラに提供することができる。プログラムコードは、完全に機械上で実行されたり、部分的に機械上で実行されたり、独立したソフトウェアパッケージとして部分的に機械上で実行され、部分的にリモート機械上実行されたり、又は完全にリモート機械又はサーバ上で実行されたりすることができる。

本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、又は機器の使用、又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又は機器、又は上記の内容の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つ又は複数のワイヤに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、又は上記の内容の任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、を含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、クラウド計算又はクラウドホストとも呼ばれ、クラウド計算サービスシステムの中の一つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、又は「ＶＰＳ」と略称する）に、存在する管理困難度が高く、業務拡張性が弱い欠陥を解決する。サーバは、分散システムのサーバであってもよく、又はブロックチェーンを組み合わせるサーバであってもよい。

上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

イベント検出方法であって、
画像データを取得し、前記画像データの都市シーンを認識するステップと、
前記都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定するステップと、
前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するステップと、
前記検出対象イベントの前記検出状態に基づいて、前記画像データのイベント検出結果を取得するステップと、を含む、
イベント検出方法。
前記画像データを取得するステップは、
都市のビデオストリームデータを取得するステップと、
前記ビデオストリームデータから少なくとも１つのキーフレーム画像を前記画像データとして抽出するステップと、を含む、
請求項１に記載のイベント検出方法。
前記都市シーンに対応する前記検出対象ターゲットと前記検出対象イベントとを決定するステップは、
予め設定された対応関係に基づいて、前記都市シーンに対応する前記検出対象ターゲットと前記検出対象イベントとを決定するステップを含む、
請求項１に記載のイベント検出方法。
前記画像データにおける前記検出対象ターゲットを検出して、前記検出対象イベントの前記検出状態を取得するステップは、
前記画像データと前記検出対象ターゲットとを第２の認識モデルに入力し、前記第２の認識モデルの出力結果に基づいて前記検出対象イベントの前記検出状態を取得するステップを含む、
請求項１に記載のイベント検出方法。
前記検出対象イベントの前記検出状態に基づいて、前記画像データの前記イベント検出結果を取得するステップは、
前記画像データと前記検出対象イベントのイベント状態とをユーザに送信するステップと、
前記ユーザから返された確認結果に基づいて、前記画像データの前記イベント検出結果を取得するステップと、を含む、
請求項１に記載のイベント検出方法。
前記画像データの前記イベント検出結果を取得した後、前記イベント検出結果に異常状態にある検出対象イベントが存在するか否かを決定するステップと、
前記イベント検出結果に前記異常状態にある検出対象イベントが存在すると決定された場合、アラーム情報を発行するステップと、をさらに含む、
請求項１に記載のイベント検出方法。
イベント検出装置であって、
画像データを取得し、前記画像データの都市シーンを認識する取得ユニットと、
前記都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定する決定ユニットと、
前記画像データにおける検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得する検出ユニットと、
前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得する処理ユニットと、を含む、
イベント検出装置。
前記取得ユニットは、前記画像データを取得するとき、
都市のビデオストリームデータを取得し、
前記ビデオストリームデータから少なくとも１つのキーフレーム画像を前記画像データとして抽出する、
請求項７に記載のイベント検出装置。
前記決定ユニットは、前記都市シーンに対応する前記検出対象ターゲットと前記検出対象イベントとを決定するとき、
予め設定された対応関係に基づいて、前記都市シーンに対応する検出対象ターゲットと検出対象イベントとを決定する、
請求項７に記載のイベント検出装置。
前記検出ユニットは、前記画像データにおける前記検出対象ターゲットを検出して、前記検出対象イベントの検出状態を取得するとき、
前記画像データと前記検出対象ターゲットとを第２の認識モデルに入力し、前記第２の認識モデルの出力結果に基づいて前記検出対象イベントの検出状態を取得する、
請求項７に記載のイベント検出装置。
前記処理ユニットは、前記検出対象イベントの検出状態に基づいて、前記画像データのイベント検出結果を取得するとき、
前記画像データと前記検出対象イベントのイベント状態とをユーザに送信し、
前記ユーザから返された確認結果に基づいて、前記画像データの前記イベント検出結果を取得する、
請求項７に記載のイベント検出装置。
アラームユニットをさらに含み、
前記アラームユニットは、
在前記処理ユニットが前記画像データのイベント検出結果を取得した後、前記イベント検出結果に異常状態にある検出対象イベントが存在するか否かを決定し、
前記イベント検出結果に前記異常状態にある検出対象イベントが存在すると決定された場合、アラーム情報を発行する、
請求項７に記載のイベント検出装置。
電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項１～６のいずれかの一つに記載のイベント検出方法を実行する、
電子機器。
コンピュータに請求項１～６のいずれかの一つに記載のイベント検出方法を実行させる、コンピュータ命令が記憶されている、非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行される際に請求項１～６のいずれかの一つに記載の方法を実現する、
コンピュータプログラム。