KR20220169373A - 타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체 - Google Patents

타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체 Download PDF

Info

Publication number
KR20220169373A
KR20220169373A KR1020217026796A KR20217026796A KR20220169373A KR 20220169373 A KR20220169373 A KR 20220169373A KR 1020217026796 A KR1020217026796 A KR 1020217026796A KR 20217026796 A KR20217026796 A KR 20217026796A KR 20220169373 A KR20220169373 A KR 20220169373A
Authority
KR
South Korea
Prior art keywords
target
image
detection
target object
filter
Prior art date
Application number
KR1020217026796A
Other languages
English (en)
Inventor
징환 천
춘야 류
쉐썬 장
바이룬 왕
Original Assignee
센스타임 인터내셔널 피티이. 리미티드.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 센스타임 인터내셔널 피티이. 리미티드. filed Critical 센스타임 인터내셔널 피티이. 리미티드.
Priority claimed from PCT/IB2021/055671 external-priority patent/WO2022263904A1/en
Publication of KR20220169373A publication Critical patent/KR20220169373A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

타겟 검출 방법 및 장치, 전자 디바이스 및 컴퓨터 판독가능한 저장 매체가 본 개시내용의 실시예들에 의해 제공된다. 이 방법은: 검출대상 이미지에 관해 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계 ― 검출 결과는 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함함 ―; 위치 정보에 기초하여 검출대상 이미지로부터 타겟 객체를 포함하는 제안 이미지를 잘라내는 단계; 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계; 및 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 검출 결과로부터 타겟 객체와 관련된 정보 항목을 삭제하는 단계를 포함한다. 이 방법에 의해, 데이터 부하를 증가시키기 않고도 오검출이 감소되고 검출 정확도가 향상될 수 있다.

Description

타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체
관련 출원의 상호참조
본 출원은, 모든 목적으로 참조에 의해 그 전체 내용이 본 명세서에 포함되는, 2021년 6월 17일 출원된 발명의 명칭이 "TARGET DETECTION METHODS, APPARATUSES, ELECTRONIC DEVICES AND COMPUTER-READABLE STORAGE MEDIA"인 싱가포르 특허 출원 번호 제10202106559T호에 대한 우선권을 주장한다.
기술적 분야
본 개시내용은 딥 러닝 기술(deep learning technology)에 관한 것으로, 특히 타겟 검출 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능한 저장 매체에 관한 것이다.
타겟 검출은 지능형 비디오 분석 시스템의 중요한 부분이다. 타겟 검출을 수행할 때, (특정한 객체 등의) 장면 내의 타겟 객체에 관한 검출은 높은 정확도를 갖는 것이 바람직하지만, 타겟 객체 이외의 객체들은 이물(foreign thing)이라고 할 수 있다. 일반적으로, 타겟 객체를 검출하는 흔한 방법을 이용하는 것은, 이물에 대한 정확한 검출 결과를 획득하기가 어려워, 이물이 타겟 객체로서 검출되기 쉽게 한다. 그러나, 타겟 검출 동안에, 이물이 잘못 검출되어 시스템의 분석에 영향을 미치는 것은 바람직하지 않다.
이에 비추어, 본 개시내용은, 타겟 검출 방법, 장치, 전자 디바이스 및 저장 매체를 제공한다.
제1 양태에서, 타겟 검출 방법이 제공되고, 이 방법은: 검출대상 이미지에 관해 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계 ― 검출 결과는, 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함함 ―; 위치 정보에 기초하여 검출대상 이미지로부터 타겟 객체를 포함하는 제안 이미지를 잘라내는 단계; 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계; 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 검출 결과로부터 타겟 객체와 관련된 정보 항목을 삭제하는 단계를 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계는: 타겟 검출 네트워크로 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계를 포함하고, 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체를 검출하도록 훈련된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속하는 신뢰도를 결정하는 단계는: 필터를 이용하여 제안 이미지에 관한 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계를 포함하고; 필터는 타겟 분류의 타겟 객체를 검출하도록 훈련된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 필터는 다음을 포함하는 동작에 의해 훈련된다: 필터로 샘플 이미지에 관한 피처 추출을 수행함으로써 이미지 피처를 추출하는 단계; 추출된 이미지 피처에 기초하여, 샘플 이미지가 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도를 결정하는 단계 ― 샘플 이미지는 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지 및 타겟 분류에 속하지 않는 간섭 객체를 포함하는 부정적 샘플 이미지를 포함함 ―; 신뢰도 및 객체 샘플 이미지의 라벨링된 분류에 기초하여 네트워크 손실을 결정하는 단계; 네트워크 손실에 기초하여 필터의 네트워크 파라미터를 조정하는 단계.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고, 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 타겟 객체의 미리설정된 디스플레이 상태에 대응한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 타겟 객체는 마킹 면 및 마킹 면에 대향하는 또 다른 면을 갖는 칩형 객체(chip-like object)를 포함하고; 긍정적 샘플 이미지들의 적어도 2개의 분류는: 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지, 또는 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지를 포함한다.
본 개시내용의 임의의 실시예를 참조하여, 이 방법은: 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 필터를 훈련시키기 위해 제안 이미지를 부정적 샘플 이미지로서 취하는 단계를 더 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지로부터 하나 이상의 타겟 객체가 검출된 경우, 하나 이상의 타겟 객체 각각에 대해, 검출 결과는: 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함하고; 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계는: 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 타겟 객체를 포함하는 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계를 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지는 게임 테이블의 이미지를 포함하고, 하나 이상의 타겟 객체는: 게임 소품, 게임 소품 조작부, 및 게임 코인 중 적어도 하나를 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 이 방법은 신뢰도가 미리설정된 임계값 이상인 것에 응답하여 검출 결과를 저장하는 단계를 더 포함한다.
제2 양태에서, 타겟 검출 장치가 제공되고, 이 장치는: 검출대상 이미지에 관해 타겟 검출을 수행함으로써 검출 결과를 획득하도록 구성된 타겟 검출 모듈 ― 검출 결과는, 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함함 ―; 위치 정보에 기초하여 검출대상 이미지로부터 타겟 객체를 포함하는 제안 이미지를 잘라내도록 구성된 이미지 자르기 모듈; 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된 신뢰도 결정 모듈; 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 검출 결과로부터 타겟 객체와 관련된 정보 항목을 삭제하도록 구성된 결과 결정 모듈을 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 타겟 검출 모듈은, 타겟 검출 네트워크로 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하도록 구성되고, 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체들을 검출하도록 훈련된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 신뢰도 결정 모듈은, 필터를 이용하여 제안 이미지에 관한 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성되고; 필터는 타겟 분류의 타겟 객체를 검출하도록 훈련된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 필터는 다음을 포함하는 동작들에 의해 훈련된다: 필터로 샘플 이미지에 관한 피처 추출을 수행함으로써 이미지 피처를 추출하는 단계; 추출된 이미지 피처에 기초하여, 샘플 이미지가 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도를 결정하는 단계 ― 샘플 이미지는 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지 및 타겟 분류에 속하지 않는 간섭 객체를 포함하는 부정적 샘플 이미지를 포함함 ―; 신뢰도 및 객체 샘플 이미지의 라벨링된 분류에 기초하여 네트워크 손실을 결정하는 단계; 네트워크 손실에 기초하여 필터의 네트워크 파라미터를 조정하는 단계.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고, 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 타겟 객체의 미리설정된 디스플레이 상태에 대응한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 타겟 객체는 마킹 면 및 마킹 면에 대향하는 또 다른 면을 갖는 칩형 객체를 포함하고; 긍정적 샘플 이미지들의 적어도 2개의 분류는: 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지, 또는 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지를 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 결과 결정 모듈은: 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 필터를 훈련시키기 위해 제안 이미지를 부정적 샘플 이미지로서 취하도록 구성된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지로부터 하나 이상의 타겟 객체가 검출된 경우, 하나 이상의 타겟 객체 각각에 대해, 검출 결과는: 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함하고; 신뢰도 결정 모듈은: 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 타겟 객체를 포함하는 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지는 게임 테이블의 이미지를 포함하고, 하나 이상의 타겟 객체는: 게임 소품, 게임 소품 조작부, 및 게임 코인 중 적어도 하나를 포함한다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 결과 결정 모듈은 신뢰도가 미리설정된 임계값 이상인 것에 응답하여 검출 결과를 저장하도록 추가로 구성된다.
제3 양태에서, 메모리 및 프로세서를 포함하는 전자 디바이스가 제공되고, 여기서 메모리는 프로세서 상에서 실행될 수 있는 컴퓨터 판독가능한 명령어들을 저장하도록 구성되고, 명령어들이 프로세서에 의해 실행될 때 본 개시내용의 실시예들 중 임의의 것에 설명된 타겟 검출 방법이 구현된다.
제4 양태에서, 컴퓨터 프로그램이 저장된 컴퓨터 판독가능한 저장 매체가 제공되고, 컴퓨터 프로그램이 프로세서에 의해 실행될 때, 본 개시내용의 실시예들 중 임의의 것에서 설명된 타겟 검출 방법이 구현된다.
제5 양태에서, 컴퓨터 프로그램(들)/명령어들을 포함하는 컴퓨터 프로그램 제품이 제공되고, 컴퓨터 프로그램(들)/명령어들이 프로세서에서 실행될 때, 본 개시내용의 실시예들 중 임의의 것에서 설명된 타겟 검출 방법이 구현된다.
본 개시내용의 실시예들에서, 타겟 검출에 기초하여, 타겟 검출에 의해 결정된 타겟 객체가 타겟 분류에 속한다는 신뢰도는 타겟 객체에 대응하는 제안 이미지를 통해 결정되고, 신뢰도에 기초하여, 타겟 객체가 검출대상 타겟 객체의 타겟 분류에 속하는지와 신뢰도가 미리설정된 임계값 미만인 타겟 객체가 필터링 제거될지가 효과적으로 결정됨으로써, 오검출들을 감소시키고 데이터 부하 증가없이 검출 정확도를 향상시킨다.
본 개시내용의 하나 이상의 실시예 또는 관련 기술 분야의 기술적 솔루션들을 더욱 명확하게 설명하기 위해, 이하에서는 실시예들 또는 관련 기술의 설명에 이용된 도면들이 간략하게 소개될 것이다. 명백하게, 이하의 설명에서의 도면들은 본 개시내용의 하나 이상의 실시예일 뿐이다. 본 기술 분야에서 통상의 기술자라면, 창작적인 노력을 지급하지 않고도 이들 도면들에 기초하여 다른 실시예들이 획득될 수 있다.
도 1은 본 개시내용의 일부 실시예에 도시된 타겟 검출 방법의 플로차트이다.
도 2는 본 개시내용의 일부 실시예에 도시된 타겟 검출 네트워크 및 필터의 구조를 나타내는 개략도이다.
도 3은 본 개시내용의 일부 실시예에 도시된 필터에 대한 훈련 방법의 플로차트이다.
도 4는 본 개시내용의 일부 실시예에 도시된 또 다른 타겟 검출 방법의 플로차트이다.
도 5는 본 개시내용의 일부 실시예에 도시된 또 다른 타겟 검출 방법의 플로차트이다.
도 6은 본 개시내용의 일부 실시예에 도시된 게임 장소의 시나리오에서 타겟 검출 방법의 플로차트이다.
도 7은 본 개시내용의 일부 실시예에 도시된 타겟 검출 장치를 나타내는 블록도이다.
도 8은 본 개시내용의 일부 실시예에 도시된 전자 디바이스의 블록도이다.
예들이, 도면들에 나타낸 그 예시들과 함께, 본 명세서에서 상세하게 설명될 것이다. 이하의 설명이 도면들을 포함할 때, 상이한 도면들에서의 유사한 참조부호들은, 달리 나타내지 않는 한, 비슷하거나 유사한 요소들을 지칭한다. 이하의 예에서 설명되는 실시예들은 본 개시내용과 일치하는 모든 실시예를 나타내는 것은 아니다. 오히려, 이들은 첨부된 청구항들 상세히 설명된 바와 같이 본 개시내용의 일부 양태와 일치하는 장치들 및 방법들의 예들일 뿐이다.
본 명세서에서 사용된 용어들은 특정한 실시예들을 설명하기 위한 목적일 뿐이며, 본 개시내용을 제한하려는 의도는 아니다. 본 개시내용 및 첨부된 청구항들에서 사용된 "한(a)", "상기(said)" 및 "그 하나(the)"의 단수 형태들은, 문맥상 명백하게 다른 의미를 나타내지 않는 한, 복수 형태를 포함하는 의도이다. 또한 본 명세서에서 사용된 용어 "및/또는"은 하나 이상의 연관된 나열된 항목의 임의의 또는 모든 가능한 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
제1, 제2, 제3 등의 용어들이 다양한 정보를 설명하기 위해 본 개시내용에서 사용될 수 있지만, 이 정보는 이들 용어들로 제한되어서는 안 된다는 것을 이해해야 한다. 이들 용어는 동일한 유형의 정보를 서로 구별하기 위해서 사용될 뿐이다. 예를 들어, 본 명세서의 범위를 벗어나지 않으면서, 제1 정보는 제2 정보라고 지칭될 수 있고, 유사하게, 제2 정보도 역시 제1 정보라고 지칭될 수 있다. 문맥에 따라, 본 명세서에 사용된 "만일"이라는 단어는, "때" 또는 "동안" 또는 "그 결정에 대한 응답하여"로서 해석될 수 있다.
도 1에 도시된 바와 같이, 도 1은 본 개시내용의 일부 실시예에 도시된 타겟 검출 방법의 플로차트이다. 이 방법은, 다음과 같은 단계들을 포함할 수 있다:
단계 100에서, 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과가 획득된다.
검출 결과는, 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다.
이 단계에서, 검출대상 이미지는 상이한 분류들의 타겟 객체들을 포함할 수 있고, 다른 객체들도 포함할 수 있다. 타겟 객체는, 타겟 검출 동안의 검출 타겟이다. 상이한 시나리오들에서, 타겟 검출에서 검출된 타겟 객체들은 상이하다. 예를 들어, 도로 장면에서, 타겟 객체들은 차량들 및 보행자들일 수 있고, 다른 객체들은, 나무들, 애완 동물들, 및 건물들일 수 있다. 또 다른 예의 경우, 얼굴 인식 장면에서, 타겟 객체들은 사람의 얼굴들일 수 있고, 다른 객체들은 만화 얼굴들일 수 있다. 검출대상 이미지에서 하나 이상의 타겟 객체가 포함되거나, 다른 객체들이 있거나, 어떠한 다른 객체도 없을 수 있다.
타겟 검출 동안에 오검출이 발생할 수 있다. 검출대상 이미지에 관해 타겟 검출이 수행되는 경우, 또 다른 객체가 소정의 타겟 분류의 타겟 객체로서 오검출될 수 있다.
검출대상 이미지에 관해 타겟 검출이 수행된 후, 검출 결과가 획득될 수 있다. 검출 결과는, 검출대상 이미지에 포함된 각각의 타겟 객체가 속하는 타겟 분류, 및 검출대상 이미지에 포함된 각각의 타겟 객체에 대응하는 위치 정보를 포함할 수 있다. 위치 정보는, 타겟 객체가 위치해 있는 프레임의 프레임 좌표 정보일 수 있다. 구체적으로, 이것은, 검출대상 이미지에 포함된 타겟 객체의 프레임을 이루는 직사각형 프레임의 4개의 꼭지점에 대응하는 좌표 정보일 수도 있고, 또는 타겟 객체를 둘러싸고 있는 고정 크기의 직사각형 프레임일 수도 있다. 4개의 꼭지점에 대응하는 좌표 정보에 대해, 본 실시예는 위치 정보의 특정한 표현을 제한하지 않는다.
이 실시예는 타겟 검출의 특정한 방법을 제한하지 않는다. 예를 들어, 타겟 검출은 훈련된 신경망에 의해 수행될 수 있거나, 타겟 검출은 또한, 다른 방식들로 수행될 수 있다.
단계 102에서, 위치 정보에 기초하여, 타겟 객체를 포함하는 제안 이미지가 검출대상 이미지로부터 잘려 나온다.
이 단계에서, 각각의 타겟 객체가 위치해 있는 영역의 이미지는, 그 타겟 객체에 대응하는 위치 정보에 따라 검출대상 이미지로부터 잘려 나올 수 있다. 이 영역의 이미지가 제안 이미지이다. 검출대상 이미지로부터 하나 이상의 제안 이미지가 획득될 수 있다.
예를 들어, 위치 정보가 타겟 객체가 위치해 있는 프레임에 대응하는 프레임 좌표 정보인 경우, 각각의 타겟 객체가 위치해 있는 프레임이 검출대상 이미지로부터 잘려 나와 제안 이미지를 획득될 수 있다.
제안 이미지는 실제 타겟 객체를 포함하거나, 타겟 객체로 잘못 검출된 또 다른 객체를 포함할 수 있다.
단계 104에서, 타겟 객체가 타겟 분류에 속한다는 신뢰도가 제안 이미지에 따라 결정된다.
이 실시예는 신뢰도를 결정하는 특정한 방식을 제한하지 않는다. 예를 들어, 훈련된 신경망은, 피처 추출을 수행하고 신뢰도를 결정하는데 이용될 수 있거나, 또는 신뢰도는 다른 방식들로도 결정될 수 있다.
예를 들어, 각각의 제안 이미지에 관해 피처 추출이 수행되어 제안 이미지의 이미지 피처를 획득될 수 있다. 대응하는 타겟 객체가 타겟 분류에 속한다는 신뢰도는 이미지 피처에 따라 예측될 수 있다. 신뢰도가 높을수록, 타겟 객체가 타겟 분류에 속할 확률이 높아진다.
대안으로서, 대응하는 타겟 객체가 타겟 분류에 속하지 않는다는 신뢰도도 역시 예측될 수 있다. 신뢰도가 낮을수록, 타겟 객체가 타겟 분류에 속하지 않을 확률이 높아진다.
예를 들어, 타겟 검출 동안 타겟 객체가 속하는 타겟 분류가 차량이라고 결정되면, 타겟 객체가 차량 분류에 속한다는 신뢰도는 타겟 객체에 대응하는 제안 이미지로부터 추출된 이미지 피처에 따라 결정될 수 있거나, 또는 타겟 객체가 차량이라는 객체 분류에 속하지 않는다는 신뢰도가 결정될 수 있다.
단계 106에서, 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다.
이 단계에서, 타겟 객체가 타겟 분류에 속하는 신뢰도가 결정된 후, 신뢰도가 미리설정된 임계값 미만인 경우, 타겟 객체가 타겟 분류의 객체로 오검출된 것으로 결정된다. 그 다음, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다. 신뢰도가 미리설정된 임계값 이상이면, 타겟 객체가 타겟 분류의 객체라고 결정된다. 한 예에서, 신뢰도가 미리설정된 임계값 이상인 것에 응답하여, 검출 결과가 저장될 수 있다.
또 다른 예에서, 타겟 객체가 타겟 분류에 속하지 않는다는 신뢰도를 결정한 후, 신뢰도가 미리설정된 임계값 이상인 경우, 타겟 객체는 타겟 객체로 잘못 검출된 또 다른 객체인 것으로 결정되고, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다. 신뢰도가 미리설정된 임계값 미만인 경우, 타겟 객체는 타겟 분류의 객체인 것으로 결정된다. 특정한 미리설정된 임계값은 실제 필요에 따라 본 기술분야의 통상의 기술자에 의해 설정될 수 있다.
본 개시내용의 실시예들에 의해 제공되는 타겟 검출 방법은, 타겟 검출의 검출 결과 및 검출된 타겟 객체에 대응하는 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하고, 타겟 객체의 신뢰도를 통해 분류 검출 결과를 효과적으로 검증하고, 검출 결과에서 미리설정된 임계값 미만의 신뢰도를 갖는 타겟 객체들을 필터링 제거한다. 그 결과, 데이터 부하를 증가시키지 않으면서 검출대상 이미지에 관한 타겟 검출에 의해 쉽게 구별되지 않는 이물이 필터링 제거될 수 있음으로써, 오검출을 감소시키고 검출 정확도를 향상시킬 수 있다.
한 실시예에서, 검출 결과를 획득하기 위해 검출대상 이미지에 관한 타겟 검출을 수행하는 단계는: 검출 결과를 획득하기 위해 타겟 검출 네트워크에 의해 검출대상 이미지에 관한 타겟 검출을 수행하는 단계를 포함한다. 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체들을 검출하도록 훈련된다. 검출대상 이미지를 타겟 검출 네트워크에 입력함으로써, 검출대상 이미지에 포함된 타겟 객체가 속하는 분류가 타겟 분류로서 획득될 수 있고, 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보가 획득될 수 있다. 타겟 검출 네트워크는, 타겟 객체의 적어도 하나의 분류를 포함하는 이미지를 샘플로서 이용함으로써 훈련된 신경망일 수 있다. 타겟 검출 네트워크를 이용하는 것은, 검출대상 이미지에서 타겟 분류의 타겟 객체를 더욱 정확하고 신속하게 식별할 수 있다. 또한, 일반적으로, 타겟 검출 네트워크의 훈련 샘플들에 포함된 타겟 객체의 분류의 수는 제한되어 있으므로, 타겟 검출 네트워크에 의해 검출된 타겟 분류의 타겟 객체들을 추가로 필터링하는 필터를 이용함으로써 제한되기 때문에, 타겟 검출 네트워크를 위한 훈련 샘플들에서 이물에 관한 데이터 부족에 의해 야기되는 오검출이 감소될 수 있다.
한 실시예에서, 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속하는 신뢰도를 결정하는 단계는: 필터를 이용하여 제안 이미지에 관해 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계를 포함하고, 여기서 필터는 타겟 분류의 타겟 객체를 검출하도록 훈련된다. 필터는 훈련된 2진 분류 신경망일 수 있다. 제안 이미지를 필터에 입력하거나, 제안 이미지로부터 추출된 피처를 필터에 입력함으로써, 타겟 객체가 타겟 분류에 속하다는 신뢰도가 획득될 수 있다. 필터들을 이용하는 것은, 타겟 객체가 타겟 분류에 속한다는 신뢰도를 더 정확하고 빠르게 획득될 수 있다.
본 개시내용의 한 실시예에 의해 제공되는 타겟 검출 방법은, 타겟 검출 네트워크 및 필터를 통해 수행될 수 있다. 도 2는 타겟 검출 방법에서 이용되는 타겟 검출 네트워크(21) 및 필터(22)의 구조를 나타낸다.
타겟 검출 네트워크(21)는 검출 결과를 획득하기 위해 입력된 검출대상 이미지에 관한 타겟 검출을 수행하도록 구성되고, 여기서, 검출 결과는 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다.
타겟 검출 네트워크(21)에 의해 출력된 위치 정보에 따라, 타겟 객체를 포함하는 제안 이미지가 검출대상 이미지로부터 잘려 나올 수 있다.
필터(22)는, 제안 이미지에 관해 피처 추출을 수행함으로써 획득된 이미지 피처에 따라 타겟 객체가 소정의 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된다. 실제 구현에서, 제안 이미지는 필터(22)에 입력될 수 있고, 필터(22)에 의해 제안 이미지에 관해 피처 추출을 수행함으로써 획득된 이미지 피처는 또한, 피처 추출을 위해 신경망을 이용하는 등의, 다른 방식들로 제안 이미지의 피처 추출에 의해 획득될 수 있다. 그 결과, 추출된 이미지 피처는 필터(22)에 입력된다.
필터(22)에 의해 출력된 신뢰도에 따라, 타겟 객체가 타겟 분류에 속하는지와, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제되거나 검출 결과에 저장될지가 결정될 수 있다.
본 개시내용의 실시예들에서 이용되는 타겟 검출 네트워크는 타겟 검출에서 흔하게 이용되는 검출 네트워크 모델일 수 있고, 흔하게 이용되는 방법들에 따라 훈련될 수 있다. 검출 네트워크의 예는, Faster RCNN(Faster region-based convolutional neural network), Fast RCNN(Fast region-based convolutional neural network), R-CNN(Region-based convolutional neural network) 등을 포함한다. 이 실시예는 타겟 검출 네트워크에 의해 이용되는 특정한 신경망 및 훈련 방법을 제한하지 않는다.
도 3은 본 개시내용의 한 실시예에 의해 제공되는 타겟 검출 방법, 즉, 도 2에 도시된 필터를 훈련시키기 위한 방법에서 이용되는 필터의 훈련 프로세스를 도시하며, 필터는, 다음과 같은 단계들을 포함한, 타겟 객체의 소정 분류를 필터링 제거하도록 구성된다.
단계 300에서, 필터는 샘플 이미지에 관한 피처 추출을 수행함으로써 이미지 피처를 추출하도록 훈련되고, 추출된 이미지 피처에 기초하여, 타겟 샘플 이미지가 타겟 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도가 결정된다.
본 실시예에서 이용되는 필터는, 딥 러닝, 예를 들어, 잔차 신경망(resnet; residual neural network), 심층 콘볼루션 신경망(VGGNet), 밀집 콘볼루션 네트워크(DenseNet), 및 기타의 딥 러닝 모델들에 기초한 분류기일 수 있다.
필터에 대해 2진 분류 작업이 구성되고, 여기서, 각각의 필터는 타겟 분류의 타겟 객체들을 필터링하는데 이용되며, 타겟 분류에 대응하는 많은 수의 샘플 이미지들이 훈련을 완료하기 위해 이용된다. 샘플 이미지는, 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지와 간섭 객체를 포함하는 부정적 샘플 이미지를 포함한다. 긍정적 샘플 이미지의 라벨링된 분류는 1일 수 있고, 부정적 샘플 이미지의 라벨링된 분류는 0일 수 있다. 대안으로서, 긍정적 샘플 이미지의 라벨링된 분류는 0일 수 있고, 부정적 샘플 이미지의 라벨링된 분류는 1일 수 있다. 훈련 성능을 향상시키기 위하여, 긍정적인 샘플 이미지와 부정적인 샘플 이미지의 수도 역시 동일하게 유지될 수 있다.
간섭 객체는 타겟 분류에 속하지 않는 또 다른 객체이다. 특히, 간섭 객체는 타겟 객체와 유사한 또 다른 객체일 수 있다. 예를 들어, 타겟 객체가 버스인 경우, 간섭 객체는 자가용 차일 수 있다. 또 다른 예의 경우, 타겟 객체가 물컵일 때, 간섭 객체는, 꽃병, 펜 꽂이 등일 수 있다. 샘플 이미지는 일반적으로 하나의 타겟 객체 또는 간섭 객체만을 포함한다.
한 예에서, 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고, 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 타겟 객체의 미리설정된 디스플레이 상태에 대응한다. 이 예에서 이용된 긍정적 샘플 이미지는 타겟 객체의 상이한 디스플레이 상태를 포함하여, 훈련된 필터가 더 강력하고 타겟 분류의 타겟 객체를 더 정확하게 필터링할 수 있게 한다.
예를 들어, 타겟 객체가 블록형 객체인 경우, 블록형 객체는, 전면, 배면, 및 상면을 갖는다. 샘플 이미지는 긍정적 샘플의 3개의 분류를 포함할 수 있다. 타겟 분류의 타겟 객체는 각각 긍정적 샘플 이미지의 3개의 분류에 대해 미리설정된 디스플레이 상태들의 3개의 분류를 가질 수 있고, 이것은: 블록형 객체의 전면이 보이는 것, 블록형 객체의 배면이 보이는 것, 및 블록형 객체의 상면이 보이는 것이다. 예를 들어, 차량의 경우, 전면은 방풍창이 위치한 곳이고, 배면은 도어가 위치한 곳이며, 상면은 지붕이 위치한 곳이다.
예를 들어, 타겟 객체가 마킹 면 및 마킹 면과 대향하는 또 다른 면을 갖는 칩형 객체인 경우, 디스플레이 상태들은 마킹 면 가시(marking side visible) 및 마킹 면 비가시(marking side invisible)이다. 긍정적 샘플 이미지들의 적어도 2개의 분류는 다음을 포함한다: 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 가진 칩형 객체를 포함하는 이미지, 또는 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 가진 칩형 객체를 포함하는 이미지. 이 예에서 이용된 긍정적 샘플 이미지는, 칩형 객체의 마킹 면이 보이는 디스플레이 상태뿐만 아니라, 칩형 객체의 마킹 면이 보이지 않는 디스플레이 상태를 포함하여, 필터가 상이한 상태의 칩형 객체의 정확한 검출 결과를 획득할 수 있게 한다.
샘플 이미지를 필터에 입력하고 필터에 의해 샘플 이미지에 관한 피처 추출을 수행함으로써, 샘플 이미지가 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도가 추출된 이미지 피처에 기초하여 결정될 수 있다.
예를 들어, 피처 추출은 필터의 콘볼루션 계층에 의해 샘플 이미지에 관해 수행될 수 있고, 추출된 이미지 피처들은 필터의 완전 접속 계층에 의해 통합될 수 있다. 샘플 이미지가 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도는, Softmax 계층에 의해 회귀 프로세스를 수행한 후 출력된다.
단계 302에서, 네트워크 손실은 샘플 이미지의 신뢰도 및 라벨링된 분류에 기초하여 결정된다.
이 단계에서, 샘플 이미지의 신뢰도와 라벨링된 분류에 기초하여, 네트워크 손실이 손실 함수를 통해 계산될 수 있다. 손실 함수는, 실제 출력과 예상 출력 사이의 차이, 즉, 필터에 의한 신뢰도 출력과 샘플 이미지의 라벨링된 분류 사이의 차이를 결정하는데 이용된다. 이 실시예는 이용된 특정한 손실 함수를 제한하지 않는다. 예를 들어, 분위수 손실 함수(quantile loss function), 평균 제곱 오차 손실 함수(mean square error loss function) 또는 교차 엔트로피 손실 함수(cross entropy loss function)가 이용될 수 있다.
한 예에서, 2진 교차 엔트로피 손실 함수가 필터를 훈련시키는데 이용될 수 있다.
Figure pct00001
여기서 x는 필터에 의해 출력된 신뢰도이고, 신뢰도 범위는 0 내지 1이며, y는 일반적으로 0 또는 1인 샘플 이미지의 라벨링된 분류이다. 2진 교차 엔트로피 손실 함수는, 실제 출력이 예상 출력에 얼마나 가까운지를 결정하는데 이용된다.
예를 들어, 긍정적 샘플 이미지의 라벨링된 분류가 1이고 부정적 샘플 이미지의 라벨링된 분류가 0인 경우, 긍정적 샘플 이미지가 입력되면 필터의 출력은 긍정적 샘플 이미지가 라벨링된 분류 1에 속한다는 신뢰도를 나타낸다; 부정적 샘플이 입력되면 필터의 출력은 부정적 샘플 이미지가 라벨링된 분류 0에 속한다는 신뢰도를 나타낸다.
신뢰도의 범위는 0 내지 1일 수 있다. 네트워크 손실은, 샘플 이미지의 신뢰도와 라벨링된 분류를 손실 함수에 입력함으로써 계산될 수 있다.
단계 304에서, 필터의 네트워크 파라미터는 네트워크 손실에 따라 조정된다.
특정한 구현에서, 필터의 네트워크 파라미터는 역전파(back propagation)를 통해 조정될 수 있다. 네트워크 반복 종료 조건에 도달하면, 네트워크 훈련이 종료되고, 여기서 종료 조건은, 반복이 소정의 횟수에 도달하거나, 네트워크 손실이 소정의 임계값 미만인 것일 수 있다.
필터가 훈련된 후, 필터는 타겟 검출 네트워크에 접속되어 타겟 검출 네트워크의 검출 결과를 필터링할 수 있다.
도 4는 본 개시내용의 한 실시예에 의해 제공되는 타겟 검출 방법이다. 도 4에 도시된 바와 같이, 이 방법은 훈련된 필터를 한 예로서 이용하여 타겟 검출 방법을 설명한다. 이 방법은, 다음과 같은 단계들을 포함할 수 있다:
단계 400에서, 검출대상 이미지가 수신된다.
이 단계에서, 검출대상 이미지는 타겟 객체들의 복수의 분류를 포함할 수 있다.
단계 402에서, 타겟 검출 네트워크를 이용하여 검출대상 이미지에 관한 타겟 검출이 수행되어 검출 결과를 획득한다.
검출 결과는, 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다.
타겟 검출 네트워크는 타겟 검출에 흔하게 이용되는 잘 훈련된 검출 네트워크 모델을 이용할 수 있다.
이 단계에서, 검출대상 이미지는 타겟 검출 네트워크에 입력되고, 각각의 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체의 위치 정보가 출력될 수 있다.
단계 404에서, 위치 정보에 기초하여, 타겟 객체를 포함하는 제안 이미지가 검출대상 이미지로부터 잘려 나온다.
타겟 검출 네트워크에 의해 출력된 위치 정보에 따라, 검출대상 이미지에 포함된 타겟 객체를 포함하는 제안 이미지가 잘려 나올 수 있다. 검출대상 이미지가 복수의 타겟 객체를 포함할 때, 복수의 제안 이미지가 획득될 수 있다.
단계 406에서, 타겟 객체가 타겟 분류에 속한다는 신뢰도는, 제안 이미지에 관해 피처 추출을 수행함으로써 획득된 이미지 피처에 따라 필터로 결정된다.
실제 구현에서, 소정의 타겟 분류의 타겟 객체에 대응하는 필터가 미리 훈련될 수 있고, 타겟 분류의 타겟 객체에 대응하는 검출된 제안 이미지가 필터에 입력되어 필터가 제안 이미지에 관한 피처 추출을 수행한다. 따라서, 필터는 이미지 피처에 따라 타겟 객체가 타겟 분류에 속한다는 신뢰도를 출력할 수 있다.
이미지 피처는 또한, 다른 방식들로 제안 이미지에 관한 피처 추출을 수행함으로써 획득될 수 있다. 예를 들어, 피처 추출을 위해 신경망을 이용하고 추출된 이미지 피처를 필터에 입력하는 것은, 필터로 하여금 타겟 객체가 타겟 분류에 속한다는 신뢰도를 출력하게 한다.
단계 408에서, 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다.
필터에 의해 출력된 신뢰도가 미리설정된 임계값 미만이라면, 타겟 객체는 타겟 분류의 객체로서 오검출된 또 다른 객체로서 결정되고, 그 다음, 타겟 객체와 관련된 정보 항목은 검출 결과로부터 삭제된다; 신뢰도가 미리설정된 임계값보다 크거나 같다면, 타겟 객체는 타겟 분류의 객체로서 결정된다.
또 다른 예에서, 단계 406에서, 타겟 객체가 타겟 분류에 속하지 않는다는 신뢰도가 결정될 수 있다. 신뢰도가 미리설정된 임계값보다 크거나 같다면, 타겟 객체는 타겟 분류의 객체로 오검출된 또 다른 객체로서 결정되고, 그 다음, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다; 신뢰도가 미리설정된 임계값 미만이면, 타겟 객체는 타겟 분류의 객체로서 결정된다.
신뢰도는 0 내지 1의 범위일 수 있다. 예를 들어, 미리설정된 임계값은 0.5로 설정될 수 있고, 특정한 미리설정된 임계값은 실제 필요에 따라 본 기술분야의 통상의 기술자에 의해 설정될 수 있다.
단계 410에서, 제안 이미지는 필터를 훈련시키기 위한 부정적 샘플 이미지로서 취해진다.
이전 단계로부터 삭제된 타겟 객체에 관련된 정보 항목의 경우, 대응하는 제안 이미지는 필터를 훈련시키기 위한 부정적 샘플 이미지로서 이용될 수 있다.
본 개시내용의 실시예들에 의해 제공된 타겟 검출 방법에서, 필터는, 타겟 검출에 의해 결정된 타겟에 대응하는 제안 이미지에 관해 피처 추출을 수행하기 위해 타겟 검출 네트워크에 접속되어, 타겟 객체가 검출대상 타겟 분류에 속하는지를 신뢰도에 따라 효과적으로 결정하고, 신뢰도가 미리설정된 임계값 미만인 타겟 객체를 필터링 제거함으로써, 데이터 부하를 증가시키지 않으면서 오검출을 감소시키고 검출 정확도를 향상시킨다. 또한, 삭제된 타겟 객체에 대응하는 제안 이미지가 필터를 훈련시키기 위한 부정적 샘플 이미지로서 이용되어, 부정적 샘플 이미지의 수를 증가시키고 필터를 더 구체적으로 최적화할 수 있다.
도 5는 본 개시내용의 한 실시예에 의해 제공되는 또 다른 타겟 검출 방법이다. 이 방법에서, 복수의 타겟 분류의 타겟 객체들이 각각 검출되고 필터링될 수 있다. 이 방법은 다음과 같은 단계들을 포함할 수 있으며, 여기서, 상기 실시예들에서 반복되는 단계들은 반복되지 않을 것이다.
단계 500에서, 검출대상 이미지에 관한 타겟 검출이 수행되고, 검출 결과가 획득된다.
검출대상 이미지로부터 하나 이상의 타겟 객체가 검출되는 경우, 하나 이상의 타겟 객체 각각에 대해, 검출 결과는: 검출대상 이미지로부터 검출된 적어도 하나의 타겟 객체 각각이 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다. 적어도 하나의 타겟 객체에 포함된 각각의 타겟 객체가 속하는 타겟 분류는 동일하거나 상이할 수 있다. 이 실시예에서, 검출대상 이미지 내의 타겟 분류의 수는 복수일 수 있고, 여기서 각각의 타겟 분류는 필터에 대응하고, 검출대상 이미지는 또한 다른 객체들을 포함할 수 있다. 한 예에서, 검출대상 이미지는 게임 테이블의 이미지일 수 있고, 하나 이상의 타겟 객체는, 게임 소품, 게임 소품 조작부, 및 게임 코인 중 적어도 하나를 포함한다. 다른 객체는, 회원 카드, 티슈 등일 수 있다.
검출대상 이미지는 타겟 검출 네트워크에 입력되어 검출대상 이미지 내의 복수의 분류 및 검출대상 이미지에서의 그 위치 정보에 대응하는 타겟 객체들을 획득될 수 있다. 그러나, 다른 객체는 타겟 분류의 객체로 결정될 수 있다.
한 예에서, 사전 검출에 의해 식별된 타겟 객체들의 분류들은 각각 A, B, C, 및 D이고, 분류 A, B, C, 및 D에 속하는 타겟 객체들에 대응하는 필터들은 각각 미리 훈련될 수 있다. 검출대상이 검출 동안에 분류 A의 타겟 객체, 분류 D의 타겟 객체, 분류 E 및 F의 다른 타겟 객체들을 포함하는 경우, 분류 E의 타겟 객체는 분류 B의 타겟으로서 오검출되고, 분류 F의 타겟 객체는 분류 D의 타겟으로서 오검출된다. 분류 B와 D에 각각 대응하는 필터들에 의해 필터링된 후, 분류 E와 분류 F의 타겟 객체들에 관한 정보 항목들은 검출 결과로부터 삭제된다
단계 502에서, 위치 정보에 기초하여, 타겟 객체를 포함하는 제안 이미지가 검출대상 이미지로부터 잘려 나온다.
이 단계에서, 각각의 타겟 객체에 대응하는 위치 정보에 따라, 타겟 객체들과 동일한 개수의 제안 이미지가 검출대상 이미지로부터 획득될 수 있다.
단계 504에서, 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 타겟 객체가 타겟 분류에 속한다는 신뢰도가 타겟 객체의 제안 이미지에 기초하여 결정된다.
이 실시예에서, 각각의 타겟 분류에 대응하는 필터는 미리 훈련될 수 있고 도 3에 도시된 훈련 방법은 각각의 필터를 훈련시키는데 이용될 수 있다. 각각의 타겟 객체에 대응하는 제안 이미지는 타겟 객체가 속하는 타겟 분류에 따라 대응하는 필터에 입력된다. 제안 이미지에 관해 필터에 의한 피처 추출을 수행함으로써 이미지 피처가 획득되고, 타겟 객체가 타겟 분류에 속한다는 신뢰도가 이미지 피처에 따라 출력된다.
이미지 피처는 또한, 다른 방식들로 각각의 제안 이미지에 관한 피처 추출을 수행함으로써 획득될 수 있다. 예를 들어, 피처 추출을 위해 신경망을 이용하고 추출된 이미지 피처를 대응하는 필터에 입력하는 것은, 필터로 하여금 타겟 객체가 타겟 분류에 속한다는 신뢰도를 출력하게 한다.
단계 506에서, 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다.
필터에 의해 출력된 신뢰도가 미리설정된 임계값 미만이라면, 타겟 객체는 타겟 객체로서 오검출된 또 다른 객체로서 결정되고, 타겟 객체는 검출 결과로부터 삭제된다; 신뢰도가 미리설정된 임계값보다 크거나 같다면, 타겟 객체는 타겟 분류의 객체로서 결정된다.
타겟 객체와 관련된 삭제된 정보 항목의 경우, 대응하는 제안 이미지는 대응하는 필터를 훈련시키기 위한 부정적 샘플 이미지로서 이용될 수 있다.
본 개시내용의 실시예들에 의해 제공되는 타겟 검출 방법에서, 타겟 객체들의 각각의 타겟 분류에 대응하는 필터가 타겟 검출 여부에 기초하여 접속된다. 필터들이 이용되어 타겟 객체들의 상응하는 타겟 분류에 대한 검출 결과들을 필터링할 수 있고, 이것은 타겟 객체들의 복수의 분류에 대한 검출 결과들의 필터링을 실현할 수 있고 검출 및 필터링의 효율성을 향상시킬 수 있다.
구체적인 구현 방식에서, 본 개시내용의 실시예에 의해 제공되는 타겟 검출 방법은 게임 장소의 환경에 적용될 수 있다. 게임 장소의 타겟 검출에서, 게임과 관련된 (포커 카드들, 칩들 등의) 타겟 객체들을 높은 정확도로 검출하는 것이 바람직한 반면, 이물이라고 통칭되는 다른 객체들이 타겟 객체들로서 오검출되어 시스템 분석에 영향을 미치는 것은 바람직하지 않다.
그러나, 게임 장소에서의 타겟 검출의 문제의 경우, 전통적인 방법은 이물들에 대한 대응하는 데이터를 수집하고 대응하는 부정적 샘플의 수를 증가시켜 이물들에 대한 타겟 검출 모델의 견고성을 향상시킴으로써, 오검출을 감소시키는 것이다. 그러나, 이물들의 분류는 끝이 없을 수 있고, 게임 장소의 실제 장면에서 이물이 나타날 확률은 낮기 때문에, 이물들을 포함하는 게임 장소의 이미지들을 수집하는 비용과 어려움이 높아서, 실현하기 어렵다.
도 6에 도시된 바와 같이, 본 개시내용의 한 실시예는 게임 장소의 시나리오에서 타겟 검출 방법을 제공한다. 이 방법은 다음과 같은 단계들을 포함할 수 있으며, 여기서, 상기 실시예에서 반복되는 단계들은 반복되지 않을 것이다.
단계 600에서, 검출대상 이미지가 수신된다.
이 단계에서, 검출대상 이미지는 게임 장소 내의 카메라에 의해 촬영될 수 있는 게임 테이블의 이미지일 수 있다. 이미지는 상이한 타겟 분류의 타겟 객체들을 포함할 수 있고, 게임과 관련되지 않은 다른 객체들도 포함될 수 있다. 예를 들어, 하나 이상의 타겟 객체는, 게임 소품, 게임 소품 조작부, 게임 코인 등, 구체적으로, 포커 카드, 칩, 기호(sign) 중 적어도 하나를 포함할 수 있다.
이 실시예에서, 포커 카드 검출이 한 예로서 취해진다. 검출되고 필터링될 타겟 객체의 타겟 분류는 포커 카드이다. 다른 객체들은, 전통적인 타겟 검출 네트워크에 의해 포커 카드로서 오검출되기 쉬운, 은행 카드, 회원 카드 등의 포커 카드와 외관이 유사한 이물들일 수 있다.
단계 602에서, 타겟 검출 네트워크에 의해 검출대상 이미지에 관한 타겟 검출이 수행되어 검출 결과를 획득한다.
검출 결과는: 검출대상 이미지로부터 검출된 적어도 하나의 타겟 객체 각각이 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다.
타겟 검출 네트워크는, 타겟 검출을 위해 흔하게 이용되는 훈련된 검출 네트워크 모델, 예를 들어, Faster RCNN을 이용할 수 있다. 게임 장소의 데이터는, Faster RCNN의 훈련을 미리 완료하여 게임에서 기존 객체들에 관한 타겟 검출을 수행하는데 이용할 수 있다.
이 단계에서, 검출대상 이미지는 타겟 검출 네트워크에 입력되고, 각각의 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 대응 위치 정보가 출력될 수 있다.
예를 들어, 검출대상 이미지 내의 각각의 포커 카드 및 대응하는 위치 정보, 각각의 칩 및 대응하는 위치 정보, 각각의 기호 및 대응하는 위치 정보가 출력될 수 있다.
단계 604에서, 위치 정보에 기초하여, 타겟 객체를 포함하는 제안 이미지가 검출대상 이미지로부터 잘려 나온다.
검출대상 이미지에 포함된 타겟 객체를 포함하는 제안 이미지, 즉, 제안 이미지는 잘려 나올 수 있다. 타겟 객체의 수가 복수일 때, 각각의 제안 이미지의 개수가 획득될 수 있다.
이 실시예에서, 포커 카드만이 더 검출되고 필터링될 수 있다. 칩들 및 기호들의 경우, 타겟 검출 결과가 직접 출력된다. 이 경우, 포커 카드들에 대응하는 필터만 필요하다. 다른 실시예들에서, 칩들 및 기호들은 또한 필터링될 수 있다. 이 경우 추가 검출 및 필터링을 위해, 칩들 및 기호들에 대응하는 필터들이 필요하며, 총 3개의 필터가 필요하다. 특히, 다중 클래스 필터는 또한, 포커 카드들, 칩들, 및 기호들을 동시에 필터링하고 검출하는데 이용될 수 있다.
이 실시예에서, 포커 카드 검출이 한 예로서 취해지고, 각각의 포커 카드에 대응하는 제안 이미지는, 각각의 포커 카드에 대응하는 위치 정보에 기초하여 검출대상 이미지로부터 잘려 나올 수 있다. 위치 정보가 프레임 좌표 정보일 때, 제안 이미지는 각각의 포커 카드가 위치해 있는 프레임에 대응하는 이미지일 수 있고, 각각의 제안 이미지는 실제 포커 카드 또는 오검출된 이물을 포함할 수 있다.
단계 606에서, 타겟 객체가 포커 카드에 속한다는 신뢰도는, 포커 카드에 대응하는 필터로 제안 이미지에 관한 피처 추출을 수행함으로써 획득된 이미지 피처에 기초하여 결정된다.
이 실시예에서, 포커 카드에 대응하는 필터는 미리 훈련될 수 있다. 구체적으로, 딥러닝 기반의 분류기가 resnet 등의 필터링 모델로서 이용되어 2진 분류 작업을 구성함으로써 예비 훈련을 완료할 수 있다. 필터는 입력 사진이 포커 카드인지 여부를 결정하도록 구성된다. 훈련 동안에 요구되는 데이터 세트는: 긍정적 샘플 데이터 및 부정적 샘플 데이터를 포함한다. 긍정적 샘플 데이터는, 포커 카드의 앞면과 뒷면을 포함할 필요가 있는 포커 카드 데이터이고, 부정적 샘플 데이터는, 회원 카드, 은행 카드, 종이 조각 등의 포커 카드와 외관이 유사한 객체들에 대한 데이터이다. 2진 교차 엔트로피 손실은 필터를 훈련시키는 손실 함수로서 이용될 수 있다.
이 단계에서, 검출된 포커 카드에 대응하는 제안 이미지가 훈련된 필터에 입력되고, 필터에 의해 제안 이미지에 관한 피처 추출을 수행함으로써 이미지 피처가 획득되고, 이미지 피처에 따라 타겟 객체가 포커 카드에 속한다는 신뢰도가 출력된다. 필터는 각각의 제안 이미지가 포커 카드를 포함하는지의 신뢰도를 예측한다.
단계 608에서, 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 타겟 객체와 관련된 정보 항목이 검출 결과로부터 삭제된다.
신뢰도는 0 내지 1의 범위일 수 있고, 미리설정된 임계값은 0.5로 설정될 수 있다. 신뢰도가 0.5 미만일 때, 타겟 객체는 포커 카드로 오검출된 이물인 것으로 결정되고, 타겟 객체와 관련된 정보 항목은 포커 카드로서 검출된 객체들로부터 삭제된다; 신뢰도가 0.5보다 크거나 같으면, 타겟 객체가 실제로 포커 카드 객체인 것으로 결정된다.
오검출된 타겟 객체들이 제거되고, 시스템에 의한 후속 분석을 위해 더 높은 정확도를 갖는 검출 결과가 출력된다.
단계 610에서, 제안 이미지는 필터를 훈련시키기 위한 부정적 샘플 이미지로서 취해진다.
이전 단계로부터 삭제된 타겟 객체에 관련된 정보 항목의 경우, 대응하는 제안 이미지는 필터를 훈련시키기 위한 부정적 샘플 이미지로서 이용될 수 있다. 특히, 필터링된 제안 이미지도 역시 수동으로 다시 체크되어 이물을 포함하고 있는지를 추가로 확인할 수 있다. 만일 그렇다면, 제안 이미지가 필터의 부정적 샘플 데이터에 추가되어 필터를 지속적으로 최적화한다.
본 개시내용의 실시예들에 의해 제공되는 타겟 검출 방법에서, 필터는 전통적인 타겟 검출에 기초하여 접속되고, 타겟 검출에 의해 결정된 타겟에 대응하는 제안 이미지에 관해 피처 추출이 추가로 수행되고, 타겟 객체가 검출대상 타겟 분류에 속하는지가 신뢰도에 기초하여 효과적으로 결정되고 그 신뢰도가 미리설정된 임계값 미만인 타겟 객체들은 삭제되어 "이물들"을 필터링한다. 게임 장소에서 데이터 부하와 데이터 수집의 어려움을 증가시키지 않으면서 오검출을 감소시키고 검출 정확도를 향상시킬 수 있다. 또한, 삭제된 타겟 객체에 대응하는 제안 이미지는 필터를 훈련시키는 부정적 샘플 데이터로서 이용되어, 부정적 샘플의 수를 증가시키고 더 타겟팅된 필터를 최적화할 수 있다. 스마트 게임 장소에서, 게임 장소에 이물들이 있는지를 결정하는 것이 필요하다. 이 방법은 타겟 객체가 이물인지를 효과적으로 결정하는데 이용할 수 있어서, 필요한 필터링 및 이물들의 제거가 이루어질 수 있게 한다.
본 개시내용의 실시예들은 타겟 검출 장치를 제공한다. 도 7에 도시된 바와 같이, 이 장치는, 타겟 검출 모듈(71), 이미지 자르기 모듈(72), 신뢰도 결정 모듈(73), 및 결과 결정 모듈(74)을 포함할 수 있다.
타겟 검출 모듈(71)은, 검출대상 이미지에 관해 타겟 검출을 수행함으로써 검출 결과를 획득하도록 구성되고, 여기서, 검출 결과는, 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함한다.
이미지 자르기 모듈(72)은 위치 정보에 기초하여 검출대상 이미지로부터 타겟 객체를 포함하는 제안 이미지를 잘라 내도록 구성된다;
신뢰도 결정 모듈(73)은 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된다.
결과 결정 모듈(74)은 신뢰도가 미리설정된 임계값 미만인 것에 응답하여 타겟 객체와 관련된 정보 항목을 검출 결과로부터 삭제하도록 구성된다.
타겟 검출에 기초하여, 본 개시내용의 실시예들에 의해 제공되는 타겟 검출 장치에 의해, 타겟 객체가 타겟 분류에 속한다는 신뢰도가 타겟 검출에 의해 결정된 타겟 객체에 대응하는 제안 이미지를 통해 결정되고, 신뢰도에 기초하여 타겟 객체가 검출대상 타겟 객체의 타겟 분류에 속하는지가 효과적으로 결정된다. 신뢰도가 미리설정된 임계값 미만인 타겟 객체는 필터링 제거됨으로써, 데이터 부하를 증가시키지 않으면서 오검출을 감소시키고 검출 정확도를 향상시킨다.
한 예에서, 타겟 검출 모듈(71)은 타겟 검출 네트워크를 이용하여 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하도록 구성되고; 여기서, 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체들을 검출하도록 훈련된다.
한 예에서, 신뢰도 결정 모듈(73)은, 필터를 이용하여 제안 이미지에 관한 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성되고; 여기서, 필터는 타겟 분류의 타겟 객체를 검출하도록 훈련된다.
한 예에서, 필터는 다음을 포함하는 동작들에 의해 훈련된다: 필터로 샘플 이미지에 관한 피처 추출을 수행함으로써 이미지 피처를 추출하는 단계; 추출된 이미지 피처에 기초하여, 샘플 이미지가 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도를 결정하는 단계 ― 샘플 이미지는 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지 및 타겟 분류에 속하지 않는 간섭 객체를 포함하는 부정적 샘플 이미지를 포함함 ―; 신뢰도 및 객체 샘플 이미지의 라벨링된 분류에 기초하여 네트워크 손실을 결정하는 단계; 네트워크 손실에 기초하여 필터의 네트워크 파라미터를 조정하는 단계.
한 예에서, 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고, 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 타겟 객체의 미리설정된 디스플레이 상태에 대응한다.
한 예에서, 타겟 객체는 마킹 면 및 마킹 면에 대향하는 또 다른 면을 갖는 칩형 객체를 포함하고; 긍정적 샘플 이미지들의 적어도 2개의 분류는: 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지, 또는 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 갖는 칩형 객체를 포함하는 이미지를 포함한다.
한 예에서, 결과 결정 모듈(74)은: 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 필터를 훈련시키기 위해 제안 이미지를 부정적 샘플 이미지로서 취하도록 구성된다.
한 예에서, 검출대상 이미지로부터 하나 이상의 타겟 객체가 검출된 경우, 하나 이상의 타겟 객체 각각에 대해, 검출 결과는: 타겟 객체가 속하는 타겟 분류 및 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함하고; 신뢰도 결정 모듈은: 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 타겟 객체를 포함하는 제안 이미지에 기초하여 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된다.
본 개시내용의 실시예들 중 임의의 것을 참조하여, 검출대상 이미지는 게임 테이블의 이미지를 포함하고, 하나 이상의 타겟 객체는 게임 소품, 게임 소품 조작부, 및 게임 코인 중 적어도 하나를 포함한다.
본 개시내용의 임의의 실시예를 참조하여, 결과 결정 모듈(74)은 신뢰도가 미리설정된 임계값 이상인 것에 응답하여 검출 결과를 저장하도록 추가로 구성된다.
상기 장치 내의 각각의 모듈의 기능들 및 역할들의 구현 프로세스에 대해, 그 상세사항은 상기의 방법에서의 대응하는 단계들의 구현 프로세스를 참조하고, 여기서는 반복되지 않을 것이다.
본 개시내용의 한 실시예는 또한, 전자 디바이스를 제공한다. 이 디바이스는, 메모리(81), 프로세서(82)를 포함하며, 여기서 메모리(81)는 프로세서(82)에서 실행될 수 있는 컴퓨터 판독가능한 명령어들을 저장하도록 구성되며 명령어들이 프로세서(82)에 의해 실행될 때, 본 개시내용의 실시예들 중 임의의 것에서 설명된 타겟 검출 방법이 구현된다.
본 개시내용의 한 실시예는 또한 컴퓨터 프로그램(들)/명령어들을 포함하는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 프로그램(들)/명령어들이 프로세서에서 실행될 때, 본 개시내용의 실시예들 중 임의의 것에서 설명된 타겟 검출 방법이 구현된다.
본 개시내용의 한 실시예는 또한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능한 저장 매체를 제공하고, 컴퓨터 프로그램이 프로세서에 의해 실행될 때, 본 개시내용의 실시예들 중 임의의 것에서 설명된 타겟 검출 방법이 구현된다.
장치 예들은 실질적으로 방법 예들에 대응하므로, 관련 부분에 대해서는 방법 예들의 설명의 일부를 참조할 수 있다. 전술된 장치 예들은 단지 예시일 뿐이고, 별도의 부재들로서 설명된 모듈들은 물리적으로 분리되거나 분리되지 않을 수 있으며, 모듈들로서 디스플레이된 부재들은 물리적 유닛들일 수도 있고 아닐 수도 있다, 즉, 한 장소에 위치하거나, 복수의 네트워크 모듈에 분산될 수도 있다. 모듈들의 일부 또는 전체는 본 개시내용의 솔루션들의 목적들을 구현하기 위한 실제 요건들에 따라 선택될 수 있다. 본 기술분야의 통상의 기술자라면, 창작 작업 없이 이들을 이해하고 실행할 수 있을 것이다.
상기 내용은 본 명세서의 특정한 실시예들을 설명한다. 다른 실시예들은 첨부된 청구항들의 범위 내에 있다. 일부 경우에, 청구항들에서 설명된 동작들 또는 단계들은 실시예들과는 상이한 순서로 수행될 수 있으며 여전히 원하는 결과들을 달성할 수 있다. 더욱이, 도면들에 도시된 프로세스들은 원하는 결과들을 달성하기 위해 도시된 특정한 순서 또는 순서를 반드시 요구하는 것은 아니다. 일부 구현에서는 멀티태스킹 및 병렬 처리가 유리할 수 있다.
본 개시내용의 다른 구현들은 본 개시내용의 고려 및 여기서의 본 개시내용의 실시로부터 본 기술분야의 통상의 기술자에게 명백할 것이다. 본 개시내용은, 본 개시내용의 일반적인 원리들을 따르고 본 개시내용에서 있지 않은 플로차트가 의도된 관련 기술에서의 통상적인 지식 또는 통상적인 기술 수단을 포함하는 본 개시내용의 임의의 변형, 이용법, 수정 또는 적합화를 포괄하도록 의도한 것이다. 본 개시내용 및 실시예들은 단지 예시적인 것으로 간주되며, 본 개시내용의 진정한 범위 및 사상은 이하의 청구항들에 의해 표시되는 것으로 의도한다.
본 개시내용은 정확히 전술되고 첨부된 도면들에 도시된 구조로 제한되지 않으며, 그 범위를 벗어나지 않고 다양한 수정 및 변경이 이루어질 수 있다는 것을 이해해야 한다. 본 개시내용의 보호 범위는 첨부된 청구항들에 의해서만 제한된다.
상기의 설명은 본 개시내용의 바람직한 예들일 뿐이고, 본 개시내용을 제한하려는 의도가 아니며, 본 개시내용의 사상 및 원리들 내에서 이루어진 임의의 수정, 균등물들, 개선들 등은 본 개시내용의 범위에 포함되어야 한다.

Claims (21)

  1. 타겟 검출 방법으로서,
    검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계 ― 상기 검출 결과는 상기 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 상기 검출대상 이미지에 포함된 상기 타겟 객체에 대응하는 위치 정보를 포함함 ―;
    상기 위치 정보에 기초하여 상기 검출대상 이미지로부터 상기 타겟 객체를 포함하는 제안 이미지를 잘라내는 단계;
    상기 제안 이미지에 기초하여 상기 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계; 및
    상기 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 상기 타겟 객체와 관련된 정보 항목을 상기 검출 결과로부터 삭제하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서, 상기 검출대상 이미지에 관한 타겟 검출을 수행함으로써 검출 결과를 획득하는 단계는,
    타겟 검출 네트워크를 이용하여 상기 검출대상 이미지에 관한 타겟 검출을 수행함으로써 상기 검출 결과를 획득하는 단계를 포함하고,
    상기 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체들을 검출하도록 훈련되는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 제안 이미지에 기초하여 상기 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하는 단계는,
    필터로 상기 제안 이미지에 관한 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 상기 타겟 객체가 상기 타겟 분류에 속한다는 신뢰도를 결정하는 단계를 포함하고,
    상기 필터는 상기 타겟 분류의 타겟 객체를 검출하도록 훈련되는, 방법.
  4. 제3항에 있어서, 상기 필터는 동작들에 의해 훈련되고, 상기 동작들은,
    상기 필터로 샘플 이미지에 관한 상기 피처 추출을 수행함으로써 이미지 피처를 추출하는 단계;
    상기 추출된 이미지 피처에 기초하여, 상기 샘플 이미지가 상기 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도를 결정하는 단계 ― 상기 샘플 이미지는,
    상기 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지, 및
    상기 타겟 분류에 속하지 않는 간섭 객체를 포함하는 부정적 샘플 이미지
    를 포함함 ―;
    상기 샘플 이미지의 상기 신뢰도 및 상기 라벨링된 분류에 기초하여 네트워크 손실을 결정하는 단계; 및
    상기 네트워크 손실에 기초하여 상기 필터의 네트워크 파라미터를 조정하는 단계
    를 포함하는, 방법.
  5. 제4항에 있어서,
    상기 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고,
    상기 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 상기 타겟 객체의 미리설정된 디스플레이 상태에 대응하는, 방법.
  6. 제5항에 있어서,
    상기 타겟 객체는 마킹 면(marking side) 및 상기 마킹 면에 대향하는 또 다른 면을 갖는 칩형 객체를 포함하고;
    상기 긍정적 샘플 이미지들의 적어도 2개의 분류는:
    상기 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 가진 상기 칩형 객체를 포함하는 이미지, 또는
    상기 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 가진 상기 칩형 객체를 포함하는 이미지
    를 포함하는, 방법.
  7. 제3항 내지 제6항 중 어느 한 항에 있어서,
    상기 신뢰도가 상기 미리설정된 임계값보다 작은 것에 응답하여, 상기 제안 이미지를 상기 필터를 훈련시키는 부정적 샘플 이미지로서 취하는 단계를 더 포함하는, 방법.
  8. 제1항 또는 제2항에 있어서, 상기 검출대상 이미지로부터 하나 이상의 타겟 객체가 검출되는 경우, 상기 하나 이상의 타겟 객체 각각에 대해,
    상기 검출 결과는 상기 타겟 객체가 속하는 타겟 분류, 및 상기 검출대상 이미지에 포함된 상기 타겟 객체에 대응하는 위치 정보를 포함하고;
    상기 제안 이미지에 기초하여 상기 타겟 객체가 상기 타겟 분류에 속한다는 신뢰도를 결정하는 단계는, 상기 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 상기 타겟 객체를 포함하는 상기 제안 이미지에 기초하여 상기 타겟 객체가 상기 타겟 분류에 속한다는 신뢰도를 결정하는 단계를 포함하는, 방법.
  9. 제8항에 있어서,
    상기 검출대상 이미지는 게임 테이블의 이미지를 포함하고,
    상기 하나 이상의 타겟 객체는 게임 소품, 게임 소품 조작부, 및 게임 코인 중 적어도 하나를 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 신뢰도가 상기 미리설정된 임계값보다 크거나 같은 것에 응답하여, 상기 검출 결과를 저장하는 단계를 더 포함하는, 방법.
  11. 타겟 검출 장치로서,
    검출대상 이미지에 관해 타겟 검출을 수행함으로써 검출 결과를 획득하도록 구성된 타겟 검출 모듈 ― 상기 검출 결과는 상기 검출대상 이미지에 포함된 타겟 객체가 속하는 타겟 분류, 및 상기 검출대상 이미지에 포함된 타겟 객체에 대응하는 위치 정보를 포함함 ―;
    상기 위치 정보에 기초하여 상기 검출대상 이미지로부터 상기 타겟 객체를 포함하는 제안 이미지를 잘라내도록 구성된 이미지 자르기 모듈;
    상기 제안 이미지에 기초하여 상기 타겟 객체가 타겟 분류에 속한다는 신뢰도를 결정하도록 구성된 신뢰도 결정 모듈; 및
    상기 신뢰도가 미리설정된 임계값 미만인 것에 응답하여, 상기 타겟 객체와 관련된 정보 항목을 상기 검출 결과로부터 삭제하도록 구성된 결과 결정 모듈
    을 포함하는, 장치.
  12. 제11항에 있어서,
    상기 타겟 검출 모듈은 타겟 검출 네트워크를 이용하여 상기 검출대상 이미지에 관한 타겟 검출을 수행함으로써 상기 검출 결과를 획득하도록 구성되고,
    상기 타겟 검출 네트워크는 복수의 분류 각각의 상응하는 타겟 객체들을 검출하도록 훈련되는, 장치.
  13. 제11항 또는 제12항에 있어서,
    상기 신뢰도 결정 모듈은 필터로 상기 제안 이미지에 관한 피처 추출을 수행함으로써 추출된 이미지 피처에 기초하여 상기 타겟 객체가 상기 타겟 분류에 속한다는 신뢰도를 결정하도록 구성되고,
    상기 필터는 상기 타겟 분류의 타겟 객체를 검출하도록 훈련되는, 장치.
  14. 제13항에 있어서, 상기 필터는 동작들에 의해 훈련되고, 상기 동작들은,
    상기 필터로 샘플 이미지에 관한 상기 피처 추출을 수행함으로써 이미지 피처를 추출하는 단계;
    상기 추출된 이미지 피처에 기초하여, 상기 샘플 이미지가 상기 샘플 이미지의 라벨링된 분류에 속한다는 신뢰도를 결정하는 단계 ― 상기 샘플 이미지는 상기 타겟 분류의 타겟 객체를 포함하는 긍정적 샘플 이미지, 및 상기 타겟 분류에 속하지 않는 간섭 객체를 포함하는 부정적 샘플 이미지를 포함함 ―;
    상기 샘플 이미지의 상기 신뢰도 및 상기 라벨링된 분류에 기초하여 네트워크 손실을 결정하는 단계; 및
    상기 네트워크 손실에 기초하여 상기 필터의 네트워크 파라미터를 조정하는 단계
    를 포함하는, 장치.
  15. 제14항에 있어서, 상기 샘플 이미지는 긍정적 샘플 이미지들의 적어도 2개의 분류를 포함하고, 상기 긍정적 샘플 이미지들의 적어도 2개의 분류 각각은 상기 타겟 객체 칩형 객체의 미리설정된 디스플레이 상태에 대응하는, 장치.
  16. 제15항에 있어서, 상기 타겟 객체는 마킹 면 및 상기 마킹 면에 대향하는 또 다른 면을 갖는 칩형 객체를 포함하고;
    상기 긍정적 샘플 이미지들의 상기 적어도 2개의 분류는: 상기 칩형 객체의 마킹 면이 보이는 제1 디스플레이 상태를 가진 상기 칩형 객체를 포함하는 이미지, 또는 상기 칩형 객체의 마킹 면이 보이지 않는 제2 디스플레이 상태를 가진 상기 칩형 객체를 포함하는 이미지를 포함하는, 장치.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 결과 결정 모듈은:
    상기 신뢰도가 상기 미리설정된 임계값보다 작은 것에 응답하여, 상기 제안 이미지를 상기 필터를 훈련시키는 부정적 샘플 이미지로서 취하도록 구성되는, 장치.
  18. 제11항 또는 제12항에 있어서, 상기 검출대상 이미지로부터 하나 이상의 타겟 객체가 검출되는 경우, 상기 하나 이상의 타겟 객체 각각에 대해,
    상기 검출 결과는 상기 타겟 객체가 속하는 타겟 분류, 및 상기 검출대상 이미지에 포함된 상기 타겟 객체에 대응하는 위치 정보를 포함하고;
    상기 신뢰도 결정 모듈은, 상기 타겟 객체가 속하는 타겟 분류에 대응하는 필터를 이용하여, 상기 타겟 객체를 포함하는 상기 제안 이미지에 기초하여 상기 타겟 객체가 상기 타겟 분류에 속한다는 신뢰도를 결정하도록 구성되는, 장치.
  19. 메모리, 및 프로세서를 포함하는 전자 디바이스로서, 상기 메모리는 컴퓨터 판독가능한 명령어들을 저장하도록 구성되고 상기 프로세서는 제1항 내지 제10항 중 어느 한 항에 따른 방법을 구현하기 위해 상기 명령어들을 호출하도록 구성되는, 전자 디바이스.
  20. 컴퓨터 프로그램이 저장된 컴퓨터 판독가능한 저장 매체로서, 상기 컴퓨터 프로그램이 프로세서에 의해 실행되는 경우, 제1항 내지 제10항 중 어느 한 항에 따른 방법이 구현되는, 컴퓨터 판독가능한 저장 매체.
  21. 컴퓨터 프로그램들/명령어들을 포함하는 컴퓨터 프로그램 제품으로서, 상기 컴퓨터 프로그램들/명령어들이 프로세서에서 실행될 때, 제1항 내지 제10항 중 어느 한 항에 따른 방법이 구현되는, 컴퓨터 프로그램 제품.
KR1020217026796A 2021-06-17 2021-06-25 타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체 KR20220169373A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10202106559T 2021-06-17
SG10202106559T 2021-06-17
PCT/IB2021/055671 WO2022263904A1 (en) 2021-06-17 2021-06-25 Target detection methods, apparatuses, electronic devices and computer-readable storage media

Publications (1)

Publication Number Publication Date
KR20220169373A true KR20220169373A (ko) 2022-12-27

Family

ID=77819459

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217026796A KR20220169373A (ko) 2021-06-17 2021-06-25 타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체

Country Status (4)

Country Link
US (1) US20220405527A1 (ko)
KR (1) KR20220169373A (ko)
CN (1) CN113454649B (ko)
AU (1) AU2021204563A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152692B (zh) * 2023-10-30 2024-02-23 中国市政工程西南设计研究总院有限公司 基于视频监控的交通目标检测方法及***

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477631B (zh) * 2009-01-20 2011-01-19 深圳先进技术研究院 图像中提取目标的方法、设备及人机交互***
US9928410B2 (en) * 2014-11-24 2018-03-27 Samsung Electronics Co., Ltd. Method and apparatus for recognizing object, and method and apparatus for training recognizer
US9524450B2 (en) * 2015-03-04 2016-12-20 Accenture Global Services Limited Digital image processing using convolutional neural networks
KR101848019B1 (ko) * 2016-12-27 2018-04-11 아주대학교산학협력단 차량 영역 검출을 통한 차량 번호판 검출 방법 및 장치
CN108229267B (zh) * 2016-12-29 2020-10-16 北京市商汤科技开发有限公司 对象属性检测、神经网络训练、区域检测方法和装置
CN108229526B (zh) * 2017-06-16 2020-09-29 北京市商汤科技开发有限公司 网络训练、图像处理方法、装置、存储介质和电子设备
DE102017210316A1 (de) * 2017-06-20 2018-12-20 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zum Erfassen einer Nutzereingabe anhand einer Geste
US10628961B2 (en) * 2017-10-13 2020-04-21 Qualcomm Incorporated Object tracking for neural network systems
CN109871730A (zh) * 2017-12-05 2019-06-11 杭州海康威视数字技术股份有限公司 一种目标识别方法、装置及监控设备
CN109558779A (zh) * 2018-07-06 2019-04-02 北京字节跳动网络技术有限公司 图像检测方法和装置
US11030768B2 (en) * 2018-10-30 2021-06-08 Ncr Corporation Image processing for occluded item recognition
CN110852285B (zh) * 2019-11-14 2023-04-18 腾讯科技(深圳)有限公司 对象检测方法、装置、计算机设备和存储介质
CN110968718B (zh) * 2019-11-19 2023-07-14 北京百度网讯科技有限公司 目标检测模型负样本挖掘方法、装置及电子设备
CN111091091A (zh) * 2019-12-16 2020-05-01 北京迈格威科技有限公司 目标对象重识别特征的提取方法、装置、设备及存储介质
CN111368923B (zh) * 2020-03-05 2023-12-19 上海商汤智能科技有限公司 神经网络训练方法及装置、电子设备和存储介质
RU2748763C1 (ru) * 2020-08-31 2021-05-31 Владимир Юрьевич Лупанчук Способ обнаружения и автосопровождения объектов целеуказания оптико-электронной системой беспилотного летательного аппарата
CN112734641B (zh) * 2020-12-31 2024-05-31 百果园技术(新加坡)有限公司 目标检测模型的训练方法、装置、计算机设备及介质
CN112884055B (zh) * 2021-03-03 2023-02-03 歌尔股份有限公司 一种目标标注方法和一种目标标注装置
CN112926673B (zh) * 2021-03-17 2023-01-17 清华大学深圳国际研究生院 一种基于一致性约束的半监督目标检测方法

Also Published As

Publication number Publication date
CN113454649A (zh) 2021-09-28
CN113454649B (zh) 2024-05-24
US20220405527A1 (en) 2022-12-22
AU2021204563A1 (en) 2023-01-19

Similar Documents

Publication Publication Date Title
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
EP3493101B1 (en) Image recognition method, terminal, and nonvolatile storage medium
CN107153817B (zh) 行人重识别数据标注方法和装置
CN111382704B (zh) 基于深度学习的车辆压线违章判断方法、装置及存储介质
JP5775225B2 (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
CN103679187B (zh) 图像识别方法和***
CN106203539B (zh) 识别集装箱箱号的方法和装置
CN106295502A (zh) 一种人脸检测方法及装置
CN111445459A (zh) 一种基于深度孪生网络的图像缺陷检测方法及***
CN111639653B (zh) 一种误检图像确定方法、装置、设备和介质
CN111414888A (zh) 低分辨率人脸识别方法、***、装置及存储介质
CN105868708A (zh) 一种图像目标识别方法及装置
CN111881741B (zh) 车牌识别方法、装置、计算机设备和计算机可读存储介质
CN111814690B (zh) 一种目标重识别方法、装置和计算机可读存储介质
CN115239644B (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN111753682A (zh) 一种基于目标检测算法的吊装区域动态监控方法
CN107704797A (zh) 基于安防视频中行人和车辆的实时检测方法和***及设备
CN111415373A (zh) 基于孪生卷积网络的目标跟踪与分割方法、***及介质
CN115062186A (zh) 一种视频内容检索方法、装置、设备以及存储介质
Ganapathy et al. A Malaysian vehicle license plate localization and recognition system
CN110619255B (zh) 一种目标检测方法及其装置
KR20220169373A (ko) 타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체
CN112241736A (zh) 一种文本检测的方法及装置
CN111382638A (zh) 一种图像检测方法、装置、设备和存储介质
CN113378837A (zh) 车牌遮挡识别方法、装置、电子设备和存储介质