JP2019531547A - 視覚検索クエリによるオブジェクト検出 - Google Patents
視覚検索クエリによるオブジェクト検出 Download PDFInfo
- Publication number
- JP2019531547A JP2019531547A JP2019513057A JP2019513057A JP2019531547A JP 2019531547 A JP2019531547 A JP 2019531547A JP 2019513057 A JP2019513057 A JP 2019513057A JP 2019513057 A JP2019513057 A JP 2019513057A JP 2019531547 A JP2019531547 A JP 2019531547A
- Authority
- JP
- Japan
- Prior art keywords
- objects
- video
- database
- product
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims description 46
- 238000001514 detection method Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 230000001737 promoting effect Effects 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 239000013598 vector Substances 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 9
- 235000014510 cooky Nutrition 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
- G06Q30/0643—Graphical representation of items or shoppers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47815—Electronic shopping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/858—Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
Abstract
Description
本発明は、インターネット販売のためのコンピュータ技術に関し、特に、映像をセグメントに分割し、セグメント内のオブジェクトを識別し、製品をオブジェクトと照合するためのコンピュータネットワークアプリケーションに関する。
に関する。
[背景技術]
Eコマース(電子商取引、E-Commerce)は、オンラインで売買する取引である。Eコマースは、顧客に販売するだけでなく、顧客の関心を引く、世界中の中小企業および大企業にとって重要なツールとなっている。2012年には、電子商取引の世界における売上高は1兆ドルを上回った。
[導入]
本発明は、映像内のオブジェクトを検出し、1または複数の製品とオブジェクトとを照合させる方法であって、以下の、(a)映像を取得するステップと、(b)類似点および相違点に関して、連続するフレームのコンテンツを比較して、描写された情景(setting)および/またはイベントに基づいて映像をセグメント化するステップと、(c)同一または類似の情景および/またはイベントのセグメントをコンパイルするステップと、(d)映像の1または複数のフレームを分析し、同一または類似の情景および/またはイベントの各セグメントからの1または複数のオブジェクトを検出するステップと、(e)データベース内の製品と1または複数のオブジェクトとを比較するステップと、(f)1または複数のオブジェクトに関連する製品を識別するステップと、(g)製品を1または複数の閲覧者に通知するステップと、を含む方法。
[発明の概要]
本発明の第1の態様は、ユーザーの視覚クエリと、オブジェクトデータベースのコーパス内から検出されたオブジェクトとの間の関連を生成するシステムである。
[図面の簡単な説明]
図1は、本発明の一実施形態の全処理の流れを示す。
[発明の詳細な説明]
[定義]
本明細書において、「一実施形態/一態様」または「ある実施形態/ある態様」の参照は、実施形態/態様に関連して説明された特定の機能、構成、または特徴が、本発明の少なくとも一つの実施形態/態様に含まれることを意味する。明細書の種々の箇所における「一実施形態/一態様において」または「別の実施形態/別の態様において」という語句の使用は、必ずしもすべてが同じ実施形態/態様を参照しているとは限らず、また他の実施形態/態様と相互に排他的な個々のまたは代替の実施形態/態様を必ずしも参照しているとは限らない。さらに、種々の特徴がいくつかの実施形態/態様によって提示され得るが、他の実施形態によっては提示され得ないことも有り得る。同様に、種々の要件がいくつかの実施形態/態様において要件であると説明されても、他の実施形態/態様においては要件ではないと説明されることもある。実施形態および態様は、場合によっては、相互に交換して使用することもできる。
[リンク解析]
「モジュール」という用語は、自己完結型のユニットを意味し、例えば、電子部品およびそれに関連する配線の組み立て品、または、それ自身が定義されたタスクを実行し、より大きなシステムを形成するために別の上記ユニットとリンク可能な、コンピュータソフトウェアのセグメントを意味する。
[好ましい実施形態の説明]
これらの非限定的な実施例において議論される特定の値および構成は、変更可能で、そして単に少なくとも一つの実施形態を例示するために引用されるだけで、その範囲を限定することを意図してはいない。
[時間分析]
時間分析手段200に含まれるステップを図2に示す。メディアコンテンツをセグメント化するために、映像110がフレームワークに取り込まれ、時間的フレームのシーケンスが分析される。このセグメント化の目的は、各セグメントが単一のイベントまたは単一の見出しに対応するように、フレームシーケンスを識別し、分離し、タグ付けすることである。その結果、セグメントがオブジェクトのために分析され得る。
[オブジェクト検出]
時間分析によって識別されたキーフレームは、個々のオブジェクトを認識し、識別するために分析され得る。一実施形態では、深層畳み込みニューラルネットワーク(CNN)が、このタスクを実行するために使用され得る。
[視覚検索]
ユーザーが特定の映像との相互作用を望む場合、彼または彼女は、「アプリケーション」と呼ばれる、ユーザーの携帯機器上で通常動作するコンピュータプログラム内から、携帯用カメラ機器を使用してフレームを撮影することにより、彼らの興味を示すことができる。アプリケーションにより、更なる処理のためのクエリ画像をアップロードすることができる。
[オフラインデータの拡張]
ウェブクローラによって取得されるような、定義されていない画像も、コンテントデータベースに入力するために利用され得る。図4は、オフライン製品データの拡張方法(400)を示す。例示のフレームワークにおいて、オフラインデータの拡張が、オブジェクトおよび関連するメタデータのデータベース170に入力するために使用される。
[ユースケース]
[製品の推薦]
本発明は、既存の視覚的メディアコンテンツに対してセカンドスクリーンのコンテンツ拡張サービスを促進させるために使用され得る。
[ライブテレビセカンドスクリーン]
オフライン、既存のコンテンツに加え、ライブ映像ストリームを処理するためのフレームワークが拡張され得る。本実施例の上記方法により、オブジェクト検出プラットフォームに送信されるフレームの各々に対して、同じフレームの任意の問い合わせより前に、取り込みメカニズムを確実に実行することができる。
−選手の経歴および/または試合成績を表示する生中継のスポーツイベント。
−ニュース速報等において検出されたオブジェクトおよび/または位置に対して情報グラフィックスを表示するライブニュース放送。
−検出された製品の価格の比較を表示するテレマーケティング放送。
[オンラインショッピングのための本発明の使用]
図6に示すように、映像110の視聴者は、彼または彼女が見つけた製品に関する追加情報を、映像110のスクリーンショットにより照会することができる。この実施例600では、視聴者はテレビでドラマを見ている。視聴者は、ある役者が特定のシャツを着ていることに気付く。視聴者は、システム120に送信するためのスクリーンショットを撮影することができる。テレビ視聴では、アプリを用いて画面の写真を撮影することが可能である。視聴者が、携帯機器、タブレット、またはコンピュータに映像をストリーミングしている場合、彼または彼女は、スクリーンショットを撮影し送信することができる。静止写真の画像(雑誌広告など)も送信可能である。
[動作環境]
システムは、通常、データネットワークによってユーザーのコンピュータに接続された中央サーバから構成されている。中央サーバは、1または複数の大容量記憶装置に接続された、1または複数のコンピュータから構成されてもよい。中央サーバの正確な構造は、特許請求の範囲を限定するものではない。さらに、ユーザーのコンピュータは、ラップトップ型またはデスクトップ型のパソコンであってもよく、また、携帯電話、スマートフォン、またはタブレットを含む他の携帯端末であってもよい。ユーザーのコンピュータの要素の正確な構成要素は、特許請求の範囲を限定するものではない。使用に最適な周知のコンピュータシステム、環境、および/または構成の例は、パソコン、サーバコンピュータ、ハンドヘルドコンピュータ、ラップトップコンピュータ、あるいは携帯コンピュータ、または携帯電話およびPDAなどの通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル家電、ネットワークPC、小型コンピュータ、メインフレームコンピュータ等の、システムまたはデバイスを含む分散型コンピュータ環境などを含むが、これらに限定されない。ユーザーのコンピュータの正確な構成要素は、特許請求の範囲を限定するものではない。一実施形態では、ユーザーのコンピュータは省略され、代わりに、中央サーバと協働する個別の計算機能が提供される。その場合、ユーザーは、別のコンピュータからサーバにログインし、ユーザー環境を介してシステムにアクセスすることになる。
Claims (19)
- 映像中のオブジェクトを検出し、オブジェクトを1または複数の製品と照合する方法であって、
a)映像を取得するステップと、
b)類似点および相違点に関して、連続するフレームのコンテンツを比較して、描写された情景およびイベントの少なくともいずれかに基づいて映像をセグメント化するステップと、
c)同一または類似の情景およびイベントの少なくともいずれかのセグメントをコンパイルするステップと、
d)1または複数のセグメントを分析し、1または複数のオブジェクトを検出するステップと、
e)前記1または複数のオブジェクトを製品と比較するステップと、
f)前記1または複数のオブジェクトに関連する製品を特定するステップと、
g)1または複数の視聴者に前記製品を通知するステップと、を含むことを特徴とする方法。 - 畳み込みニューラルネットワーク(CNN)が、前記1または複数のオブジェクトに関連付けられた製品を識別するために使用されることを特徴とする、請求項1に記載の方法。
- 1または複数のセグメントを分析し、前記1または複数のオブジェクトを検出する前記ステップは、フレームおよびフレームの一部の少なくともいずれかを、データベース内の既定のコンテンツと比較するステップを含むことを特徴とする、請求項1に記載の方法。
- 前記データベースは、ウェブクローラを使用して既定のコンテンツが入力されることを特徴とする、請求項3に記載の方法。
- 前記データベースは、既知のオブジェクトおよびメタデータクラスタをアラインすることによって、既定のコンテンツが入力されることを特徴とする、請求項3に記載の方法。
- セカンドスクリーンのコンテンツ拡張は、ライブ映像またはストリーミング映像のために使用されることを特徴とする、請求項1に記載の方法。
- 1または複数の視聴者に前記製品を通知する前記ステップは、広告を表示するステップを含むことを特徴とする、請求項1に記載の方法。
- 1または複数の視聴者に前記製品を通知する前記ステップは、ウェブサイトまたは映像へハイパーリンクを提供するステップを含むことを特徴とする、請求項1に記載の方法。
- スクリーンショットにおける1または複数のオブジェクトを検出し、前記1または複数のオブジェクトを販売促進物と照合する方法であって、
a)視聴者からの問い合わせを、デジタルスクリーンショットの形式で受信するステップと、
b)前記スクリーンショットにおける1または複数のオブジェクトを識別するステップと、
c)前記1または複数のオブジェクトを製品と比較するステップと、
d)前記1または複数のオブジェクトに関連付けられた製品を照合するステップと、
e)前記視聴者に、照合された製品に関する販売促進物を連絡するステップと、を含むことを特徴とする方法。 - 前記1または複数のオブジェクトに関連付けられた製品を照合する前記ステップにおいて、畳み込みニューラルネットワーク(CNN)が使用されることを特徴とする、請求項9に記載の方法。
- 前記スクリーンショット内の1または複数のオブジェクトを識別する前記ステップは、前記スクリーンショットおよび前記スクリーンショットの一部の少なくともいずれかを、データベース内の既定のコンテンツと比較するステップを含むことを特徴とする、請求項9に記載の方法。
- 前記データベースは、ウェブクローラを使用して既定のコンテンツが入力されることを特徴とする、請求項11に記載の方法。
- 前記データベースは、既知のオブジェクトおよびメタデータクラスタをアラインさせることによって、既定のコンテンツが入力されることを特徴とする、請求項11に記載の方法。
- セカンドスクリーンのコンテンツ拡張を、ライブ映像またはストリーミング映像のために使用することを特徴とする、請求項9に記載の方法。
- 前記視聴者に、前記照合された製品に関連付けられた販売促進物を連絡する前記ステップは、宣伝を表示するステップ、および、ウェブサイトもしくは映像へのハイパーリンクを提供するステップの少なくともいずれかを含むことを特徴とする、請求項9に記載の方法。
- 映像中のオブジェクトと製品のデータベース中の製品との間の関連を生成するためのシステムであって、
ユーザーインターフェースアプリケーションを介してユーザーまたはユーザーグループにローカルまたはリモートで接続されるコンピュータネットワークおよびコンピュータシステムと、
メディアコンテンツをローカルまたはサーバ上で検出および記憶するモジュールと、
メタデータおよび視覚的特徴の少なくともいずれかを取り込むために、リモートまたはサーバベースのプロセッサに前記メディアコンテンツを送信するモジュールと、
メタデータおよび視覚的特徴の少なくともいずれかを抽出するために、リモートまたはサーバベースのプロセッサに前記メディアコンテンツを送信するモジュールと、
視覚的特徴を含むデジタル画像の形式で1または複数のユーザーからの入力を受信する装置と、
前記視覚的特徴を識別し、前記視覚的特徴を前記データベース内のオブジェクトおよび関連製品のグループの少なくともいずれかと関連付けるように構成されたモジュールと、
前記オブジェクトおよび関連製品のグループの少なくともいずれかに関する情報を、ユーザーおよびユーザーのグループの少なくともいずれかに配信するネットワークサービスと、を含むことを特徴とするシステム。 - 畳み込みニューラルネットワーク(CNN)が、視覚的特徴およびメタデータを分析し、前記視覚的特徴をオブジェクトおよび関連製品のグループの少なくともいずれかと関連付けることに使用されることを特徴とする、請求項16に記載のシステム。
- 前記オブジェクトおよび関連製品のグループの少なくともいずれかについての前記情報は、広告を含むことを特徴とする、請求項16に記載のシステム。
- 前記オブジェクトおよび関連製品のグループの少なくともいずれかについての前記情報は、前記インターネットを通じてアクセス可能なハイパーリンクまたはコンテンツを含むことを特徴とする、請求項16に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662384855P | 2016-09-08 | 2016-09-08 | |
US62/384,855 | 2016-09-08 | ||
PCT/SG2017/050449 WO2018048355A1 (en) | 2016-09-08 | 2017-09-07 | Object detection from visual search queries |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019531547A true JP2019531547A (ja) | 2019-10-31 |
JP2019531547A5 JP2019531547A5 (ja) | 2020-02-27 |
Family
ID=61562210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019513057A Pending JP2019531547A (ja) | 2016-09-08 | 2017-09-07 | 視覚検索クエリによるオブジェクト検出 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10769444B2 (ja) |
EP (1) | EP3472755A4 (ja) |
JP (1) | JP2019531547A (ja) |
KR (1) | KR20190052028A (ja) |
CN (1) | CN109906455A (ja) |
MY (1) | MY198128A (ja) |
RU (1) | RU2729956C2 (ja) |
SG (1) | SG11201809634TA (ja) |
WO (1) | WO2018048355A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9940670B2 (en) * | 2009-12-10 | 2018-04-10 | Royal Bank Of Canada | Synchronized processing of data by networked computing resources |
WO2011069234A1 (en) | 2009-12-10 | 2011-06-16 | Royal Bank Of Canada | Synchronized processing of data by networked computing resources |
KR102114701B1 (ko) * | 2011-01-18 | 2020-05-25 | 에이치에스엔아이 엘엘씨 | 미디어 데이터에 있는 아이템을 인식하고 이와 관련된 정보를 전달하기 위한 시스템 및 방법 |
US10939182B2 (en) * | 2018-01-31 | 2021-03-02 | WowYow, Inc. | Methods and apparatus for media search, characterization, and augmented reality provision |
US10814235B2 (en) * | 2018-02-08 | 2020-10-27 | Sony Interactive Entertainment Inc. | Vector-space framework for evaluating gameplay content in a game environment |
US11275833B2 (en) * | 2018-05-10 | 2022-03-15 | Endgame, Inc. | System and method for detecting a malicious file using image analysis prior to execution of the file |
US11605227B2 (en) * | 2018-09-04 | 2023-03-14 | Pandoodle Corporation | Method and system for dynamically analyzing, modifying, and distributing digital images and video |
WO2020064988A1 (en) * | 2018-09-27 | 2020-04-02 | Deepmind Technologies Limited | Scalable and compressive neural network data storage system |
US11080358B2 (en) | 2019-05-03 | 2021-08-03 | Microsoft Technology Licensing, Llc | Collaboration and sharing of curated web data from an integrated browser experience |
US11386144B2 (en) * | 2019-09-09 | 2022-07-12 | Adobe Inc. | Identifying digital attributes from multiple attribute groups within target digital images utilizing a deep cognitive attribution neural network |
US10963702B1 (en) * | 2019-09-10 | 2021-03-30 | Huawei Technologies Co., Ltd. | Method and system for video segmentation |
US11049176B1 (en) | 2020-01-10 | 2021-06-29 | House Of Skye Ltd | Systems/methods for identifying products within audio-visual content and enabling seamless purchasing of such identified products by viewers/users of the audio-visual content |
CN111259843B (zh) * | 2020-01-21 | 2021-09-03 | 敬科(深圳)机器人科技有限公司 | 基于视觉稳定特征分类配准的多媒体导航仪测试方法 |
KR102522989B1 (ko) * | 2020-02-28 | 2023-04-18 | 주식회사 아토맘코리아 | 멀티미디어 콘텐츠 내 상품 정보 제공 장치 및 방법 |
KR102415366B1 (ko) * | 2020-04-02 | 2022-07-01 | 네이버 주식회사 | 서로 다른 모달의 피처를 이용한 복합 랭킹 모델을 통해 연관 이미지를 검색하는 방법 및 시스템 |
US11589124B1 (en) * | 2020-04-14 | 2023-02-21 | Worldpay Limited | Methods and systems for seamlessly transporting objects between connected devices for electronic transactions |
KR102395876B1 (ko) | 2020-04-14 | 2022-05-10 | 빅베이스 주식회사 | 딥러닝을 이용하여 유사한 이미지를 필터링할 수 있는 상품 분류 시스템 및 방법 |
US20220044298A1 (en) * | 2020-08-05 | 2022-02-10 | Foodspace Technology, LLC | Method and Apparatus for Extracting Product Attributes from Packaging |
US11620829B2 (en) | 2020-09-30 | 2023-04-04 | Snap Inc. | Visual matching with a messaging application |
US11386625B2 (en) * | 2020-09-30 | 2022-07-12 | Snap Inc. | 3D graphic interaction based on scan |
US11341728B2 (en) | 2020-09-30 | 2022-05-24 | Snap Inc. | Online transaction based on currency scan |
RU2754199C1 (ru) * | 2020-11-20 | 2021-08-30 | Акционерное Общество "Вьюэво" | Способ электронной коммерции через общественную вещательную среду |
GB2604851A (en) * | 2021-02-12 | 2022-09-21 | Tekkpro Ltd | A system for accessing a web page |
US11893792B2 (en) * | 2021-03-25 | 2024-02-06 | Adobe Inc. | Integrating video content into online product listings to demonstrate product features |
CN113313516A (zh) * | 2021-05-26 | 2021-08-27 | 广州长盛科技有限公司 | 基于音视频平台的成本核算方法 |
US11816174B2 (en) | 2022-03-29 | 2023-11-14 | Ebay Inc. | Enhanced search with morphed images |
CN114494982B (zh) * | 2022-04-08 | 2022-12-20 | 华夏文广传媒集团股份有限公司 | 一种基于人工智能的直播视频大数据精准推荐方法及*** |
CN114880517A (zh) * | 2022-05-27 | 2022-08-09 | 支付宝(杭州)信息技术有限公司 | 用于视频检索的方法及装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177640A1 (en) * | 2005-05-09 | 2008-07-24 | Salih Burak Gokturk | System and method for using image analysis and search in e-commerce |
US7702681B2 (en) * | 2005-06-29 | 2010-04-20 | Microsoft Corporation | Query-by-image search and retrieval system |
US7747070B2 (en) * | 2005-08-31 | 2010-06-29 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
US9195898B2 (en) * | 2009-04-14 | 2015-11-24 | Qualcomm Incorporated | Systems and methods for image recognition using mobile devices |
US20110082735A1 (en) * | 2009-10-06 | 2011-04-07 | Qualcomm Incorporated | Systems and methods for merchandising transactions via image matching in a content delivery system |
US8463100B2 (en) * | 2009-11-05 | 2013-06-11 | Cosmo Research Company Limited | System and method for identifying, providing, and presenting content on a mobile device |
CN102063436A (zh) * | 2009-11-18 | 2011-05-18 | 腾讯科技(深圳)有限公司 | 一种利用终端获取图像实现商品信息搜索的***及方法 |
US20120238254A1 (en) * | 2011-03-17 | 2012-09-20 | Ebay Inc. | Video processing system for identifying items in video frames |
US9355330B2 (en) * | 2011-04-12 | 2016-05-31 | National University Of Singapore | In-video product annotation with web information mining |
JP2012248070A (ja) * | 2011-05-30 | 2012-12-13 | Sony Corp | 情報処理装置、メタデータ設定方法、及びプログラム |
US8625887B2 (en) * | 2011-07-13 | 2014-01-07 | Google Inc. | Systems and methods for matching visual object components |
US10650442B2 (en) * | 2012-01-13 | 2020-05-12 | Amro SHIHADAH | Systems and methods for presentation and analysis of media content |
US8595773B1 (en) * | 2012-07-26 | 2013-11-26 | TCL Research America Inc. | Intelligent TV shopping system and method |
US20140100993A1 (en) * | 2012-10-04 | 2014-04-10 | Rico Farmer | Product Purchase in a Video Communication Session |
CN103020172B (zh) * | 2012-11-28 | 2015-08-19 | 北京京东世纪贸易有限公司 | 一种利用视频信息搜索物品的方法和装置 |
US9560415B2 (en) * | 2013-01-25 | 2017-01-31 | TapShop, LLC | Method and system for interactive selection of items for purchase from a video |
US9323785B2 (en) * | 2013-03-06 | 2016-04-26 | Streamoid Technologies Private Limited | Method and system for mobile visual search using metadata and segmentation |
US9183583B2 (en) * | 2013-05-13 | 2015-11-10 | A9.Com, Inc. | Augmented reality recommendations |
US10999637B2 (en) * | 2013-08-30 | 2021-05-04 | Adobe Inc. | Video media item selections |
US20150296250A1 (en) | 2014-04-10 | 2015-10-15 | Google Inc. | Methods, systems, and media for presenting commerce information relating to video content |
CN105373938A (zh) * | 2014-08-27 | 2016-03-02 | 阿里巴巴集团控股有限公司 | 识别视频图像中的商品和展示其信息的方法、装置及*** |
US10715862B2 (en) * | 2015-02-24 | 2020-07-14 | Visenze Pte Ltd | Method and system for identifying relevant media content |
CN104715023B (zh) | 2015-03-02 | 2018-08-03 | 北京奇艺世纪科技有限公司 | 基于视频内容的商品推荐方法和*** |
CN104967885B (zh) * | 2015-03-27 | 2019-01-11 | 哈尔滨工业大学深圳研究生院 | 一种基于视频内容感知的广告推荐方法及*** |
US10440435B1 (en) * | 2015-09-18 | 2019-10-08 | Amazon Technologies, Inc. | Performing searches while viewing video content |
US9959468B2 (en) * | 2015-11-06 | 2018-05-01 | The Boeing Company | Systems and methods for object tracking and classification |
CN105868238A (zh) * | 2015-12-09 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 信息处理方法及装置 |
CA3028710A1 (en) * | 2016-06-23 | 2017-12-28 | Capital One Services, Llc | Systems and methods for automated object recognition |
-
2017
- 2017-09-07 JP JP2019513057A patent/JP2019531547A/ja active Pending
- 2017-09-07 RU RU2018142028A patent/RU2729956C2/ru active
- 2017-09-07 CN CN201780057452.5A patent/CN109906455A/zh active Pending
- 2017-09-07 EP EP17849212.0A patent/EP3472755A4/en not_active Withdrawn
- 2017-09-07 KR KR1020197009533A patent/KR20190052028A/ko not_active Application Discontinuation
- 2017-09-07 WO PCT/SG2017/050449 patent/WO2018048355A1/en unknown
- 2017-09-07 MY MYPI2018001841A patent/MY198128A/en unknown
- 2017-09-07 SG SG11201809634TA patent/SG11201809634TA/en unknown
- 2017-09-07 US US16/331,330 patent/US10769444B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2018048355A9 (en) | 2018-04-05 |
SG11201809634TA (en) | 2018-11-29 |
US10769444B2 (en) | 2020-09-08 |
RU2018142028A (ru) | 2020-05-29 |
MY198128A (en) | 2023-08-04 |
KR20190052028A (ko) | 2019-05-15 |
RU2018142028A3 (ja) | 2020-06-26 |
EP3472755A1 (en) | 2019-04-24 |
US20190362154A1 (en) | 2019-11-28 |
EP3472755A4 (en) | 2020-02-19 |
RU2729956C2 (ru) | 2020-08-13 |
WO2018048355A1 (en) | 2018-03-15 |
CN109906455A (zh) | 2019-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2729956C2 (ru) | Обнаружение объектов из запросов визуального поиска | |
KR102533972B1 (ko) | 시각적 검색 플랫폼용 영상 인제스트 프레임워크 | |
US11290775B2 (en) | Computerized system and method for automatically detecting and rendering highlights from streaming videos | |
US10832738B2 (en) | Computerized system and method for automatically generating high-quality digital content thumbnails from digital video | |
US9471936B2 (en) | Web identity to social media identity correlation | |
JP6821149B2 (ja) | 広告配信のための動画使用情報処理 | |
US10180979B2 (en) | System and method for generating suggestions by a search engine in response to search queries | |
US20180181569A1 (en) | Visual category representation with diverse ranking | |
US9123061B2 (en) | System and method for personalized dynamic web content based on photographic data | |
US10719836B2 (en) | Methods and systems for enhancing web content based on a web search query | |
US9449231B2 (en) | Computerized systems and methods for generating models for identifying thumbnail images to promote videos | |
US11468675B1 (en) | Techniques for identifying objects from video content | |
Wang et al. | Interactive ads recommendation with contextual search on product topic space | |
KR20210041733A (ko) | 패션 상품 추천 방법, 장치 및 컴퓨터 프로그램 | |
KR101687377B1 (ko) | 영상자료에 대한 광고 영상 제작방법, 이를 이용한 제작 시스템 및 제작된 영상데이터에 대한 상영방법 | |
US20140258328A1 (en) | System and method for visual determination of the correlation between a multimedia content element and a plurality of keywords | |
KR20150075068A (ko) | 영상자료에 대한 광고 영상 제작방법, 이를 이용한 제작 시스템 및 제작된 영상데이터에 대한 상영방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20191220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210406 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211102 |