KR102224757B1 - 확인된 특성을 갖는 아이템을 결정하는 기법 - Google Patents

확인된 특성을 갖는 아이템을 결정하는 기법 Download PDF

Info

Publication number
KR102224757B1
KR102224757B1 KR1020197007664A KR20197007664A KR102224757B1 KR 102224757 B1 KR102224757 B1 KR 102224757B1 KR 1020197007664 A KR1020197007664 A KR 1020197007664A KR 20197007664 A KR20197007664 A KR 20197007664A KR 102224757 B1 KR102224757 B1 KR 102224757B1
Authority
KR
South Korea
Prior art keywords
item
image
client device
characteristic
structured data
Prior art date
Application number
KR1020197007664A
Other languages
English (en)
Other versions
KR20190039780A (ko
Inventor
아진크야 고라크나스 케일
모하마드하디 키아포어
로빈슨 피라무수
판 양
퀴아오송 왕
Original Assignee
이베이 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이베이 인크. filed Critical 이베이 인크.
Priority to KR1020217006252A priority Critical patent/KR102288435B1/ko
Publication of KR20190039780A publication Critical patent/KR20190039780A/ko
Application granted granted Critical
Publication of KR102224757B1 publication Critical patent/KR102224757B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • G06K9/52
    • G06K9/6201
    • G06K9/66
    • G06N7/005
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)

Abstract

다양한 예시적인 실시예에서, 확인된 특성을 갖는 아이템을 결정하는 시스템 및 방법이 본 명세서에 설명된다. 객체를 묘사하는 이미지가 클라이언트 장치로부터 수신된다. 하나 이상의 아이템의 특성에 대응하는 구조화된 데이터가 검색된다. 특성 세트가 결정되되, 이 특성 세트는 객체와 매칭될 것으로 예측된다. 특성 세트의 확인에 대한 요청을 포함하는 인터페이스가 생성된다. 이 인터페이스는 클라이언트 장치 상에 디스플레이된다. 특성 세트로부터의 적어도 하나의 특성이 이미지에 묘사된 객체와 매칭된다는 확인이 클라이언트 장치로부터 수신된다.

Description

확인된 특성을 갖는 아이템을 결정하는 기법
이 국제 출원은 2016년 9월 20일자로 "DETERMINING AN ITEM THAT HAS CONFIRMED CHARACTERISTICS"라는 제목으로 출원된 미국 특허 출원 제15/270,844호, 및 2016년 8월 16일자로 "DETERMINING AN ITEM THAT HAS CONFIRMED CHARACTERISTICS"라는 제목으로 출원된 미국 가출원 제62/375,855호를 우선권으로 주장하며, 이는 본 명세서에서 참조로서 인용된다.
본 발명의 실시예는 일반적으로 특수 목적 머신의 컴퓨터화된 변형예 및 그러한 변형예에 대한 개선을 비롯하여 이미지 검색 시스템과의 상호작용을 용이하게 하는 이러한 특수 목적 머신의 기술 분야에 관한 것이고, 또한 이러한 특수 목적 머신이 이미지 검색 시스템과의 상호 작용을 용이하게 하는 다른 특수 목적 머신과 비교했을 때 개선되게 하는 기술에 관한 것이다. 구체적으로, 본 개시는 확인된 특성을 갖는 아이템을 결정하기 위한 시스템 및 방법을 다룬다.
통상적으로, 사용자는 아이템을 설명하는 텍스트 검색 질의를 사용하여 아이템 인벤토리로부터 아이템을 검색할 수 있다. 그러나, 아이템에 대한 사용자의 설명은, 사용자의 검색 질의를 동일한 아이템에 대한 판매자의 설명과 비교했을 때, 종종 정확하지 않거나 불완전할 수 있다. 또한, 아이템 인벤토리로부터의 아이템은 여러 해석에 놓일 수 있고 따라서 동일한 아이템을 기술하는데 다양한 설명이 사용될 수 있다. 예를 들어, 아이템 인벤토리로부터의 아이템은 둘 이상의 판매자에 의해 둘 이상의 방식으로 설명될 수 있다. 따라서, 아이템에 대한 종래의 검색은 사용자에게 부담을 가중시킬 수 있다.
첨부된 도면의 다양한 도면들은 본 발명의 실시예를 설명하기 위한 것에 불과하며 이의 범위를 한정하는 것으로 간주될 수 없다.
도 1은 일부 예시적인 실시예에 따른 네트워크 시스템을 도시하는 블록도이다.
도 2는 일부 예시적인 실시예에 따른 지능형 개인 보조 시스템의 아키텍처 세부사항을 도시하는 블록도이다.
도 3은 일부 예시적인 실시예에 따른 컴퓨터 비전 시스템의 컴포넌트를 나타내는 블록도이다.
도 4 내지 도 6은 몇몇 예시적인 실시예에 따라, 아이템이 디스플레이되게 하는 방법을 수행하는 컴퓨터 비전 시스템의 동작을 도시하는 흐름도이다.
도 7 내지 도 9는 몇몇 예시적인 실시예에 따른 예시적인 사용자 인터페이스를 나타내는 블록도이다.
도 10은 일부 예시적인 실시예에 따른 예시적인 지식 그래프를 나타내는 블록도이다.
도 11은 예시적인 실시예에 따라, 머신으로 하여금 본 명세서에 언급된 방법들 중 하나 이상을 수행하게 하도록 명령어 세트가 실행될 수 있는 컴퓨터 시스템의 형태로 된 머신의 개략적 표현이다.
이하의 설명은 본 발명의 실시예를 도시하는 시스템, 방법, 기술, 명령어 시퀀스 및 컴퓨팅 머신 프로그램 제품을 설명한다. 다음의 기재에서, 설명 목적으로, 본 명세서에 기술된 본 발명의 다양한 실시예의 이해를 제공하기 위해 많은 특정 상세사항이 제공된다. 그러나 해당 분야의 통상의 기술자에게, 본 발명의 실시예는 이들 특정 상세사항 없이도 실시될 수 있음이 자명할 것이다.
다양한 예시적인 실시예에서, 컴퓨터 비전 시스템은 클라이언트 장치로부터 객체의 이미지를 수신하도록 구성된다. 객체의 이미지가 수신된 후, 컴퓨터 비전 시스템은 객체와 매칭될 것으로 예측되는 특성 세트를 결정한다. 특성 세트는 아이템 목록(item listing)으로서 게시되고 아이템 인벤토리에 표시된 아이템의 특성에 대응한다. 예측된 특성이 이미지에 묘사된 객체와 매칭되는지 여부를 확인하기 위해, 특성 세트가 클라이언트 장치 상에 디스플레이된다. 특성 세트로부터의 적어도 하나의 특성의 확인이 수신되면, 컴퓨터 비전 시스템은 확인된 적어도 하나의 특성을 갖는 결과 아이템의 디스플레이를 발생시킨다.
또 다른 예시적인 실시예에서, 지식 그래프는 컴퓨터 비전 시스템에 의해 이용되어 객체와 매칭될 것으로 예측되는 특성을 결정한다. 또한, 지식 그래프는 아이템 목록으로서 게시되고 아이템 인벤토리에 표시된 아이템의 특성을 나타내는 노드를 포함한다.
따라서, 본 명세서에서 논의된 방법들 중 하나 이상은 텍스트 검색 질의를 사용하여 검색을 수행할 필요성을 제거할 수 있으며, 이는 시스템 내의 하나 이상의 장치에 의해 사용되는 컴퓨팅 리소스를 감소시키는 기술적 효과를 가질 수 있다. 이러한 컴퓨팅 리소스의 예는 프로세서 사이클, 네트워크 트래픽, 메모리 사용, 저장 공간 및 전력 소비를 포함하나 이에 국한되지는 않는다.
도 1을 참조하면, 고 수준의 클라이언트-서버 기반 네트워크 아키텍처(100)의 예시적인 실시예가 도시된다. 네트워크 기반 게시 시스템의 예시적인 형태를 갖는 네트워크 시스템(102)은 네트워크(104)(예를 들어, 인터넷 또는 광역 네트워크(WAN))를 통해 서버 측 기능을 하나 이상의 클라이언트 장치(110)에 제공한다. 도 1은 예를 들어, 웹 클라이언트(112), 클라이언트 애플리케이션(114) 및 클라이언트 장치(110)에서 실행중인 프로그래매틱 클라이언트(116)를 도시한다.
클라이언트 장치(110)는 이동 전화, 데스크톱 컴퓨터, 랩탑, 휴대용 디지털 보조 장치(PDA), 스마트폰, 태블릿, 울트라북, 넷북, 랩탑, 멀티 프로세서 시스템, 마이크로 프로세서 또는 프로그래머블 소비자 전자기기, 게임 콘솔, 셋톱 박스, 또는 사용자가 네트워크 시스템(102)에 액세스하기 위해 이용할 수 있는 임의의 다른 통신 장치를 포함할 수 있으나, 이에 국한되지는 않는다. 일부 실시예에서, 클라이언트 장치(110)는 정보를 디스플레이하는데 사용되는 (예를 들어, 사용자 인터페이스의 형태를 갖는) 컴포넌트를 포함한다. 다른 실시예에서, 클라이언트 장치(110)는 터치 스크린, 가속도계, 자이로스코프, 카메라, 마이크로폰, GPS(Global Positioning System) 장치 등 중 하나 이상을 포함할 수 있다. 일 실시예에서, 네트워크 시스템(102)은 아이템 목록에 대한 요청에 응답하고, 네트워크 기반 게시 시스템에서 이용 가능한 아이템의 목록을 포함하는 게시물을 공개하고, 공개된 아이템 목록에 대한 검색을 관리하는 네트워크 기반 게시 시스템이다. 예를 들어, 네트워크(104)의 하나 이상의 부분은 애드혹 네트워크, 인트라넷, 엑스트라넷, 가상 사설망(VPN), 근거리망(LAN), 무선 LAN(WLAN), 광역망(WAN), 무선 WAN(WWAN), MAN(Metropolitan Area Network), 인터넷의 일부, PSTN(Public Switched Telephone Network)의 일부, 셀룰러 전화 네트워크, 무선 네트워크, WiFi 네트워크, WiMax 네트워크, 다른 유형의 네트워크, 또는 2개 이상의 이러한 네트워크의 조합일 수 있다.
각각의 클라이언트 장치(110)는 웹 브라우저, 메시징 애플리케이션, 전자 메일(이메일) 애플리케이션, 전자 상거래 사이트 애플리케이션, 지능형 개인 보조 애플리케이션 등과 같은, 그러나 이에 국한되지 않는 하나 이상의 애플리케이션("앱"으로도 지칭됨)을 포함한다. 일부 실시예에서, 지능형 개인 보조 애플리케이션이 클라이언트 장치(110)의 주어진 하나에 포함되는 경우, 이 애플리케이션은 사용자 인터페이스, 및 기능들 중 적어도 일부를 로컬로 제공하도록 구성되되 이 애플리케이션은 로컬로 이용가능하지 않은 데이터 및/또는 프로세싱 기능(예를 들어, 판매가능한 아이템의 데이터베이스에 액세스, 사용자 인증)을 위해 필요에 따라 네트워크 시스템(102)과 통신하도록 구성된다.
사용자(106)는 클라이언트 장치(100)와 상호작용하는 사람, 머신, 또는 다른 수단일 수 있다. 예시적인 실시예에서, 사용자(106)는 네트워크 아키텍처(100)의 일부는 아니지만, 클라이언트 장치(110) 또는 다른 수단을 통해 네트워크 아키텍처(100)와 상호작용한다. 예를 들어, 사용자(106)는 클라이언트 장치(110)에 입력(예를 들어, 터치 스크린 입력 또는 영숫자 입력)을 제공하고 입력은 네트워크(104)를 통해 네트워크 시스템(102)에 전달된다. 이 예에서, 네트워크 시스템(102)은 사용자(106)로부터의 입력을 수신하는 것에 응답하여 사용자(106)에게 제공될 정보를 네트워크(104)를 통해 클라이언트 장치(110)에 전달한다. 이러한 방식으로, 사용자(106)는 클라이언트 장치(110)를 사용하여 네트워크 시스템(102)과 상호작용할 수 있다.
애플리케이션 프로그램 인터페이스(API) 서버(120) 및 웹 서버(122)는 각각 하나 이상의 애플리케이션 서버(140)에 연결되어 프로그래매틱 및 웹 인터페이스를 각각 제공한다. 애플리케이션 서버(140)는 게시 시스템(142) 및 지능형 개인 보조 시스템(152)을 호스팅하는데, 이들 각각은 하나 이상의 모듈, 엔진 또는 애플리케이션을 포함할 수 있고 또한 하드웨어, 소프트웨어, 펌웨어, 회로 또는 이들의 임의의 조합으로 구현될 수 있다. 다음으로, 애플리케이션 서버(140)는 하나 이상의 정보 저장소 또는 데이터베이스(들)(126)로의 액세스를 용이하게 하는 하나 이상의 데이터베이스 서버(124)에 결합되는 것으로 도시된다. 일 실시예에서, 데이터베이스(126)는 게시 시스템(142) 또는 지능형 개인 보조 시스템(152) 중 임의의 것으로 전달된 정보(예를 들어, 게시물 또는 목록)를 저장하는 저장 장치이다. 데이터베이스(126)는 또한 예시적인 실시예에 따라 디지털 아이템 정보를 저장할 수 있다.
또한, 제3자 서버(들)(130)상에서 실행되는 제3자 애플리케이션(132)은 API 서버(120)에 의해 제공되는 프로그래매틱 인터페이스를 통해 네트워크 시스템(102)에 대한 프로그래매틱 액세스를 갖는 것으로 도시되어 있다. 예를 들어, 네트워크 시스템(102)으로부터 검색된 정보를 이용하는 제3자 애플리케이션(132)은 제3자에 의해 호스팅되는 웹 사이트상의 하나 이상의 특징 또는 기능을 지원한다. 예를 들어, 제3자 웹 사이트는 네트워크 시스템(102)의 관련 애플리케이션에 의해 지원되는 하나 이상의 판촉 또는 게시 기능을 제공한다.
게시 시스템(142)은 네트워크 시스템(102)에 액세스하는 사용자(106)에게 다수의 게시 기능 및 서비스를 제공한다. 게시 시스템(142)이 도 1에서 네트워크 시스템(102)의 일부를 형성하는 것으로 도시되어 있지만, 대안적인 실시예에서, 시스템(142)은 네트워크 시스템(102)과는 별개 및 별도의 서비스의 일부를 형성할 수 있다는 것을 이해할 수 있을 것이다.
또한, 도 1에 도시된 클라이언트-서버 기반 네트워크 아키텍처(100)는 클라이언트-서버 아키텍처를 사용하지만, 본 발명의 주제는 당연히 그러한 아키텍처에 국한되지 않으며, 예를 들어 분산 또는 피어 투 피어(peer-to-peer) 아키텍처 시스템에서도 동일하게 잘 적용될 수 있다.
웹 클라이언트(112)는 웹 서버(122)에 의해 지원되는 웹 인터페이스를 통해 게시 시스템(142) 또는 지능형 개인 보조 시스템(152)에 액세스한다. 마찬가지로, 프로그래밍 클라이언트(116)는 API 서버(120)에 의해 제공되는 프로그래밍 인터페이스를 통해 게시 시스템(142) 또는 지능형 개인 보조 시스템(152)에 의해 제공되는 다양한 서비스 및 기능에 액세스한다.
도 1에 도시된 임의의 시스템 또는 머신(예를 들어, 데이터베이스, 장치, 서버)은 이 시스템 또는 머신에 대해 본 명세서에서 기술된 하나 이상의 기능을 수행하도록 수정된(예를 들어, 애플리케이션, 운영 체제, 펌웨어, 미들웨어 또는 다른 프로그램의 하나 이상의 소프트웨어 모듈과 같은 소프트웨어에 의해 구성된 또는 프로그래밍된) 특수 목적(예를 들어, 특수 또는 기타 비 일반적인) 컴퓨터 내에 포함되거나 구현될 수 있다. 예를 들어, 본 명세서에 기술된 임의의 하나 이상의 방법을 구현할 수 있는 특수 목적 컴퓨터 시스템은 도 4 내지 도 6과 관련하여 아래에 설명되며, 따라서, 이러한 특수 목적 컴퓨터는 본 명세서에서 논의된 임의의 하나 이상의 방법을 수행하는 수단일 수 있다. 이러한 특수 목적 컴퓨터의 기술 분야 내에서, 본 명세서에서 논의된 기능을 수행하기 위해 본 명세서에서 논의된 구조에 의해 수정된 특수 목적 컴퓨터는 본 명세서에서 논의된 구조가 결여되거나 본 명세서에서 설명된 기능을 수행할 수 없는 다른 특수 목적 컴퓨터와 비교하여 기술적으로 개선된다. 따라서, 본 명세서에서 논의된 시스템 및 방법에 따라 구성된 특수 목적 머신은 유사한 특수 목적 머신의 기술에 대한 개선을 제공한다.
본 명세서에서 사용되는 "데이터베이스"는 데이터 저장 리소스이며 텍스트 파일, 테이블, 스프레드시트, 관계형 데이터베이스(예를 들어, 객체 관계형 데이터베이스), 트리플 저장소, 계층적 데이터 저장소, 또는 이들의 임의의 적합한 조합으로 구조화된 데이터를 저장할 수 있다. 또한, 도 1에 도시된 임의의 2 이상의 시스템 또는 머신은 단일 시스템 또는 머신으로 결합될 수 있으며, 임의의 단일 시스템 또는 머신에 대해 본 명세서에서 설명된 기능은 다수의 시스템 또는 머신 사이에서 세분화될 수 있다.
도 2는 일부 예시적인 실시예에 따른 지능형 개인 보조 시스템(152)의 아키텍처 세부사항을 도시하는 블록도이다. 특히, 지능형 개인 보조 시스템(152)이 (예를 들어, 네트워크(104)를 통해) 네트워크 아키텍처(100) 내의 다른 시스템과 통신할 수 있게 해주는 프론트 엔드 컴포넌트(202)(FE))를 포함하는 지능형 개인 보조 시스템(152)이 도시되어 있다. 프론트 엔드 컴포넌트(202)는 기존 메시징 시스템의 패브릭과 통신할 수 있다. 본 명세서에서 사용되는 바와 같이, 메시징 패브릭이라는 용어는 Facebook 메신저, Microsoft Cortana 및 기타 "봇(bots)"과 같은 제3자 플랫폼에 사용할 수 있는 API 및 서비스 모음을 의미한다. 일 예로, 메시징 패브릭은 사용자가 상업적 의도로 상호작용할 수 있는 온라인 상거래 생태계를 지원할 수 있다. 프론트 엔드 컴포넌트(202)의 출력은 도 1의 클라이언트 장치(110)와 같은 클라이언트 장치의 디스플레이에서 지능형 개인 보조기(예를 들어, "봇")와의 인터페이스의 일부로서 렌더링될 수 있다.
지능형 개인 보조 시스템(152)의 프론트 엔드 컴포넌트(202)는 프론트 엔드 컴포넌트(202)를 인공지능 프레임워크(128)에 링크하도록 동작하는 프론트 엔드(BFF)에 대한 백 엔드 컴포넌트(204)에 결합된다. 인공지능 프레임워크(128)는 아래에서 논의되는 몇몇 컴포넌트를 포함한다.
지능형 개인 보조 시스템(152)의 일례에서, 인공지능(AI) 오케스트레이터(206)는 인공지능 프레임워크(128) 내부 및 외부의 컴포넌트의 통신을 조정한다. AI 오케스트레이터(206)에 대한 입력 양식은 컴퓨터 비전 컴포넌트(208)(예를 들어, 컴퓨터 비전 시스템), 음성 인식 컴포넌트(210), 및 음성 인식 컴포넌트(210)의 일부를 형성할 수 있는 텍스트 정규화 컴포넌트로부터 도출된다. 컴퓨터 비전 컴포넌트(208)(예를 들어, 컴퓨터 비전 시스템)는 시각적 입력(예를 들어, 사진)으로부터 객체 및 속성을 식별할 수 있다. 음성 인식 컴포넌트(210)는 오디오 신호(예를 들어, 발언)를 텍스트로 변환한다. 텍스트 정규화 컴포넌트는 예를 들어, 이모티콘을 텍스트로 렌더링함으로써 언어 정규화와 같은 입력 정규화를 수행하도록 동작한다. 직교 정규화, 외국어 정규화, 회화 텍스트 정규화 등과 같은 다른 정규화가 가능하다.
인공지능 프레임워크(128)는 사용자 의도 및 의도 파라미터(예를 들어, 필수 및/또는 선택적 파라미터)를 분석 및 추출하도록 동작하는 자연 언어 이해 또는 NLU 컴포넌트(214)를 더 포함한다. 도 2에는 도시되지 않았지만, 도 2에 도시된 바와 같이, NLU 컴포넌트(214)는 또한 철자 교정기(스펠러), 파서, 명명된 개체 인식(NER) 서브-컴포넌트 및 단어 감지 검출기(WSD)와 같은 서브-컴포넌트를 포함할 수 있다. NLU 컴포넌트(214)는 또한 도 2에 도시된 바와 같이 지식 그래프를 포함할 수 있다.
인공지능 프레임워크(128)는 (예를 들어, 검색 질의 또는 발언과 같은 입력의) "특이성의 완전성"을 이해하고 다음 동작 유형 및 파라미터(예를 들어, "검색" 또는 "사용자로부터 추가 정보 요청")를 결정하도록 동작하는 대화 관리자(216)를 포함한다. 일 예에서, 대화 관리자(216)는 콘텍스트 관리자(218) 및 NLG 컴포넌트(212)(또는 자연 언어 생성 컴포넌트)와 관련하여 동작한다. 콘텍스트 관리자(218)는 지능형 개인 보조기(예를 들어, "봇") 및 이 지능형 개인 보조기와 연관된 인공지능과 관련하여 사용자의 콘텍스트 및 통신을 관리한다. 콘텍스트 관리자(218)는 두 부분, 즉 장기 이력 및 단기 메모리를 포함한다. 이러한 부분 중 하나 또는 둘 모두에 대한 데이터 입력은 관련 의도와, 주어진 입력, 봇 상호작용 또는 통신 전환의 모든 파라미터 및 모든 관련 결과를 포함할 수 있다. NLG 컴포넌트(212)는 지능형 봇과 상호작용하는 사용자에게 제시하기 위해 인공지능 메시지로부터 자연 언어 발언을 구성하도록 동작한다.
검색 컴포넌트(220)는 또한 인공지능 프레임워크(128) 내에 포함된다. 도시되지는 않았지만, 검색 컴포넌트(220)는 프론트 엔드 유닛 및 백 엔드 유닛을 갖는다. 백 엔드 유닛은 아이템 및 제품 인벤토리를 관리하고 인벤토리를 검색하여 의도 파라미터 및 의도의 특정 튜플(tuple)을 최적화하는 기능을 제공한다. 인공지능 프레임워크(128)의 일부를 구성할 수도 있고 그렇지 않을 수도 있는 아이덴티티 서비스(222) 컴포넌트는 사용자 프로파일, 예를 들어 "이름", "연령", "성별", "지오로케이션" 등의 사용자 속성의 형태를 갖는 명시적인 정보뿐만 아니라 "사용자 관심" 또는 "유사한 페르소나"와 같은 "정보 유출물"과 같은 형태의 암시적 정보도 관리하도록 동작한다.
인공지능 프레임워크(128)의 기능은 다수의 부분, 예를 들어 결정 실행 및 콘텍스트 부분으로 설정될 수 있다. 일 실시예에서, 결정 실행 부분은 AI 오케스트레이터(orchestrator))(206), NLU 컴포넌트(214) 및 그 서브 컴포넌트, 대화 관리자(216), NLG 컴포넌트(212), 컴퓨터 비전 컴포넌트(208) 및 음성 인식 컴포넌트(210)에 의한 동작을 포함한다. AI 기능의 콘텍스트 부분은 사용자 주위의 (암시적 및 명시적) 파라미터 및 (예를 들어, 주어진 인벤토리 또는 기타에 관한) 전달된 의도에 관한 것이다. 시간에 걸쳐 AI 품질을 측정하고 개선하기 위해, 인공지능 프레임워크(128)는 샘플 질의(예를 들어, dev 세트)를 사용하여 트레이닝되고, 상이한 질의 세트(예를 들어, eval 세트)에 대해 테스트되며, 이들 세트 모두는 인간 큐레이션에 의해 개발된다. 또한, 인공지능 프레임워크(128)는 숙련된 큐레이션 전문가 또는 사람 오버라이드(224)에 의해 정의된 트랜잭션 및 상호작용 흐름에 대해 트레이닝되어야 한다. 인공지능 프레임워크(128)의 다양한 컴포넌트 내에서 인코딩된 흐름 및 로직은 식별된 사용자 의도에 기초하여 지능형 보조기에 의해 만들어진 후속 발언 또는 프리젠테이션(예를 들어, 질문, 결과 세트)을 정의한다.
지능형 개인 보조 시스템(152)에서 지능형 온라인 개인 보조기(예를 들어, "봇")의 예시적인 입력 양식에 대해 상술하였다. 지능형 개인 보조 시스템(152)은 사용자의 의도(예를 들어, 타겟 검색, 비교, 쇼핑 /브라우징 등) 및 임의의 필수 파라미터(예를 들어, 제품, 제품 카테고리, 아이템 등) 및/또는 선택적 파라미터(예를 들어, 명시적 정보, 예컨대 아이템/제품, 행사(occasion) 등의 양상), 및 암시적 정보(예를 들어, 지오로케이션, 개인 취향, 연령 및 성별 등)를 파악하고 사용자에게 심사숙고한 또는 "지능적"인 응답을 제공한다. 명시적 입력 양식은 텍스트, 음성 및 시각적 입력이 포함할 수 있고, 사용자에 대한 암시적 지식(예컨대, 지오로케이션, 이전 검색 기록 등)으로 풍부해질 수 있다. 출력 양식은 텍스트(음성 또는 자연 언어 문장, 또는 제품 관련 정보), 및 클라이언트 장치(110)와 같은 스마트 장치의 스크린 상의 이미지를 포함할 수 있다. 따라서, 입력 양식은 사용자가 봇과 통신할 수 있는 다양한 방법을 나타낸다. 입력 양식은 키보드 또는 마우스 탐색, 터치 감지 제스처 등을 포함할 수 있다.
컴퓨터 비전 컴포넌트(208)의 양상과 관련하여, 사진은 종종 사용자가 텍스트보다 우수한 것을 찾고 있는 것을 나타낼 수 있다. 사용자는 어떤 아이템이 호출되는지를 모를 수도 있고, 또는 전문가만이 알 수 있는 상세한 정보, 예컨대, 의류의 복잡한 패턴 또는 가구의 특정 스타일에 대해 텍스트를 사용하는 것이 어렵거나 불가능할 수도 있다. 또한, 휴대폰에 복잡한 텍스트 질의를 입력하는 것은 불편하며 긴 텍스트 질의는 일반적으로 기억하기 어렵다. 따라서, 도 2를 참조하면, 컴퓨터 비전 컴포넌트(208)의 주요 기능은 객체 위치파악, 객체 인식, 광학 문자 인식(OCR) 및 이미지 또는 비디오로부터의 시각적 큐에 기초한 인벤토리에 대한 매칭을 포함한다. 컴퓨터 비전이 구현된 봇은 카메라가 내장된 휴대 장치에서 실행할 때 유리하다. 강력한 딥 신경 네트워크를 사용하여 컴퓨터 비전 애플리케이션을 가능하게 할 수 있다.
도 3은 일부 예시적인 실시예에 따른 컴퓨터 비전 시스템(208)의 컴포넌트를 나타내는 블록도이다. 컴퓨터 비전 시스템(208)은 액세스 모듈(310), 결정 모듈(320), 생성 모듈(330) 및 전송 모듈(340)을 포함하는 것으로 도시되어 있으며, 이들 모두는 (예를 들어, 버스, 공유 메모리 또는 스위치를 통해) 서로 통신하도록 구성된다. 본 명세서에서 설명된 컴포넌트들(예를 들어, 모듈들) 중 임의의 하나 이상은 하드웨어(예를 들어, 머신의 하나 이상의 프로세서)만을 이용하여 또는 하드웨어와 소프트웨어의 결합을 사용하여 구현될 수 있다. 예를 들어, 본 명세서에서 설명된 임의의 컴포넌트는 물리적으로 프로세스들 중 하나 이상의 구성을 포함할 수 있고 또는 본 명세서에서 해당 모듈에 대해 설명된 동작을 수행하도록 (예를 들어, 머신의 하나 이상의 프로세서 중의) 프로세서를 구성할 수 있다. 따라서, 본 명세서에서 설명된 상이한 컴포넌트는 서로 다른 시점에서 프로세서들의 상이한 배치 또는 다른 시점에서 프로세서들의 단일 배치를 포함하고 구성할 수 있다. 본 명세서에서 기술된 각각의 컴포넌트(예를 들어, 모듈)는 해당 컴포넌트에 대해 본 명세서에서 설명된 동작을 수행하기 위한 수단의 예이다. 또한, 이들 컴포넌트들 중 임의의 2개 이상의 컴포넌트는 단일 컴포넌트로 결합될 수 있으며, 단일 컴포넌트에 대해 본 명세서에 설명된 기능은 다수의 컴포넌트 사이에서 세분화될 수 있다. 또한, 다양한 예시적인 실시예에 따르면, 단일 머신, 데이터베이스 또는 장치 내에 구현되는 것으로 본 명세서에서 설명된 컴포넌트는 다수의 머신, 데이터베이스 또는 장치에 걸쳐 분산될 수 있다.
다양한 예시적인 실시예에서, 액세스 모듈(310)은 객체를 묘사하는 이미지를 수신하도록 구성된다. 이미지는 클라이언트 장치(예컨대, 클라이언트 장치(110))로부터 액세스 모듈(310)에 의해 수신된다. 또한, 일부 경우에는, 클라이언트 장치의 사용자는 이미지에 묘사된 객체에 관한 정보를 검색한다. 일부 실시예에서, 객체의 이미지는 클라이언트 장치에 의해 생성된다. 예를 들어, 클라이언트 장치에 연결된 카메라를 사용하여 객체의 이미지를 캡처한다.
다양한 예시적인 실시예에서, 액세스 모듈(310)은 아이템 목록으로서 게시된 하나 이상의 아이템의 특성에 대응하는 구조화된 데이터를 검색하도록 구성된다. 즉, 구조화된 데이터는 하나 이상의 아이템의 특성을 나타낸다. 구조화된 데이터는 몇몇 경우 컴퓨터 비전 시스템(208)에 의해 유지되는 데이터베이스(예를 들어, 데이터베이스(126))에 저장된다. 일부 실시예에서, 게시된 아이템 목록은 판매가능한 아이템에 대한 목록이다. 게시된 아이템 목록은 경우에 따라 게시 시스템(142)에 의해 게시된다.
다양한 예시적인 실시예에서, 구조화된 데이터는 테이블이 게시 시스템에 의해 유지되는 데이터베이스에 저장되는 것을 포함한다. 또한, 하나 이상의 아이템의 각각의 특성은 테이블에 의해 표시된다. 예를 들어, 각각의 특성은 데이터베이스 테이블 내의 셀에 대응한다. 즉, 각각의 특성은 데이터베이스 테이블 내의 특정 셀에 저장된다. 또한, 데이터베이스 테이블은 지능형 개인 보조 시스템(152)에 의해 유지되는 데이터베이스(예를 들어, 데이터베이스(126)) 내에 저장될 수 있다.
하나 이상의 특성은 보다 높은 입도(higher granularity)의 광범위한 특징(예를 들어, 거친 입자 특성(coarse grain characteristics))을 나타낼 수 있다. 하나 이상의 특성은 일부 경우에 따라 보다 구체적인 특징(예를 들어, 미세 입자 특성)을 나타낼 수도 있다. 광범위한 특징은 아이템의 그룹에 관련되지만, 구체적인 특징은 개별 아이템과 관련된다. 광범위한 특징의 예는 패션, 아웃도어, 게임 등과 같은 아이템의 범주를 포함한다. 광범위한 특징은 또한 아이템의 그룹에 의해 제공되는 기능을 설명할 수도 있다. 광범위한 특징은 아이템의 그룹과 관련된 제조업체 또는 브랜드를 포함할 수도 있다. 구체적인 특징의 예는 아이템의 그룹과는 달리 개별 아이템에 보다 구체적인 특성을 포함한다. 예를 들어, 구체적인 특징은 컬러, 크기, 텍스쳐 등을 나타낼 수 있다.
다른 실시예에서, 각각의 특성은 다양한 다른 형태의 구조화된 데이터 객체에 저장될 수 있다. 일부 실시예에서, 특성은 지식 그래프 내의 노드에 대응한다. 또한, 일부 경우에, 지식 그래프는 거친 입자 특성이 미세 입자 특성과 어떻게 관련되는지를 묘사하는 데 사용된다. 즉, 지식 그래프는 거친 입자 특성과 적어도 하나의 미세 입자 특성 사이의 관계를 묘사한다. 예를 들어, 패션 특성(예컨대, 거친 입자 특성)에 대응하는 노드는 패션 카테고리(예를 들어, 미세 입자 특성)에 속하는 아이템의 특성에 연결될 수 있다. 다른 예로서, 스포츠 특성 노드는 운동화, 신발, 스포츠 의류 등(예를 들어, 스포츠 아이템으로서 라벨링될 수 있는 아이템)의 특성에 연결될 수 있다.
다양한 예시적인 실시예에서, 결정 모듈(320)은 객체와 매칭하는 것으로 예측되는 특성 세트를 결정하도록 구성된다. 결정 모듈(320)은 또한 구조화된 데이터 및 객체를 묘사하는 이미지를 분석하도록 구성된다.
일부 예에서, 결정 모듈(320)은 이미지에 대응하는 이미지 서명을 생성한다. 이미지 서명은 이미지를 고유하게 식별하는 심볼의 집합을 포함한다. 예를 들어, 이미지 서명은 하나 이상의 영숫자 문자를 포함할 수 있다. 또한, 영숫자 문자는 벡터로 표시될 수 있다. 몇몇 예에서, 이미지 서명은 이미지의 다양한 특징(예를 들어, 밝기, 콘트라스트, 컬러 등)에 기초하여 생성된다. 결과적으로, 이미지 서명은 이미지의 다양한 기능을 결합한 표현이다. 또한, 이미지 서명은 이미지 분석 중에 사용된다.
다양한 예시적인 실시예에서, 생성 모듈(330)은 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하도록 구성된다. 다양한 예시적인 실시예에서, 생성 모듈(330)은 특성 세트로부터의 각각의 특성에 대한 묘사(예를 들어, 이미지 또는 설명)를 생성한다. 생성 모듈(330)은 또한 특성 세트가 이미지에 묘사된 객체와 매칭됨을 확인하는 옵션(예를 들어, 버튼)을 생성한다. 일부 예에서, 생성 모듈(330)은 인터페이스 내의 특성 세트와 함께 특성 세트를 확인하는 옵션을 생성한다.
다양한 실시예에서, 전송 모듈(340)은 생성된 인터페이스가 클라이언트 장치 상에 디스플레이되게 한다. 즉, 전송 모듈(340)은 생성된 인터페이스가 클라이언트 장치 상에 디스플레이되게 하는 데이터를 전송한다. 이것은 특성 세트가 객체와 매칭됨을 확인하는 옵션이 표시되게 하는 데이터를 전송하는 것을 포함한다. 다른 실시예에서, 전송 모듈(340)은 객체와 매칭될 것으로 확인된 특성을 갖는 결과 아이템이 디스플레이되게 한다.
다양한 예시적인 실시예에서, 액세스 모듈(310)은 특성 세트로부터의 적어도 하나의 특성이 이미지에 묘사된 객체와 매칭된다는 클라이언트 장치로부터의 확인을 수신한다. 이러한 확인은, 일부 경우에, 생성 모듈(330)에 의해 생성된 옵션의 선택시 수신된다. 일단 확인이 액세스 모듈(310)에서 수신되면, 일부 예에서, 생성 모듈(330)은 추가 특성의 확인에 대한 추가 요청을 포함하는 추가 인터페이스를 생성한다. 경우에 따라, 이 추가 특성은 지식 그래프를 사용하여 결정된다.
다양한 예시적인 실시예에서, 생성 모듈(330)은 클라이언트 장치로부터 수신된 이미지에 묘사된 객체의 위치파악을 포함하는 편집된 버전의 이미지를 생성하도록 또한 구성된다. 다양한 예시적인 실시예에서, 생성 모듈(330)은 이미지로부터 관련없는 정보를 제거하도록 구성된다. 이 관련없는 정보는 객체와 관계가 없는 세부사항(예를 들어, 객체를 묘사하지 않는 이미지의 일부)을 나타낸다. 다양한 예시적인 실시예에서, 생성 모듈(330)은 이미지의 휘도를 수정하여 이미지 내의 객체의 가시성이 증가되게 하도록 구성된다. 일부 실시예에서, 생성 모듈(330)은 이미지 내의 객체의 휘도를 증가시키도록 구성된다. 또한, 생성 모듈(330)은 객체를 포함하지 않는 이미지 부분의 휘도를 감소시키도록 구성된다. 이러한 각 편집은 이미지 서명을 수정하거나 더 변경할 수 있다.
도 4 내지 도 6은 몇몇 예시적인 실시예에 따라 아이템의 디스플레이를 발생시키는 방법(400)을 수행하는 컴퓨터 비전 시스템(208)의 동작을 도시하는 흐름도이다. 방법(400)에서의 동작은 컴퓨터 비전 시스템(208)의 컴포넌트들에 의해 부분적으로 또는 전체적으로 수행될 수 있으며, 이는 도 3과 관련하여 앞서 설명한 컴포넌트를 사용하여 네트워크 시스템(102)의 하나 이상의 애플리케이션 서버(140) 에서 전체적으로 또는 부분적으로 구현될 수 있다. 따라서, 방법(400)은 컴퓨터 비전 시스템(208)을 참조하여 예로써 설명된다. 그러나, 방법(400)의 동작 중 적어도 일부는 다양한 다른 하드웨어 구성에 배치되거나 네트워크 아키텍처(100) 내의 다른 곳에 있는 유사한 컴포넌트에 의해 수행될 수 있음을 이해해야 한다. 따라서, 방법(400)은 컴퓨터 비전 시스템(208)에 한정되는 것으로 의도되지 않는다. 도 4에 도시된 바와 같이, 방법(400)은 동작들(410,420,430,440,450,460,470)을 포함한다.
동작(410)에서, 액세스 모듈(310)은 객체를 묘사하는 이미지를 수신한다. 일부 경우, 객체는 이미지의 일부를 차지하는 것으로 묘사된다. 예를 들어, 이미지의 대부분을 점유하는 객체 대신에, 객체는 이미지의 특정 영역(예를 들어, 코너, 중간, 측면)에만 나타난다. 다양한 예시적인 실시예에서, 이미지는 클라이언트 장치로부터 수신된다. 또한, 이미지는 클라이언트 장치에 부착된 카메라의 동작과 같이 클라이언트 장치에 의해 생성될 수 있다.
동작(420)에서, 액세스 모듈(310)은 아이템 목록으로서 게시된 하나 이상의 아이템의 특성에 대응하는 구조화된 데이터를 검색한다. 즉, 구조화된 데이터는 하나 이상의 아이템의 특성을 나타낸다. 구조화된 데이터는 데이터베이스(예를 들어, 데이터베이스(126))에 저장될 수 있다. 또한, 구조 데이터는 다양한 형태를 취할 수 있다. 예를 들어, 구조화된 데이터는 데이터베이스 테이블, 지식 그래프 등을 포함한다. 또한, 각각의 특성은 구조화된 데이터 내에 저장된다. 예를 들어, 특성은 데이터베이스 테이블 내에 셀로서 저장된다. 이와 달리, 특성은 지식 그래프 내에 노드로 저장된다.
동작(430)에서, 결정 모듈(320)은 객체와 매칭될 것으로 예측된 특성 세트를 결정한다. 다양한 실시예에서, 결정 모듈(320)은 구조화된 데이터를 분석한다. 또한, 특성 세트는 이하에서 더 설명되는 바와 같이, 구조화된 데이터의 분석에 기초하여 결정 모듈(320)에 의해 결정된다.
동작(440)에서, 생성 모듈(330)은 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성한다. 일부 예에서, 생성 모듈(330)은 특성 세트로부터의 각 특성에 대한 묘사를 생성한다. 예를 들어, 생성 모듈(330)은 특성 세트로부터의 각 특성에 대한 설명을 생성한다. 마찬가지로, 생성 모듈(330)은 특성 세트로부터의 각 특성의 이미지를 생성할 수 있다. 경우에 따라, 설명 및 이미지는 구조화된 데이터에서 발견된다. 즉, 구조화된 데이터는 아이템 특성의 설명 및 아이템 특성의 이미지를 포함한다. 특성 세트에 대한 묘사가 생성되면, 생성 모듈(330)은 생성된 인터페이스에 각 특성의 묘사를 삽입한다.
동작(450)에서, 전송 모듈(340)은 클라이언트 장치상에 인터페이스의 디스플레이를 발생시킨다. 전송 모듈(340)은 인터페이스의 디스플레이를 유발하는 데이터를 전송한다. 데이터는 네트워크(예를 들어, 네트워크(104))를 통해 클라이언트 장치(예컨대, 클라이언트 장치(110))로 송신된다.
동작(460)에서, 액세스 모듈(310)은, 특성 세트로부터의 적어도 하나의 특성이 이미지에 묘사된 객체와 매칭된다는 확인을 클라이언트 장치로부터 수신한다. 일부 예에서, 이러한 확인은 사용자 인터페이스에서 생성된 옵션 선택에 대한 응답으로 수신된다.
동작(470)에서, 전송 모듈(340)은 객체와 매칭되는 적어도 하나의 확인된 특성을 갖는 결과 아이템이 디스플레이되게 한다. 즉, 결과 아이템은 적어도 하나의 확인된 특성을 그의 특성 중 하나로 포함한다. 일부 예에서, 결과 아이템은 데이터베이스(예를 들어, 데이터베이스(126))에 저장된 아이템 인벤토리에 포함된다. 결과적으로, 결과 아이템은 아이템 인벤토리로부터 검색된다. 또한, 전송 모듈(340)은 결과 아이템의 이미지가 디스플레이되게 한다. 다른 실시예에서, 전송 모듈(340)은 결과 아이템의 설명이 디스플레이되게 한다. 결과 아이템에 대한 이미지 및 설명은 아이템 인벤토리에서 찾을 수 있다. 아이템 인벤토리는 경우에 따라, 게시 시스템(142)에 의해 (예를 들어, 아이템 목록에) 게시된 각 아이템의 이미지 및 설명을 저장하는 저장소이다.
추가 실시예에서, 지능형 개인 보조 시스템(152)은 적어도 하나의 확인된 특성을 검색어로서 사용하여 결과 아이템에 대해 인벤토리를 검색한다. 아이템 인벤토리 내의 아이템(예를 들어, 게시된 아이템 목록)은 이들의 특성에 따라 태그 지정할 수 있다. 또한, 앞서 설명한 바와 같이, 아이템 인벤토리(예를 들어, 게시된 아이템 목록) 내의 아이템의 특성은 구조화된 데이터로서 저장된다. 따라서, 확인된 특성과 매칭되는 특성을 가진 아이템은 특성을 사용하여 검색가능하다.
도 5에 도시된 바와 같이, 방법(400)은 동작(510,520,530,540) 중 하나 이상을 포함할 수 있다. 동작들(510-530) 중 하나 이상은 동작(430)의 부분(예를 들어, 서브루틴 또는 일부분)으로서 수행될 수 있다. 동작(540)은 동작(440)의 일부로서 수행될 수 있다.
동작(510)에서, 결정 모듈(320)은 하나 이상의 아이템 목록의 특성에 대한 확률을 계산한다. 확률은 특성이 이미지에 묘사된 객체와 매칭될 확률을 나타낸다. 예를 들어, 확률은 각 특성이 이미지에 묘사된 객체와 얼마나 근접하게 매칭되는지 나타내는 값일 수 있다. 결정 모듈(320)은 몇몇 경우에 이미지 서명을 사용하여 확률을 계산한다. 전술한 바와 같이, 이미지 서명은 이미지를 고유하게 식별하는 기호 또는 특성들의 집합을 포함한다.
동작(520)에서, 결정 모듈(320)은 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정한다. 일부 경우에, 임계치는 동작(530)에서 특성이 특성 세트에서 선택되도록 하기 위한 최소 확률을 나타낸다. 결정 모듈(320)은 일부 경우에, 특성 세트 외의 특성이 사전결정된 임계치를 벗어나지 않은 계산된 확률을 갖는 것으로 결정한다.
동작(530)에서, 결정 모듈(320)은 동작(520)에서 수행된 결정에 기초하여 특성 세트를 선택한다. 다시 말해서, 결정 모듈(320)은 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것에 기초하여 특성 세트를 선택한다.
동작(540)에서, 생성 모듈(330)은 특성 세트로부터 적어도 하나의 특성의 확인을 표시하도록 선택가능한 옵션의 그래픽 요소를 생성한다. 전술한 바와 같이, 생성된 옵션은 적어도 하나의 특성의 확인을 나타내기 위해 사용자에 의해 선택가능한 버튼을 포함한다. 또한, 버튼은 클라이언트 장치에 디스플레이된 사용자 인터페이스의 일부로 디스플레이된다. 일부 예에서, 생성 모듈(330)은 특성 세트로부터의 각 특성에 대한 옵션을 생성한다.
도 6에 도시된 바와 같이, 방법(400)은 동작(610,620,630,640) 중 하나 이상을 포함할 수 있다. 또한, 동작(610)은 동작(410)의 일부(예를 들어, 서브루틴 또는 일부)로서 수행될 수 있다. 동작(620)은 동작(410) 이후 및 동작(420) 이전에 수행될 수 있다. 마지막으로, 동작(630,640)은 동작(460) 이후일 수 있지만 동작(470) 이전에 있을 수 있다.
동작(610)에서, 생성 모듈(330)은 편집된 버전의 이미지를 생성한다. 다양한 예시적인 실시예에서, 편집된 버전의 이미지를 생성하는 단계는 이미지의 일부를 위치파악하는 것을 포함한다.
동작(620)에서, 생성 모듈(330)은 이미지 서명을 생성한다. 이미지 서명은 이미지를 고유하게 식별하는 심볼의 집합을 포함한다. 전술한 바와 같이, 이미지 서명은 하나 이상의 영숫자 문자를 포함할 수 있다. 또한, 심볼의 집합(예를 들어, 영숫자)은 벡터로서 표현될 수 있다. 몇몇 예에서, 이미지 서명은 이미지의 다양한 특징(예를 들어, 휘도, 콘트라스트, 컬러 등)에 기초하여 생성된다. 따라서, 생성 모듈(330)은 이미지 서명을 생성하기 위해 이미지의 다양한 특징을 분석한다.
동작(630)에서, 액세스 모듈(310)은 거친 입자 특성과 적어도 하나의 미세 입자 특성 사이의 관계를 나타내는 지식 그래프에 액세스한다. 지식 그래프는 또한 동작(460)에서 사용자에 의해 확인된 특성들 중 하나와 추가 특성 사이의 관계를 묘사할 수 있다. 따라서, 동작(460)에서 사용자에 의해 확인된 특성들 중 하나는 지식 그래프에 묘사된 거친 입자 특성 또는 미세 입자 특성일 수 있다.
동작(640)에서, 전송 모듈(340)은 추가 요청의 디스플레이를 발생시킨다. 다양한 예시적인 실시예에서, 추가 요청은 지식 그래프로부터 액세스되는 정보를 포함한다. 예를 들어, 확인된 특성은 지식 그래프 내의 특정 노드(예를 들어, 소스 노드)에 대응할 수 있다. 따라서, 소스 노드에 접속된 노드는 결과 아이템에 대한 검색을 더 정제하기 위해 추가 요청에서 디스플레이될 수 있다.
도 7은 일부 예시적인 실시예에 따른 예시적인 사용자 인터페이스(700)를 나타내는 블록도이다. 다양한 실시예에서, 사용자 인터페이스(700)는 클라이언트 장치 상에 디스플레이된다. 도 7에 도시된 바와 같이, 예시적인 사용자 인터페이스(700)는 예측된 특성 세트를 나타내는 섹션(704) 및 이미지(702)를 포함한다. 도 7에 또한 도시된 바와 같이, 이미지(702)는 객체를 나타낸다. 특성 세트는 이미지(702)에 묘사된 객체와 매칭되도록 컴퓨터 비전 시스템(208)에 의해 예측되는 특성이다. 또한, 특성 세트는 도 4의 동작(430)에서 결정된 특성 세트에 대응할 수 있다. 섹션(704)에는 또한 예측된 특성이 이미지에 묘사된 객체와 매칭되는지 여부를 나타내기 위해 각각 선택가능한 버튼이 표시되어 있다.
도 8은 일부 예시적인 실시예에 따른 예시적인 사용자 인터페이스(800)를 나타내는 블록도이다. 다양한 실시예에서, 사용자 인터페이스(800)는 클라이언트 장치 상에 디스플레이된다. 도 8에 도시된 바와 같이, 예시적인 사용자 인터페이스(800)는 확인된 특성 세트를 나타내는 섹션(804) 및 이미지(802)를 포함한다. 예시적인 사용자 인터페이스(800)는 일부 경우, 예시적인 사용자 인터페이스(700)에 도시된 특성 세트로부터의 적어도 하나의 특성의 선택 후에 디스플레이된다. 또한, 도 8에 도시된 바와 같이, 섹션(804)은 결과 아이템에 대한 검색범위를 좁히기 위해 추가 특성을 확인하기 위한 요청을 나타낸다. 경우에 따라서, 추가 특성은 지식 그래프로부터 결정될 수 있다.
도 9는 일부 예시적인 실시예에 따른 예시적인 사용자 인터페이스(900)를 나타내는 블록도이다. 다양한 실시예에서, 사용자 인터페이스(900)는 클라이언트 장치 상에 디스플레이된다. 도 9에 도시된 바와 같이, 사용자 인터페이스(900)는 검색 결과(예를 들어, 제1 검색 결과(902) 및 제2 검색 결과(904))을 나타낸다. 검색 결과는 도 8의 섹션(804)에 묘사된 확인된 특성을 나타내는 아이템이다. 검색 결과는 아이템의 이미지 및 아이템에 대한 설명을 포함한다. 도 9에는 또한 검색 결과에 해당하는 아이템 목록을 탐색하는 데 사용할 수 있는 버튼이 도시되어 있다.
도 10은 일부 예시적인 실시예에 따른 예시적인 지식 그래프(1000)를 나타내는 블록도이다. 지식 그래프(1000)는 노드(1002), 노드(1004), 노드(1006), 노드(1014) 및 노드(1016)를 포함한다. 노드(1002,1004,1006,1008,1010) 각각은 거친 입자 특성을 나타낸다. 노드(1012,1014,1016,1018,1020,1022,1024)가 지식 그래프(1000)에 더 포함된다. 노드(1012,1014,1016,1018,1020,1022,1024) 각각은 아이템 목록 내의 아이템을 기술하는데 사용될 수 있는 미세 입자 특성을 나타낸다.
추가로 도시된 바와 같이, 지식 그래프(1000)는 노드(1006)와 각 노드(1012,1014,1016) 사이의 연결을 나타낸다. 또한, 지식 그래프(1000)는 노드(1002)와 노드(1006) 간의 연결을 나타낸다. 또한, 지식 그래프(1000)는 노드(1004)와 노드(1006) 사이의 연결을 나타낸다. 지식 그래프(1000)에서의 이러한 연결은 노드(1012,1014,1016)에 대응하는 특성을 갖는 아이템 인벤토리 내의 아이템이 이러한 거친 입자 특성(예를 들어, 노드(1002), 노드(1004) 및 노드(1006))에 따라 추가로 특성화될 수 있음을 나타낸다.
모듈, 컴포넌트 및 로직
본 명세서에서 특정 실시예는 로직 또는 다수의 컴포넌트, 모듈, 또는 메커니즘을 포함하는 것으로 기재된다. 모듈은 소프트웨어 모듈(가령, 머신 판독가능 매체 상에서 구현되는 코드) 또는 하드웨어 모듈일 수 있다. "하드웨어 모듈"은 특정 동작을 수행하는 유형의(tangible) 유닛이며 특정 물리적 방식으로 구성 또는 배열될 수 있다. 다양한 실시예에서, 하나 이상의 컴퓨터 시스템(가령, 자립형 컴퓨터 시스템, 클라이언트 컴퓨터 시스템, 또는 서버 컴퓨터 시스템) 또는 컴퓨터 시스템의 하나 이상의 하드웨어 모듈(가령, 프로세서 또는 프로세서 그룹)이 소프트웨어(가령, 애플리케이션 또는 애플리케이션 부분)에 의해, 본 명세서에 기재된 특정 동작을 수행하도록 동작하는 하드웨어 모듈로서 구성될 수 있다.
일부 실시예에서, 하드웨어 모듈은 기계적으로, 전자적으로, 또는 이들의 임의의 적합한 조합으로 구현될 수 있다. 예를 들어, 하드웨어 모듈은 특정 동작을 수행하도록 영구적으로 설정된 전용 회로 또는 로직을 포함할 수 있다. 예를 들어, 하드웨어 모듈은 특수 프로세서, 가령, FPGA(Field-Programmable Gate Array) 또는 ASIC(Application-Specific Integrated Circuit)일 수 있다. 또한 하드웨어 모듈은 특정 동작을 수행하도록 소프트웨어에 의해 임시로 구성된 프로그램가능 로직 또는 회로를 포함할 수 있다. 예를 들어, 하드웨어 모듈은 범용 프로세서 또는 그 밖의 다른 프로그램 가능 프로세서에 의해 실행되는 소프트웨어를 포함할 수 있다. 이러한 소프트웨어에 의해 구성되면, 하드웨어 모듈은 구성된 기능을 수행하도록 고유하게 설정된 특정 머신(또는 머신의 특정 컴포넌트)이 되며 더는 범용 프로세서가 아니다. 하드웨어 모듈을 기계적으로, 전용의 영구적으로 구성된 회로에서 구현할지 또는 (가령, 소프트웨어에 의해 구성된) 일시적으로 구성된 회로에서 구현할지에 대한 결정은 비용과 시간을 고려하여 이뤄질 수 있음이 자명할 것이다.
따라서, "하드웨어 모듈"이라는 구문은 개체가 본 명세서에 기재된 특정 방식으로 동작하도록 또는 특정 동작을 수행하도록 물리적으로 구성되거나, 영구적으로 구성(가령, 하드와이어링)되거나, 임시로 구성(가령, 프로그래밍)되는 한, 유형의 개체를 포함하는 것으로 이해되어야 한다. 본 명세서에서 사용될 때, "하드웨어로 구현되는 모듈"은 하드웨어 모듈을 지칭한다. 하드웨어 모듈이 일시적으로 구성(가령, 프로그래밍)되는 실시예를 고려하면, 하드웨어 모듈 각각은 어느 한 시점에서 구성되거나 인스턴스화될 필요가 없다. 예를 들어, 하드웨어 모듈이 소프트웨어에 의해 특수 목적 프로세서가 되도록 구성되는 범용 프로세서를 포함하는 경우, 범용 프로세서는 상이한 때에 각각 상이한 특수 목적 프로세서(가령, 상이한 하드웨어 모듈을 포함함)로서 구성될 수 있다. 따라서, 소프트웨어는 특정 프로세서 또는 프로세서들을 한 시점에서 특정 하드웨어가 되도록 구성하고 상이한 시점에서 상이한 하드웨어 모듈이 되도록 구성한다.
하드웨어 모듈은 타 하드웨어 모듈로 정보를 제공하고 이로부터 정보를 수신할 수 있다. 따라서, 기재된 하드웨어 모듈은 통신 가능하게 연결되는 것으로 간주될 수 있다. 다수의 하드웨어 모듈이 동시에 존재하는 경우, 통신은 하드웨어 모듈들 중 둘 이상 간에 (가령, 적절한 회로 및 버스를 통한) 단일 전송을 통해 이뤄질 수 있다. 다수의 하드웨어 모듈이 상이한 시점에서 구성 또는 인스턴스화되는 실시예에서, 이러한 하드웨어 모듈들 간 통신은, 예를 들어, 다수의 하드웨어 모듈이 액세스할 수 있는 메모리 구조에서의 정보의 저장 및 탐색을 통해 이뤄질 수 있다. 예를 들어, 하나의 하드웨어 모듈이 한 동작을 수행하고 이 동작의 출력을 자신이 통신 가능하게 연결된 메모리 장치에 저장할 수 있다. 그 후 추가 하드웨어 모듈이, 나중에, 메모리 장치에 액세스하여 저장된 출력을 탐색하고 프로세싱할 수 있다. 하드웨어 모듈은 또한 입력 또는 출력 장치와의 통신을 개시할 수 있고, 리소스(가령, 정보의 집합)에 대해 동작할 수 있다.
본 명세서에 기재된 예시적 방법의 다양한 동작이 관련 동작을 수행하기 위해 (가령, 소프트웨어에 의해) 일시적으로 구성되거나 영구적으로 구성된 하나 이상의 프로세서에 의해 적어도 부분적으로 수행될 수 있다. 일시적으로 구성되거나 영구적으로 구성되거나에 무관하게, 이러한 프로세서는 본 명세서에 기재된 하나 이상의 동작 또는 기능을 수행하도록 동작하는 프로세서로 구현되는 모듈을 구성할 수 있다. 본 명세서에서 사용될 때, "프로세서로 구현되는 모듈"은 하나 이상의 프로세서를 이용해 구현되는 하드웨어 모듈을 지칭한다.
마찬가지로, 본 명세서에 기재된 방법은 적어도 부분적으로 프로세서로 구현될 수 있으며, 이때 특정 프로세서 또는 프로세서들은 하드웨어의 예시이다. 예를 들어, 방법의 동작 중 적어도 일부는 하나 이상의 프로세서 또는 프로세서들로 구현되는 모듈에 의해 수행될 수 있다. 덧붙여, 하나 이상의 프로세서는 "클라우드 컴퓨팅" 환경에서 또는 "서비스형 소프트웨어"(SaaS)로서 관련 동작의 수행을 지원하도록 더 동작할 수 있다. 예를 들어, 동작 중 적어도 일부는 컴퓨터(프로세서를 포함하는 머신의 예시)의 그룹에 의해 수행될 수 있으며, 이때 이들 동작은 네트워크(가령, 인터넷)를 통해 그리고 하나 이상의 적절한 인터페이스(가령, 애플리케이션 프로그램 인터페이스(API))를 통해 액세스 가능하다.
특정 동작의 성능이 단일 머신 내에 위치하는 프로세서들뿐 아니라 다수의 머신에 걸쳐 배치된 프로세서들 사이에서 분산될 수 있다. 일부 실시예에서, 프로세서들 또는 프로세서로 구현되는 모듈이 단일 지리적 위치에(가령, 가정 환경, 사무실 환경, 또는 서버 팜 내에) 위치할 수 있다. 또 다른 실시예에서, 프로세서 또는 프로세서로 구현되는 모듈이 다수의 지리적 위치에 걸쳐 분산될 수 있다.
예시적 머신 아키텍처 및 머신 판독가능 매체
도 11은 머신 판독가능 매체(가령, 머신 판독가능 저장 매체)로부터 명령어를 판독하고 본 명세서에 기재된 방법 중 임의의 하나 이상을 수행할 수 있는 일부 실시예에 따르는 머신(1100)의 컴포넌트를 도시하는 블록도이다. 구체적으로, 도 11은 머신(1100)이 본 명세서에 기재된 방법 중 임의의 하나 이상을 수행할 수 있게 하는 명령어(1116)(가령, 소프트웨어, 프로그램, 애플리케이션, 애플릿, 앱, 또는 그 밖의 다른 코드)가 실행될 수 있는 컴퓨터 시스템의 예시적 형태로 된 머신(1100)의 개략적 표현을 나타낸다. 예를 들어, 명령어는 머신이 도 4 내지 6의 흐름도를 실행하게 할 수 있다. 명령어는 일반적인 프로그램되지 않은 머신을, 기재되고 도시된 기능을 기재된 방식으로 수행하도록 구체적으로 구성된 특정 머신으로 변환한다. 대안 실시예에서, 머신(1100)은 자립형 장치로서 동작하거나 또 다른 머신으로 연결(가령, 네트워킹)될 수 있다. 네트워크형 배치에서, 머신(1100)은 서버-클라이언트 네트워크 환경에서 서버 머신 또는 클라이언트 머신으로서 동작하거나, 피어-투-피어(peer-to-peer)(또는 분산) 네트워크 환경에서 피어(peer) 머신으로서 동작할 수 있다. 머신(1100)의 비제한적인 예를 들면, 서버 컴퓨터, 클라이언트 컴퓨터, 개인 컴퓨터(PC), 태블릿 컴퓨터, 랩탑 컴퓨터, 개인 디지털 보조기(PDA), 오락 미디어 시스템, 휴대 전화, 스마트폰, 이동 장치, 웨어러블 장치(예를 들어, 스마트워치), 네트워크 라우터, 네트워크 스위치, 네트워크 브릿지, 또는 머신(1100)에 의해 수행될 동작을 특정하는 명령어(1116)를 순차적으로 또는 그 밖의 다른 방식으로 실행하는 임의의 머신이 있을 수 있다. 또한 하나의 머신(1100)만이 도시되어 있지만, 용어 "머신"은 본 명세서에서 언급된 방법 중 임의의 하나 이상을 수행하도록 명령어(1116)를 개별적으로 또는 공동으로 실행하는 머신(1100)의 집합을 포함하는 것으로도 이해될 것이다.
머신(1100)은 가령 버스(1102)를 통해 서로 통신하도록 구성될 수 있는 프로세서(1110), 메모리(1130), 및 I/O 컴포넌트(1150)를 포함할 수 있다. 실시예에서, 프로세서(1110)(가령, CPU(Central Processing Unit), RISC(Reduced Instruction Set Computing) 프로세서, CISC(Complex Instruction Set Computing) 프로세서, GPU(Graphics Processing Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), RFIC(Radio-Frequency Integrated Circuit), 또 다른 프로세서, 또는 이들의 임의의 조합)는 예를 들어, 명령어(1116)를 실행할 수 있는 프로세서(1112) 및 프로세서(1114)를 포함할 수 있다. 용어 "프로세서"는 명령어를 동시에 실행할 수 있는 둘 이상의 독립 프로세서(때때로 "코어"로 지칭됨)를 포함할 수 있는 멀티-코어 프로세서를 포함하는 것을 의도한다. 도 11이 다수의 프로세서를 도시하지만, 머신(1100)은 단일 코어를 갖는 단일 프로세서, 다수의 코어를 갖는 단일 프로세서(가령, 멀티-코어 프로세스), 단일 코어를 갖는 다수의 프로세서, 다수의 코어를 갖는 다수의 프로세서, 또는 이들의 임의의 조합을 포함할 수 있다.
메모리/저장소(1130)는 가령, 메인 메모리, 또는 그 밖의 다른 메모리 저장소와 같은 메모리(1132), 저장 유닛(1136)을 포함할 수 있으며, 이들 모두는 가령 버스(1102)를 통해 프로세서(1110)에 의해 액세스가능하다. 저장 유닛(1136) 및 메모리(1132)는 본 명세서에 기재된 방법 또는 기능 중 임의의 하나 이상을 구현하는 명령어(1116)를 저장한다. 명령어(1116)는 또한 머신(1100)에 의해 실행되는 동안 메모리(1132), 저장 유닛(1136), 프로세서(1110) 중 적어도 하나(가령, 프로세서의 캐시 메모리), 또는 이들의 임의의 적합한 조합 내에 완전히 또는 부분적으로 위치할 수 있다. 따라서, 메모리(1132), 저장 유닛(1136) 및 프로세서(1110)의 메모리가 머신 판독가능 매체의 예시이다.
본 명세서에서 사용될 때, "머신 판독가능 저장 매체"는 명령어 및 데이터를 일시적으로 또는 영구적으로 저장할 수 있는 장치를 의미하며, 비제한적인 예를 들면, 랜덤-액세스 메모리(RAM), 판독 전용 메모리(ROM), 버퍼 메모리, 플래시 메모리, 광학 매체, 자기 매체, 캐시 메모리, 그 밖의 다른 유형의 저장소(가령, EEPROM(Electrically Erasable Programmable Read-Only Memory) 및/또는 이의 임의의 적합한 조합을 포함할 수 있다. 용어 "머신 판독가능 저장 매체"는 명령어(1116)를 저장할 수 있는 단일 매체 또는 다수의 매체(가령, 중앙집중형 또는 분산형 데이터베이스, 또는 연관된 캐시 및 서버)를 포함하는 것으로 이해되어야 한다. 용어 "머신 판독가능 저장 매체"는 명령어가 머신(1100)의 하나 이상의 프로세서(가령, 프로세서(1110))에 의해 실행될 때, 머신(1100)으로 하여금 본 명세서에 기재된 방법들 중 임의의 하나 이상을 수행하게 하도록 머신(가령, 머신(1100))에 의해 실행되기 위한 명령어(가령, 명령어(1116))를 저장할 수 있는 임의의 매체 또는 다수의 매체의 조합을 포함하는 것으로도 취급되어야 한다. 따라서, "머신 판독가능 저장 매체"는 단일 저장 장치 또는 디바이스뿐 아니라 다수의 저장 장치 또는 디바이스를 포함하는 "클라우드-기반" 저장 시스템 또는 저장 네트워크까지 지칭한다. 용어 "머신 판독가능 저장 매체"는 신호 자체를 배제한다. 머신 판독가능 매체라는 용어는 머신 판독가능 저장 매체 및 전송 매체 또는 반송 신호를 포함한다.
I/O 컴포넌트(1150)는 입력을 수신, 출력을 제공, 출력을 생성, 정보를 전송, 정보를 교환, 측정치를 캡처 등을 위한 다양한 컴포넌트를 포함할 수 있다. 특정 머신 내에 포함되는 특정 I/O 컴포넌트(1150)는 머신의 유형에 따라 달라질 것이다. 예를 들어, 이동 전화와 같은 휴대용 머신은 터치 입력 장치, 또는 그 밖의 다른 이러한 입력 수단을 포함할 가능성이 높을 것이지만, 헤드리스 서버 머신(headless server machine)은 이러한 터치 입력 장치를 포함하지 않을 가능성이 높을 것이다. I/O 컴포넌트(1150)는 도 11에 도시되지 않는 그 밖의 다른 많은 컴포넌트를 포함할 수 있다. I/O 컴포넌트(1150)는 단지 이하의 설명을 단순화하기 위한 목적으로 기능에 따라 그룹지어지지만, 그룹으로 한정되는 것은 아니다. 다양한 실시예에서, I/O 컴포넌트(1150)는 출력 컴포넌트(1152) 및 입력 컴포넌트(1154)를 포함할 수 있다. 출력 컴포넌트(1152)는 시각적 컴포넌트(예를 들어, PDP(plasma display panel), LED(light emitting diode) 디스플레이, LCD(liquid crystal display), 프로젝터, 또는 CRT(cathode ray tube)와 같은 디스플레이), 음향 컴포넌트(가령, 스피커), 햅틱 컴포넌트(가령, 진동 모터, 저항성 수단), 그 밖의 다른 신호 생성기 등을 포함할 수 있다. 입력 컴포넌트(1154)는 영숫자 입력 컴포넌트(가령, 키보드, 영숫자 입력을 수신하도록 구성된 터치 스크린, 광학 키보드, 또는 그 밖의 다른 영숫자 입력 컴포넌트), 포인트-기반 입력 컴포넌트(가령, 마우스, 터치패드, 트랙볼, 조이스틱, 모션 센서, 또는 그 밖의 다른 포인팅 기구), 촉감 입력 컴포넌트(가령, 물리적 버튼, 터치 또는 터치 제스처의 위치 및/또는 힘을 제공하는 터치 스크린, 또는 그 밖의 다른 촉감 입력 컴포넌트), 오디오 입력 컴포넌트(가령, 마이크로폰) 등을 포함할 수 있다.
또 다른 실시예에서, I/O 컴포넌트(1150)는 그 밖의 다른 여러 컴포넌트 중에서 생체측정 컴포넌트(1156), 모션 컴포넌트(1158), 환경 컴포넌트(1160), 또는 위치 컴포넌트(1162)를 포함할 수 있다. 예를 들어, 생체측정 컴포넌트(1156)는 표현(예를 들어, 손짓, 표정, 목소리 표현, 바디 제스처, 또는 안구 추적)의 검출, 생체 신호(가령, 혈압, 심박수, 체온, 발한, 또는 뇌파)의 측정, 개인의 식별(예컨대, 음성 식별, 홍채 식별, 안면 식별, 지문 식별, 또는 뇌전도 기반 식별) 등을 위한 컴포넌트를 포함할 수 있다. 모션 컴포넌트(1158)는 가속 센서 컴포넌트(가령, 가속도계), 중력 센서 컴포넌트, 회전 센서 컴포넌트(가령, 자이로스코프) 등을 포함할 수 있다. 환경 컴포넌트(1160)는 예를 들어, 조명 센서 컴포넌트(가령, 광도계), 온도 센서 컴포넌트(가령, 주위 온도를 검출하는 하나 이상의 온도계), 습도 센서 컴포넌트, 압력 센서 컴포넌트(가령, 기압계), 음향 센서 컴포넌트(가령, 배경 노이즈를 검출하는 하나 이상의 마이크로폰), 근접도 센서 컴포넌트(가령, 근처 물체를 검출하는 적외선 센서), 가스 센서(가령, 안전을 위해 위험한 가스의 농도를 검출하거나 대기 중 오염물질을 측정하기 위한 가스 검출 센서), 또는 주변의 물리적 환경에 대응하는 지시, 측정치, 또는 신호를 제공할 수 있는 그 밖의 다른 컴포넌트를 포함할 수 있다. 위치 컴포넌트(1162)는 측위 센서 컴포넌트(가령, GPS(Global Position System) 수신기 컴포넌트), 고도 센서 컴포넌트(가령, 고도계 또는 고도가 도출될 수 있는 공기압을 검출하는 기압계), 배향 센서 컴포넌트(가령, 자기력계) 등을 포함할 수 있다.
다양한 기법을 이용해 통신이 구현될 수 있다. I/O 컴포넌트(1150)는 머신(1100)을 각각 연결(1182) 및 연결(1172)을 통해 네트워크(1180) 또는 장치(1170)로 연결하도록 동작하는 통신 컴포넌트(1164)를 포함할 수 있다. 예를 들어, 통신 컴포넌트(1164)는 네트워크(1180)와 인터페이싱하기 위한 네트워크 인터페이스 컴포넌트 또는 그 밖의 다른 적절한 장치를 포함할 수 있다. 또 다른 예시에서, 통신 컴포넌트(1164)는 유선 통신 컴포넌트, 무선 통신 컴포넌트, 셀룰러 통신 컴포넌트, 근거리장 통신(NFC) 컴포넌트, Blutooth® 컴포넌트(가령, Bluetooth® Low Energy), Wi-Fi® 컴포넌트, 및 그 밖의 다른 방식을 통해 통신을 제공하기 위한 그 밖의 다른 통신 컴포넌트를 포함할 수 있다. 장치(1170)는 또 다른 머신 또는 다양한 주변 장치 중 임의의 것(가령, USB(Universal Serial Bus)를 통해 연결된 주변 장치)일 수 있다.
덧붙여, 통신 컴포넌트(1164)는 식별자를 검출하거나 식별자를 검출하도록 동작 가능한 컴포넌트를 포함할 수 있다. 예를 들어, 통신 컴포넌트(1164)는 RFID(Radio Frequency Identification) 태그 판독기 컴포넌트, NFC 스마트 태그 검출 컴포넌트, 광학 판독기 컴포넌트(가령, 1차원 바코드, 가령, UPC(Universal Product Code) 바코드, 다차원 바코드, 가령, QR(Quick Response) 코드, Aztec 코드, Data Matrix, Dataglyph, MaxiCode, PDF417, Ultra Code, UCC RSS-2D 바코드 및 그 밖의 다른 광학 코드를 검출하기 위한 광학 센서), 또는 음향 검출 컴포넌트(가령, 태깅된 오디오 신호를 식별하기 위한 마이크로폰)를 포함할 수 있다. 덧붙여, 통신 컴포넌트(1164)를 통해 다양한 정보가 도출될 수 있는데, 가령, IP(Internet Protocol) 지오로케이션을 통해 얻어지는 위치, Wi-Fi® 신호 삼각측량을 통해 얻어지는 위치, 특정 위치를 가리킬 수 있는 NFC 비컨 신호를 검출함으로써 얻어지는 위치 등이 도출될 수 있다.
전송 매체
다양한 예시적 실시예에서, 네트워크(1180)의 하나 이상의 부분이 애드혹 네트워크, 인트라넷, 익스트라넷, 가상 가설 네트워크(VPN), 로컬 영역 네트워크(LAN), 무선 LAN(WLAN), 광역 네트워크(WAN), 무선 WAN(WWAN), 도시권 네트워크(MAN), 인터넷, 인터넷의 일부분, 공중 교환 전화 네트워크(PSTN)의 일부분, 기존 전화 서비스(POTS: plain old telephone service) 네트워크, 셀룰러 전화 네트워크, 무선 네트워크, Wi-Fi® 네트워크, 또 다른 유형의 네트워크, 또는 둘 이상의 이러한 네트워크의 조합일 수 있다. 예를 들어, 네트워크(1180) 또는 네트워크(1180)의 일부분이 무선 또는 셀룰러 네트워크를 포함할 수 있으며 연결(1182)은 CDMA(Code Division Multiple Access) 연결, GSM(Global System for Mobile communications) 연결, 또는 그 밖의 다른 유형의 셀룰러 또는 무선 연결을 포함할 수 있다. 이러한 예시에서, 연결(1182)은 다양한 유형의 데이터 전송 기법, 가령, 1xRTT(Single Carrier Radio Transmission Technology), EVDO(Evolution-Data Optimized) 기법, GPRS(General Packet Radio Service) 기법, EDGE(Enhanced Data rates for GSM Evolution) 기법, 3GPP(third Generation Partnership Project), 가령, 3G, 4G(fourth generation wireless) 네트워크, UMTS(Universal Mobile Telecommunications System), HSPA(High Speed Packet Access), WiMAX(Worldwide Interoperability for Microwave Access), LTE(Long Term Evolution) 표준, 다양한 표준 설정 기구에 의해 정의된 그 밖의 다른 것, 그 밖의 다른 장거리 프로토콜, 또는 그 밖의 다른 데이터 전송 기법 중 임의의 것을 구현할 수 있다.
명령어(1116)는 네트워크 인터페이스 장치(예를 들어, 통신 컴포넌트(1164)에 포함되는 네트워크 인터페이스 컴포넌트)를 통한 전송 매체를 이용하고 잘 알려진 전송 여러 프로토콜 중 하나(가령, HTTP(hypertext transfer protocol))를 이용해 네트워크(1180)를 통해 전송되거나 수신될 수 있다. 마찬가지로, 명령어(1116)는 장치(1170)로의 연결(1172)(가령, 피어-투-피어 연결)을 통해 전송 매체를 이용해 송신 또는 수신될 수 있다. 용어 "전송 매체"는 머신(1100)에 의해 실행되기 위한 명령어(1116)를 저장, 인코딩, 또는 반송할 수 있는 임의의 무형의 매체를 포함하는 것으로 여겨져야 하며, 디지털 신호 또는 아날로그 통신 신호 또는 이러한 소프트웨어의 통신을 촉진시키기 위한 그 밖의 다른 무형의 매체를 포함한다. 전송 매체는 머신 판독 매체의 하나의 구현예이다.
다음의 번호가 매겨진 예는 실시예이다.
방법으로서,
객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 단계와,
아이템 목록으로서 게시된 하나 이상의 아이템의 특성을 나타내는 구조화된 데이터를 검색하는 단계와,
상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체와 매칭될 것으로 예측되는 특성 세트를 결정하는 단계와,
하나 이상의 프로세서를 사용하여, 상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하는 단계와,
상기 클라이언트 장치 상에 상기 인터페이스가 디스플레이되게 하는 단계와,
상기 특성 세트로부터의 적어도 하나의 특성이 상기 이미지에 묘사된 상기 객체와 매칭된다는 확인을 상기 클라이언트 장치로부터 수신하는 단계를 포함한다.
2. 예 1의 방법으로서, 상기 특성 세트로부터 상기 확인된 적어도 하나의 특성을 갖는 결과 아이템의 아이템 목록이 디스플레이되게 하는 단계를 더 포함한다.
3. 예 1 또는 예 2의 방법으로서, 상기 구조화된 데이터 및 상기 이미지의 분석은,
상기 하나 이상의 아이템의 목록의 특성에 대한 확률을 계산하는 것- 상기 확률은 상기 특성이 상기 객체와 매칭될 확률을 나타냄 -과,
상기 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것과,
상기 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것에 기초하여 상기 특성 세트를 선택하는 것을 포함한다.
4. 예 1 내지 3 중 어느 하나의 방법으로서, 상기 요청은 이미지 및 상기 특성 세트로부터의 각 특성에 대한 설명을 포함한다.
5. 예 1 내지 예 4 중 어느 하나의 방법으로서, 상기 생성하는 단계는 상기 특성 세트로부터의 상기 적어도 하나의 특성의 확인을 나타내도록 선택가능한 옵션의 그래픽 요소를 생성하는 단계를 포함한다.
6. 예 1 내지 예 5 중 어느 하나의 방법으로서, 확인된 특성과 추가 특성 사이의 관계를 나타내는 지식 그래프에 액세스하는 단계를 더 포함한다.
7. 예 6의 방법으로서,
상기 클라이언트 장치로부터의 상기 수신된 확인에 기초하여 추가 요청이 디스플레이되게 하는 단계를 더 포함하며, 상기 추가 요청은 상기 지식 그래프에 기초하여 상기 객체와 매칭될 것으로 예측되는 추가 특성의 확인을 위한 것이다.
8. 예 1 내지 예 7 중 어느 하나의 방법으로서, 상기 클라이언트 장치로부터 수신된 상기 이미지에 묘사된 상기 객체의 위치파악을 포함하는 상기 이미지의 편집된 버전을 생성하는 단계를 더 포함한다.
9. 예 8의 방법으로서, 상기 생성하는 단계는 상기 이미지로부터 관련없는 정보를 제거하는 단계를 포함하고, 상기 관련없는 정보는 상기 객체를 포함하지 않는 상기 이미지의 세부사항을 묘사한다.
10. 예 8 또는 예 9의 방법으로서, 상기 생성하는 단계는 상기 이미지 내의 상기 객체의 가시성이 증가하도록 상기 이미지의 휘도를 변경하는 단계를 포함한다.
11. 시스템으로서,
하나 이상의 프로세서와,
상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 동작들을 수행하게 하는 실행 가능한 명령어를 저장하는 메모리를 포함하되,
상기 동작들은
객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 동작과,
아이템 목록으로서 게시된 하나 이상의 아이템의 특성을 나타내는 구조화된 데이터를 검색하는 동작과,
상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체와 매칭될 것으로 예측되는 특성 세트를 결정하는 동작과,
상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하는 동작과,
상기 클라이언트 장치 상에 상기 인터페이스가 디스플레이되게 하는 동작과,
상기 특성 세트로부터의 적어도 하나의 특성이 상기 이미지에 묘사된 상기 객체와 매칭된다는 확인을 상기 클라이언트 장치로부터 수신하는 동작을 포함한다.
12. 예 11의 시스템으로서, 상기 동작들은 상기 특성 세트로부터 상기 확인된 적어도 하나의 특성을 갖는 결과 아이템의 아이템 목록이 디스플레이되게 하는 동작을 더 포함한다.
13. 예 11 또는 예 12의 시스템으로서, 상기 동작들은
상기 하나 이상의 아이템의 목록의 특성에 대한 확률을 계산하는 동작- 상기 확률은 상기 특성이 상기 객체와 매칭될 확률을 나타냄 -과,
상기 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 동작과,
상기 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것에 기초하여 상기 특성 세트를 선택하는 동작을 더 포함한다.
14. 예 11 내지 13 중 어느 하나의 시스템으로서, 상기 요청은 이미지 및 상기 특성 세트로부터의 각 특성에 대한 설명을 포함한다.
15. 예 11 내지 예 14 중 어느 하나의 시스템으로서, 상기 동작들은 상기 특성 세트로부터의 상기 적어도 하나의 특성의 확인을 나타내도록 선택가능한 옵션의 그래픽 요소를 생성하는 동작을 더 포함한다.
16. 예 11 내지 예 15 중 어느 하나의 시스템으로서, 상기 동작들은 확인된 특성과 추가 특성 사이의 관계를 나타내는 지식 그래프에 액세스하는 동작을 더 포함한다.
17. 예 16의 시스템으로서,
상기 동작들은 상기 클라이언트 장치로부터의 상기 수신된 확인에 기초하여 추가 요청이 디스플레이되게 하는 동작을 더 포함하며, 상기 추가 요청은 상기 지식 그래프에 기초하여 상기 객체와 매칭될 것으로 예측되는 추가 특성의 확인을 위한 것이다.
18. 예 11 내지 예 17 중 어느 하나의 시스템으로서, 상기 동작들은 상기 클라이언트 장치로부터 수신된 상기 이미지에 묘사된 객체의 위치파악을 포함하는 상기 이미지의 편집된 버전을 생성하는 동작을 더 포함한다.
19. 예 18의 시스템으로서, 상기 동작들은 상기 이미지로부터 관련없는 정보를 제거하는 단계를 포함하고, 상기 관련없는 정보는 상기 객체를 포함하지 않는 상기 이미지의 세부사항을 묘사한다.
20. 명령어를 저장하는 머신 판독가능 저장 매체로서,
상기 명령어는 머신의 하나 이상의 프로세서에 의해 실행될 때, 상기 머신으로 하여금 동작들을 수행하게 하고,
상기 동작들은
객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 동작과,
아이템 목록으로서 게시된 하나 이상의 아이템의 특성을 나타내는 구조화된 데이터를 검색하는 동작과,
상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체와 매칭될 것으로 예측되는 특성 세트를 결정하는 동작과,
상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하는 동작과,
상기 클라이언트 장치 상에 상기 인터페이스가 디스플레이되게 하는 동작과,
상기 특성 세트로부터의 적어도 하나의 특성이 상기 이미지에 묘사된 상기 객체와 매칭된다는 확인을 상기 클라이언트 장치로부터 수신하는 동작을 포함한다.
21. 명령어를 운반하는 머신 판독가능 매체로서,
상기 명령어는 머신의 하나 이상의 프로세서에 의해 실행될 때, 상기 머신으로 하여금 예 1 내지 예 10 중 어느 하나의 방법을 수행하게 한다.
언어
본 명세서 전체에서, 복수 사례가 단수 사례로서 기재된 컴포넌트, 동작, 또는 구조물을 구현할 수 있다. 하나 이상의 방법의 개별 동작이 개별 동작으로 도시되고 기재되지만, 개별 동작 중 하나 이상은 동시에 수행될 수 있으며, 동작들은 반드시 도시된 순서로 수행되어야 하는 것은 아니다. 예시적 구성에서 개별 컴포넌트로서 제공된 구조물 및 기능이 조합된 구조물 또는 컴포넌트로서 구현될 수 있다. 마찬가지로, 단일 컴포넌트로서 제공된 구조물 및 기능이 개별 컴포넌트로서 구현될 수 있다. 이들 및 그 밖의 다른 변형, 수정, 추가 및 개선이 본 명세서의 주제 사항의 범위 내에 있다.
청구대상의 개관이 특정 실시예를 참조하여 기재되었지만, 다양한 수정 및 변경이 본 개시의 실시예의 광의의 범위를 벗어나지 않으면서 이들 실시예에 대해 이뤄질 수 있다. 청구대상의 이러한 실시예들은 본 명세서에서 개별적으로 또는 총칭하여, "발명"이라는 용어로 지칭될 수 있으며 이는 단지 편의를 위한 것이며, 본 출원의 범위를, 사실상 둘 이상의 개시사항 또는 개념이 개시되는 경우 임의의 하나로 자의적으로 한정하려는 것은 아니다.
본 명세서에 설명되는 실시예는 해당 분야의 통상의 기술자가 개시된 설명을 실시할 수 있도록 충분히 상세히 기재된다. 본 개시내용의 범위에서 벗어나지 않고 구조적 및 논리적 치환 및 변경이 이뤄질 수 있도록 그 밖의 다른 실시예가 사용될 수 있고 이로부터 도출될 수 있다. 따라서 발명의 설명은 한정으로 취급되지 않으며 다양한 실시예의 범위는 이하의 청구범위 및 이러한 청구항에 수반되는 균등물의 전체 범위에 의해서만 규정된다.
본 명세서에서 사용되는 바와 같이, "또는"이라는 용어는 포괄적 또는 배타적 의미로 해석될 수 있다. 또한, 복수 사례가 단일 사례로서 기재된 리소스, 동작, 또는 구조물에 대해 제공될 수 있다. 덧붙여, 다양한 리소스, 동작, 모듈, 엔진, 및 데이터 저장소 간의 경계는 다소 모호하고, 특정 동작이 특정 예시적 구성의 맥락에서 도시된다. 기능의 또 다른 할당이 고려되며 본 개시의 다양한 실시예의 범위 내에 있을 수 있다. 일반적으로, 예시적 구성에서 개별 리소스로 제공되는 구조물 및 기능이 조합된 구조물 또는 리소스로 구현될 수 있다. 마찬가지로, 단일 리소스로서 제공되는 구조물 및 기능이 개별 리소스로서 구현될 수 있다. 이들 및 그 밖의 다른 변동, 수정, 추가 및 개선이 이하의 청구항에 의해 나타내어지는 본 발명의 실시예의 범위 내에 속한다. 따라서 발명의 설명 및 도면은 한정이 아니라 예시로서 간주될 것이다.

Claims (21)

  1. 컴퓨터에 의해 수행되는 방법으로서,
    객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 단계와,
    아이템 목록(item listings)으로서 게시된 하나 이상의 아이템의 아이템 특성을 나타내는 구조화된 데이터를 검색하는 단계와,
    상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 아이템 특성 세트(set of item characteristics)를 결정하는 단계와,
    하나 이상의 프로세서를 사용하여, 상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 아이템 특성 세트의 확인에 대한 요청을 포함하는 사용자 인터페이스를 생성하는 단계와,
    상기 클라이언트 장치 상에 상기 사용자 인터페이스가 디스플레이되게 하는 단계와,
    상기 아이템 특성 세트로부터의 적어도 하나의 아이템 특성이 상기 이미지에 묘사된 상기 객체와 매칭된다는 확인을 상기 클라이언트 장치 상의 상기 사용자 인터페이스로부터 수신하는 단계와,
    확인된 아이템 특성과 추가 아이템 특성 사이의 관계를 나타내는 지식 그래프에 액세스하는 단계와,
    상기 클라이언트 장치로부터의 상기 수신된 확인에 기초하여 추가 요청이 디스플레이되게 하는 단계 - 상기 추가 요청은 상기 지식 그래프에 기초하여 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 추가 아이템 특성의 확인을 위한 것임 - 를 포함하는
    컴퓨터에 의해 수행되는 방법.
  2. 제1항에 있어서,
    상기 아이템 특성 세트로부터 상기 확인된 적어도 하나의 아이템 특성을 갖는 결과 아이템의 아이템 목록이 디스플레이되게 하는 단계를 더 포함하는
    컴퓨터에 의해 수행되는 방법.
  3. 제1항에 있어서,
    상기 구조화된 데이터 및 상기 이미지의 분석은,
    상기 아이템 목록으로서 게시된 상기 하나 이상의 아이템의 아이템 특성에 대한 확률을 계산하는 것- 상기 확률은 상기 아이템 특성이 상기 객체의 아이템 특성과 매칭될 확률을 나타냄 -과,
    상기 아이템 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것과,
    상기 아이템 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것에 기초하여 상기 아이템 특성 세트를 선택하는 것을 포함하는
    컴퓨터에 의해 수행되는 방법.
  4. 제1항에 있어서,
    상기 요청은 이미지 및 상기 아이템 특성 세트로부터의 각 아이템 특성에 대한 설명을 포함하는
    컴퓨터에 의해 수행되는 방법.
  5. 제1항에 있어서,
    상기 생성하는 단계는 상기 아이템 특성 세트로부터의 상기 적어도 하나의 아이템 특성의 확인을 나타내도록 선택가능한 옵션의 그래픽 요소를 생성하는 단계를 포함하는
    컴퓨터에 의해 수행되는 방법.
  6. 삭제
  7. 삭제
  8. 제1항에 있어서,
    상기 클라이언트 장치로부터 수신된 상기 이미지에 묘사된 상기 객체의 위치파악(localization)을 포함하는 상기 이미지의 편집된 버전을 생성하는 단계를 더 포함하는
    컴퓨터에 의해 수행되는 방법.
  9. 제8항에 있어서,
    상기 생성하는 단계는 상기 이미지로부터 관련없는 정보를 제거하는 단계를 포함하고, 상기 관련없는 정보는 상기 객체를 포함하지 않는 상기 이미지의 세부사항을 묘사하는
    컴퓨터에 의해 수행되는 방법.
  10. 제8항에 있어서,
    상기 생성하는 단계는 상기 이미지 내의 상기 객체의 가시성이 증가하도록 상기 이미지의 휘도를 변경하는 단계를 포함하는
    컴퓨터에 의해 수행되는 방법.
  11. 시스템으로서,
    하나 이상의 프로세서와,
    상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 동작들을 수행하게 하는 실행 가능한 명령어를 저장하는 메모리를 포함하되,
    상기 동작들은
    객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 동작과,
    아이템 목록으로서 게시된 하나 이상의 아이템의 아이템 특성을 나타내는 구조화된 데이터를 검색하는 동작과,
    상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 아이템 특성 세트를 결정하는 동작과,
    상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 아이템 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하는 동작과,
    상기 클라이언트 장치 상에 상기 인터페이스가 디스플레이되게 하는 동작과,
    상기 아이템 특성 세트로부터의 적어도 하나의 아이템 특성이 상기 이미지에 묘사된 상기 객체의 아이템 특성과 매칭된다는 확인을 상기 클라이언트 장치로부터 수신하는 동작과,
    확인된 아이템 특성과 추가 아이템 특성 사이의 관계를 나타내는 지식 그래프에 액세스하는 동작과,
    상기 클라이언트 장치로부터의 상기 수신된 확인에 기초하여 추가 요청이 디스플레이되게 하는 동작 - 상기 추가 요청은 상기 지식 그래프에 기초하여 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 추가 아이템 특성의 확인을 위한 것임 - 을 포함하는
    시스템.
  12. 제11항에 있어서,
    상기 동작들은 상기 아이템 특성 세트로부터 상기 확인된 적어도 하나의 아이템 특성을 갖는 결과 아이템의 아이템 목록이 디스플레이되게 하는 동작을 더 포함하는
    시스템.
  13. 제11항에 있어서,
    상기 동작들은
    상기 아이템 목록으로서 게시된 상기 하나 이상의 아이템의 아이템 특성에 대한 확률을 계산하는 동작- 상기 확률은 상기 아이템 특성이 상기 객체의 아이템 특성과 매칭될 확률을 나타냄 -과,
    상기 아이템 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 동작과,
    상기 아이템 특성 세트가 각각 사전결정된 임계치를 초과하는 계산된 확률을 갖는 것으로 결정하는 것에 기초하여 상기 아이템 특성 세트를 선택하는 동작을 더 포함하는
    시스템.
  14. 제11항에 있어서,
    상기 요청은 이미지 및 상기 아이템 특성 세트로부터의 각 아이템 특성에 대한 설명을 포함하는
    시스템.
  15. 제11항에 있어서,
    상기 동작들은 상기 아이템 특성 세트로부터의 상기 적어도 하나의 아이템 특성의 확인을 나타내도록 선택가능한 옵션의 그래픽 요소를 생성하는 동작을 더 포함하는
    시스템.
  16. 삭제
  17. 삭제
  18. 제11항에 있어서,
    상기 동작들은 상기 클라이언트 장치로부터 수신된 상기 이미지에 묘사된 상기 객체의 위치파악을 포함하는 상기 이미지의 편집된 버전을 생성하는 동작을 더 포함하는
    시스템.
  19. 제18항에 있어서,
    상기 동작들은 상기 이미지로부터 관련없는 정보를 제거하는 단계를 포함하고, 상기 관련없는 정보는 상기 객체를 포함하지 않는 상기 이미지의 세부사항을 묘사하는
    시스템.
  20. 명령어를 저장하는 머신 판독가능 저장 매체로서,
    상기 명령어는 머신의 하나 이상의 프로세서에 의해 실행될 때, 상기 머신으로 하여금 동작들을 수행하게 하고,
    상기 동작들은
    객체를 묘사하는 이미지를 클라이언트 장치로부터 수신하는 동작과,
    아이템 목록으로서 게시된 하나 이상의 아이템의 아이템 특성을 나타내는 구조화된 데이터를 검색하는 동작과,
    상기 구조화된 데이터 및 상기 객체를 묘사하는 이미지의 분석에 기초하여, 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 아이템 특성 세트를 결정하는 동작과,
    상기 구조화된 데이터 및 상기 객체를 묘사하는 상기 이미지의 분석에 기초하여 결정된 상기 아이템 특성 세트의 확인에 대한 요청을 포함하는 인터페이스를 생성하는 동작과,
    상기 클라이언트 장치 상에 상기 인터페이스가 디스플레이되게 하는 동작과,
    상기 아이템 특성 세트로부터의 적어도 하나의 아이템 특성이 상기 이미지에 묘사된 상기 객체의 아이템 특성과 매칭된다는 확인을 상기 클라이언트 장치로부터 수신하는 동작과,
    확인된 아이템 특성과 추가 아이템 특성 사이의 관계를 나타내는 지식 그래프에 액세스하는 동작과,
    상기 클라이언트 장치로부터의 상기 수신된 확인에 기초하여 추가 요청이 디스플레이되게 하는 동작 - 상기 추가 요청은 상기 지식 그래프에 기초하여 상기 객체의 아이템 특성과 매칭될 것으로 예측되는 추가 아이템 특성의 확인을 위한 것임 - 을 포함하는
    머신 판독가능 저장 매체.
  21. 삭제
KR1020197007664A 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법 KR102224757B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020217006252A KR102288435B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662375855P 2016-08-16 2016-08-16
US62/375,855 2016-08-16
US15/270,844 2016-09-20
US15/270,844 US10133958B2 (en) 2016-08-16 2016-09-20 Determining an item that has confirmed characteristics
PCT/US2017/045948 WO2018034895A1 (en) 2016-08-16 2017-08-08 Determining an item that has confirmed characteristics

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020217006252A Division KR102288435B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법

Publications (2)

Publication Number Publication Date
KR20190039780A KR20190039780A (ko) 2019-04-15
KR102224757B1 true KR102224757B1 (ko) 2021-03-08

Family

ID=61191971

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020197007664A KR102224757B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법
KR1020217006252A KR102288435B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법
KR1020217024754A KR102425498B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020217006252A KR102288435B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법
KR1020217024754A KR102425498B1 (ko) 2016-08-16 2017-08-08 확인된 특성을 갖는 아이템을 결정하는 기법

Country Status (5)

Country Link
US (3) US10133958B2 (ko)
EP (1) EP3500921A4 (ko)
KR (3) KR102224757B1 (ko)
CN (1) CN109716286A (ko)
WO (1) WO2018034895A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12020174B2 (en) 2016-08-16 2024-06-25 Ebay Inc. Selecting next user prompt types in an intelligent online personal assistant multi-turn dialog
US10133958B2 (en) 2016-08-16 2018-11-20 Ebay Inc. Determining an item that has confirmed characteristics
US11004131B2 (en) * 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US11200273B2 (en) 2016-10-16 2021-12-14 Ebay Inc. Parallel prediction of multiple image aspects
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
US11704716B2 (en) * 2019-11-18 2023-07-18 Meta Platforms, Inc. Identifying objects within an image from a user of an online system matching products identified to the online system by the user
US11869055B2 (en) * 2021-01-28 2024-01-09 Maplebear Inc. Identifying items offered by an online concierge system for a received query based on a graph identifying relationships between items and attributes of the items
US20230067956A1 (en) * 2021-08-27 2023-03-02 Ebay Inc. Multiple product identification assistance in an electronic marketplace application

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120183185A1 (en) * 2008-10-02 2012-07-19 International Business Machines Corporation Product identification using image analysis and user interaction
US20120246029A1 (en) * 2011-03-25 2012-09-27 Ventrone Mark D Product comparison and selection system and method
US20150046483A1 (en) * 2012-04-25 2015-02-12 Tencent Technology (Shenzhen) Company Limited Method, system and computer storage medium for visual searching based on cloud service
US20160154823A1 (en) * 2010-06-30 2016-06-02 International Business Machines Corporation Template-based recognition of food product information

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8042740B2 (en) * 2000-11-24 2011-10-25 Metrologic Instruments, Inc. Method of reading bar code symbols on objects at a point-of-sale station by passing said objects through a complex of stationary coplanar illumination and imaging planes projected into a 3D imaging volume
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US7864178B2 (en) * 2005-11-09 2011-01-04 National Instruments Corporation Creating machine vision inspections using a state diagram representation
US20080059281A1 (en) * 2006-08-30 2008-03-06 Kimberly-Clark Worldwide, Inc. Systems and methods for product attribute analysis and product recommendation
US8028246B2 (en) * 2008-08-21 2011-09-27 Eastman Kodak Company Concierge—shopping assistant
US8600824B2 (en) * 2010-04-28 2013-12-03 Verizon Patent And Licensing Inc. Image-based product marketing systems and methods
US8737747B2 (en) * 2011-02-14 2014-05-27 Xerox Corporation Method for automated tire detection and recognition
EP2973040A1 (en) * 2013-03-15 2016-01-20 NIKE Innovate C.V. Product presentation assisted by visual search
CN104881407A (zh) * 2014-02-27 2015-09-02 福州瑞芯微电子有限公司 基于特征识别的信息推荐***及方法
CN104537065A (zh) * 2014-12-29 2015-04-22 北京奇虎科技有限公司 一种搜索结果的推送方法及***
CN105550190B (zh) * 2015-06-26 2019-03-29 许昌学院 面向知识图谱的跨媒体检索***
US10133958B2 (en) 2016-08-16 2018-11-20 Ebay Inc. Determining an item that has confirmed characteristics
WO2020029867A1 (en) * 2018-08-07 2020-02-13 Shenzhen GOODIX Technology Co., Ltd. Optical sensing of fingerprints or other patterns on or near display screen using optical detectors integrated to display screen

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120183185A1 (en) * 2008-10-02 2012-07-19 International Business Machines Corporation Product identification using image analysis and user interaction
US20160154823A1 (en) * 2010-06-30 2016-06-02 International Business Machines Corporation Template-based recognition of food product information
US20120246029A1 (en) * 2011-03-25 2012-09-27 Ventrone Mark D Product comparison and selection system and method
US20150046483A1 (en) * 2012-04-25 2015-02-12 Tencent Technology (Shenzhen) Company Limited Method, system and computer storage medium for visual searching based on cloud service

Also Published As

Publication number Publication date
US20180053069A1 (en) 2018-02-22
WO2018034895A1 (en) 2018-02-22
US20190057280A1 (en) 2019-02-21
EP3500921A4 (en) 2019-07-10
US20210004634A1 (en) 2021-01-07
CN109716286A (zh) 2019-05-03
KR20190039780A (ko) 2019-04-15
US11551023B2 (en) 2023-01-10
KR102425498B1 (ko) 2022-07-27
KR20210100214A (ko) 2021-08-13
KR20210027522A (ko) 2021-03-10
EP3500921A1 (en) 2019-06-26
KR102288435B1 (ko) 2021-08-10
US10133958B2 (en) 2018-11-20
US10803345B2 (en) 2020-10-13

Similar Documents

Publication Publication Date Title
KR102224757B1 (ko) 확인된 특성을 갖는 아이템을 결정하는 기법
US20210224877A1 (en) Intelligent online personal assistant with image text localization
US10885394B2 (en) Fine-grained categorization
US20210406960A1 (en) Joint-based item recognition
US20210166146A1 (en) Visual aspect localization presentation
US11526919B2 (en) Detecting cross-lingual comparable listings
US20170372398A1 (en) Vector representation of descriptions and queries
US20170177712A1 (en) Single step cross-linguistic search using semantic meaning vectors
US11301511B2 (en) Projecting visual aspects into a vector space
US20230290171A1 (en) Parallel prediction of multiple image aspects
US11681768B2 (en) Search and notification in response to a request
US20210286851A1 (en) Guided query recommendations
US12001471B2 (en) Automatic lot classification
US11222064B2 (en) Generating structured queries from images
KR20190077123A (ko) 상품 특징을 도시하는 발견 페이지 생성 기법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant