JP7150090B2 - Product Attribute Extraction Method for Shopping Search - Google Patents

Product Attribute Extraction Method for Shopping Search Download PDF

Info

Publication number
JP7150090B2
JP7150090B2 JP2021075589A JP2021075589A JP7150090B2 JP 7150090 B2 JP7150090 B2 JP 7150090B2 JP 2021075589 A JP2021075589 A JP 2021075589A JP 2021075589 A JP2021075589 A JP 2021075589A JP 7150090 B2 JP7150090 B2 JP 7150090B2
Authority
JP
Japan
Prior art keywords
product
search
user
user query
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021075589A
Other languages
Japanese (ja)
Other versions
JP2021179979A (en
Inventor
ウンキ イ
ジェヒ イ
ジョンヒョン イ
ジョンテ イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2021179979A publication Critical patent/JP2021179979A/en
Application granted granted Critical
Publication of JP7150090B2 publication Critical patent/JP7150090B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示は、ショッピング検索のための商品属性抽出方法及びシステムに関し、具体的には、ショッピング検索のために入力されたユーザクエリ(user query)又は検索クエリから商品属性を抽出して、商品検索順位に反映できる方法及びシステムに関する。 TECHNICAL FIELD The present disclosure relates to a method and system for extracting product attributes for shopping search, and more specifically, extracting product attributes from a user query or search query input for shopping search to determine product search ranking. It relates to a method and system that can reflect

最近、インターネットやモバイル環境においてショッピング、ゲーム、映画及び音楽などのような多様なサービスがオンラインで提供されている。特に、オンラインショッピングは、商品購買時間に対する制約がなく、直接的に商品販売店に訪問しなくても、商品の選択及び購買が可能であるため、多数のユーザにより利用されている。 Recently, various services such as shopping, games, movies, and music are provided online in the Internet and mobile environment. In particular, online shopping is used by a large number of users because there is no time limit for purchasing products and it is possible to select and purchase products without directly visiting a product store.

このようなオンラインショッピングの便宜により、オンラインショッピングを利用するユーザが増加することで、オンライン上で販売又は取り扱う商品の数や種類も幾何級数的に増加している。これにより、ユーザは、オンライン上で販売される多様な商品のうち、自分の意図と一致する商品を検索し難いという問題がある。 Due to the convenience of online shopping, the number of users who use online shopping is increasing, and the number and types of products sold or handled online are increasing exponentially. Accordingly, there is a problem that it is difficult for the user to search for a product that matches his/her intention among various products sold online.

一方、ユーザが、オンラインショッピングシステムに接続して、所望の商品を検索するためのクエリ(query)を入力すれば、当該クエリと関連する商品情報や購買先に関する接続情報などを含む商品検索結果のリストが提供できる。このようなオンラインショッピングシステムは、単にユーザクエリを商品データベースの商品情報と比較して検索結果を抽出するため、クエリに含まれたユーザの意図と一致する商品検索結果を導出し難い。 On the other hand, when a user connects to an online shopping system and inputs a query to search for a desired product, the product search results including product information related to the query and connection information regarding purchasers are displayed. A list can be provided. Since such an online shopping system simply compares a user query with product information in a product database to extract search results, it is difficult to derive product search results that match the intention of the user included in the query.

韓国登録特許第10-1017016号Korea Registered Patent No. 10-1017016

本開示は、前記問題点を解決するためになされたもので、ショッピング検索のための商品属性抽出方法、コンピュータプログラム及び装置(システム)を提供する。 The present disclosure has been made to solve the above problems, and provides a product attribute extraction method, a computer program, and an apparatus (system) for shopping search.

また、本開示は、ショッピング検索のための商品属性抽出のために、統計基盤分類モデルを利用することで、より正確な商品属性抽出が可能な方法及び装置(システム)を提供する。 In addition, the present disclosure provides a method and apparatus (system) capable of extracting more accurate product attributes by using a statistically-based classification model for product attribute extraction for shopping searches.

本開示は、方法、装置(システム)又はコンピュータプログラムを含む多様な方式により具現できる。 The present disclosure can be embodied in various forms including methods, apparatus (systems), and computer programs.

本開示の一実施例によれば、コンピュータシステムで実行されるショッピング検索のための商品属性抽出方法は、ユーザクエリを受信するステップ、商品データベースからユーザクエリに対する商品検索結果を抽出するステップ、統計基盤分類モデルにより、ユーザクエリ及び複数の商品属性の関連点数を算出するステップ、及び、算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整するステップを含む。 According to an embodiment of the present disclosure, a product attribute extraction method for shopping search performed by a computer system comprises: receiving a user query; extracting product search results for the user query from a product database; According to the classification model, calculating the relevance score of the user query and the plurality of product attributes, and adjusting the product search ranking according to the product search result based on the calculated relevance score.

本開示の他の実施例によれば、ユーザ端末で実行されるショッピング検索のための商品属性抽出方法は、ユーザクエリを受信するステップ、ユーザクエリに基づき、統計基盤分類モデルにより算出された複数の商品属性の関連点数を受信するステップ、及び、算出された関連点数に基づき、ユーザクエリに対する商品検索順位を調整するステップを含む。 According to another embodiment of the present disclosure, a product attribute extraction method for shopping search performed on a user terminal comprises: receiving a user query; The method includes the steps of: receiving relevance scores of product attributes; and adjusting product search rankings for user queries based on the calculated relevance scores.

本開示のまた他の実施例によれば、前述したショッピング検索のための商品属性抽出方法をコンピュータで実行するためのコンピュータプログラムが提供される。 According to yet another embodiment of the present disclosure, there is provided a computer program for executing the product attribute extraction method for shopping search described above on a computer.

本開示のまた他の実施例によれば、コンピュータシステムで実行されるショッピング検索のための商品属性抽出の学習方法は、複数の第1のユーザクエリ及び複数の第1のユーザクエリと関連する複数の第1の商品属性を含む複数の第1の学習データを生成するステップ、及び、複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルを学習するステップを含む。 According to yet another embodiment of the present disclosure, a learning method for product attribute extraction for shopping search performed by a computer system comprises a plurality of first user queries and a plurality of queries associated with the plurality of first user queries. generating a plurality of first learning data including the first product attributes of and, based on the plurality of first learning data, determining the relevance score of the one or more product attributes corresponding to the second user query training a statistically-based classification model to compute.

本開示のまた他の実施例によれば、前述したショッピング検索のための商品属性抽出の学習方法をコンピュータで実行するためのコンピュータプログラムが提供される。 According to yet another embodiment of the present disclosure, there is provided a computer program for executing the above learning method for product attribute extraction for shopping search on a computer.

本開示のまた他の実施例によれば、ショッピング検索のための商品属性抽出システムは、ユーザクエリを受信する通信モジュール、メモリ、及び、メモリと連結し、メモリに含まれたコンピュータ読み取り可能な命令を実行するように構成された少なくとも一つのプロセッサを含む。少なくとも一つのプロセッサは、商品データベースからユーザクエリに対する商品検索結果を抽出し、統計基盤分類モデルを用いて、ユーザクエリ及び複数の商品属性の関連点数を算出し、算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整する。 According to yet another embodiment of the present disclosure, a product attribute extraction system for shopping search includes a communication module for receiving a user query, a memory, and computer readable instructions coupled to the memory, comprising: at least one processor configured to execute At least one processor extracts product search results for user queries from a product database, calculates relevance scores of user queries and a plurality of product attributes using a statistically-based classification model, and calculates the relevance scores based on the calculated relevance scores. Adjust the product search ranking according to product search results.

本開示の多様な実施例によれば、ユーザクエリからユーザの意図した商品属性が反映された検索結果をユーザ端末に出力できる。また、本開示の多様な実施例によれば、ユーザクエリと関連する商品属性を持つ商品を検索結果の上部に表示することで、当該商品に対するユーザらのクリック率及び購買率を向上させることができる。 According to various embodiments of the present disclosure, it is possible to output to the user terminal a search result reflecting the product attributes intended by the user based on the user query. In addition, according to various embodiments of the present disclosure, by displaying products having product attributes related to user queries at the top of search results, users' click rate and purchase rate for the products can be improved. can.

本開示の多様な実施例によれば、ユーザクエリに対する複数の商品属性の関連点数を算出するために、統計基盤分類モデルを使用することで、ユーザクエリに対する商品属性の関連性の正確度を改善させることができる。 According to various embodiments of the present disclosure, improving the accuracy of the relevance of product attributes to user queries by using a statistically-based classification model to calculate relevance scores of multiple product attributes to user queries. can be made

本開示の多様な実施例によれば、ユーザクエリを音節及び/又は形態素の単位に分割して、統計基盤分類モデルにより商品属性に対する関連点数を算出することで、タイプミス又は学習データにないユーザクエリに対しても、商品属性の関連点数の算出の正確性を向上させることができる。また、統計基盤分類モデルの学習データのマッチングカバレッジ(matching coverage)が極大化し、ユーザクエリ及び複数の商品属性の関連点数の算出の正確度を一層向上させることができる。 According to various embodiments of the present disclosure, by dividing a user query into units of syllables and/or morphemes and calculating relevance scores for product attributes using a statistically-based classification model, it is possible to It is also possible to improve the accuracy of calculation of the associated score of product attributes for queries. In addition, the matching coverage of the learning data of the statistical-based classification model is maximized, and the accuracy of calculation of user queries and related scores of multiple product attributes can be further improved.

本開示の多様な実施例によれば、ユーザクエリに対する複数の商品属性の関連点数を算出する統計基盤分類モデルの学習に使用される学習データを、統合検索ログデータやショッピング又は商品検索ログデータなどのような多様な検索ログデータから生成できる。また、学習データは、検索ログデータのうちでユーザが入力したユーザクエリ、検索結果及び検索結果に応答するユーザの動作に基づいて自動生成できるので、統計基盤分類モデルの学習データを効率よく確保できる。 According to various embodiments of the present disclosure, the learning data used for learning a statistically-based classification model that calculates the relevance scores of multiple product attributes for a user query may be integrated search log data, shopping or product search log data, or the like. It can be generated from various search log data such as In addition, learning data can be automatically generated based on user queries, search results, and user actions in response to search results among search log data, so that learning data for the statistical-based classification model can be efficiently secured. .

本開示の多様な実施例によれば、商品属性を商品属性コードで表示することで、同一又は類似の商品属性が互いに異なる商品類型又はユーザクエリと関連することにより、商品属性抽出の結果の正確性を低下させるのを防止できる。すなわち、商品属性を商品属性コードで表示して統計基盤分類モデルを学習させることで、両義的商品属性及び範囲型商品属性に対しても関連点数の算出の正確性を向上させることができる。 According to various embodiments of the present disclosure, by displaying product attributes as product attribute codes, the same or similar product attributes are associated with different product types or user queries, thereby improving the accuracy of product attribute extraction results. It can prevent deterioration of performance. That is, by displaying product attributes as product attribute codes and learning a statistically-based classification model, it is possible to improve the accuracy of calculation of related points even for ambiguous product attributes and range-type product attributes.

本開示の実施例は、以下の添付図面に基づいて説明する。ここで、類似の参照番号は類似の要素を示すが、これに限定されるものではない。
本開示の一実施例に係るショッピング検索のための商品属性抽出方法によりユーザクエリから抽出された商品属性を反映した検索結果を表示する画面を例示する図である。 本開示の一実施例に係るショッピング検索のための商品属性抽出サービスを提供するために、複数のユーザ端末及び商品属性抽出サーバが通信可能に連結したシステムを示す概要図である。 本開示の一実施例に係るユーザ端末及び商品属性抽出サーバの内部構成を示すブロック図である。 本開示の一実施例に係る統計基盤分類モデルを用いてユーザクエリに対する商品属性の関連点数を算出する構成を示す図である。 本開示の一実施例に係る前処理器及び統計基盤分類モデルを含む分類器を用いて関連点数を算出する構成を示す図である。 本開示の一実施例に係る多様な検索結果から商品属性抽出のための統計基盤分類モデルの学習データを生成する例示を示す図である。 本開示の一実施例に係る商品属性を商品属性コードで表現して学習データを生成する方法を例示する図である。 本開示の一実施例に係る商品属性抽出サーバにより遂行されるショッピング検索のための商品属性抽出方法を示すフローチャートである。 本開示の一実施例に係るショッピング検索のための商品検索順位調整方法を示すフローチャートである。 本開示の一実施例に係るユーザ端末により遂行されるショッピング検索のための商品属性抽出方法を示すフローチャートである。 本開示の一実施例に係る商品属性抽出のための統計基盤分類モデルの学習方法を示すフローチャートである。
Embodiments of the present disclosure will be described with reference to the following accompanying drawings. Here, like reference numbers indicate like elements, but are not so limited.
FIG. 5 is a diagram illustrating a screen displaying search results reflecting product attributes extracted from a user query by a product attribute extraction method for shopping searches according to an embodiment of the present disclosure; 1 is a schematic diagram illustrating a system in which a plurality of user terminals and a product attribute extraction server are communicatively coupled to provide a product attribute extraction service for shopping search according to an embodiment of the present disclosure; FIG. It is a block diagram showing the internal configuration of a user terminal and a product attribute extraction server according to an embodiment of the present disclosure. FIG. 4 is a diagram showing a configuration for calculating a product attribute related score for a user query using a statistically based classification model according to an embodiment of the present disclosure; FIG. 4 is a diagram showing a configuration for calculating a relevance score using a classifier including a preprocessor and a statistically-based classification model according to an embodiment of the present disclosure; FIG. 5 is a diagram illustrating an example of generating learning data of a statistically-based classification model for extracting product attributes from various search results according to an embodiment of the present disclosure; FIG. 4 is a diagram illustrating a method of generating learning data by representing product attributes with product attribute codes according to an embodiment of the present disclosure; 4 is a flowchart illustrating a product attribute extraction method for shopping search performed by a product attribute extraction server according to an embodiment of the present disclosure; 4 is a flowchart illustrating a product search ranking adjustment method for shopping search according to an embodiment of the present disclosure; 4 is a flowchart illustrating a product attribute extraction method for shopping search performed by a user terminal according to an embodiment of the present disclosure; 4 is a flowchart illustrating a statistically-based classification model learning method for product attribute extraction according to an embodiment of the present disclosure;

以下、本開示の実施のための具体的な内容を添付図面に基づいて詳細に説明する。ただし、
以下の説明では、本開示の要旨を不要にぼやかす恐れがある場合、公知の機能や構成に関する具体的な説明は省略する。
Hereinafter, specific contents for carrying out the present disclosure will be described in detail based on the accompanying drawings. however,
In the following description, specific descriptions of well-known functions and configurations are omitted when they may unnecessarily obscure the subject matter of the present disclosure.

添付図面において、同一又は対応する構成要素には同一の参照符号が付与される。また、以下の実施例の説明において、同一又は対応する構成要素の重複記述は省略され得る。しかしながら、構成要素に関する記述が省略されても、そのような構成要素がある実施例に含まれないものと解してはならない。 In the accompanying drawings, the same or corresponding components are provided with the same reference numerals. Also, in the description of the embodiments below, duplicate descriptions of the same or corresponding components may be omitted. However, the omission of a description of an element should not be construed as omitting such element from being included in some embodiments.

開示の実施例の利点及び特徴、そしてそれらを達成する方法は、添付図面に基づいて後述する実施例を参照すれば明確になる。しかしながら、本開示は、以下で開示される実施例に限定されず、互いに異なる多様な形態で具現され得る。但し、本実施例は、本開示が完全になるようにし、本開示が通常の技術者に発明のカテゴリを正確に認識させるために提供されるだけである。 Advantages and features of the disclosed embodiments, and the manner in which they are achieved, will become apparent with reference to the embodiments described below with reference to the accompanying drawings. The present disclosure may, however, be embodied in various different forms and should not be construed as limited to the embodiments set forth below. However, the examples are provided only so that this disclosure will be complete and will enable those of ordinary skill in the art to accurately recognize the categories of the invention.

本明細書で使用される用語について簡略に説明し、開示の実施例について具体的に説明する。本明細書で使用される用語は、本開示での機能を考慮しつつ、可能な限り現在広く使用される一般的な用語を選択したが、これは関連分野に従事する技術者の意図又は判例、新技術の出現などにより変化し得る。また、特定の場合は出願人が任意で選定した用語もあり得るが、これらの意味は当該発明の説明の部分において詳細に記載する。よって、本開示で使用される用語は、単純な用語の名称ではなく、その用語が持つ意味と本開示の全般にわたった内容に基づいて定義されるべきである。 A brief description of terms used herein and a specific description of the disclosed embodiments are provided. The terms used in this specification have been selected as common terms that are currently widely used as much as possible while considering the function in this disclosure, but this is not the intention or precedent of an engineer engaged in the related field. , may change due to the emergence of new technologies. Also, certain terms may be arbitrarily chosen by the applicant, the meaning of which will be detailed in the description of the invention. Accordingly, terms used in this disclosure should be defined based on their meanings and overall context of this disclosure, rather than simply terminology.

本明細書では、文脈上において明確に特定しない限り、単数の表現は複数の表現を含み、複数の表現は単数の表現を含むことができる。 In this specification, singular expressions may include pluralities and plural expressions may include the singular unless the context clearly dictates otherwise.

明細書の全般に渡り、ある部分がある構成要素を「含む」とする際、これは特に反対の記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含むこともできることを意味する。 Throughout the specification, when a part "includes" an element, this does not exclude or may include other elements, unless specifically stated to the contrary. means you can.

また、明細書で使用される「モジュール」又は「部」という用語は、ソフトウェアやハードウェア構成要素を意味し、「モジュール」又は「部」はある役割を遂行する。しかしながら、「モジュール」又は「部」はソフトウェアやハードウェアに限定される意味ではない。「モジュール」又は「部」は、アドレッシング可能な保存媒体にあるように構成してもよく、一つ又はそれ以上のプロセッサを再生させるように構成してもよい。したがって、一例として、「モジュール」又は「部」は、ソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素、タスク構成要素のような構成要素、並びに、プロセス、関数、属性、プロシーザー、サブルーチン、プログラムコードのセグメント、ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ又は変数のうちで少なくとも一つを含むことができる。構成要素と「モジュール」又は「部」は、内部で提供される機能はさらに小さい数の構成要素及び「モジュール」又は「部」で結合されたり、追加的な構成要素と「モジュール」又は「部」にさらに分離されたりできる。 Also, the term "module" or "unit" as used herein means a software or hardware component that performs a certain role. However, "module" or "unit" is not meant to be limited to software or hardware. A "module" or "unit" may be configured to reside on an addressable storage medium and configured to run on one or more processors. Thus, by way of example, a "module" or "part" may refer to components such as software components, object-oriented software components, class components, task components, as well as processes, functions, attributes, procedures, subroutines, It may include at least one of program code segments, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays or variables. Components and "modules" or "sections" may be combined with a smaller number of components and "modules" or "sections" or may be combined with additional components and "modules" or "sections". ” can be further separated into

本開示の一実施例によれば、「モジュール」又は「部」はプロセッサ及びメモリで具現され得る。「プロセッサ」は汎用プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、制御器、マイクロ制御器、状態マシンなどを含むように広く解釈されるべきである。いくつかの環境では、「プロセッサ」は特定用途向け半導体(ASIC)、プログラム可能なロジックデバイス(PLD)、フィールドプログラム可能なゲートアレイ(FPGA)等を指すこともできる。「プロセッサ」は、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサの組合せ、DSPコアと結合した一つ以上のマイクロプロセッサの組合せ、若しくは、任意の他のそのような構成等の組合せのような処理デバイスの組合せを指すこともできる。また、「メモリ」は電子情報を保存可能な任意の電子コンポーネントを含むように広く解釈されるべきである。「メモリ」は、RAM(Random Access Memory)、ROM(Read Only Memory)、NVRAM(Non-Volatile Random Access Memory)、PROM(Programmable Read-Only Memory)、EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Reda-Only Memory)、フラッシュメモリ、磁気又は光学データ保存装置、レジスターなどのようなプロセッサ-読み取り可能な媒体の多様な類型を指すこともできる。プロセッサがメモリから情報を読み取り/読み取ったりメモリに情報を記録できる場合、メモリはプロセッサと電子通信状態にあると言われる。プロセッサに集積されたメモリはプロセッサと電子通信状態にある。 According to one embodiment of the present disclosure, a "module" or "unit" may be embodied with a processor and memory. "Processor" should be interpreted broadly to include general purpose processors, central processing units (CPUs), microprocessors, digital signal processors (DSPs), controllers, microcontrollers, state machines, and the like. In some environments, a "processor" can also refer to an application specific semiconductor (ASIC), programmable logic device (PLD), field programmable gate array (FPGA), and the like. A "processor" may be, for example, a combination of a DSP and a microprocessor, a combination of multiple microprocessors, a combination of one or more microprocessors combined with a DSP core, or any other such configuration. It can also refer to any combination of processing devices. Also, "memory" should be interpreted broadly to include any electronic component capable of storing electronic information. "Memory" includes RAM (Random Access Memory), ROM (Read Only Memory), NVRAM (Non-Volatile Random Access Memory), PROM (Programmable Read-Only Memory), EPROM (Erasable Programmable Read-Only Memory), EEPROM ( It can also refer to various types of processor-readable media such as electrically erasable programmable reda-only memory), flash memory, magnetic or optical data storage devices, registers, and the like. Memory is said to be in electronic communication with a processor when the processor can read information from, or record information in, the memory. Memory integrated with the processor is in electronic communication with the processor.

本開示において、「ユーザクエリ」は、検索エンジンを用いて入力及び検索できるテキスト(例えば、単語、文句、文章等)を含むことのできるが、これに限定されるものではない。例えば、ユーザクエリは、ユーザがウェブブラウザ、検索アプリケーション又はショッピングアプリケーションのような検索プログラムの入力UIを介して入力するテキストを含んだり、ユーザが検索プログラムで提供するクエリリストからクリックにより選択できるテキストを含んだりできる。他の例において、ユーザクエリは、テキストに限定されず、イメージ、映像、音声、声などのようなマルチメディアコンテンツから抽出できるテキスト又は情報を含むことができる。 In the present disclosure, a "user query" can include, but is not limited to, text (eg, words, phrases, sentences, etc.) that can be entered and searched using a search engine. For example, a user query includes text that a user inputs through an input UI of a search program such as a web browser, search application, or shopping application, or text that a user can select from a query list provided by a search program by clicking on it. can contain In other examples, user queries are not limited to text, but can include text or information that can be extracted from multimedia content such as images, videos, sounds, voices, and the like.

本開示において、「商品属性」は、商品名、製品番号、規格又はサイズ、形態、色相、材質、性能、価格などを含む商品に関する多様な情報を示すことができる。例えば、商品属性は、ショッピング検索又は商品検索の結果として当該商品の購買先に関する接続情報(例えば、商品購買ウェブページに関するリンク情報)と共にユーザに提供され得る。 In the present disclosure, the 'product attribute' may indicate various information about the product, including product name, product number, standard or size, shape, color, material, performance, price, and the like. For example, the product attributes may be provided to the user as a result of a shopping search or product search along with connection information regarding the purchaser of the product (eg, link information regarding a product purchase web page).

本開示において、「統計基盤分類モデル」は、公知のラベル付き(labeling)データに対する関連性(relevance)に基づき、ラベル付きにならない新しい情報を分類するように学習さされた分類器(classifier)又は分類モデルを一般的に示すことができる。例えば、統計基盤分類モデルは、言語モデル(language model)、SVM(support vector machine)、最大エントロピーモデル(maximum entropy model)、CRFモデル(conditional random field model)、FFNN(feed-forward neural network)、RNN(recurrent neural network)、GRU(gated recurrent unit)、LSTM(long short-term memory)、トランスフォーマーモデル(transformer model)、BERTモデル(bidirectional encoder representations from transformers model)などのような多様な機械学習又は人工ニューラルネットワーク(neural network)モデルの何れか一つであり得る。 In the present disclosure, a “statistics-based classification model” is a classifier trained to classify new unlabeled information based on its relevance to known labeled data, or Classification models can be presented generically. For example, statistically based classification models include language model, SVM (support vector machine), maximum entropy model, CRF model (conditional random field model), FFNN (feed-forward neural network), RNN (recurrent neural network), GRU (gated recurrent unit), LSTM (long short-term memory), transformer model, BERT model (bidirectional encoder representations from transformers model), etc. It can be any one of a neural network model.

本開示において、「埋め込み(embedding)」は、カテゴリ変数又は離散変数(categorical or discrete variable)を連続ベクトル(continuous vector)に変換する技法を示すことができる。埋め込みは、ユーザクエリのようなカテゴリ変数を連続ベクトルに変換することにより、その情報の次元を縮小し、意味を導出するのに使用できる。また、ユーザクエリが埋め込みベクトル空間でベクトルとして表現される場合、そのベクトル空間上における近所のベクトル等は類似又は関連した特性を共有できる。例えば、ユーザクエリをベクトル空間に埋め込む方法は、人工ニューラルネットワークの学習により具現できる。 In this disclosure, "embedding" can refer to the technique of transforming a categorical or discrete variable into a continuous vector. Embedding can be used to reduce the dimensionality of information and derive meaning from categorical variables, such as user queries, by transforming them into continuous vectors. Also, if a user query is represented as a vector in an embedded vector space, neighborhood vectors, etc. on that vector space can share similar or related properties. For example, a method of embedding user queries in a vector space can be implemented by training an artificial neural network.

図1は、本開示の一実施例に係るショッピング検索のための商品属性抽出方法によりユーザクエリ110から抽出された商品属性を反映した検索結果130を表示する画面100を例示する図である。同図に示すように、ユーザがショッピングサイトの検索窓にユーザクエリ110を入力する場合、当該ユーザクエリ110から抽出した商品属性134、138を反映した検索結果130が表示され得る。検索結果130には、検索の商品を示すイメージや名称132、136及び商品属性134、138などが含まれる。例えば、ユーザが「ミニノートブック」を検索クエリとして入力した場合、当該クエリに含まれた商品である「ノートブック」コンピュータのサイズ又は規格に関する表現である「ミニ」と関連する商品132、136が、検索結果130の上部に表示されるように検索結果の順位が調整され得る。すなわち、検索結果130には、多様なノートブック(又はラップトップ)コンピュータ商品のうち、画面サイズが「10インチ」及び「11インチ」である商品132、136が、検索結果130の上部に優先的に表示され得る。したがって、ユーザは、検索結果130を介して、本人が入力した商品検索クエリから抽出できる商品属性134、138と関連する商品132、136の情報を容易且つ迅速に確認できる。また、ユーザは、必要に応じて、当該商品132、136の何れか一つを選択又はクリックすることで、選択の商品に関するより具体的な情報を取得したり、オンライン購買を実行したりできる。 FIG. 1 is a diagram illustrating a screen 100 displaying search results 130 reflecting product attributes extracted from a user query 110 by a product attribute extraction method for shopping searches according to an embodiment of the present disclosure. As shown in the figure, when a user inputs a user query 110 into a search window of a shopping site, a search result 130 reflecting product attributes 134 and 138 extracted from the user query 110 can be displayed. The search result 130 includes images and names 132 and 136 indicating the searched product, product attributes 134 and 138, and the like. For example, when a user inputs "mini-notebook" as a search query, products 132 and 136 related to "mini", which is an expression related to the size or standard of the "notebook" computer, which is the product included in the query, are displayed. , the ranking of the search results may be adjusted so that they appear at the top of the search results 130 . That is, in the search result 130, among various notebook (or laptop) computer products, products 132 and 136 with screen sizes of '10 inches' and '11 inches' are preferentially displayed at the top of the search results 130. can be displayed in Therefore, through the search result 130, the user can easily and quickly check the information of the products 132, 136 related to the product attributes 134, 138 that can be extracted from the product search query entered by the user. In addition, the user can select or click any one of the products 132 and 136 as necessary to obtain more specific information about the selected product, or perform online purchases.

さらに、画面100において、検索結果130の上部には、商品属性をフィルタリング又は選択できるユーザインタフェース120が表示され得る。したがって、ユーザは、ユーザインタフェース120から、商品カテゴリや製造社や画面サイズなどのように、ユーザクエリ110と関連する商品属性の一つ以上を選択して、検索結果130に表示された商品132、136の順序又は順位をさらに調整できる。例えば、ユーザが、ユーザインタフェース120から製造社フィルタリング項目のうちで「A社」を選択する場合、検索結果130には「A社」の生産商品等の情報が上部に表示され得る。 Further, in screen 100, above search results 130, a user interface 120 may be displayed that allows filtering or selection of product attributes. Accordingly, from the user interface 120, the user selects one or more of the product attributes associated with the user query 110, such as product category, manufacturer, screen size, etc., to obtain the products 132, 136 can be further adjusted. For example, when the user selects 'Company A' from among the manufacturer filtering items from the user interface 120, information such as products manufactured by 'Company A' may be displayed at the top of the search results 130 .

一実施例において、ユーザクエリ110が入力された場合、商品属性抽出方法によりユーザクエリ110に対する複数の商品属性の関連性又は関連確率が算出できる。例えば、ノートブックコンピュータの商品属性は、色相、ケースの材質、CPUの性能、メモリの容量、画面サイズ及び解像度などを含むことができる。他の例として、家庭用TVの商品属性は、色相、ディスプレイの種類、サイズ、解像度及びインターネット接続機能可否などを含むことができる。商品属性抽出方法は、ユーザクエリ110が「ミニノートブック」である場合、ノートブックコンピュータの複数の商品属性だけでなく、家庭用TV、ファッション雑貨及び生活健康用品などの異なる種類の商品の複数の商品属性に対しても関連性が算出できる。ユーザクエリ110が「ミニノートブック」である場合、ノートブックコンピュータの商品属性のうち、小型の画面サイズ属性(例えば、「10インチ」)に対する関連性が最も高く算出されるのに対し、ノートブックコンピュータの異なる商品属性や異なる種類の商品の商品属性に対する関連性は低く算出され得る。 In one embodiment, when the user query 110 is input, the relevance or relevance probability of a plurality of product attributes to the user query 110 can be calculated by the product attribute extraction method. For example, the product attributes of a notebook computer may include color, case material, CPU performance, memory capacity, screen size and resolution. As another example, the product attributes of a home TV may include color, display type, size, resolution, internet connectivity, and the like. When the user query 110 is "mini-notebook", the product attribute extraction method includes not only multiple product attributes of notebook computers, but also multiple product attributes of different types of products such as household TVs, fashion miscellaneous goods, and lifestyle and health products. Relevance can also be calculated for product attributes. When the user query 110 is "mini-notebook", the relevance to the small screen size attribute (for example, "10 inches") is calculated to be the highest among the product attributes of the notebook computer. Relevance to different product attributes of computers and product attributes of different types of products can be calculated to be low.

一方、ユーザクエリ110に対する商品検索結果130を商品データベースから得られる。ユーザクエリ110による商品検索は、商品データベースに保存された商品情報のうち、ユーザクエリ110と関連性が高い商品情報を抽出することにより実行できる。このように抽出された商品検索結果130には、ユーザクエリ110との関連性の高い商品情報の方が、関連性の低い商品情報よりも上位に表示され得る。また、前述したように算出されたユーザクエリ110に対する商品属性の関連性(又は関連点数)に基づき、商品検索結果130による商品検索順位が調整できる。これによれば、ユーザクエリ110が「ミニノートブック」である場合、商品検索結果130には、画面サイズが小さいノートブックコンピュータに関する商品132、136情報が上位に表示され得る。 On the other hand, a product search result 130 for the user query 110 is obtained from the product database. A product search based on the user query 110 can be executed by extracting product information highly relevant to the user query 110 from product information stored in the product database. In the product search results 130 extracted in this manner, product information highly relevant to the user query 110 may be displayed at a higher rank than product information less relevant. In addition, the product search ranking according to the product search results 130 can be adjusted based on the relevance (or related score) of product attributes to the user query 110 calculated as described above. According to this, when the user query 110 is “mini-notebook”, the product search results 130 may display product 132 and 136 information related to notebook computers with small screen sizes at the top.

また、ユーザクエリ110に対する商品属性抽出方法によれば、ユーザクエリ110を音節(syllable)及び/又は形態素(morpheme)の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。一実施例において、商品属性抽出方法は、ユーザクエリ110を音節の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。また、商品属性抽出方法は、ユーザクエリ110を形態素の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。以上のように抽出された2つの関連点数は、合算又は結合により最終の関連点数として用いられる。 In addition, according to the product attribute extraction method for the user query 110, the user query 110 is divided into syllable and/or morpheme units and analyzed, so that a plurality of product attributes related to the user query 110 are analyzed. Score can be calculated. In one embodiment, the method for extracting product attributes can calculate the relevance score of a plurality of product attributes with respect to the user query 110 by analyzing the user query 110 by dividing it into syllable units. In addition, the product attribute extraction method divides the user query 110 into morpheme units and analyzes them, so that the relevance score of a plurality of product attributes to the user query 110 can be calculated. The two relevance scores extracted as described above are used as the final relevance score by summing or combining.

ユーザクエリ110に対する商品属性抽出方法は、統計基盤分類モデルにより商品属性の関連点数が算出できる。統計基盤分類モデルは、ユーザクエリ110が複数の商品属性と関連する確率を算出するように学習できる。一実施例において、統計基盤分類モデルは、音節及び/又は形態素の単位に分割されたユーザクエリ110を入力として、可能な全ての商品属性と関連する確率(又は関連点数)を算出するように学習できる。例えば、ユーザクエリ110として「ミニノートブック」が入力された場合、画面サイズが小さい「10インチ」又は「11インチ」の商品属性134、138に該当する確率値が、画面サイズが大きい「17インチ」の商品属性に該当する確率値よりも大きく算出され得る。 The product attribute extraction method for the user query 110 can calculate the related score of product attributes using a statistically based classification model. A statistically-based classification model can be trained to calculate the probabilities that a user query 110 is associated with multiple product attributes. In one embodiment, the statistically-based classification model is trained to take as input a user query 110 segmented into syllables and/or morphemes and calculate the probabilities (or association scores) associated with all possible product attributes. can. For example, when "mini notebook" is input as the user query 110, the probability value corresponding to the product attributes 134, 138 of "10 inches" or "11 inches" with a small screen size is "17 inches" with a large screen size. ” can be calculated to be larger than the probability value corresponding to the product attribute.

以上で説明した方法により、統計基盤分類モデルにより算出された商品属性の関連点数に基づき、検索結果130に含まれた商品132、136の検索順位が調整できる。商品検索順位(又は商品検索順位点数)は、ユーザクエリ110に対する商品名又は商品属性の語彙類似度、商品に対するユーザ人気度等に基づいて決定され得る。このとき、各商品132、136の検索順位点数に対して商品属性の関連点数が合算又は加重値として適用されて、最終の商品132、136の検索順位点数が決定され得る。一実施例において、ユーザクエリ110に対して算出された商品属性の関連点数のうち、最も高い関連点数に基づいて商品132、136の検索順位が調整できる。代案として、ユーザクエリ110に対して算出された商品属性の関連点数のうち、上位n個(nは1より大きい整数)の関連点数に基づいて商品132、136の検索順位が調整できる。 According to the method described above, the search rankings of the products 132 and 136 included in the search results 130 can be adjusted based on the related scores of the product attributes calculated by the statistically based classification model. The product search ranking (or product search ranking score) may be determined based on the lexical similarity of the product name or product attribute to the user query 110, user popularity of the product, and the like. At this time, a final search ranking score of the products 132 and 136 may be determined by adding or weighting the related scores of the product attributes to the search ranking scores of the products 132 and 136 . In one embodiment, the search rankings of the products 132 and 136 may be adjusted based on the highest relevance score among the relevance scores of the product attributes calculated for the user query 110 . Alternatively, the search rankings of the products 132 and 136 may be adjusted based on the top n (n is an integer greater than 1) related scores among the related scores of the product attributes calculated for the user query 110 .

他の実施例において、ユーザクエリ110に対する商品属性抽出方法は、商品データベースから商品情報の商品属性を生成又はアップデートするのに使用される。例えば、商品属性抽出方法は、商品データベースに保存された商品情報の商品名に基づき、可能な全ての商品属性の関連点数を算出し、最も高い関連点数と関連する商品属性を当該商品情報の商品属性として保存又はアップデートできる。 In another embodiment, the product attribute extraction method for user query 110 is used to generate or update product attributes for product information from a product database. For example, the method for extracting product attributes is to calculate the associated scores of all possible product attributes based on the product name of the product information stored in the product database, and select the product attribute associated with the highest Can be stored or updated as attributes.

図1に示す例は、本開示のショッピング検索のための商品属性抽出方法によって決定された商品検索結果130又は商品検索順位が、商品検索又はショッピングのためのウェブサイトやアプリケーションを介して提供されることを示しているが、これに限定されるものではない。本開示の多様な実施例による方法は、統合検索サイトの検索サービス又はユーザ端末により実行される検索アプリケーションを介して提供されることもできる。 In the example shown in FIG. 1, product search results 130 or product search rankings determined by the product attribute extraction method for shopping search of the present disclosure are provided via a website or application for product search or shopping. However, it is not limited to this. Methods according to various embodiments of the present disclosure can also be provided via a search service of an integrated search site or a search application executed by a user terminal.

図2は、本開示の一実施例に係るショッピング検索のための商品属性抽出サービスを提供するために、複数のユーザ端末210_1、210_2、210_3及び商品属性抽出サーバ230が通信可能に連結したシステム200を示す概要図である。同図に示すように、システム200は、ショッピング検索のための商品属性抽出サービスを提供する商品属性抽出サーバ230と、商品属性抽出サーバ230にネットワーク220を介して連結した複数のユーザ端末210_1、210_2、210_3と、検索ログデータベース240とを含むことができる。一実施例によれば、商品属性抽出サーバ230は、商品属性抽出サービスを提供するためのコンピュータ実行可能なプログラム(例えば、ダウンロード可能なアプリケーション)や、データを保存、提供及び実行できる一つ以上のサーバ装置及び/又はデータベースや、クラウドコンピューティング(cloud computing)サービス基盤の一つ以上の分散コンピュータ装置及び/又は分散データベースを含むことができる。商品属性抽出サーバ230により提供される商品属性抽出サービスは、複数のユーザ端末210_1、210_2、210_3の各々に設置された検索アプリケーション又はウェブブラウザを介してユーザに提供され得る。 FIG. 2 illustrates a system 200 in which a plurality of user terminals 210_1, 210_2, 210_3 and a product attribute extraction server 230 are communicatively coupled to provide a product attribute extraction service for shopping search according to an embodiment of the present disclosure. It is a schematic diagram showing As shown in the figure, the system 200 includes a product attribute extraction server 230 that provides a product attribute extraction service for shopping searches, and a plurality of user terminals 210_1 and 210_2 connected to the product attribute extraction server 230 via a network 220. , 210_3 and a search log database 240 . According to one embodiment, the product attribute extraction server 230 is one or more computer-executable programs (e.g., downloadable applications) that can store, provide, and execute data for providing product attribute extraction services. It can include server devices and/or databases, and one or more distributed computer devices and/or distributed databases of cloud computing service infrastructure. The product attribute extraction service provided by the product attribute extraction server 230 can be provided to the user via a search application or web browser installed in each of the plurality of user terminals 210_1, 210_2, 210_3.

複数のユーザ端末210_1、210_2、210_3は、ネットワーク220を介して商品属性抽出サーバ230と通信できる。ネットワーク220は、複数のユーザ端末210及び商品属性抽出サーバ230間の通信が可能であるように構成できる。ネットワーク220は、設置環境に応じて、例えば、イーサネット(Ethernet)、PLC(Power Line Communication)、電話線通信装置及びRS-serial通信などのような有線ネットワーク220、移動通信網、WLAN(Wireless LAN)、Wi-Fi、Bluetooth及びZigBeeなどのような無線ネットワーク220又はその組合せからなることができる。通信方式は制限されず、ネットワーク220を含むことができる通信網(例えば、移動通信網、有線インターネット、無線インターネット、放送網、衛星網等)を活用する通信方式だけでなく、ユーザ端末210_1、210_2、210_3間の近距離無線通信も含まれる。例えば、ネットワーク220は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークの何れか一つ以上を含むことができる。また、ネットワーク220は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリー又は階層ネットワークなどを含むネットワークトポロジー(network topology)の何れかの一つ以上を含むことができるが、これに制限されるものではない。 A plurality of user terminals 210_1, 210_2, and 210_3 can communicate with the product attribute extraction server 230 via the network 220. FIG. The network 220 can be configured to allow communication between multiple user terminals 210 and product attribute extraction servers 230 . The network 220 may be a wired network 220 such as Ethernet, PLC (Power Line Communication), telephone line communication device and RS-serial communication, mobile communication network, WLAN (Wireless LAN), etc., depending on the installation environment. , Wi-Fi, Bluetooth and ZigBee, etc., or a combination thereof. The communication method is not limited, and the user terminals 210_1 and 210_2 as well as the communication method using a communication network (eg, mobile communication network, wired Internet, wireless Internet, broadcasting network, satellite network, etc.) that can include the network 220. , 210_3 is also included. For example, the network 220 includes a PAN (personal area network), a LAN (local area network), a CAN (campus area network), a MAN (metropolitan area network), a WAN (wide area network), a BBN (broadband network), the Internet, and the like. Any one or more of the networks can be included. Network 220 may also include any one or more of network topologies including bus networks, star networks, ring networks, mesh networks, star-bus networks, tree or hierarchical networks, etc. It is not limited to this.

図2では、携帯電話やスマートフォン210_1、タブレットコンピュータ210_2及びラップトップ又はデスクトップコンピュータ210_3をユーザ端末の例として示したが、これに限定されず、ユーザ端末210_1、210_2、210_3は、有線及び/又は無線通信が可能であり、検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザが設置されて実行できる任意のコンピュータ装置であり得る。例えば、ユーザ端末210は、スマートフォン、携帯電話、ナビゲーション端末機、デスクトップコンピュータ、ラップトップコンピュータ、デジタル放送用端末機、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットコンピュータ、ゲームコンソール(game console)、ウェアラブルデバイス(wearable device)、IoT(internet of things)デバイス、VR(virtual reality)デバイス及びAR(augmented reality)デバイスなどを含むことができる。また、図2では、3つのユーザ端末210_1、210_2、210_3がネットワーク220を介して商品属性抽出サーバ230と通信するものと示したが、これに限定されず、異なる数のユーザ端末がネットワーク220を介して商品属性抽出サーバ230と通信するように構成されることもできる。 In FIG. 2, a mobile phone or smart phone 210_1, a tablet computer 210_2, and a laptop or desktop computer 210_3 are shown as examples of user terminals, but the user terminals 210_1, 210_2, and 210_3 are wired and/or wireless. It can be any computing device capable of communication and on which a search application, mobile browser application or web browser can be installed and executed. For example, the user terminal 210 includes a smart phone, a mobile phone, a navigation terminal, a desktop computer, a laptop computer, a digital broadcast terminal, a PDA (Personal Digital Assistants), a PMP (Portable Multimedia Player), a tablet computer, a game console (game console), wearable device, internet of things (IoT) device, virtual reality (VR) device, augmented reality (AR) device, and the like. In addition, although FIG. 2 shows that three user terminals 210_1, 210_2, and 210_3 communicate with the product attribute extraction server 230 via the network 220, the present invention is not limited to this, and different numbers of user terminals communicate with the network 220. It can also be configured to communicate with the product attribute extraction server 230 via.

一実施例によれば、商品属性抽出サーバ230は、複数のユーザ端末210_1、210_2、210_3から入力された一つ以上のユーザクエリが受信できる。一実施例によれば、商品属性抽出サーバ230は、複数のデスクトップ又はラップトップコンピュータ210_3で実行中であるウェブブラウザにより表示された検索サイトの検索エンジンに入力されたユーザクエリが受信できる。他の実施例によれば、商品属性抽出サーバ230は、複数の携帯電話やスマートフォン及びタブレットコンピュータ210_1、210_2で実行中であるモバイルブラウザアプリケーションにより表示された検索サイトの検索エンジンに入力されたユーザクエリが受信できる。他の実施例によれば、商品属性抽出サーバ230は、商品を販売するオンラインショッピングサイトの検索エンジンに入力されたユーザクエリが受信できる。 According to one embodiment, the product attribute extraction server 230 can receive one or more user queries input from a plurality of user terminals 210_1, 210_2, and 210_3. According to one embodiment, the product attribute extraction server 230 can receive user queries entered into a search engine of a search site displayed by a web browser running on a plurality of desktop or laptop computers 210_3. According to another embodiment, the product attribute extraction server 230 extracts user queries entered into search engines of search sites displayed by mobile browser applications running on a plurality of mobile phones, smart phones and tablet computers 210_1, 210_2. can be received. According to another embodiment, the product attribute extraction server 230 can receive user queries entered into a search engine of an online shopping site that sells products.

また、商品属性抽出サーバ230は、受信したユーザクエリに対する複数の商品属性の関連点数が算出できる。一実施例において、商品属性抽出サーバ230は、商品属性の関連点数を算出するように学習された統計基盤分類モデルを含むことができる。商品属性抽出サーバ230は、受信したユーザクエリを音節及び/又は形態素の単位に分割し、分割した音節及び/又は形態素の単位のユーザクエリを、関連点数を算出する統計基盤分類モデルの入力として使用できる。また、商品属性抽出サーバ230は、ネットワーク220を介して連結した検索ログデータベース240から統計基盤分類モデルを学習するための学習データが受信できる。例えば、検索ログデータベース240から受信された学習データは、ユーザクエリ及び当該ユーザクエリに対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対(pair)を含むことができる。 In addition, the product attribute extraction server 230 can calculate the associated score of a plurality of product attributes with respect to the received user query. In one embodiment, the product attribute extraction server 230 may include a statistically-based classification model trained to calculate the relevance score of product attributes. The product attribute extraction server 230 divides the received user query into units of syllables and/or morphemes, and uses the divided user queries of units of syllables and/or morphemes as inputs for a statistically-based classification model that calculates a relevance score. can. Also, the product attribute extraction server 230 can receive learning data for learning a statistical-based classification model from the search log database 240 connected through the network 220 . For example, the learning data received from the search log database 240 includes a pair of user queries and product information (e.g., attribute information of specific products) selected by the user from product search results corresponding to the user queries. can be done.

商品属性抽出サーバ230は、複数の商品属性の一つ以上の上位関連点数と関連する商品属性を抽出し、商品データベース(図示せず)から当該商品属性を含む商品情報が検索できる。このように検索された商品情報の順位は、商品属性の関連点数に基づいて再調整できる。また、商品属性抽出サーバ230は、上位関連点数と関連する商品属性の重要度を決定する商品属性加重値及び当該関連点数に基づいて商品検索順位が調整できる。ここで、商品属性加重値は、商品検索結果に対するユーザの応答(例えば、上位商品検索結果に対するユーザの選択回数)によって変更できる。 The product attribute extraction server 230 can extract product attributes related to one or more top-level related scores among a plurality of product attributes, and search product information including the product attributes from a product database (not shown). The ranking of the retrieved product information can be readjusted based on the associated score of product attributes. In addition, the product attribute extraction server 230 can adjust the product search order based on the product attribute weighting value that determines the importance of the product attributes related to the top related scores and the relevant related scores. Here, the product attribute weight value can be changed according to the user's response to the product search result (for example, the number of times the user selects the top product search result).

図3は、本開示の一実施例に係るユーザ端末210及び商品属性抽出サーバ230の内部構成を示すブロック図である。ユーザ端末210は、ウェブブラウザ又はアプリケーションが実行可能であり、有/無線通信が可能な任意のコンピュータ装置を示すことができ、例えば、ユーザ端末210は、図2に示す携帯電話やスマートフォン210_1、タブレットコンピュータ210_2、ラップトップ又はデスクトップコンピュータ210_3などを含むことができる。図3に示すように、ユーザ端末210は、メモリ312、プロセッサ314、通信モジュール316及び入出力インタフェース318を含むことができる。これと同様に、商品属性抽出サーバ230は、メモリ332、プロセッサ334、通信モジュール336及び入出力インタフェース338を含むことができる。図3に示すように、ユーザ端末210及び商品属性抽出サーバ230は、各々の通信モジュール316、336を用いて、ネットワーク220を介して情報及び/又はデータが通信できるように構成できる。また、入出力装置320は、入出力インタフェース318を介して、ユーザ端末210に情報及び/又はデータを入力したり、ユーザ端末210から生成された情報及び/又はデータを出力したりするように構成できる。 FIG. 3 is a block diagram showing internal configurations of the user terminal 210 and the product attribute extraction server 230 according to an embodiment of the present disclosure. The user terminal 210 can represent any computer device capable of executing a web browser or an application and capable of wire/wireless communication. It may include a computer 210_2, a laptop or desktop computer 210_3, and so on. As shown in FIG. 3, user terminal 210 may include memory 312 , processor 314 , communication module 316 and input/output interface 318 . Similarly, item attribute extraction server 230 may include memory 332 , processor 334 , communication module 336 and input/output interface 338 . As shown in FIG. 3 , user terminal 210 and product attribute extraction server 230 can be configured to communicate information and/or data over network 220 using respective communication modules 316 , 336 . The input/output device 320 is also configured to input information and/or data to the user terminal 210 and output information and/or data generated from the user terminal 210 via the input/output interface 318. can.

メモリ312、332は、非一時的な任意のコンピュータ読取り可能な記録媒体を含むことができる。一実施例によれば、メモリ312、332は、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)及びフラッシュメモリ(flash memory)などのような永久的な大容量記憶装置(permanent mass storage device)を含むことができる。他の例として、ROM、SSD、フラッシュメモリ及びディスクドライブなどのような永久的な大容量保存装置は、メモリ312、332とは区分される別途の永久保存装置としてユーザ端末210又は商品属性抽出サーバ230に含まれることができる。また、メモリ312、332には、運営体制と少なくとも一つのプログラムコード(例えば、ユーザ端末210又は商品属性抽出サーバ230に設置されて駆動される商品属性抽出方法を実行するためのコード)が保存され得る。 Memory 312, 332 may include any non-transitory computer-readable medium. According to one embodiment, the memory 312, 332 is a permanent memory such as random access memory (RAM), read only memory (ROM), disk drive, solid state drive (SSD), and flash memory. A permanent mass storage device may be included. As another example, a permanent large-capacity storage device such as a ROM, an SSD, a flash memory, a disk drive, etc. may be used as a permanent storage device separate from the memories 312 and 332, and the user terminal 210 or the product attribute extraction server may be used. 230. In addition, the memories 312 and 332 store an operating system and at least one program code (for example, a code for executing a product attribute extraction method installed and driven by the user terminal 210 or the product attribute extraction server 230). obtain.

このようなソフトウェア構成要素は、メモリ312、332とは別途のコンピュータで読み取り可能な記録媒体からローディングできる。このような別途のコンピュータで読み取り可能な記録媒体は、このようなユーザ端末210及び商品属性抽出サーバ230に直接連結可能な記録媒体を含むことのできるが、例えば、フロッピードライブ、ディスク、テープ、DVD/CD-ROMドライブ及びメモリカードなどのようなコンピュータで読み取り可能な記録媒体を含むことができる。他の例として、ソフトウェア構成要素等は、コンピュータで読み取り可能な記録媒体でない、通信モジュール316、336を介してメモリ312、332にローディングできる。例えば、少なくとも一つのプログラムは、開発者又はアプリケーションの設置ファイルを配信するファイル配信システムが、ネットワーク220を介して提供するファイルにより設置されるコンピュータプログラム(例えば、ショッピング検索のための商品属性抽出サービスを提供するアプリケーション)に基づいてメモリ312、332にローディングできる。 Such software components can be loaded from a computer-readable medium separate from the memories 312,332. Such separate computer-readable recording media can include recording media directly connectable to the user terminal 210 and the product attribute extraction server 230, such as floppy drives, discs, tapes, DVDs, etc. /CD-ROM drives and computer readable recording media such as memory cards. As another example, software components and the like can be loaded into memory 312, 332 via communication modules 316, 336, which are not computer-readable media. For example, at least one program is a computer program installed by a file provided via the network 220 by a developer or a file distribution system that distributes an application installation file (for example, a product attribute extraction service for shopping searches). It can be loaded into the memory 312, 332 based on the application serving).

プロセッサ314、334は、基本的な算術、ロジック及び入出力演算を遂行することで、コンピュータプログラムの命令を処理するように構成できる。命令は、メモリ312、332又は通信モジュール316、336によりプロセッサ314、334に提供され得る。例えば、プロセッサ314、334は、メモリ312、332のような記録装置に保存されたプログラムコードによって受信される命令を実行するように構成できる。 The processors 314, 334 can be configured to process computer program instructions by performing basic arithmetic, logic and input/output operations. Instructions may be provided to processors 314 , 334 by memory 312 , 332 or communication modules 316 , 336 . For example, the processors 314,334 can be configured to execute instructions received by program code stored in a storage device, such as the memory 312,332.

通信モジュール316、336は、ネットワーク220を介して、ユーザ端末210と商品属性抽出サーバ230とが互いに通信するための構成や機能が提供でき、ユーザ端末210及び/又は商品属性抽出サーバ230が、他のユーザ端末又は他のシステム(例えば、別途の検索エンジンシステム等)と通信するための構成や機能が提供できる。一例として、ユーザ端末210のプロセッサ314がメモリ312などのような記録装置に保存されたプログラムコードによって生成した要請やデータ(例えば、ユーザクエリに対する商品属性を考慮した検索結果出力要請)は、通信モジュール316の制御により、ネットワーク220を介して商品属性抽出サーバ230に伝達され得る。反対に、商品属性抽出サーバ230のプロセッサ334の制御により提供される制御信号や命令が、通信モジュール336及びネットワーク220を経て、ユーザ端末210の通信モジュール316を介してユーザ端末210に受信され得る。例えば、ユーザ端末210は、商品属性抽出サーバ230から通信モジュール316を介してユーザクエリに対する商品検索結果、複数の商品属性の関連点数、算出された関連点数が反映された商品検索結果などが受信できる。 Communication modules 316 and 336 can provide configurations and functions for mutual communication between user terminal 210 and product attribute extraction server 230 via network 220, and user terminal 210 and/or product attribute extraction server 230 can communicate with each other. configuration or functionality for communicating with other user terminals or other systems (eg, a separate search engine system, etc.). For example, the processor 314 of the user terminal 210 requests or data generated by program codes stored in a recording device such as the memory 312 (e.g., a search result output request considering product attributes for a user query) may be sent to the communication module. Control at 316 may be communicated to product attribute extraction server 230 via network 220 . Conversely, control signals or instructions provided by the control of processor 334 of product attribute extraction server 230 may be received by user terminal 210 via communication module 316 of user terminal 210 via communication module 336 and network 220 . For example, the user terminal 210 can receive, from the product attribute extraction server 230 through the communication module 316, a product search result corresponding to a user query, related scores of a plurality of product attributes, product search results reflecting the calculated related score, and the like. .

入出力インタフェース318は、入出力装置320とのインタフェースのための手段であり得る。一例として、入力装置はイメージセンサを含むカメラ、キーボード、マイクロホン、マウスなどのような装置を含み、出力装置はディスプレイ、スピーカ、ハプティックフィードバックデバイス(haptic feedback device)などのような装置を含むことができる。他の例として、入出力インタフェース318は、タッチスクリーンなどのように入力及び出力を遂行するための構成及び機能が一つで統合された装置とのインタフェースのための手段であり得る。例えば、ユーザ端末210のプロセッサ314がメモリ312にローディングされたコンピュータプログラムの命令を処理する際に、商品属性抽出サーバ230や他のユーザ端末210が提供する情報及び/又はデータを用いて構成されるサービス画面や商品検索結果が、入出力インタフェース318を介してディスプレイに表示され得る。図3では、入出力装置320がユーザ端末210に含まれないように示したが、これに限定されず、ユーザ端末210と一体に構成することもできる。また、商品属性抽出サーバ230の入出力インタフェース338は、商品属性抽出サーバ230と連結するか、又は、商品属性抽出サーバ230が含むことができる入力や出力のための装置(図示せず)とのインタフェースのための手段であり得る。図3では、入出力インタフェース318、338をプロセッサ314、334と別途に構成された要素として示したが、これに限定されず、入出力インタフェース318、338をプロセッサ314、334に含まれるように構成することもできる。 Input/output interface 318 may be a means for interfacing with input/output devices 320 . By way of example, input devices may include devices such as cameras including image sensors, keyboards, microphones, mice, etc., and output devices may include devices such as displays, speakers, haptic feedback devices, etc. . As another example, the input/output interface 318 may be a means for interfacing with a device such as a touch screen that has a single configuration and functions for performing input and output. For example, when the processor 314 of the user terminal 210 processes instructions of a computer program loaded in the memory 312, information and/or data provided by the product attribute extraction server 230 or other user terminals 210 may be used. Service screens and product search results can be displayed on the display via the input/output interface 318 . Although the input/output device 320 is not included in the user terminal 210 in FIG. In addition, the input/output interface 338 of the product attribute extraction server 230 is connected to the product attribute extraction server 230 or communicates with a device (not shown) for input or output that the product attribute extraction server 230 may include. It can be a means for interfacing. Although FIG. 3 shows the input/output interfaces 318 and 338 as elements configured separately from the processors 314 and 334, the present invention is not limited to this and the input/output interfaces 318 and 338 are configured to be included in the processors 314 and 334. You can also

ユーザ端末210及び商品属性抽出サーバ230は、図3に示す構成要素よりも多くの構成要素を含むことができる。しかしながら、大部分の従来技術的構成要素を明確に示す必要はない。一実施例によれば、ユーザ端末210は、前述した入出力装置320の少なくとも一部を含むように具現できる。また、ユーザ端末210は、トランシーバー(transceiver)、GPS(Global Positioning system)モジュール、カメラ、各種センサ及びデータベースなどのような他の構成要素をさらに含むことができる。例えば、ユーザ端末210がスマートフォンである場合、一般にスマートフォンが持つ構成要素を含むことができ、例えば、加速度センサ、ジャイロセンサ、カメラモジュール、各種物理的なボタン、タッチパネルを用いたボタン、入出力ポート及び振動のための振動器などのような多様な構成要素がユーザ端末210にさらに含まれるように具現できる。 The user terminal 210 and product attribute extraction server 230 can include more components than those shown in FIG. However, it is not necessary to explicitly show most prior art components. According to one embodiment, the user terminal 210 can be implemented to include at least a portion of the input/output device 320 described above. In addition, the user terminal 210 may further include other components such as a transceiver, a GPS (Global Positioning System) module, a camera, various sensors and a database. For example, if the user terminal 210 is a smart phone, it can generally include components that a smart phone has, such as an acceleration sensor, a gyro sensor, a camera module, various physical buttons, buttons using a touch panel, input/output ports, and Various components such as a vibrator for vibration may be further included in the user terminal 210 .

一実施例によれば、ユーザ端末210のプロセッサ314は、商品検索又はショッピングサイトに接続可能な検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザが動作するように構成できる。このとき、当該アプリケーション又はウェブブラウザと関連するプログラムコードがユーザ端末210のメモリ312にローディングできる。 According to one embodiment, the processor 314 of the user terminal 210 can be configured to run a search application, mobile browser application, or web browser capable of connecting to a product search or shopping site. At this time, program code associated with the application or web browser can be loaded into the memory 312 of the user terminal 210 .

ユーザ端末210のプロセッサ314は、入出力装置320から提供された情報及び/又はデータを入出力インタフェース318を介して受信したり、通信モジュール316を介して商品属性抽出サーバ230から情報及び/又はデータを受信したりでき、受信された情報及び/又はデータを処理してメモリ312に保存できる。また、このような情報及び/又はデータは、通信モジュール316を介して商品属性抽出サーバ230に提供できる。 The processor 314 of the user terminal 210 receives information and/or data provided from the input/output device 320 via the input/output interface 318, and receives information and/or data from the product attribute extraction server 230 via the communication module 316. can be received and the received information and/or data can be processed and stored in memory 312 . Such information and/or data can also be provided to the product attribute extraction server 230 via the communication module 316 .

一実施例によれば、プロセッサ314は、入出力インタフェース318と連結したタッチスクリーンやキーボードなどの入出力装置320により入力されたり、選択されたテキスト、イメージ及び動作などが受信したりできる。受信されたテキスト、イメージ及び/又は動作をメモリ312に保存したり、通信モジュール316及びネットワーク220を介して商品属性抽出サーバ230に提供したりできる。例えば、プロセッサ314は、タッチスクリーンやキーボードなどのような入出力装置により、一つ以上のユーザクエリ及び/又はユーザクエリに対応する商品属性などが受信でき、受信されたユーザクエリ及び/又は商品属性に対する入力などは、通信モジュール316及びネットワーク220を介して商品属性抽出サーバ230に提供できる。 According to one embodiment, processor 314 can receive input or selected text, images, actions, etc. through an input/output device 320 such as a touch screen or keyboard coupled to input/output interface 318 . The received text, images and/or actions may be stored in memory 312 or provided to item attribute extraction server 230 via communication module 316 and network 220 . For example, the processor 314 can receive one or more user queries and/or product attributes corresponding to the user queries via an input/output device such as a touch screen, keyboard, etc., and process the received user queries and/or product attributes. can be provided to the product attribute extraction server 230 via the communication module 316 and the network 220 .

一実施例によれば、プロセッサ314は、入力装置により受信されたユーザクエリ又はユーザクエリに対する検索結果要請を、ネットワーク220及び通信モジュール316を介して商品属性抽出サーバ230に提供できる。ユーザクエリを受信した商品属性抽出サーバ230は、ユーザクエリから複数の商品属性の関連点数が算出できる。また、商品属性抽出サーバ230は、算出された商品属性の関連点数が反映された商品検索結果又は商品検索順位に関する情報が提供できる。 According to one embodiment, the processor 314 can provide the user query received by the input device or a search result request for the user query to the product attribute extraction server 230 via the network 220 and the communication module 316 . Upon receiving the user query, the product attribute extraction server 230 can calculate the related scores of a plurality of product attributes from the user query. In addition, the product attribute extraction server 230 may provide information on product search results or product search rankings reflecting the calculated product attribute related score.

他の実施例によれば、プロセッサ314は、入力装置により受信されたユーザクエリ又はユーザクエリに対する検索結果要請を、ネットワーク220及び通信モジュール316を介して商品属性抽出サーバ230に提供できる。また、プロセッサ314は、ネットワーク220及び通信モジュール316を介して、商品属性抽出サーバ230又は商品データベースからユーザクエリによる商品検索結果が受信できる。プロセッサ334は、ユーザクエリ又はユーザクエリに対する検索結果要請に応じて、ユーザクエリに対する複数の商品属性の関連点数を算出し、算出された関連点数を商品検索結果に適用して商品検索順位が調整できる。 According to another embodiment, the processor 314 can provide the user query received by the input device or a search result request for the user query to the product attribute extraction server 230 via the network 220 and the communication module 316 . In addition, the processor 314 can receive product search results based on user queries from the product attribute extraction server 230 or product database via the network 220 and the communication module 316 . The processor 334 may calculate the relevance score of a plurality of product attributes to the user query according to the user query or a search result request for the user query, and apply the calculated relevance score to the product search result to adjust the product search ranking. .

他の実施例によれば、商品属性抽出サーバ230は、ユーザ端末210からユーザクエリ及びユーザにより選択された商品属性を、ネットワーク220及び通信モジュール316を介して受信できる。代案として、商品属性抽出サーバ230は、検索ログデータベース(図2の240)からユーザクエリ及びユーザにより選択された商品属性のデータ対を、ネットワーク220を介して受信できる。商品属性抽出サーバ230は、受信したユーザクエリ及び商品属性のデータ対から学習データを生成し、生成された学習データを用いて、ユーザクエリ及び商品属性の関連点数を算出するための統計基盤分類モデルを学習させることができる。 According to another embodiment, the product attribute extraction server 230 can receive user queries and user-selected product attributes from the user terminal 210 via the network 220 and the communication module 316 . Alternatively, the product attribute extraction server 230 can receive data pairs of user queries and user-selected product attributes from the search log database (240 in FIG. 2) via the network 220 . The product attribute extraction server 230 generates learning data from the received data pairs of the user query and product attributes, and uses the generated learning data to calculate the user query and product attribute relevance score. can be learned.

図4は、本開示の一実施例に係る統計基盤分類モデル420を用いてユーザクエリ410に対する商品属性の関連点数434、444、454を算出する構成を示す図である。統計基盤分類モデル420は、図2及び図3に示す商品属性抽出サーバ230又はユーザ端末210により生成、保存又は実行され得る。図4に示すように、統計基盤分類モデル420は、ユーザクエリ410を入力として、複数の商品属性430、440、450に対する関連点数434、444、454が出力できる。ここで、複数の商品属性430、440、450は、対応する複数の商品属性コード432、442、452で表現され得る。このとき、商品属性コード432、442、452は、両義的商品属性又は範囲型商品属性に対応するために既定されることができる。例えば、商品属性のうち、ノートブックの画面サイズを示す「10インチ」(430)と、家庭用TVの画面サイズを示す「10インチ」とは、互いに異なる商品属性を示すことができるので、互いに異なる商品コードで表現されることができる。また、関連点数434、444、454は、ユーザクエリ410が複数の商品属性430、440、450の各々と関連する確率値であり得る。例えば、ユーザクエリ410が「ミニノートブック」である場合、画面サイズが小さい「10インチ」(430)の商品属性と関連する確率値は「0.7」であり、画面サイズが中間である「12インチ」(440)の商品属性と関連する確率値は「0.17」であり、画面サイズが大きい「15インチ」(450)の商品属性と関連する確率値は「0.01」であり得る。 FIG. 4 is a diagram illustrating a configuration for calculating product attribute related scores 434, 444, and 454 for a user query 410 using a statistically-based classification model 420 according to an embodiment of the present disclosure. The statistical-based classification model 420 can be generated, stored, or executed by the product attribute extraction server 230 or user terminal 210 shown in FIGS. As shown in FIG. 4 , the statistical-based classification model 420 can output association scores 434 , 444 , 454 for a plurality of product attributes 430 , 440 , 450 with a user query 410 as input. Here, the multiple product attributes 430 , 440 , 450 can be represented by multiple corresponding product attribute codes 432 , 442 , 452 . At this time, the product attribute codes 432, 442, 452 can be defined to correspond to ambiguous product attributes or range-type product attributes. For example, among the product attributes, "10 inches" (430) indicating the screen size of a notebook and "10 inches" indicating the screen size of a home TV can indicate mutually different product attributes. It can be represented by different product codes. Also, the association scores 434 , 444 , 454 may be probability values that the user query 410 is associated with each of the plurality of product attributes 430 , 440 , 450 . For example, if the user query 410 is "mini-notebook", the probability value associated with the product attribute of "10 inches" (430) with a small screen size is "0.7" and " The probability value associated with the product attribute of "12 inches" (440) is "0.17", and the probability value associated with the product attribute of "15 inches" (450) with a large screen size is "0.01". obtain.

各々の商品属性430、440、450に対する関連点数434、444、454は、統計基盤分類モデル420により算出できる。統計基盤分類モデル420は、入力されたユーザクエリ410から複数の商品属性と関連する確率値を算出するように学習できる。この場合、商品属性抽出サーバ又はユーザ端末は、検索ログデータベース(例えば、図2の240)から統計基盤分類モデル420を学習するための学習データが受信できる。例えば、検索ログデータベースから受信された学習データは、ユーザクエリ410及び当該ユーザクエリ410に対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対を含むことができる。また、統計基盤分類モデル420は、ユーザクエリ410に対する複数の商品属性の関連性を決定するための機械学習又は人工ニューラルネットワークモデルであり得る。 Relevance scores 434 , 444 , 454 for each product attribute 430 , 440 , 450 can be calculated by the statistically based classification model 420 . The statistical-based classification model 420 can learn to calculate probability values associated with multiple product attributes from the input user query 410 . In this case, the product attribute extraction server or user terminal can receive learning data for learning the statistical-based classification model 420 from the search log database (eg, 240 in FIG. 2). For example, the learning data received from the search log database may include a pair of the user query 410 and product information (eg, attribute information of a specific product) selected by the user from the product search results corresponding to the user query 410. . Statistical-based classification model 420 may also be a machine learning or artificial neural network model for determining the relevance of multiple product attributes to user query 410 .

図4では、1つの統計基盤分類モデル420を用いて、ユーザクエリ410に対する3つの商品属性430、440、450の関連点数434、444、454が算出されることを示したが、これに限定されるものではない。多様な具現方式により、統計基盤分類モデル420は、ユーザクエリ410に対して3つ未満又は4つ以上の商品属性の関連点数が算出されるように構成できる。また、ユーザクエリ410を前処理又は分析する方法により、2つ以上の統計基盤分類モデルが使用できる。一実施例において、ユーザクエリ410は、より小さな単位の複数のデータ(例えば、形態素及び/又は音節の単位のデータ)に分割され、分割されたデータは、対応する複数の統計基盤分類モデルに入力され得る。この場合、複数の統計基盤分類モデルから算出された関連点数を合算又は結合して、最終の関連点数が算出できる。 FIG. 4 shows that the association scores 434, 444, 454 of the three product attributes 430, 440, 450 for the user query 410 are calculated using one statistically-based classification model 420, but is limited to this. not something. According to various implementation methods, the statistical-based classification model 420 may be configured to calculate the relevance scores of less than three or more than four product attributes for the user query 410 . Also, depending on how the user query 410 is pre-processed or analyzed, more than one statistically-based classification model can be used. In one embodiment, the user query 410 is split into multiple smaller units of data (e.g., morpheme and/or syllable units of data), and the split data are input to corresponding statistically-based classification models. can be In this case, the final relevance score can be calculated by summing or combining the relevance scores calculated from the plurality of statistical-based classification models.

図5は、本開示の一実施例に係る前処理器510及び統計基盤分類モデ522、524を含む分類器520を用いて関連点数534、544、554を算出する構成を示す図である。前処理器510及び分類器520は、図2及び図3に示す商品属性抽出サーバ230又はユーザ端末210により生成、保存又は実行できる。図5に示すように、商品属性抽出サーバ又はユーザ端末は、ユーザクエリ410を分析して統計基盤分類モデル522、524の入力データを生成する前処理器510と、前処理器510から生成された入力データを用いて複数の商品属性に対する関連点数を算出する分類器520とを含むことができる。 FIG. 5 is a diagram illustrating a configuration for calculating relevance scores 534, 544, 554 using a classifier 520 including a preprocessor 510 and statistically-based classification models 522, 524 according to an embodiment of the present disclosure. The preprocessor 510 and classifier 520 can be generated, stored, or executed by the product attribute extraction server 230 or the user terminal 210 shown in FIGS. As shown in FIG. 5, the product attribute extraction server or user terminal includes a preprocessor 510 that analyzes a user query 410 to generate input data for statistically based classification models 522 and 524, and and a classifier 520 that uses the input data to calculate relevance scores for multiple product attributes.

前処理器510は、ユーザクエリ410を音節の単位に分割する音節単位分割部512と、ユーザクエリ410を形態素の単位に分割する形態素単位分割部514とを含むことができる。一実施例において、音節単位分割部512及び形態素単位分割部514は、ユーザクエリ410のテキストを各々音節埋め込みベクトル及び形態素埋め込みベクトルに変換できる。音節単位分割部512及び形態素単位分割部514の各々は、ユーザクエリ410を連続ベクトル空間に埋め込むように学習された人工ニューラルネットワークで具現できる。 The preprocessor 510 may include a syllable unit segmentation unit 512 that segments the user query 410 into syllable units, and a morpheme unit segmentation unit 514 that divides the user query 410 into morpheme units. In one embodiment, the syllable unit divider 512 and the morpheme unit divider 514 can transform the text of the user query 410 into syllable embedding vectors and morpheme embedding vectors, respectively. Each of the syllable unit segmentation unit 512 and the morpheme unit segmentation unit 514 can be implemented by an artificial neural network trained to embed the user query 410 in a continuous vector space.

また、分類器520は、音節の単位に分割されたユーザクエリ410を入力とする第1の統計基盤分類モデル522と、形態素の単位に分割されたユーザクエリ410を入力とする第2の統計基盤分類モデル524と、各々の統計基盤分類モデル522、524から算出された関連点数を合算又は結合して、最終の関連点数534、544、554を算出する結合部526とを含むことができる。 In addition, the classifier 520 includes a first statistically-based classification model 522 that receives the user query 410 divided into syllable units, and a second statistical-based classification model 522 that receives the user query 410 divided into morpheme units. A classification model 524 and a combiner 526 that sums or combines the relevance scores calculated from each of the statistically-based classification models 522, 524 to calculate final relevance scores 534, 544, 554 may be included.

一実施例において、商品属性抽出サーバ又はユーザ端末は、音節の単位に分割されたユーザクエリ410を入力とする第1の統計基盤分類モデル522と、形態素の単位に分割されたユーザクエリ410を入力とする第2の統計基盤分類モデル524とを用いて、関連点数534、544、554が算出できる。 In one embodiment, the product attribute extraction server or user terminal inputs the first statistically-based classification model 522 that receives the user query 410 divided into syllable units and the user query 410 divided into morpheme units. Relevant scores 534, 544, and 554 can be calculated using the second statistically-based classification model 524 as

分類器520に含まれた統計基盤分類モデル522、524は、音節及び形態素の単位に分割されたユーザクエリ410を入力として、複数の商品属性530、540、550に対する関連点数534、544、554が算出できる。統計基盤分類モデル522、524の各々は、検索ログデータベースから抽出された学習データを用いて、ユーザクエリ410に対する複数の商品属性530、540、550の関連点数534、544、554を算出するように学習できる。検索ログデータベースから抽出された学習データは、ユーザクエリ及び当該ユーザクエリに対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対を含むことができる。 Statistical-based classification models 522 and 524 included in the classifier 520 receive the user query 410 divided into units of syllables and morphemes, and obtain association scores 534, 544, and 554 for a plurality of product attributes 530, 540, and 550. can be calculated. Each of the statistical-based classification models 522 and 524 uses the learning data extracted from the search log database to calculate the association scores 534, 544 and 554 of the plurality of product attributes 530, 540 and 550 for the user query 410. can learn The learning data extracted from the search log database may include pairs of user queries and product information (for example, attribute information of specific products) selected by the user from product search results corresponding to the user queries.

統計基盤分類モデル522、524は、ユーザクエリ410を構成するテキスト(例えば、文章、文句、単語等)をそのまま使用することなく、音節又は形態素の単位に分割して使用することで、ユーザクエリ410に誤字脱字が含まれた場合や、ユーザクエリ410が学習データになくて見慣れない場合にも対応できる。例えば、ユーザクエリ410が「ミニノートブック」である場合、「ミニノートブック」を音節の単位に分割した「ミ」、「ニ」、「ノー」、「ト」、「ブック」を統計基盤分類モデル522の入力として算出された関連点数と、ユーザクエリ410が「ミニナトブック」のように誤字脱字を含む場合、音節の単位に分割した「ミ」、「ニ」、「ナ」、「ト」、「ブック」を統計基盤分類モデル522の入力として算出された関連点数とは、同一又は類似する。他の例として、ユーザクエリ410が「ミニノートブック」である場合、「ミニノートブック」を形態素の単位に分割した「ミニ」、「ノートブック」を統計基盤分類モデル524の入力として算出された関連点数と、ユーザクエリ410が「ノートブックミニ」のように形態素の順序が変更された場合、形態素の単位に分割した「ノートブック」、「ミニ」を統計基盤分類モデル522の入力として算出された関連点数とは、同一又は類似する。 The statistically-based classification models 522 and 524 do not use the text (eg, sentences, phrases, words, etc.) that make up the user query 410 as they are, but divide them into units of syllables or morphemes. , or the user query 410 does not appear in the training data and is unfamiliar. For example, if the user query 410 is 'mini-notebook', 'mi', 'di', 'no', 'to', and 'book' obtained by dividing 'mini-notebook' into syllable units are classified into statistical-based classifications. If the user query 410 contains misspellings such as "mini nato book", it is divided into syllable units "mi", "ni", "na", and "to". , and 'book' are the same or similar to the relevance scores calculated using the statistical-based classification model 522 as an input. As another example, when the user query 410 is 'mini-notebook', 'mini' and 'notebook' obtained by dividing 'mini-notebook' into units of morphemes are calculated as inputs of the statistical-based classification model 524. If the order of morphemes in the user query 410 is changed, such as 'notebook mini', the relation score and the 'notebook' and 'mini' divided into morpheme units are calculated as inputs to the statistical-based classification model 522. The associated score is the same or similar.

統計基盤分類モデル522、524により算出された関連点数は、結合部526により合算又は結合できる。その結果、1つの統計基盤分類モデルを使用した場合よりも、正確度が高い最終の関連点数534、544、554が算出できる。前記のような構成により、統計基盤分類モデル522、524により使用される学習データのマッチングカバレッジを極大化し、ユーザクエリ及び複数の商品属性の関連点数の算出の正確度を向上させることができる。 The relevance scores calculated by the statistically-based classification models 522 and 524 can be summed or combined by a combiner 526 . As a result, final relevance scores 534, 544, 554 can be calculated that are more accurate than using a single statistically-based classification model. With the above configuration, it is possible to maximize the matching coverage of learning data used by the statistical-based classification models 522 and 524, and improve the accuracy of calculating user queries and related scores of a plurality of product attributes.

図6は、本開示の一実施例に係る多様な検索結果から商品属性抽出のための統計基盤分類モデルの学習データを生成する例を示す図である。統計基盤分類モデルの学習のために使用される学習データは、検索ログデータベース650から抽出できる。検索ログデータベース650は、例えば、ユーザがショッピング検索サービスを使用しながら入力したユーザクエリ(例えば、検索対象の商品名が含まれた文章、文句、単語等)、当該ユーザクエリによるショッピング検索結果(例えば、商品名や商品属性などが含まれた検索結果)、及び、ショッピング検索結果に対するユーザの応答(例えば、特定の商品名や商品属性などに対するユーザのクリック可否又は回数等)が保存できる。統計基盤分類モデルの学習データは、検索ログデータベース650から抽出されたユーザクエリ及び当該ユーザクエリと関連する商品属性の対を含むことができる。 FIG. 6 is a diagram illustrating an example of generating learning data of a statistical-based classification model for product attribute extraction from various search results according to an embodiment of the present disclosure. Training data used for training the statistical-based classification model can be extracted from the search log database 650 . The search log database 650 stores, for example, user queries input by the user while using the shopping search service (e.g. sentences, phrases, words, etc. containing the name of the product to be searched), shopping search results (e.g. , search results including product names, product attributes, etc.), and user responses to shopping search results (e.g., whether or not a user clicks on a specific product name, product attributes, etc.) can be saved. The learning data of the statistical-based classification model may include pairs of user queries extracted from the search log database 650 and product attributes associated with the user queries.

同図に示すように、例えば、ユーザがショッピングサイト又は統合検索サイトの検索窓にユーザクエリ110を入力した場合、入力されたユーザクエリ110と関連する検索結果130が出力され得る。検索結果画面100は、ユーザクエリ110が入力された検索窓と、商品属性をフィルタリングするためのユーザインタフェース120と、検索の商品132、136及び検索の商品132、136と関連する商品属性134、138等を含む検索結果130とを含むことができる。 As shown in the figure, for example, when a user inputs a user query 110 into a search window of a shopping site or an integrated search site, search results 130 related to the input user query 110 can be output. The search result screen 100 includes a search window in which a user query 110 is input, a user interface 120 for filtering product attributes, search products 132 and 136, and product attributes 134 and 138 associated with the search products 132 and 136. etc., including search results 130 .

一実施例において、ユーザクエリ110を入力したユーザが、ユーザインタフェース120に含まれた画面サイズ属性610をクリックする場合、当該ユーザクエリ110及びクリックされた画面サイズ属性610の対の学習データ640が検索ログデータベース650に保存できる。商品属性抽出サーバのプロセッサは、このようなユーザクエリ110及びクリックログ情報が保存された検索ログデータベース650からユーザクエリ110及び商品属性の対を含む学習データが抽出できる。例えば、ユーザが「ミニノートブック」をユーザクエリ110として入力し、ユーザインタフェース120を介して商品属性のうちで「12インチ」をクリックして検索ログデータが生成された場合、「ミニノートブック-12インチ」の対の学習データ640が生成できる。 In one embodiment, when a user who has entered a user query 110 clicks a screen size attribute 610 included in the user interface 120, learning data 640 for the user query 110 and clicked screen size attribute 610 pair is retrieved. It can be stored in the log database 650 . The processor of the product attribute extraction server can extract learning data including pairs of user queries 110 and product attributes from the search log database 650 storing such user queries 110 and click log information. For example, when a user enters "mini-notebook" as the user query 110 and clicks "12 inches" among product attributes via the user interface 120 to generate search log data, "mini-notebook- 12 inches” of training data 640 can be generated.

他の実施例として、ユーザクエリ110を入力したユーザが、検索結果130として出力された商品132、136をクリックする場合、当該ユーザクエリ110及び当該商品132、136と関連する商品属性134、138の対の学習データ620、630が検索ログデータベース650に保存され得る。例えば、ユーザが「ミニノートブック」をユーザクエリ110として入力した後、検索結果130のうちで商品132、136をクリックした場合、クリックされた商品132と関連する商品属性である「10インチ」(134)及びユーザクエリ110の対の学習データ620と、クリックされた商品136と関連する商品属性である「11インチ」(138)及びユーザクエリ110の対の学習データ630とが生成され得る。追加又は代案として、ユーザクエリ110を入力したユーザが、商品と関連する商品属性134、138をクリックする場合、クリックされた商品属性134、138及びユーザクエリ110の対の学習データ620、630が生成され得る。 As another example, when a user who has entered a user query 110 clicks on products 132 and 136 output as search results 130, product attributes 134 and 138 associated with the user query 110 and the products 132 and 136 are displayed. Paired learning data 620 , 630 may be stored in search log database 650 . For example, if a user clicks on items 132 and 136 in the search results 130 after entering "mini notebook" as the user query 110, the item attribute associated with the clicked item 132 is "10 inches" ( 134) and the user query 110 pair, and learning data 630 for the product attribute associated with the clicked item 136, "11 inches" (138) and the user query 110 pair. Additionally or alternatively, if the user who entered the user query 110 clicks on an item attribute 134, 138 associated with the item, learning data 620, 630 of the clicked item attribute 134, 138 and user query 110 pair is generated. can be

図7は、本開示の一実施例に係る商品属性714、724、734を商品属性コード716、726、736で表現して学習データ710、720、730を生成する方法を例示する図である。同図に示すように、統計基盤分類モデルの学習のために使用される学習データは、ユーザクエリ712、722、732と、これに対応する商品属性714、724、734と、各々の商品属性714、724、734を表現した商品属性コード716、726、736とを含むことができる。一実施例において、ユーザクエリ712、722、732及び商品属性714、724、734は、図6に基づいて説明したように、ショッピングサイト又は統合検索サイトの検索窓にユーザクエリ712、722、732を入力したユーザが、検索結果に表示された商品又は商品属性をクリックする場合、生成される検索ログデータベースから抽出できる。また、商品属性714、724、734の各々は、これに対応する商品属性コード716、726、736で表現できる。このように、学習データに含まれる商品属性を商品属性コードで表現することで、異なる類型の商品が同一又は類似の商品属性を持つ場合(すなわち、両義的商品属性及び範囲型商品属性の場合)に対しても、統計基盤分類モデルが正確な関連点数が算出できる。 FIG. 7 is a diagram illustrating how product attributes 714, 724, 734 are represented by product attribute codes 716, 726, 736 to generate learning data 710, 720, 730 according to one embodiment of the present disclosure. As shown in the figure, learning data used for learning the statistical-based classification model includes user queries 712, 722, and 732, corresponding product attributes 714, 724, and 734, and each product attribute 714 , 724, 734, and product attribute codes 716, 726, 736. In one embodiment, the user queries 712, 722, 732 and the product attributes 714, 724, 734 are generated by entering the user queries 712, 722, 732 in the search window of the shopping site or integrated search site as described with reference to FIG. When the input user clicks on the product or product attributes displayed in the search results, it can be extracted from the generated search log database. Also, each of the product attributes 714, 724, 734 can be represented by corresponding product attribute codes 716, 726, 736. FIG. In this way, by expressing the product attributes contained in the learning data with product attribute codes, when different types of products have the same or similar product attributes (i.e. ambiguous product attributes and range-type product attributes) , the statistically-based classification model can also calculate an accurate relevance score.

例えば、ユーザがショッピングサイトの検索窓に「ミニノートブック」(712)を入力し、「10インチ」(714)の商品属性をクリックする場合、入力された「ミニノートブック」(712)のユーザクエリと、クリックされた「10インチ」(714)の商品属性と、「10インチ」(714)の商品属性コード「M10834726」(716)とを含む学習データ710が生成できる。また、ユーザがショッピングサイトの検索窓に「ミニノートブック」(722)を入力し、「12インチ」(724)の商品属性をクリックする場合、入力された「ミニノートブック」(722)のユーザクエリと、クリックされた「12インチ」(724)の商品属性と、「12インチ」(724)の商品属性コード「M10706689」(726)とを含む学習データ720が生成できる。 For example, when a user enters "mini-notebook" (712) in the search window of a shopping site and clicks the product attribute of "10 inches" (714), the entered "mini-notebook" (712) user Learning data 710 can be generated that includes the query, the item attribute of "10" (714) that was clicked, and the item attribute code "M10834726" (716) of "10" (714). Also, when the user enters 'mini-notebook' (722) in the search window of the shopping site and clicks the product attribute of '12 inches' (724), the user of the entered 'mini-notebook' (722) Learning data 720 can be generated that includes the query, the product attribute of "12" (724) that was clicked, and the product attribute code of "12" (724) "M10706689" (726).

他の実施例において、ユーザクエリを入力したユーザが、検索結果において2つ以上の商品属性をクリックする場合、入力されたユーザクエリ及びクリックされた商品属性を全部含む学習データが生成できる。例えば、ユーザがショッピングサイトの検索窓に「ミニノートブック」(732)を入力し、「13インチ及び12インチ」(734)の商品属性を各々クリックする場合、入力された「ミニノートブック」(732)のユーザクエリと、クリックされた「13インチ及び12インチ」(734)の商品属性と、これに対応する商品属性コード「M10835015及びM10706689」(736)とを含む学習データ730が生成できる。 In another embodiment, when a user who inputs a user query clicks two or more product attributes in a search result, learning data including both the input user query and the clicked product attributes can be generated. For example, when the user inputs 'mini-notebook' (732) in the search window of the shopping site and clicks on each of the product attributes of '13 inches and 12 inches' (734), the input 'mini-notebook' ( 732) and clicked product attributes of "13 inches and 12 inches" (734) and corresponding product attribute codes "M10835015 and M10706689" (736) can be generated.

図8は、本開示の一実施例に係る商品属性抽出サーバにより遂行されるショッピング検索のための商品属性抽出方法800を示すフローチャートである。一実施例において、ショッピング検索のための商品属性抽出方法800は、ユーザクエリの受信により開始できる(S810)。一実施例において、ユーザクエリは、ユーザ端末に表示されるショッピングサイト又は統合検索サイトの検索窓から受信され、商品属性抽出サーバのプロセッサに転送できる。 FIG. 8 is a flowchart illustrating a product attribute extraction method 800 for shopping searches performed by a product attribute extraction server according to one embodiment of the present disclosure. In one embodiment, the product attribute extraction method 800 for shopping search can be initiated by receiving a user query (S810). In one embodiment, a user query can be received from a search window of a shopping site or an integrated search site displayed on a user terminal and forwarded to a processor of a product attribute extraction server.

受信されたユーザクエリに基づき、商品データベースからユーザクエリに対する商品検索結果が抽出される(S820)。一実施例において、商品属性抽出サーバのプロセッサは、商品データベースからユーザクエリに対する商品検索結果が抽出できる。このとき、商品検索結果は、ユーザクエリ及び商品データベースに保存された商品名の語彙類似度、商品のユーザ人気度などの情報に基づいて決定された商品検索順位情報を含むことができる。例えば、ユーザクエリが「ミニノートブック」である場合、「ミニノートブック」の少なくとも一部を含む商品名を持つ商品のうち、ユーザによる購買率が高い商品、若しくは、ユーザによるクリック率が高い商品が、高順位を持つ商品検索結果として抽出できる。 Based on the received user query, a product search result corresponding to the user query is extracted from the product database (S820). In one embodiment, the processor of the product attribute extraction server can extract product search results for user queries from a product database. At this time, the product search result may include product search ranking information determined based on user queries, lexical similarity of product names stored in the product database, and user popularity of products. For example, if the user query is "mini-notebook", among the products whose product name includes at least a part of "mini-notebook", products with a high purchase rate by users or products with a high click-through rate by users can be extracted as product search results with high rank.

ユーザクエリは音節及び/又は形態素の単位に分割できる(S830)。一実施例において、商品属性抽出サーバのプロセッサは、ユーザクエリを音節及び/又は形態素の単位に分割して統計基盤分類モデルに入力できる。例えば、ユーザクエリは、音節埋め込みベクトル及び/又は形態素埋め込みベクトルに変換されて統計基盤分類モデルに入力できる。 The user query can be divided into units of syllables and/or morphemes (S830). In one embodiment, the processor of the product attribute extraction server can divide the user query into units of syllables and/or morphemes and input them into the statistically-based classification model. For example, a user query can be converted into a syllable embedding vector and/or a morpheme embedding vector and input to a statistically based classification model.

また、統計基盤分類モデルにより、ユーザクエリに対する複数の商品属性の関連点数が算出できる(S840)。一実施例において、商品属性抽出サーバのプロセッサは、統計基盤分類モデルを用いて、ユーザクエリが商品属性コードで表示された商品属性と関連する確率が算出できる。このように、商品属性を商品属性コードで表示することで、統計基盤分類モデルが両義的商品属性及び範囲型商品属性に対応して正確な関連点数が算出できる。ユーザクエリが音節又は形態素の単位に分割された場合、統計基盤分類モデルは、音節又は形態素の単位に分割されたユーザクエリが複数の商品属性と関連する確率値が算出できる。 In addition, the statistical-based classification model can be used to calculate the associated score of multiple product attributes with respect to the user query (S840). In one embodiment, the processor of the product attribute extraction server can use a statistically-based classification model to calculate the probability that the user query is associated with the product attributes indicated by the product attribute code. In this way, by displaying product attributes with product attribute codes, the statistics-based classification model can calculate accurate relevance scores corresponding to ambiguous product attributes and range-type product attributes. When a user query is divided into units of syllables or morphemes, the statistical-based classification model can calculate a probability value that the user query divided into units of syllables or morphemes is associated with a plurality of product attributes.

他の実施例において、商品属性抽出サーバのプロセッサは、ユーザクエリを音節及び形態素の単位に各々分割できる。プロセッサは、第1の統計基盤分類モデルを用いて、音節の単位に分割されたユーザクエリが複数の商品属性と関連する第1の確率を算出し、第2の統計基盤分類モデルを用いて、形態素の単位に分割されたユーザクエリが商品属性と関連する第2の確率が算出できる。その後、プロセッサは、第1の確率及び第2の確率を合算又は結合して、最終の商品属性の関連点数として算出できる。前述したように、ユーザクエリを音節及び/又は形態素の単位に分割して統計基盤分類モデルにより商品属性に対する関連点数を算出することで、タイプミスまたは学習データにないユーザクエリに対しても、商品属性の関連点数の算出の正確性を向上させることができる。 In another embodiment, the processor of the product attribute extraction server can divide the user query into units of syllables and morphemes, respectively. The processor uses a first statistically based classification model to calculate a first probability that the user query divided into syllable units is associated with a plurality of product attributes, and uses a second statistically based classification model to: A second probability that the morpheme-divided user query is associated with the product attribute can be calculated. The processor can then sum or combine the first and second probabilities to calculate a final item attribute relevance score. As described above, by dividing the user query into syllable and/or morpheme units and calculating the relevance score for the product attributes by the statistically-based classification model, it is possible to identify the product even if the user query is mistyped or not included in the training data. It is possible to improve the accuracy of calculation of attribute relevance scores.

算出された関連点数に基づき、ユーザクエリに対する商品検索結果による商品検索順位が調整できる(S850)。一実施例において、商品属性抽出サーバのプロセッサは、算出された一つ以上の関連点数を商品検索結果に反映して商品検索順位が調整できる。これにより、関連点数の高い商品属性を含む商品が検索結果の上部に表示され得る。ユーザクエリと関連する商品属性を持つ商品を検索結果の上部に表示することで、当該商品に対するユーザらのクリック率及び購買率を向上させることができる。 Based on the calculated relevance score, the product search ranking according to the product search result for the user query can be adjusted (S850). In one embodiment, the processor of the product attribute extraction server may adjust the product search ranking by reflecting the calculated one or more related scores in the product search result. As a result, products including product attributes with high related scores can be displayed at the top of the search results. By displaying products having product attributes related to the user query at the top of the search results, it is possible to improve the click rate and purchase rate of users for the products.

図9は、本開示の一実施例に係るショッピング検索のための商品検索順位調整方法900を示すフローチャートである。一実施例において、商品検索順位調整方法900は、ユーザクエリに対する複数の商品属性の関連点数の算出により開始できる(S910)。ユーザクエリに対する複数の商品属性の関連点数を算出する方法は、図8に基づいて説明した方法と同様に遂行できる。 FIG. 9 is a flowchart illustrating a product search ranking adjustment method 900 for shopping searches according to one embodiment of the present disclosure. In one embodiment, the product search ranking adjustment method 900 may begin by calculating the relevance score of a plurality of product attributes to a user query (S910). A method of calculating the relevance score of a plurality of product attributes with respect to a user query may be performed in the same manner as the method described with reference to FIG.

次に、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる(S920)。一実施例において、商品属性抽出サーバ又はユーザ端末のプロセッサが、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる。また、抽出された第1の商品属性に基づき、商品データベースから第1の商品属性を含む第1の商品が検索できる(S930)。 Next, a first product attribute associated with a first related score, which is the highest related score, among the calculated related scores can be extracted (S920). In one embodiment, the product attribute extraction server or the processor of the user terminal can extract the first product attribute associated with the first related score, which is the highest related score among the calculated related scores. Also, based on the extracted first product attribute, the first product including the first product attribute can be searched from the product database (S930).

代案として、算出された関連点数のうち、関連点数が既定の閾値以上である第1の関連点数群(すなわち、一つ以上の第1の関連点数)と関連する第1の商品属性群(すなわち、一つ以上の第1の商品属性)が抽出できる。その後、商品データベースから第1の商品属性群に含まれた少なくとも一つの商品属性を含む商品が検索できる。 Alternatively, among the calculated relevance scores, a first product attribute group (i.e., , one or more first product attributes) can be extracted. After that, a product including at least one product attribute included in the first product attribute group can be retrieved from the product database.

第1の商品属性の重要度を決定する商品属性加重値が決定できる(S940)。商品属性加重値は、抽出された商品属性がこれと関連する商品の検索順位の調整に及ぼす影響の程度を示すことができる。一実施例において、商品属性加重値は商品属性別に既定の値であり得る。代案として、商品属性加重値は、商品検索結果に対するユーザの応答によって動的に変動できる。具体的に、商品属性抽出サーバ又はユーザ端末のプロセッサは、既定の商品属性加重値及び関連点数に基づいて調整された第1の商品が表示された検索結果画面を出力し、出力された商品検索結果画面でユーザによる第1の商品のクリック数が受信できる。第1の商品のクリック数が既定の閾値以上である場合、プロセッサは商品属性加重値が変更できる。 A product attribute weight that determines the importance of the first product attribute can be determined (S940). The product attribute weight value may indicate the degree of influence of the extracted product attribute on adjustment of the search ranking of related products. In one embodiment, the product attribute weight value may be a default value for each product attribute. Alternatively, the item attribute weights can vary dynamically depending on the user's response to the item search results. Specifically, the product attribute extraction server or the processor of the user terminal outputs a search result screen displaying the first product adjusted based on the predetermined product attribute weighting value and the related score, and outputs the product search The number of user clicks on the first product can be received on the results screen. If the number of clicks for the first item is greater than or equal to the predetermined threshold, the processor can change the item attribute weights.

第1の関連点数及び商品属性加重値に基づいて第1の商品の検索順位が調整できる(S950)。商品検索順位が調整された結果、抽出された第1の商品属性と関連する第1の商品の方が、抽出された第1の商品属性と関連しない他の商品よりも、商品検索結果の上部に表示され得る。これにより、ユーザクエリに基づいてユーザの意図した商品属性が反映された検索結果をユーザ端末に出力できる。 The search ranking of the first product may be adjusted based on the first relevance score and the product attribute weight (S950). As a result of adjusting the product search ranking, the first product related to the extracted first product attribute is higher in the product search results than other products not related to the first extracted product attribute. can be displayed in Thereby, based on the user query, it is possible to output to the user terminal a search result reflecting the product attributes intended by the user.

図10は、本開示の一実施例に係るユーザ端末により遂行されるショッピング検索のための商品属性抽出方法1000を示すフローチャートである。一実施例において、ユーザ端末により遂行されるショッピング検索のための商品属性抽出方法1000は、ユーザ端末のプロセッサがユーザクエリを受信することにより開始できる(S1010)。ユーザクエリは、ユーザ端末に表示されたショッピングサイト又は統合検索サイトの検索窓から受信できる。 FIG. 10 is a flowchart illustrating a product attribute extraction method 1000 for shopping search performed by a user terminal according to one embodiment of the present disclosure. In one embodiment, the product attribute extraction method 1000 for shopping search performed by a user terminal can be initiated by a processor of the user terminal receiving a user query (S1010). A user query can be received from a search window of a shopping site or an integrated search site displayed on the user terminal.

ユーザ端末のプロセッサは、ユーザクエリに基づいて統計基盤分類モデルにより算出された複数の商品属性の関連点数が受信できる(S1020)。このとき、統計基盤分類モデルは、ユーザクエリに対する複数の商品属性の関連点数を算出するように予め学習できる。また、正確度の高い関連点数を算出するために、統計基盤分類モデルは、音節及び/又は形態素の単位に分割されたユーザクエリを受信して商品属性の関連点数を算出する2つ以上の統計基盤分類モデルを含むことができる。 The processor of the user terminal can receive the relevance scores of a plurality of product attributes calculated by the statistically based classification model based on the user query (S1020). At this time, the statistical-based classification model can be learned in advance to calculate the relevance score of a plurality of product attributes with respect to the user query. In addition, in order to calculate the relevance score with high accuracy, the statistical-based classification model receives a user query divided into units of syllables and/or morphemes and uses two or more statistics for calculating the relevance score of product attributes. A base classification model can be included.

ユーザ端末のプロセッサは、算出された関連点数に基づいてユーザクエリに対する商品検索順位を調整できる(S1030)。具体的に、プロセッサは、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる。その後、プロセッサは、商品データベースから検索された第1の商品属性を含む第1の商品を受信し、第1の関連点数によって検索された第1の商品の商品検索順位が調整できる。このとき、第1の商品の検索順位は、第1の商品属性の重要度を決定する商品属性加重値及び第1の関連点数に基づいて調整できる。 The processor of the user terminal may adjust the product search order for the user query based on the calculated relevance score (S1030). Specifically, the processor can extract a first product attribute associated with a first association score, which is the highest association score, among the calculated association scores. The processor can then receive the first item including the first item attribute retrieved from the item database, and adjust the item search ranking of the retrieved first item with the first relevance score. At this time, the search ranking of the first product may be adjusted based on the product attribute weighting value that determines the importance of the first product attribute and the first relevance score.

図11は、本開示の一実施例に係る商品属性抽出のための統計基盤分類モデルの学習方法1100を示すフローチャートである。同図に示すように、学習方法1100は、プロセッサが複数の第1のユーザクエリ及び複数の第1のユーザクエリと関連する複数の第1の商品属性に基づいて第1の学習データを生成するステップ(S1110)により開始できる。プロセッサは、複数の第1のユーザクエリと関連する検索ログデータベースから複数の第1の商品属性が抽出できる。検索ログデータベースは、ユーザクエリ及びこれにより抽出された商品検索結果からユーザが選択又はクリックした商品属性情報を含むことができる。例えば、プロセッサは、統合検索ログデータベース、ショッピング又は商品検索ログデータベースの少なくとも一つから複数のユーザクエリと関連する商品属性が抽出できる。また、プロセッサは、統計基盤分類モデルが両義的商品属性又は範囲型商品属性に対応できるように、複数の第1の商品属性を対応する複数の商品属性コードに変換できる。前記構成により、学習データは、ユーザが入力したユーザクエリ及びユーザクエリによって抽出された商品検索結果に対するユーザの動作(例えば、商品属性のフィルタリング、商品や商品属性の選択又はクリック等)によって生成された検索ログデータベースから得られるので、統計基盤分類モデルの学習データを効率よく確保できる。 FIG. 11 is a flowchart illustrating a method 1100 of training a statistically-based classification model for product attribute extraction according to one embodiment of the present disclosure. As shown, the learning method 1100 includes a processor generating first learning data based on a plurality of first user queries and a plurality of first product attributes associated with the plurality of first user queries. It can start with step (S1110). The processor can extract a plurality of first product attributes from a search log database associated with the plurality of first user queries. The search log database may include product attribute information selected or clicked by the user from user queries and product search results extracted thereby. For example, the processor can extract product attributes associated with a plurality of user queries from at least one of a federated search log database, a shopping or product search log database. The processor can also transform the plurality of first product attributes into corresponding plurality of product attribute codes so that the statistically-based classification model can accommodate ambiguous product attributes or range-type product attributes. With the above configuration, the learning data is generated by the user's input by the user and the user's action on the product search results extracted by the user query (e.g., product attribute filtering, product or product attribute selection or click, etc.). Since it is obtained from the search log database, it is possible to efficiently secure training data for the statistically based classification model.

プロセッサは、複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる(S1120)。一実施例において、プロセッサは、複数の第1のユーザクエリを形態素の単位に分割して統計基盤分類モデルが学習できる。具体的に、プロセッサは、形態素の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる。追加又は代案として、プロセッサは、複数の第1のユーザクエリを音節の単位に分割して統計基盤分類モデルが学習できる。プロセッサは、音節の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる。 The processor can learn a statistically-based classification model to calculate the relevance score of one or more product attributes corresponding to the second user query based on the plurality of first learning data (S1120). In one embodiment, the processor can divide the plurality of first user queries into units of morphemes to learn a statistically based classification model. Specifically, the processor can learn a statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on a plurality of first user queries divided into units of morphemes. . Additionally or alternatively, the processor can divide the plurality of first user queries into units of syllables to learn a statistically based classification model. The processor can learn a statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on a plurality of first user queries divided into syllable units.

他の実施例において、プロセッサは、複数の第1のユーザクエリを音節及び形態素の単位に分割して統計基盤分類モデルが学習できる。具体的に、プロセッサは、複数の第1のユーザクエリを形態素及び音節の単位に分割できる。その後、プロセッサは、形態素の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第1の統計基盤分類モデルが学習できる。また、プロセッサは、音節の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第2の統計基盤分類モデルが学習できる。前述したように、プロセッサは、ユーザクエリを分割する方式によって2つ以上の統計基盤分類モデルを使用することで、ユーザクエリ及び商品属性の関連点数をより正確に算出できる。 In another embodiment, the processor can divide the plurality of first user queries into units of syllables and morphemes to learn a statistically based classification model. Specifically, the processor can divide the plurality of first user queries into units of morphemes and syllables. Then, the processor learns the first statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query based on the plurality of first user queries divided into units of morphemes. can. In addition, the processor learns the second statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query based on the plurality of first user queries divided into units of syllables. can. As described above, the processor can more accurately calculate the relevance score of the user query and product attributes by using two or more statistically-based classification models according to the method of dividing the user query.

前述したショッピング検索のための商品属性抽出方法及び商品属性抽出の学習方法は、コンピュータで読み取り可能な記録媒体にコンピュータが読み取り可能なコードとして具現されることもできる。記録媒体は、コンピュータで実行可能なプログラムを継続的に保存したり、実行又はダウンロードのために一時保存したりするものであり得る。また、媒体は、単一又は多数のハードウェアが結合された形態の多様な記録手段又は保存手段であり得るが、あるコンピュータシステムに直接接続される媒体に限定されず、ネットワーク上に分散存在するものであり得る。媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD-ROMやDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、及び、ROM、RAM、フラッシュメモリなどを含み、プログラム命令語が保存されるように構成されたものが挙げられる。また、他の媒体の例としては、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給乃至流通するサイト、サーバなどで管理する記録媒体乃至保存媒体も挙げられる。 The product attribute extraction method and product attribute extraction learning method for shopping search described above can also be embodied as computer-readable codes on a computer-readable recording medium. The recording medium may be of continuous storage or temporary storage for execution or download of the computer-executable program. In addition, the medium can be a variety of recording means or storage means in the form of a single or multiple pieces of hardware combined, but is not limited to a medium directly connected to a computer system, and is distributed over a network. can be Examples of media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. medium), ROM, RAM, flash memory, etc., which are configured to store program instructions. Examples of other media include recording media and storage media managed by application stores that distribute applications, sites that supply and distribute various software, and servers.

本開示の方法、動作又は技法は多様な手段により具現できる。例えば、このような技法は、ハードウェア、ファームウェア、ソフトウェア、若しくはこれらの組合せで具現できる。本願の開示により説明された多様な例示的な論理的ブロック、モジュール、回路及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、若しくは両方の組合せで具現できることを、通常の技術者であれば理解できるはずである。ハードウェア及びソフトウェアのこのような相互の代替を明確に説明するために、多様な例示的な構成要素、ブロック、モジュール、回路及びステップが、それらの機能的観点から一般的に前述された。そのような機能が、ハードウェアとして具現されるか、若しくは、ソフトウェアとして具現されるかは、特定アプリケーション及び全体システムに付加される設計要求事項によって変化する。通常の技術者は、各々の特定アプリケーションのために多様な方式により説明された機能を具現することもできるが、そのような具現は本開示の範囲から逸脱するものと解釈してはならない。 The methods, acts, or techniques of the disclosure may be embodied by various means. For example, such techniques may be implemented in hardware, firmware, software, or any combination thereof. A person of ordinary skill in the art should understand that the various exemplary logical blocks, modules, circuits and algorithm steps described in the present disclosure can be embodied in electronic hardware, computer software, or a combination of both. is. To clearly illustrate such mutual alternatives of hardware and software, various illustrative components, blocks, modules, circuits, and steps have been described above generally in terms of their functionality. Whether such functionality is implemented as hardware or software will vary depending on the particular application and design requirements imposed on the overall system. Skilled artisans may implement the described functionality in varying ways for each particular application, but such implementations should not be interpreted as departing from the scope of the present disclosure.

ハードウェアの具現において、技法の遂行に利用されるプロセッシングユニットは、一つ以上のASIC、DSP、デジタル信号処理デバイス(digital signal processing devices ; DSPD)、プログラム可能な論理デバイス(programmable logic devices ; PLD)、フィールドプログラム可能なゲートアレイ(field programmable gate arrays ; FPGA)、プロセッサ、制御器、マイクロ制御器、マイクロプロセッサ、電子デバイス、本開示に説明された機能を遂行するように設計された他の電子ユニット、コンピュータ、若しくはこれらの組合せ内で具現されることもできる。 In a hardware implementation, the processing unit utilized to perform the techniques may be one or more of ASICs, DSPs, digital signal processing devices (DSPDs), programmable logic devices (PLDs). , field programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, electronic devices, and other electronic units designed to perform the functions described in this disclosure , a computer, or a combination thereof.

したがって、本開示により説明された多様な例示的な論理ブロック、モジュール及び回路は、汎用プロセッサ、DSP、ASIC、FPGAや他のプログラム可能な論理デバイス、離散ゲートやトランジスタロジック、離散ハードウェアコンポーネント、若しくは、本願に説明された機能を遂行するように設計されたもの等の任意の組合せで具現又は遂行されることもできる。汎用プロセッサはマイクロプロセッサであり得るが、代案として、プロセッサは、任意の従来のプロセッサ、制御器、マイクロ制御器、若しくは状態マシンであり得る。プロセッサは、また、コンピューティングデバイスの組合せ、例えば、DSPとマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと関連する一つ以上のマイクロプロセッサ、若しくは任意の他の構成の組合せで具現されることもできる。 Thus, the various exemplary logic blocks, modules and circuits described by this disclosure may be general purpose processors, DSPs, ASICs, FPGAs or other programmable logic devices, discrete gate or transistor logic, discrete hardware components, or , may be embodied or performed in any combination, including those designed to perform the functions described herein. A general-purpose processor can be a microprocessor, but, in the alternative, the processor can be any conventional processor, controller, microcontroller, or state machine. A processor may also be embodied in a combination of computing devices, such as a DSP and a microprocessor, multiple microprocessors, one or more microprocessors associated with a DSP core, or any other combination of configurations. .

ファームウェア及び/又はソフトウェアの具現において、技法は、RAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、PROM(programmable read-only memory)、EPROM(erasable programmable read-only memory)、EEPROM(electrically erasable PROM)、フラッシュメモリ、CD(compact disc)、磁気又は光学データストレージデバイスなどのようなコンピュータ読み取り可能な媒体上に保存された命令で具現できる。命令は、一つ以上のプロセッサによって実行可能であり得、プロセッサが本開示に説明された機能の特定様態を遂行するようにできる。 In the implementation of firmware and/or software, the technique is random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), programmable read-only memory (PROM), erasable programmable memory (EPROM). It can be embodied by instructions stored on a computer-readable medium such as a read-only memory), electrically erasable PROM (EEPROM), flash memory, compact disc (CD), magnetic or optical data storage device, and the like. The instructions may be executable by one or more processors and may cause the processors to perform certain aspects of the functions described in this disclosure.

ソフトウェアで具現される場合、前記技法は、一つ以上の命令又はコードとしてコンピュータ読み取り可能な媒体上に保存されたり、コンピュータ読み取り可能な媒体を介して転送されたりできる。コンピュータ読み取り可能な媒体は、ある場所から他の場所にコンピュータプログラムの転送を容易にする任意の媒体を含み、コンピュータ保存媒体及び通信媒体の両方を含む。保存媒体は、コンピュータによってアクセスできる任意の利用可能な媒体であり得る。非制限的な例として、このようなコンピュータ読み取り可能な媒体は、RAM、ROM、EEPROM、CD-ROMや他の光学ディスクストレージ、磁気ディスクストレージや他の磁気ストレージデバイス、若しくは、所望のプログラムコードを命令又はデータ構造の形態に移送又は保存するために使用されることができ、コンピュータによってアクセスできる任意の他の媒体を含むことができる。また、任意の接続をコンピュータ読み取り可能な媒体として含むことができる。 When implemented in software, the techniques can be stored on or transferred over a computer-readable medium as one or more instructions or code. Computer-readable media includes both computer storage media and communication media that facilitates transfer of a computer program from one place to another. A storage media may be any available media that can be accessed by a computer. By way of non-limiting example, such computer readable media may include RAM, ROM, EEPROM, CD-ROM or other optical disk storage, magnetic disk storage or other magnetic storage devices, or any desired program code. It can also include any other computer-accessible medium that can be used to transport or store instructions or data structures in a form. Also, any connection may be included as a computer-readable medium.

例えば、ソフトウェアが同軸ケーブル、光繊維ケーブル、リード線、デジタル加入者回線(DSL)、又は、赤外線、無線及びマイクロ波のような無線技術を用いて、ウェブサイト、サーバ又は他の遠隔ソースから転送される場合、同軸ケーブル、光繊維ケーブル、リード線、デジタル加入者回線、又は、赤外線、無線及びマイクロ波のような無線技術は、媒体の定義内に含まれる。本願で使用されたディスク(disk)及びディスク(disc)は、CD、レーザーディスク、光ディスク、DVD(digital versatile disc)、フロッピーディスク及びブルーレイディスクを含み、ここで、通常、ディスク(disk)は磁気的にデータを再生するのに対し、ディスク(disc)はレーザーを用いて光学的にデータを再生する。前記組合せ等も、コンピュータ読み取り可能な媒体等の範囲内に含まれなければならない。 For example, software may be transferred from a website, server or other remote source using coaxial cable, fiber optic cable, lead wire, digital subscriber line (DSL), or wireless technologies such as infrared, radio and microwave. Coaxial cable, fiber optic cable, lead wire, digital subscriber line, or wireless technologies such as infrared, radio and microwave, where applicable, are included within the definition of medium. As used herein, disk and disc include CDs, laser discs, optical discs, DVDs (digital versatile discs), floppy discs and Blu-ray discs, where disk generally refers to a magnetic A disc reproduces data optically using a laser, whereas a disc reproduces data optically. Combinations and the like should also be included within the scope of computer-readable media and the like.

ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、移動式ディスク、CD-ROM、又は、公知の任意の異なる形態の保存媒体内に常駐することもできる。例示的な保存媒体は、プロセッサが保存媒体から情報を読み取る、或いは、保存媒体に情報を書き込むように、プロセッサに連結することができる。代案として、保存媒体はプロセッサに統合されることもできる。プロセッサ及び保存媒体はASIC内に存在することもできる。ASICはユーザ端末内に存在することもできる。代案として、プロセッサ及び保存媒体はユーザ端末で個別構成要素として存在することもできる。 A software module may reside in RAM memory, flash memory, ROM memory, EPROM memory, EEPROM memory, registers, hard disk, a removable disk, a CD-ROM, or any other form of storage medium known in the art. An exemplary storage medium may be coupled to the processor, such that the processor reads information from, and writes information to, the storage medium. Alternatively, the storage medium may be integrated into the processor. The processor and storage medium can also reside within an ASIC. The ASIC may also reside in a user terminal. Alternatively, the processor and storage medium may exist as separate components in the user terminal.

前述した実施例が一つ以上の独立型コンピュータシステムで現在開示された主題の様態を活用するものとして記述しているが、本開示はこれに限定されず、ネットワークや分散コンピューティング環境のような任意のコンピューティング環境によって具現できる。さらには、本開示における主題の様態は複数のプロセッシングチップや装置で具現されることもでき、ストレージは複数の装置に亘って類似に影響を受けることもできる。このような装置は、PC、ネットワークサーバ及び携帯用装置を含むこともできる。 Although the foregoing embodiments are described as utilizing aspects of the presently disclosed subject matter in one or more stand-alone computer systems, the disclosure is not so limited, and may be used in networked or distributed computing environments, such as. It can be embodied by any computing environment. Further, aspects of the subject matter of this disclosure may be embodied in multiple processing chips or devices, and storage may be similarly affected across multiple devices. Such devices may also include PCs, network servers and handheld devices.

本明細書では、本開示が一部の実施例によって説明されたが、本開示の発明が属する技術分野における通常の技術者が理解し得る本開示から逸脱しない範囲内で多様な変形や変更が可能である。また、そのような変形や変更は、本明細書に添付された特許請求の範囲内に属するものと理解されるべきである。 In the present specification, the present disclosure has been described with some embodiments, but various modifications and changes can be made without departing from the present disclosure that can be understood by a person of ordinary skill in the technical field to which the disclosed invention belongs. It is possible. Also, such variations and modifications should be understood to fall within the scope of the claims appended hereto.

100 画面
110 ユーザクエリ
120 ユーザインタフェース
130 検索結果
132、136 商品
134、138 商品属性
210 ユーザ端末
220 ネットワーク
230 商品属性抽出サーバ
240 検索ログデータベース
420 統計基盤分類モデル
510 前処理器
520 分類器
100 Screen 110 User Query 120 User Interface 130 Search Result 132, 136 Product 134, 138 Product Attribute 210 User Terminal 220 Network 230 Product Attribute Extraction Server 240 Search Log Database 420 Statistical Base Classification Model 510 Preprocessor 520 Classifier

Claims (15)

コンピュータシステムで実行されるショッピング検索のための商品属性抽出方法において、
ユーザクエリを受信するステップ;
商品データベースから前記ユーザクエリに対する商品検索結果を抽出するステップ;
統計基盤分類モデルにより、前記ユーザクエリ及び複数の商品属性の関連点数を算出するステップ;及び、
前記算出された関連点数に基づき、前記商品検索結果による商品検索順位を調整するステップを含み、
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数を算出するステップは、
前記ユーザクエリを音節及び形態素の単位に分割するステップ;
第1の統計基盤分類モデルにより、前記音節の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第1の確率を算出するステップ;
第2の統計基盤分類モデルにより、前記形態素の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第2の確率を算出するステップ;及び、
前記第1の確率及び前記第2の確率に基づいて、前記複数の商品属性の関連点数として算出するステップを含む、
ショッピング検索のための商品属性抽出方法。
In a product attribute extraction method for shopping search performed by a computer system,
receiving a user query;
extracting product search results for the user query from a product database;
calculating a relevance score of the user query and a plurality of product attributes according to a statistically-based classification model; and
adjusting the product search ranking according to the product search results based on the calculated relevance score ;
The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
dividing the user query into units of syllables and morphemes;
calculating a first probability that the syllable-divided user query is associated with the plurality of product attributes according to a first statistically-based classification model;
calculating a second probability that the user query divided into morphemes is associated with the plurality of product attributes by a second statistically-based classification model; and
Based on the first probability and the second probability, calculating as the related score of the plurality of product attributes,
Product attribute extraction method for shopping search.
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数を算出するステップは、
前記統計基盤分類モデルにより、前記ユーザクエリが各々商品属性コードで表示された前記複数の商品属性と関連する確率を算出するステップを含む、請求項1に記載のショッピング検索のための商品属性抽出方法。
The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
2. The product attribute extraction method for shopping search according to claim 1, comprising calculating a probability that the user query is associated with the plurality of product attributes each represented by a product attribute code, according to the statistically-based classification model. .
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数を算出するステップは、
前記ユーザクエリを音節及び形態素の単位の少なくとも一つに分割するステップ;及び、
前記統計基盤分類モデルにより、前記音節及び前記形態素の単位の少なくとも一つに分割された前記ユーザクエリが前記複数の商品属性と関連する確率を算出するステップを含む、請求項1又は2に記載のショッピング検索のための商品属性抽出方法。
The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
dividing the user query into at least one of syllable and morpheme units; and
3. The method according to claim 1, further comprising calculating a probability that the user query divided into at least one of the syllable and the morpheme unit is associated with the plurality of product attributes by the statistically-based classification model. Product attribute extraction method for shopping search.
前記算出された関連点数に基づき、前記商品検索結果による商品検索順位を調整するステップは、
前記算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性を抽出するステップ;
前記商品データベースから前記抽出された第1の商品属性を含む第1の商品を検索するステップ;及び、
前記第1の関連点数によって前記検索された第1の商品の前記商品検索順位を調整するステップを含む、請求項1乃至の何れか一項に記載のショッピング検索のための商品属性抽出方法。
The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
a step of extracting a first product attribute associated with a first association score, which is the highest association score among the calculated association scores;
searching the product database for a first product that includes the extracted first product attribute; and
4. The product attribute extraction method for shopping search according to any one of claims 1 to 3 , comprising adjusting the product search order of the searched first product according to the first relevance score.
前記算出された関連点数に基づき、前記商品検索結果による商品検索順位を調整するステップは、
前記算出された関連点数のうち、関連点数が既定の閾値以上である第1の関連点数群と関連する第1の商品属性群を抽出するステップ;
前記商品データベースから前記抽出された第1の商品属性群に含まれた少なくとも一つの商品属性を含む商品を検索するステップ;及び、
前記第1の関連点数群によって前記検索された商品の前記商品検索順位を調整するステップを含む、請求項1乃至の何れか一項に記載のショッピング検索のための商品属性抽出方法。
The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
a step of extracting a first product attribute group related to a first group of related scores having a related score greater than or equal to a predetermined threshold among the calculated related scores;
searching from the product database for products including at least one product attribute included in the extracted first product attribute group; and
4. The product attribute extraction method for shopping search according to any one of claims 1 to 3 , comprising a step of adjusting the product search order of the searched product according to the first related score group.
前記算出された関連点数に基づき、前記商品検索結果による商品検索順位を調整するステップは、
前記第1の商品属性の重要度を決定する商品属性加重値及び前記第1の関連点数に基づいて前記第1の商品の検索順位を調整するステップをさらに含む、請求項に記載のショッピング検索のための商品属性抽出方法。
The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
5. The shopping search of claim 4 , further comprising adjusting a search ranking of the first product based on a product attribute weighting value for determining importance of the first product attribute and the first relevance score. Product attribute extraction method for
前記検索順位の調整により前記第1の商品が表示される検索結果画面を出力するステップ;
前記出力された検索結果画面で前記第1の商品のクリック数を受信するステップ;及び、
前記第1の商品のクリック数が既定の閾値以上である場合、前記商品属性加重値を変更するステップをさらに含む、請求項に記載のショッピング検索のための商品属性抽出方法。
a step of outputting a search result screen on which the first product is displayed by adjusting the search ranking;
receiving the number of clicks of the first product on the output search results screen; and
7. The product attribute extraction method for shopping search as claimed in claim 6 , further comprising changing the product attribute weighting value when the number of clicks of the first product is greater than or equal to a predetermined threshold.
請求項1乃至の何れか一項に係るショッピング検索のための商品属性抽出方法をコンピュータで実行するためのコンピュータプログラム。 A computer program for executing the product attribute extraction method for shopping search according to any one of claims 1 to 7 on a computer. コンピュータシステムで実行されるショッピング検索のための商品属性抽出の学習方法において、
複数の第1のユーザクエリ及び前記複数の第1のユーザクエリと関連する複数の第1の商品属性を含む複数の第1の学習データを生成するステップ;及び、
前記複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルを学習するステップを含み、
前記統計基盤分類モデルを学習するステップは、
前記複数の第1のユーザクエリを形態素の単位に分割するステップ;
前記複数の第1のユーザクエリを音節の単位に分割するステップ;
前記形態素の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第1の統計基盤分類モデルを学習するステップ;及び、
前記音節の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第2の統計基盤分類モデルを学習するステップを含む、
ショッピング検索のための商品属性抽出の学習方法。
In a learning method of product attribute extraction for shopping search performed by a computer system,
generating a plurality of first learning data including a plurality of first user queries and a plurality of first product attributes associated with the plurality of first user queries; and
learning a statistically-based classification model to calculate relevance scores for one or more product attributes corresponding to a second user query based on the plurality of first learning data ;
The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of morphemes;
dividing the plurality of first user queries into units of syllables;
learning a first statistical-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on the plurality of first user queries divided into morpheme units; as well as,
learning a second statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to the user queries based on the plurality of first user queries divided into syllable units; include,
How to learn product attribute extraction for shopping search.
前記複数の第1の学習データを生成するステップは、
前記複数の第1のユーザクエリと関連する統合検索クリック情報、ショッピングクリック情報又は商品データベースの少なくとも一つから前記複数の第1の商品属性を抽出するステップを含む、請求項に記載のショッピング検索のための商品属性抽出の学習方法。
The step of generating the plurality of first learning data includes:
10. The shopping search of claim 9 , comprising extracting the plurality of first product attributes from at least one of federated search click information, shopping click information, or a product database associated with the plurality of first user queries. How to learn product attribute extraction for
前記複数の第1の学習データを生成するステップは、
前記複数の第1の商品属性を両義的商品属性に対応できる複数の第1の商品属性コードに変換するステップを含む、請求項9又は10に記載のショッピング検索のための商品属性抽出の学習方法。
The step of generating the plurality of first learning data includes:
11. The learning method for product attribute extraction for shopping search according to claim 9 or 10 , comprising the step of converting said plurality of first product attributes into a plurality of first product attribute codes that can correspond to ambiguous product attributes. .
前記統計基盤分類モデルを学習するステップは、
前記複数の第1のユーザクエリを形態素の単位に分割するステップ;及び、
前記形態素の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように前記統計基盤分類モデルを学習するステップを含む、請求項9乃至11の何れか一項に記載のショッピング検索のための商品属性抽出の学習方法。
The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of morphemes; and
Based on the plurality of first user queries divided into units of the morpheme, learning the statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query; The learning method for product attribute extraction for shopping search according to any one of claims 9 to 11 .
前記統計基盤分類モデルを学習するステップは、
前記複数の第1のユーザクエリを音節の単位に分割するステップ;及び、
前記音節の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように前記統計基盤分類モデルを学習するステップを含む、請求項9乃至11の何れか一項に記載のショッピング検索のための商品属性抽出の学習方法。
The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of syllables; and
Based on the plurality of first user queries divided into syllable units, learning the statistically-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query; The learning method for product attribute extraction for shopping search according to any one of claims 9 to 11 .
請求項9乃至13の何れか一項に係るショッピング検索のための商品属性抽出の学習方法をコンピュータで実行するためのコンピュータプログラム。 A computer program for executing the learning method for product attribute extraction for shopping search according to any one of claims 9 to 13 on a computer. ショッピング検索のための商品属性抽出システムにおいて、
ユーザクエリを受信する通信モジュール;
メモリ;及び、
前記メモリと連結し、前記メモリに含まれたコンピュータ読み取り可能な命令を実行するように構成された少なくとも一つのプロセッサを含み、
前記少なくとも一つのプロセッサは、
商品データベースから前記ユーザクエリに対する商品検索結果を抽出し、統計基盤分類モデルを用いて、前記ユーザクエリ及び複数の商品属性の関連点数を算出し、前記算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整し、
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数の算出は、
前記ユーザクエリを音節及び形態素の単位に分割し、
第1の統計基盤分類モデルにより、前記音節の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第1の確率を算出し、
第2の統計基盤分類モデルにより、前記形態素の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第2の確率を算出し、
前記第1の確率及び前記第2の確率に基づいて、前記複数の商品属性の関連点数として算出することにより行われる、
ショッピング検索のための商品属性抽出システム。
In the product attribute extraction system for shopping search,
a communication module for receiving user queries;
memory; and
at least one processor coupled to the memory and configured to execute computer readable instructions contained in the memory;
The at least one processor
Extracting product search results for the user query from a product database, calculating the relation scores of the user query and a plurality of product attributes using a statistically-based classification model, and calculating the product search results based on the calculated relation scores Adjust the product search ranking by
According to the statistical-based classification model, calculating the user query and the related scores of the plurality of product attributes includes:
dividing the user query into units of syllables and morphemes;
calculating a first probability that the user query divided into syllables is associated with the plurality of product attributes by a first statistically based classification model;
calculating a second probability that the user query divided into morpheme units is associated with the plurality of product attributes by a second statistically-based classification model;
Based on the first probability and the second probability, by calculating as the related score of the plurality of product attributes,
Product attribute extraction system for shopping search.
JP2021075589A 2020-05-11 2021-04-28 Product Attribute Extraction Method for Shopping Search Active JP7150090B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0055675 2020-05-11
KR1020200055675A KR102400995B1 (en) 2020-05-11 2020-05-11 Method and system for extracting product attribute for shopping search

Publications (2)

Publication Number Publication Date
JP2021179979A JP2021179979A (en) 2021-11-18
JP7150090B2 true JP7150090B2 (en) 2022-10-07

Family

ID=78510322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021075589A Active JP7150090B2 (en) 2020-05-11 2021-04-28 Product Attribute Extraction Method for Shopping Search

Country Status (2)

Country Link
JP (1) JP7150090B2 (en)
KR (1) KR102400995B1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737559B (en) * 2020-05-29 2024-05-31 北京百度网讯科技有限公司 Resource ordering method, method for training ordering model and corresponding device
US20230316387A1 (en) * 2022-03-29 2023-10-05 Donde Fashion, Inc. Systems and methods for providing product data on mobile user interfaces
CN115563510B (en) * 2022-12-01 2023-04-07 北京搜狐新动力信息技术有限公司 Training method of click rate estimation model and related device
KR102535399B1 (en) * 2023-02-21 2023-05-30 주식회사 그린랩스 Server, method and program for providing seller and buyer matching service based on agricultural product attribute data
KR102590569B1 (en) * 2023-05-12 2023-10-19 주식회사 어베어 Apparatus and method for deriving product name based on commerce characteristic

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156429A (en) 2017-03-17 2018-10-04 ヤフー株式会社 Information processing device, information processing method, and program
JP2020042402A (en) 2018-09-07 2020-03-19 Zホールディングス株式会社 Information processing apparatus, learning device, information processing method, generation method and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101110030B1 (en) * 2009-11-30 2012-02-29 전남대학교산학협력단 System and method for providing recommended words using context in a mobile communication terminal
KR101873873B1 (en) * 2018-03-12 2018-07-03 미디어젠(주) Multimedia content search device through attribute information analysis and Method
KR102544781B1 (en) * 2018-08-08 2023-06-19 삼성전자주식회사 Method for providing information on merchandise based on priority and electronic device thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156429A (en) 2017-03-17 2018-10-04 ヤフー株式会社 Information processing device, information processing method, and program
JP2020042402A (en) 2018-09-07 2020-03-19 Zホールディングス株式会社 Information processing apparatus, learning device, information processing method, generation method and program

Also Published As

Publication number Publication date
JP2021179979A (en) 2021-11-18
KR20210137643A (en) 2021-11-18
KR102400995B1 (en) 2022-05-24

Similar Documents

Publication Publication Date Title
JP7150090B2 (en) Product Attribute Extraction Method for Shopping Search
CN109844767B (en) Visual search based on image analysis and prediction
JP6446602B2 (en) Method and system for categorizing data
US11100170B2 (en) Domain-agnostic structured search query exploration
KR102354716B1 (en) Context-sensitive search using a deep learning model
JP6745384B2 (en) Method and apparatus for pushing information
JP2022505237A (en) Techniques for ranking content item recommendations
US11301540B1 (en) Refined search query results through external content aggregation and application
US9727906B1 (en) Generating item clusters based on aggregated search history data
US20160078101A1 (en) Enhanced search query suggestions
WO2018035110A1 (en) Search of publication corpus with multiple algorithms
US9767417B1 (en) Category predictions for user behavior
US9767204B1 (en) Category predictions identifying a search frequency
US11210341B1 (en) Weighted behavioral signal association graphing for search engines
JP7108740B2 (en) Product Category Extraction Method for Shopping Search
KR20180000166A (en) System and method for providing interest contents
JP7012803B2 (en) Soaring search term provision method and system
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission
JP2023162154A (en) Method, computer device and computer program for providing recommendation information based on local knowledge graph
CN107784061B (en) Method and system for determining image-based content style and machine-readable medium
KR102611482B1 (en) Method and system for providing marketing strategy model based on big data
US11709844B2 (en) Computerized smart inventory search methods and systems using classification and tagging
KR102649675B1 (en) Method and system for providing information using full-text index integrated graph data structure and vector data
US11810577B2 (en) Dialogue management using lattice walking
WO2023225919A1 (en) Visual search method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220927

R150 Certificate of patent or registration of utility model

Ref document number: 7150090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150