KR20080037413A - On line context aware advertising apparatus and method - Google Patents

On line context aware advertising apparatus and method Download PDF

Info

Publication number
KR20080037413A
KR20080037413A KR1020060104547A KR20060104547A KR20080037413A KR 20080037413 A KR20080037413 A KR 20080037413A KR 1020060104547 A KR1020060104547 A KR 1020060104547A KR 20060104547 A KR20060104547 A KR 20060104547A KR 20080037413 A KR20080037413 A KR 20080037413A
Authority
KR
South Korea
Prior art keywords
advertisement
keyword
keywords
advertisements
content
Prior art date
Application number
KR1020060104547A
Other languages
Korean (ko)
Other versions
KR101355945B1 (en
Inventor
구만영
김대성
김연태
박종복
조원준
Original Assignee
에스케이커뮤니케이션즈 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이커뮤니케이션즈 주식회사 filed Critical 에스케이커뮤니케이션즈 주식회사
Priority to KR1020060104547A priority Critical patent/KR101355945B1/en
Publication of KR20080037413A publication Critical patent/KR20080037413A/en
Application granted granted Critical
Publication of KR101355945B1 publication Critical patent/KR101355945B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Abstract

An online context based advertising apparatus and a method thereof are provided to select optimized advertisement through duplicate filtering by performing following clustering and a correlation calculation to candidate advertisement groups. A first matching part extracts a keyword from advertisement target contents, and selects the plural advertisement by matching the keyword with the advertisement as a classification way. A second matching part classifies the advertisement keywords into a group by clustering. A third matching part selects a group correlated with the advertisement target contents of the groups which are classified by the second matching part, so as to select the advertisement of the selected group. The first matching part comprises a keyword dictionary DB(410), a database(420) storing the advertisement and the keywords, a content keyword extraction part(510) and a keyword matching part(520).

Description

온라인 문맥기반 광고 장치 및 방법{ON LINE CONTEXT AWARE ADVERTISING APPARATUS AND METHOD}Online context-based advertising device and method {ON LINE CONTEXT AWARE ADVERTISING APPARATUS AND METHOD}

도 1은 일반적인 온라인 문맥기반 광고 방법을 보인 순서도.1 is a flow chart showing a general online context-based advertising method.

도 2는 종래 온라인 문맥기반 광고 방법을 보인 순서도.2 is a flow chart showing a conventional online context-based advertising method.

도 3은 본 발명 일 실시예의 광고 방법을 보인 순서도.Figure 3 is a flow chart showing the advertising method of an embodiment of the present invention.

도 4는 본 발명 일 실시예의 동작 방식을 보인 예시도.4 is an exemplary view showing an operation method of an embodiment of the present invention.

도 5는 본 발명 일 실시예의 키워드 추출 대상을 보인 예시도.5 is an exemplary view showing a keyword extraction target of an embodiment of the present invention.

도 6은 본 발명 일 실시예의 구성을 보인 블록도.Figure 6 is a block diagram showing the configuration of an embodiment of the present invention.

도 7은 본 발명 다른 실시예의 구성을 보인 블록도.Figure 7 is a block diagram showing the configuration of another embodiment of the present invention.

도 8은 본 발명 다른 실시예의 키워드 추천부 구조를 보인 블록도.8 is a block diagram showing a keyword recommendation unit structure according to another embodiment of the present invention.

도 9는 본 발명 다른 실시예의 컨텐츠 키워드 추출부 구조를 보인 블록도.9 is a block diagram showing a structure of a content keyword extraction unit according to another embodiment of the present invention.

** 도면의 주요 부분에 대한 부호의 설명 **** Description of symbols for the main parts of the drawing **

10: 광고 대상 컨텐츠 20: 1차 매칭 결과 목록10: Target content 20: Primary matching result list

30: 2차 매칭 결과 목록 40: 최종 매칭 결과 목록30: Secondary Match Result List 40: Final Match Result List

110: 컨텐츠 키워드 추출부 120: 키워드 매칭부110: content keyword extraction unit 120: keyword matching unit

130: 광고 군집 처리부 140: 상관관계 연산부130: advertisement cluster processing unit 140: correlation calculation unit

150: 광고 선택부 160: 광고 제공부150: advertisement selection unit 160: advertisement providing unit

170: 표시부 180: 광고용 키워드 사전 DB170: display unit 180: keyword dictionary DB for advertising

190: 광고 및 광고 키워드 DB 200: 광고별 캠페인 정보 DB190: advertisement and ad keyword DB 200: campaign information DB for each advertisement

210: 사용자 입력부 300: 광고정보 IF부210: user input unit 300: advertising information IF unit

310: 키워드 추천부 320: 키워드 선택부310: keyword recommendation unit 320: keyword selection unit

330: 데이터 기계 학습부 400: 데이터 베이스330: data machine learning unit 400: database

410: 광고용 키워드 사전 DB 420: 광고 및 광고 키워드 DB410: Keyword dictionary for ads DB 420: Ad and ad keywords DB

430: 사용자 컨텐츠의 키워드 DB 440: 키워드 점수 DB430: keyword DB of the user content 440: keyword score DB

450: 광고별 캠페인 정보 DB 500: 컨텐츠 입력부450: Ad campaign information DB 500: Content input unit

510: 컨텐츠 키워드 추출부 520: 키워드 매칭부510: Content keyword extraction unit 520: Keyword matching unit

530: 광고 군집 처리부 540: 상관 관계 연산부530: advertisement cluster processing unit 540: correlation calculation unit

550: 광고 선택부 560: 광고 제공부550: advertisement selection unit 560: advertisement providing unit

본 발명은 온라인 문맥기반 광고에 관한 것으로, 특히, 효과적으로 광고 대상 컨텐츠의 키워드를 추출하고 해당 키워드에 일치하는 광고를 선별하여 상기 컨텐츠에 정확히 대응되는 광고의 노출을 유도하도록 한 온라인 문맥기반 광고 장치 및 방법에 관한 것이다.The present invention relates to an online context-based advertisement, and more particularly, to an online context-based advertisement apparatus which effectively extracts keywords of an advertisement target content and selects advertisements corresponding to the keywords to induce exposure of an advertisement corresponding to the contents. It is about a method.

최근 인터넷의 급속한 보급과 검색 기능을 가진 다양한 포털 서비스(블로그, 카페 등)의 폭발적인 증가로 인하여 검색된 결과를 제공함과 아울러 해당 결과에 관련된 광고를 선별 제공하는 서비스가 증가하고 있다. Recently, due to the rapid spread of the Internet and the explosive increase of various portal services (blogs, cafes, etc.) that have a search function, a number of services that provide search results and provide advertisements related to the results are increasing.

이러한 제공 컨텐츠의 내용을 기반으로 광고를 선별하여 표시하는 문맥기반 광고 방식은 컨텐츠의 내용과 광고의 정확한 일치 여부가 무엇보다 중요한 요소가 된다. The context-based advertising method that selects and displays advertisements based on the contents of the provided contents is the most important factor whether the contents of the contents exactly match with the advertisement.

상기 컨텐츠 기반 온라인 광고가 부적절한 컨텐츠와 함께 노출될 경우 해당 광고의 임프레션(impression) 수를 상승시키게 되며, 이러한 상승된 임프레션은 온라인 광고 시스템에 등록된 광고의 CTR(Click-Through Rate)을 낮추는 주요 요인이 된다. 즉, 광고주에게는 부적절한 컨텐츠에 광고주의 광고가 게재되어 광고 효과가 낮아지는 문제가 있으며, 해당 컨텐츠를 확인하는 일반 사용자는 유용한 광고 정보를 얻지 못하게 될 뿐만 아니라 심할 경우 부적절한 광고에 의해 불쾌감을 느낄 수 있다. 따라서, 컨텐츠와 광고를 부정확하게 대응시켜 게재하는 비율이 높을수록 CTR이 감소하며 그로 인해 광고 단가와 매출도 줄어들게 된다.When the content-based online advertisement is exposed with inappropriate content, the impression number of the advertisement is increased, and the increased impression lowers the click-through rate (CTR) of the advertisement registered in the online advertisement system. Becomes In other words, the advertiser has a problem that the advertisement of the advertiser is displayed on the inappropriate content, and the effect of the advertisement is lowered, and the general user who checks the content may not be able to obtain useful advertisement information and may be uncomfortable by the inappropriate advertisement. . Therefore, the higher the rate of incorrectly matching the content and the advertisement, the lower the CTR, thereby reducing the unit price and sales.

따라서, 컨텐츠의 내용을 정확히 파악하여 주된 주제를 선별하고, 이를 근거로 적절한 광고들을 보다 더 정확하게 검색한 후 이들을 함께 제공할 수 있는 기술이 요구되고 있다. Therefore, there is a need for a technology that can accurately grasp the contents of the contents, select the main themes, search for the appropriate advertisements more accurately, and provide them together based on the contents.

도 1 및 2는 상기 설명한 종래 기술들에 대한 광고 방식을 간략히 설명하는 순서도로서, 도 1은 기본적인 문맥기반 광고 방법에 대한 순서도이고, 도 2는 클러스터링 방식으로 컨텐츠를 분류하는 방식을 이용한 문맥기반 광고 방법에 대한 순서도이다. 1 and 2 is a flow chart briefly explaining the advertising method for the prior art described above, Figure 1 is a flow chart for a basic context-based advertising method, Figure 2 is a context-based advertising using a method for classifying content in a clustering method Flowchart for the method.

도 1은 도시한 바와 같이 광고 대상이 되는 컨텐츠에서 광고 키워드들을 추 출한다. 이는 중요성이 있는 단어들 중에서 명사 부분을 추출하는 방식이 이용될 수 있으며, 관련되는 다양한 유사 키워드들도 추출될 수 있다. 1 extracts the advertising keywords from the content to be advertised as shown. This method can be used to extract the noun part from the important words, and can also be extracted a variety of similar keywords.

상기 과정을 통해 추출된 키워드들을 이용하여 수주된 광고의 키워드들을 검색하여 매칭되는 광고들을 선별한다. 상기 광고의 키워드들은 상기 광고 수주시 광고주가 지정하는 키워드들일 수 있다. Using the keywords extracted through the above process, the keywords of the received advertisements are searched to select matching advertisements. Keywords of the advertisement may be keywords specified by an advertiser when receiving the advertisement.

상기 선별된 광고들 중에서 상기 광고 대상 컨텐츠와 상관 관계가 높은 상위 N개의 광고를 선별한다. 이때, 상기 상관 관계는 키워드의 출현 빈도가 주로 이용된다.The top N advertisements having a high correlation with the advertisement target content are selected from the selected advertisements. At this time, the correlation is mainly used for the frequency of appearance of the keyword.

이후, 상기 선별된 상위 N개의 광고를 상기 광고 대상 컨텐츠와 함께 상기 컨텐츠를 요청한 사용자에게 제공한다.Thereafter, the selected top N advertisements are provided to the user who requested the content together with the advertisement target content.

이를 통해 상기 광고 대상이 되는 컨텐츠와 관련된 광고가 선별되어 제공될 수 있다. 하지만, 해당 컨텐츠에서 추출한 키워드들과 개별 광고에 설정된 복수의 키워드들이 중복하여 매칭될 수 있어 관련성이 없는 광고들도 관련 광고인 것처럼 선별될 수 있다.Through this, advertisements related to the content targeted for advertisement may be selected and provided. However, since keywords extracted from the corresponding content and a plurality of keywords set in individual advertisements may be duplicated and matched, irrelevant advertisements may be selected as if they are related advertisements.

도 2는 컨텐츠를 주제별로 분류하는 방식을 이용하여 문맥기반 광고의 효율을 높이고자 한 것으로, 도시한 바와 같이 컨텐츠를 미리 수집하여 해당 컨텐츠에서 중요도가 높은 주제(토픽)를 찾아낸 후 이를 근거로 상기 컨텐츠들을 분류한다. 2 is to improve the efficiency of context-based advertising by using a method of classifying content by topic. As shown in FIG. 2, content is collected in advance to find a topic (topic) of high importance in the corresponding content. Classify the contents.

그리고, 수주된 광고 역시 주제별로 분류하여 저장해둔다. 즉, 광고를 수주한 후 광고 관련 정보로 상기 광고의 분류를 지정하는 것이며, 이는 자동적으로 처리될 수 있다. In addition, the ordered advertisement is also classified and stored by theme. That is, after ordering an advertisement, a classification of the advertisement is designated as advertisement-related information, which may be automatically processed.

상기 과정이 완료된 상태에서 일반 사용자가 상기 주제별로 분류된 컨텐츠를 요청하면 상기 컨텐츠를 추출하고 해당 컨텐츠가 속한 주제와 동일한 주제를 가지는 광고를 검색하여 매칭과정을 수행한다. 이후, 상기 매칭된 광고를 상기 컨텐츠에 삽입하여 제공한다. When the process is completed, when a general user requests content classified by the topic, the content is extracted and a matching process is performed by searching for an advertisement having the same theme as the topic to which the corresponding content belongs. Thereafter, the matched advertisement is inserted into the content and provided.

상기 과정에서 알 수 있듯이 이 경우에는 컨텐츠에 대한 주제별 분류와, 광고에 대한 주제별 분류가 중요하며, 이러한 주제별 분류가 정확하지 않은 경우 광고의 정확한 노출이 어렵게 된다. 특히 주제의 범위나 정확도에 따라 결과가 크게 차이가 나기 때문에 상기 분류의 기준의 되는 주제를 정확하게 선택하는 것이 용이하지 않다. 특히, 모든 컨텐츠과 광고들을 수 많은 주제에 따라 분류해야 하기 때문에 처리량이 방대하여 비효율적이며 실시간 분류가 어렵다.As can be seen in the above process, in this case, it is important to classify the content and the thematic classification for the advertisement. If the classification is not correct, the accurate exposure of the advertisement becomes difficult. In particular, since the results vary greatly depending on the range or accuracy of the subject, it is not easy to accurately select the subject of the classification. In particular, because all content and advertisements must be classified according to a number of topics, the throughput is enormous and inefficient and difficult to classify in real time.

상기와 같은 광고 대상 컨텐츠와 광고에 대한 효과적인 분류 및 선택을 위해 새롭게 제안하는 본 발명 실시예들의 목적은 광고 대상 컨텐츠에서 키워드를 추출한 후 이를 근거로 수주된 광고의 키워드를 검색하여 복수의 광고들을 추출하고, 상기 광고들의 키워드들을 군집화한 다음 상기 군집들과 상기 광고 대상 컨텐츠의 상관 관계를 비교하여 가장 높은 상관 관계를 보이는 키워드 집단의 광고들을 선택함으로써, 빠르고 정확한 중복 필터링을 통해서 컨텐츠에 적합한 광고들을 선택하도록 한 온라인 문맥기반 광고 장치 및 방법을 제공하는 것이다.An object of the present invention, which is newly proposed for effective classification and selection of advertisement target content and advertisement, is to extract a plurality of advertisements by searching for a keyword of an ad received based on the extracted keyword from the advertisement target content. Select the advertisements suitable for the content through fast and accurate duplicate filtering by clustering the keywords of the advertisements and then comparing the correlations between the clusters and the target content and selecting the advertisements of the keyword group having the highest correlation. The present invention provides an online context-based advertising device and method.

본 발명 실시예들의 다른 목적은 광고 대상 컨텐츠에서 키워드를 추출함에 있어 컨텐츠를 구성하는 다양한 정보는 물론이고 상기 컨텐츠와 링크된 컨텐츠 및 상기 컨텐츠를 검색하면서 사용한 키워드도 추출 대상에 포함시키도록 함으로써, 보다 정확한 수준의 키워드 추출이 가능하도록 한 온라인 문맥기반 광고 장치 및 방법을 제공하는 것이다.Another object of the embodiments of the present invention is to extract not only the various information constituting the content, but also the content linked to the content and the keyword used while searching for the content to extract the keyword from the advertisement target content, The present invention provides an online context-based advertising device and method for enabling accurate keyword extraction.

본 발명 실시예들의 또 다른 목적은 광고를 수주하면서 해당 광고가 목적으로 하는 키워드를 입력할 경우 이를 음소 단위로 분리하여 유사한 음소를 가지는 유사 단어를 광고용 키워드 사전과 기존 광고들의 키워드들 및 광고 대상 컨텐츠로부터 추출한 키워드 목록들과 비교하여 유사 키워드를 추천하도록 하고, 상기 추천된 키워드들 중에서 적절한 키워드들을 선택하도록 함으로써, 광고에 대한 키워드를 효과적으로 지정하도록 한 온라인 문맥기반 광고 장치 및 방법을 제공하는 것이다.Another object of the embodiments of the present invention is to input a keyword targeted for the advertisement while receiving an advertisement, and to divide similar words having a phoneme by dividing them into phoneme units. The present invention provides an online context-based advertising apparatus and method for effectively designating keywords for advertisements by recommending similar keywords in comparison with keyword lists extracted from the keywords and selecting appropriate keywords among the recommended keywords.

본 발명 실시예들의 또 다른 목적은 수주한 광고에 대한 키워드를 광고 및 광고에 관련된 키워드를 저장하는 데이터베이스를 이용하는 데이터 기계 학습기를 통해 파악하여 가중치 점수 데이터를 생성한 후 이를 키워드 점수 데이터베이스에 저장하고, 이를 고려하면서 광고 대상 컨텐츠로부터 추출된 키워드들과 광고의 매칭 여부를 판단하도록 함으로써, 반복 학습으로 인해 선택 가능성이 더 높은 광고가 우선 선택되도록 하여 광고 후보군 선택의 효율을 높이도록 한 온라인 문맥기반 광고 장치 및 방법을 제공하는 것이다.Another object of the embodiments of the present invention is to identify the keyword for the ordered advertisement through a data machine learner using a database for storing the advertisement and the keyword associated with the advertisement to generate weighted score data, and then store it in the keyword score database, Considering this, it is possible to determine whether or not the keywords extracted from the target content match the advertisement, so that an advertisement having a higher selection possibility is selected first because of repetitive learning, thereby increasing the efficiency of selecting an advertisement candidate group. And a method.

본 발명 실시예들의 또 다른 목적은 광고주가 설정하는 광고의 노출 제한인 캠페인 정보를 광고별 데이터베이스로 구축하고, 해당 캠페인 정보를 근거로 선택된 광고의 노출 여부를 결정하도록 함으로써, 광고주의 요구에 일치되는 광고 효과 를 얻을 수 있도록 한 온라인 문맥기반 광고 장치 및 방법을 제공하는 것이다.Another object of the embodiments of the present invention is to build a campaign information, which is the exposure limit of the advertisement set by the advertiser into a database for each advertisement, and determine whether or not the selected advertisement is exposed based on the corresponding campaign information, thereby meeting the needs of the advertiser. To provide an online context-based advertising device and method to achieve the advertising effect.

본 발명의 목적은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해되어질 수 있을 것이다.The object of the present invention is not limited to the above-mentioned objects, and other objects that are not mentioned will be clearly understood by those skilled in the art from the following description.

상기와 같은 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 온라인 문맥기반 광고 장치는 광고 대상 컨텐츠로부터 키워드를 획득하고, 광고 키워드가 설정된 광고와 분류 방식으로 매칭시켜 복수의 광고들을 선택하는 제 1매칭부와; 상기 제 1매칭부가 제공하는 광고들의 키워드들을 클러스터링하여 군집화하는 제 2매칭부와; 상기 제 2매칭부를 통해 얻은 집단들 중 상기 광고 대상 컨텐츠와 상관 관계가 높은 집단을 선택하여 해당 집단의 광고를 선택하는 제 3매칭부를 포함하여 이루어진다.In order to achieve the above object, the online context-based advertising apparatus according to an embodiment of the present invention obtains a keyword from the content to be advertised, and matches the advertisement keyword with the set advertisement in a classification manner to select a plurality of advertisements. 1 matching part; A second matching unit for clustering and clustering keywords of advertisements provided by the first matching unit; And a third matching unit which selects a group having a high correlation with the advertisement target content among the groups obtained through the second matching unit and selects an advertisement of the corresponding group.

상기 구성에 부가적으로 상기 각 광고의 집행 정책을 저장하는 캠페인 데이터베이스와; 상기 제 3매칭부에서 선택된 광고들 중에서 상기 캠페인 데이터베이스에 저장된 광고 집행 정책에 따라 노출 가능한 광고만 선택하는 광고 선택부를 더 포함하여 이루어질 수 있다.A campaign database for storing the execution policy of each advertisement in addition to the configuration; The advertisement selector may be further configured to select only the advertisements that can be exposed according to the advertisement execution policy stored in the campaign database among the advertisements selected by the third matching unit.

또한, 본 발명 다른 실시예에 따른 온라인 문맥기반 광고 장치는 광고 및 키워드에 관련된 정보들을 종류별로 저장하는 데이터베이스부와; 상기 데이터베이스부에 키워드 관련 정보를 제공하는 키워드 선택부와; 광고 대상 컨텐츠로부터 획득한 키워드와 상기 데이터베이스부의 광고 관련 정보를 이용하여 적어도 분 류(classifing) 방식과 클러스터링(clustering) 방식을 한번 이상씩 반복 실시하여 상기 방식들에 의해 동일 집단으로 선별 및 구분된 광고들 중 상기 광고 대상 컨텐츠와의 상관 관계가 가장 높은 집단을 선택하여 해당 집단에 포함된 광고 목록을 획득하는 매칭부를 포함하여 구성될 수 있다.In addition, the online context-based advertising device according to another embodiment of the present invention includes a database unit for storing information related to the advertisement and keywords by type; A keyword selecting unit which provides keyword related information to the database unit; Ads classified and classified into the same group by the above methods by repeatedly performing at least a classifing method and a clustering method one or more times by using keywords acquired from the target content and advertisement related information of the database unit. It may be configured to include a matching unit for obtaining a list of advertisements included in the group by selecting the group having the highest correlation with the target content of the advertisement.

상기 매칭부는 상기 광고 대상 컨텐츠로부터 획득한 키워드에 일치되는 광고들을 분류 방식으로 분류한 후 이들 중 일치도가 높은 소정 광고들만 선택하고, 상기 선택된 광고들의 광고 키워드들을 클러스터링 방식으로 군집화한 다음 다시 상기 군집화된 광고 집단들 중 상기 광고 대상 컨텐츠와 상관관계가 가장 높은 광고 집단을 선택하여 해당 집단에 포함된 광고들의 목록을 획득하는 것을 특징으로 한다.The matching unit classifies advertisements matching the keywords obtained from the advertisement target content by a classification method, selects only predetermined advertisements having high matching among them, clusters the advertisement keywords of the selected advertisements by clustering, and then clusters the advertisements again. Among the advertising groups, the advertisement group having the highest correlation with the advertisement target content is selected to obtain a list of advertisements included in the corresponding group.

상기 키워드 관련 정보를 제공하는 키워드 선택부는 소정 광고에 관련된 키워드를 입력받아 상기 입력된 광고 관련 키워드를 상기 데이터베이스의 광고 관련 키워드들을 이용하여 가중치를 계산한 후 상기 정보를 관련된 광고 정보들과 함께 상기 데이터베이스에 학습 결과로서 저장시키는 기계학습부를 더 포함할 수 있다.The keyword selecting unit that provides the keyword related information receives a keyword related to a predetermined advertisement, calculates a weight of the input advertisement related keyword using advertisement related keywords of the database, and then stores the information together with related advertisement information. It may further include a machine learning unit for storing as a learning result.

또한, 본 발명의 일 실시예에 따른 온라인 문맥기반 광고 방법은, 광고 대상 컨텐츠로부터 하나 이상의 키워드를 획득하는 단계와; 상기 획득된 컨텐츠의 키워드와 일치되는 복수의 광고들을 해당 광고에 대해 기 설정된 광고 키워드를 통해 선택하는 단계와; 상기 선택된 광고들의 키워드들을 클러스터링하여 군집화하고, 상기 군집들 중 유사한 것들을 병합하여 하나 이상의 집단을 형성하는 단계와; 상기 집단들과 상기 광고 대상 컨텐츠에 대한 상관관계가 높은 집단부터 선택하여 해 당 집단의 광고들을 선택하는 단계를 포함하여 이루어진다.In addition, the online context-based advertising method according to an embodiment of the present invention, the step of obtaining one or more keywords from the content to be advertised; Selecting a plurality of advertisements that match the keywords of the obtained content through a predetermined advertisement keyword for the corresponding advertisement; Clustering and clustering keywords of the selected advertisements and merging similar ones of the clusters to form one or more populations; And selecting a group having a high correlation with the groups and the advertisement target content, and selecting advertisements of the group.

또한, 본 발명 다른 실시예에 따른 온라인 문맥기반 광고 방법은 광고 및 해당 광고에 관련된 키워드를 수신하여 광고 관련 정보를 저장하는 데이터베이스부에 저장하는 단계와; 광고 대상 컨텐츠를 분석하여 키워드를 추출하는 단계와; 상기 광고 대상 컨텐츠로부터 추출된 키워드와 상기 데이터베이스부의 광고 관련 정보를 이용하여 적어도 분류 방식과 클러스터링 방식을 한번 이상씩 반복 실시하여 동일 집단으로 선별 및 구분된 광고 집단들을 얻는 단계와; 상기 광고 집단들 중 상기 광고 대상 컨텐츠와의 상관 관계가 가장 높은 집단을 선택하여 해당 집단에 포함된 광고들 중에서 실제 적용할 광고의 목록을 선별하는 단계를 포함하여 이루어진다.In addition, the online context-based advertising method according to another embodiment of the present invention includes the steps of receiving an advertisement and keywords related to the advertisement and storing the advertisement related information; Extracting keywords by analyzing advertisement target content; Repeating at least one classification scheme and a clustering scheme one or more times by using keywords extracted from the advertisement target content and advertisement related information of the database unit to obtain advertisement groups selected and classified into the same group; And selecting a group having the highest correlation with the advertisement target content among the advertisement groups, and selecting a list of advertisements to be actually applied among the advertisements included in the corresponding group.

상기 단계들에 부가적으로, 상기 데이터베이스부에 각 광고의 집행 정책을 포함하는 캠페인 데이터베이스를 구축하는 단계와; 상기 실제 적용할 광고의 목록을 선별하는 단계를 수행한 후에 상기 선별된 광고의 목록에서 상기 데이터베이스부에 포함된 각 광고의 집행 정책에 따라 노출 가능한 광고들만 선별하여 상기 광고 대상 컨텐츠와 함께 제공하는 단계를 더 포함할 수 있다.In addition to the above steps, constructing a campaign database including an execution policy of each advertisement in the database unit; After selecting the list of advertisements to be actually applied, selecting only the advertisements that can be exposed according to the execution policy of each advertisement included in the database unit from the selected list of advertisements and providing the selected advertisements together with the target content; It may further include.

상기한 바와 같은 본 발명을 첨부된 도면들과 실시예들을 통해 상세히 설명하도록 한다. The present invention as described above will be described in detail with reference to the accompanying drawings and embodiments.

도 3은 본 발명 일 실시예의 동작 방식을 개념적으로 설명하기 위한 순서도로서, 도시한 바와 같이 광고 대상 컨텐츠에서 복수의 키워드를 추출하는 것으로 상기 광고가 함께 표시될 광고 대상 컨텐츠를 특정한다. 상기 키워드의 추출 방식은 단순히 형태소 분석에 의해 명사들을 추출하고 해당 명사들의 출현 빈도에 따라 상위의 키워드들 중 일부를 선택하는 방식일 수 있고, 광고 제공에 빈번하게 사용되는 키워드들이나 광고와 연관성이 있는 키워드들 및 상호 관련성이 있는 키워드들에 대한 정보를 가지는 광고용 사전 데이터베이스를 통해 광고 자질어들에 가중치를 두는 방식도 사용할 수 있다. 그 외의 구체적인 방식들은 이후 좀더 상세히 설명할 것이다. 3 is a flowchart for conceptually describing an operation method of an embodiment of the present invention. As shown in FIG. 3, a plurality of keywords are extracted from advertisement target content to specify advertisement target content to be displayed together. The extraction method of the keyword may be a method of simply extracting nouns by morphological analysis and selecting some of the higher keywords according to the frequency of occurrence of the nouns, and may be related to keywords or advertisements frequently used for providing an advertisement. Weighting of ad qualities may also be used through a dictionary database for advertisements having information about keywords and correlated keywords. Other specific ways will be described later in more detail.

상기 과정을 통해 광고 대상 컨텐츠에서 키워드를 추출한 후 추출된 키워드를 이용하여 수주된 광고들에 대한 정보를 검색하여 매칭되는 광고들을 선별한다. 상기 광고들은 광고를 수주할 때 해당 광고의 업종이나 대상을 특정할 수 있는 광고 키워드들이 결정된다. 이는 광고주나 서비스 제공 업체에서 수작업으로 결정할 수도 있고, 자동적으로 해당 광고의 자체 컨텐츠를 검색하여 키워드를 추출하는 방식도 사용될 수 있다. 이러한 광고 관련 정보(광고 컨텐츠나 광고 컨텐츠의 위치정보 및 각 광고에 대한 키워드들)들을 키워드를 수단으로 검색하여 일치하는 광고들을 선택(매칭)하게 되는데, 다양한 키워드들의 상호 교차 매칭에 의해 상기 광고 대상 컨텐츠와 관련성이 약한 광고들까지도 상기 복수의 키워드들에 의해 선택될 수 있다. After extracting the keyword from the content to be advertised through the above process, the searched information on the received advertisements are selected using the extracted keyword to select matching advertisements. When the advertisements are ordered, the advertisement keywords that can specify the type or target of the advertisement are determined. This may be determined manually by an advertiser or a service provider, or a method of automatically searching for the content of the advertisement and extracting a keyword may be used. The advertisement-related information (ad content or location information of the advertisement content and keywords for each advertisement) is searched for by means of keywords to select (match) matching advertisements. Even ads that are less relevant to the content may be selected by the plurality of keywords.

상기 매칭 과정을 통해 얻어진 광고들 중에서 많은 광고 키워드들이 매칭되었거나 광고 자질어가 키워드에 포함되어 가중치가 높은 광고들과 같이 선택의 우위가 있는 상위 N개의 광고들을 추출한다. 이때, 상기 N개의 광고들은 상기 광고 대상 컨텐츠와 함께 제공할 광고들의 수보다는 많은 것이 바람직하다.Among the advertisements obtained through the matching process, many advertisement keywords are matched or advertisement qualifiers are included in the keyword to extract the top N advertisements having a superior selection, such as advertisements having a high weight. In this case, it is preferable that the N advertisements are larger than the number of advertisements to be provided together with the advertisement target content.

이후, 상기 N개의 광고들 간 상관관계를 연산하여 군집화를 실시한다. 상기 군집화는 상기 매칭과 같은 키워드 일치(가중치 고려)에 의한 분류(classification) 방식이 아니라, 상기 광고들에 대응되는 광고 키워드들에 대한 개별적인 군집을 형성하는 방식의 클러스터링(clustering)의 결과로 얻어지는 것이다. 상기 클러스터링이란 특정 키워드를 자동 선정하고 이러한 키워드들끼리 군집화하는 방식을 의미한다. 즉, 광고에는 복수의 광고 키워드들이 포함된 단위 구성을 가지지만, 클러스터링에서는 상기 키워드들을 독립적으로 간주하고 상기 키워드들 단위로 군집화가 이루어지게 된다.Subsequently, the correlation between the N advertisements is calculated to perform clustering. The clustering is not a classification method by keyword matching (weight consideration) such as the matching, but is a result of clustering of a method of forming individual clusters of advertisement keywords corresponding to the advertisements. . The clustering means a method of automatically selecting specific keywords and clustering the keywords. That is, although the advertisement has a unit configuration in which a plurality of advertisement keywords are included, clustering is regarded independently of the keywords and clustering is performed in units of the keywords.

그리고, 상기 군집화된 키워드들의 상관 관계를 고려하여 이들을 유사한 내용들끼리 병합하여 M개의 그룹으로 집단화한다. 즉 이 과정까지 실시하게 되면 수많은 광고들 중에서 광고 대상 컨텐츠와 관련된 광고들을 상기 분류 방식을 통해 1차적으로 선별하고, 이렇게 1차 선택된 광고 후보군들만을 대상으로 클러스터링을 실시하여 빠르게 유사 키워드들을 가진 그룹들로 재편성하는 2차적인 선별이 실시된다. 즉, 상기 2차적 선별과정까지 거쳐 그룹화된 2차 광고 후보군들은 상기 광고들을 중복 분류한 결과가 된다. In consideration of the correlation between the clustered keywords, similar contents are merged and grouped into M groups. That is, if this process is carried out, advertisements related to the target content among the numerous advertisements are first selected through the above classification method, and clustering is performed only on the first selected advertisement candidate groups to rapidly group similar keywords. Secondary sorting to regroup is carried out. That is, the secondary advertisement candidate groups grouped through the secondary selection process result in the classification of the advertisements.

이후, 상기 병합된 키워드 집단과 광고 대상 컨텐츠의 상관관계를 연산한다. 상기 키워드 집단과 광고 대상 컨텐츠와의 상관 관계는 상기 컨텐츠에서 추출한 키워드들 중 얼마나 많은 키워드들이 상기 키워드 집단에 포함되는 지를 통해 파악할 수 있으며, 상기 키워드 집단에 포함된 키워드의 중복도(Term Frequency)를 가중치로 고려할 수 있다. Thereafter, a correlation between the merged keyword group and the advertisement target content is calculated. The correlation between the keyword group and the content to be advertised may be determined by how many keywords among the keywords extracted from the content are included in the keyword group, and the term frequency of the keywords included in the keyword group may be determined. Can be considered as a weight.

상기 과정을 통해서 가장 높은 상관 관계를 가지는 키워드 집단이 선택되면, 해당 집단에 포함된 키워드를 광고 키워드로 하는 광고들을 상기 광고 대상 컨텐츠와 함께 제공할 광고들로 최종 선택하게 된다. When the keyword group having the highest correlation is selected through the above process, advertisements using keywords included in the group as an advertisement keyword are finally selected as advertisements to be provided together with the advertisement target content.

도 4는 상기 도 3의 순서도를 예를 들어 설명하기 위한 개념도로서, 일반 사용자가 특정한 검색 사이트를 통해 특정 컨텐츠를 검색하여 해당 컨텐츠를 확인하고자 할 경우의 광고를 제공하는 방식을 보인 것이다.FIG. 4 is a conceptual diagram for explaining the flowchart of FIG. 3 by way of example. FIG. 4 illustrates a method of providing an advertisement when a general user searches for a specific content through a specific search site and checks the corresponding content.

사용자의 컨텐츠 요청에 따라 광고를 제공하기 위해 문맥을 파악할 광고 대상 컨텐츠(10)로부터 키워드들을 추출한다. 도시된 경우는 굵은 글자로 표시된 부분이 추출된 키워드들로서, 도시한 바와 같이 '포장이사'에 관련된 컨텐츠이지만, 연관성이 약한 '서랍'이나 '청바지'등과 같은 키워드들도 선택되었음을 알 수 있다. 이는 유사한 빈도로 발생한 명사들 중에서 상기 명사들이 광고에 많이 사용될 수 있는 것으로 판단되었기 때문이다(자질어 이용).Keywords are extracted from the advertisement target content 10 to grasp the context in order to provide an advertisement according to a user's content request. In the illustrated case, keywords shown in bold letters are extracted, and as shown, the contents related to the 'packaging director', but keywords such as 'drawer' or 'jeans', which are weakly related, are also selected. This is because it was determined that the nouns can be used in advertisements among the nouns generated at similar frequencies (using qualifiers).

상기 선택된 키워드들을 이용하여 기 저장된 광고별 키워드들을 검색한 1차 매치 결과(20)를 보면, 각각의 광고들(1내지 5로 구분)은 복수의 키워드들로 특정되어 있으며, 이들 중 적어도 하나 이상이 상기 컨텐츠에서 추출된 키워드들과 매칭됨을 알 수 있다. Referring to the first match result 20 of searching for the pre-stored keywords of each advertisement by using the selected keywords, each of the advertisements (divided into 1 to 5) is specified by a plurality of keywords, and at least one of them. It can be seen that the keywords match the extracted keywords.

이렇게 1차적인 광고 후보군을 얻어 이를 그대로 이용하게 되면 도시된 바와 같이 '포장이사'에 관련된 컨텐츠와는 무관한 '청바지 쇼핑몰'이나 '가구 쇼핑몰'에 대한 광고가 제공되므로 상기 광고를 접한 사용자는 해당 광고에 대한 거부감을 가질 수 있으며, 관심도 얻기 어렵다.When the primary advertising candidate group is used and used as it is, as shown, advertisements for 'jeans shopping mall' or 'furniture shopping mall' are irrelevant to the contents related to the 'packaging director'. You may have a dislike for advertising, and it's hard to get attention.

따라서, 본 실시예에서는 상기 얻어진 1차 매치 결과로 얻은 광고 키워드들 을 클러스터링 방식으로 군집화한 후 이를 병합시켜 2차 매치결과(30)와 같은 병합된 그룹들(A내지 C로 구분)을 얻는다. 즉, 각 키워드들로 군집화한 후 유사 단어가 포함된 군집들을 병합하는 방식을 이용할 수 있으며, 이를 통해 효과적으로 키워드들을 근거로 그룹화를 실시할 수 있다. 상기 각 그룹의 키워드들은 복수의 광고들에 동일한 키워드들이 있을 수 있으므로 중복될 수 있으며, ()에 기재된 수만큼 중복되었음을 보였다. Therefore, in the present embodiment, the advertisement keywords obtained as the result of the first match are clustered in a clustering manner and merged to obtain merged groups (divided into A to C) such as the second match result 30. That is, a method of merging clusters containing similar words after clustering each keyword may be used, and thus grouping may be effectively performed based on the keywords. The keywords of each group may be duplicated because there may be the same keywords in a plurality of advertisements, and it has been shown that the number of duplicates in () is shown.

따라서, 도시된 2차 매치결과(30)는 3개의 그룹으로 구분되며, '포장이사그룹'에는 '포장이사', '해외이사', '해외포장이사', '포장' 등과 같은 키워드들을 포함하며, 이들 중 복수의 키워드들은 여러 광고에서 중복되어 설정된 것임을 알 수 있다. 즉, 1차 매치결과(20) 얻은 광고들 중에서 유사한 업종의 광고들이 복수로 선정되었으며, 해당 광고들이 광고 대상 컨텐츠에 정확히 대응할 가능성이 높음을 알 수 있게 된다.Accordingly, the illustrated second match result 30 is divided into three groups, and the 'packaging director group' includes keywords such as 'packaging director', 'overseas director', 'overseas packaging director', and 'packaging'. In this case, it can be seen that a plurality of keywords are set in duplicate in various advertisements. That is, a plurality of advertisements of similar industries are selected from among the advertisements obtained in the first match result 20, and it is understood that the corresponding advertisements are likely to correspond precisely to the target content.

그 외의 '청바지 쇼핑몰 그룹'이나 '가구 쇼핑몰 그룹'의 예를 보면, 각 그룹에 포함된 키워드들 중 중복된 키워드들이 없음을 알 수 있다. 즉, 관련성이 작은 광고에 포함된 키워드들은 중복될 가능성이 낮으며, 이러한 가능성이 도시한 바와 같은 결과로 나타나게 되는 것이다. Looking at other examples of the "jeans shopping mall group" or the "furniture shopping mall group", it can be seen that there are no duplicate keywords among the keywords included in each group. That is, the keywords included in the less relevant advertisements are less likely to overlap, and this possibility is shown as a result as shown.

따라서, 상기 각 그룹들과 상기 광고 대상 컨텐츠와의 상관 관계가 높은 것을 선택하면 해당 그룹에 포함된 키워드를 광고 키워드로 설정한 광고들은 상기 광고 대상 컨텐츠에 대응되는 광고일 확률이 대단히 높아진다. 따라서, 예로 든 최종 광고 선택 결과(40)를 보면 '포장이사'에 관련된 광고들만 선별되었음을 알 수 있 다.Therefore, if the correlation between the respective groups and the advertisement target content is selected, it is highly possible that the advertisements in which the keywords included in the group are the advertisement keywords are the advertisements corresponding to the advertisement target content. Therefore, the example of the final advertisement selection result 40 shows that only advertisements related to the 'packaging director' were selected.

상기 각 그룹들과 광고 대상 컨텐츠의 상관 관계는 다음과 같이 판단될 수 있다. 즉, 상기 광고 대상 컨텐츠에서 추출한 키워드들이 많이 포함된 그룹이 높은 상관 관계를 가진다고 판단할 수 있고, 중복되는 키워드들이 많이 포함된 그룹이 상기 광고 대상 컨텐츠와 높은 상관 관계를 가진다고 판단할 수 있다. 따라서, 이들을 복합적으로 고려하여 상관 관계를 파악할 수 있으며, 이들 중 한가지 방식의 결과를 가중치로 간주하는 방식이 고려될 수 있다.Correlation between the groups and the advertisement target content may be determined as follows. That is, it may be determined that a group including a lot of keywords extracted from the advertisement target content has a high correlation, and a group including a lot of duplicate keywords may have a high correlation with the advertisement target content. Therefore, the correlation can be identified by considering these in combination, and a method of considering the result of one of these methods as a weight can be considered.

상기 예를 들어 설명한 3단계의 광고 선택 및 분류 방식은 처음에는 분류방식(classification)에 따라 키워드 매칭되는 광고들을 분류하여 선별하고, 두번째로 선별된 광고들의 키워드들을 클러스터링(clustering) 방식에 따라 군집화하며, 마지막으로 군집화된 키워드 그룹들을 분류 방식(classification)으로 상관도에 따라 각 그룹들 중 상위 그룹을 선별하는 순서로 실시되었으나, 이 순서는 변경 가능하며, 먼저 클러스터링 방식으로 광고들을 군집화한 후 해당 군집들에서 키워드 매칭을 실시하는 등의 과정으로 실시될 수도 있다. 하지만, 실행 속도나 실시간성을 위해서는 도 3내지 4에서 설명한 방식을 이용하는 것이 바람직하다.For example, the three-step advertisement selection and classification method described above may first classify and classify ads matching keywords according to classification, and secondly, cluster keywords of the selected advertisements according to a clustering method. Finally, the grouping of the grouped keyword groups was performed in the order of selecting the upper group among the groups according to the degree of correlation by the classification method. However, the order can be changed. First, the advertisements are clustered and clustered. The keyword matching may be performed in a process such as performing keyword matching. However, it is preferable to use the method described in FIGS. 3 to 4 for execution speed or real time performance.

도 5는 광고 대상 컨텐츠로부터 키워드를 추출하는 방식을 설명하기 위한 개념도로서, 도시한 바와 같이 이루어진 광고 대상 컨텐츠를 효과적으로 분석하여 적절한 키워드들을 검출하기 위해서 보조적인 정보들을 최대한 활용하도록 한다. FIG. 5 is a conceptual diagram illustrating a method of extracting a keyword from advertisement target content, and effectively utilizes supplemental information to detect appropriate keywords by effectively analyzing the advertisement target content made as shown in FIG.

도시된 광고 대상 컨텐츠는 크게 컨텐츠의 내용인 본문(50)과, 문서의 정보를 포함하는 메타 태그(meta tag)(51), 이미지 링크를 위한 파일명(52), 컨텐츠 내 의 링크나 링크 주소 및 해당 링크된 내용(53), 그리고 상기 광고 대상 컨텐츠를 검색하거나 연결시켜 준 이전 주소(referer URL)의 검색 키워드(54)를 포함하여 이루어져 있으며, 상기 각 부분들은 상기 컨텐츠의 본문(50)을 보조적으로 특정하는데 도움을 줄 수 있기 때문에 상기 컨텐츠를 이루는 메타 태그나 파일명 등과 같은 컨텐츠 소스 내에 포함된 내용들이나 링크로 연결되거나 referer URL과 같은 항목을 통해 얻어지는 이전 검색결과의 키워드를 이용할 수 있다.The illustrated advertisement target content includes a main body 50, which is the content of the content, a meta tag 51 including information of a document, a file name 52 for linking an image, a link or link address in the content, The linked content 53 and a search keyword 54 of a referer URL for searching or linking the content to be advertised, and each of the portions supplements the body 50 of the content. In this case, the keyword of a previous search result obtained through an item such as a referer URL or a link to contents or a link included in a content source such as a meta tag or a file name constituting the content can be used.

이때, 상기 키워드를 획득하는 방식은 형태소 분석에 기반한 명사 키워드 추출 방식을 이용할 수 있다. 상기 컨텐츠 소스 내의 파일명, 속성들(attribute)에서도 이러한 방식으로 명사 키워드를 추출할 수 있으나, 의미 없는 영숫자나 파일명은 배제시킨다.In this case, the method of obtaining the keyword may use a noun keyword extraction method based on morphological analysis. File names and attributes in the content source can also extract noun keywords in this manner, but exclude meaningless alphanumeric or file names.

따라서, 상기와 같이 콘텐츠의 영역을 확장하게 되면, '포장', '해외이사', '포장이사' 등과 같이 실제 콘텐츠와 관련성이 높은 키워드들이 중복되어 검출될 가능성이 대폭 증가하게 된다.Therefore, when the content area is expanded as described above, the possibility of overlapping the keywords related to the actual content such as 'packaging', 'overseas director', 'packaging director' and the like is greatly increased.

도 6은 본 발명 일 실시예의 수행을 위한 간략한 구성을 보인 블록도로서, 복수의 데이터베이스들을 이용하여 전술한 과정을 수행하도록 한 경우이다.6 is a block diagram showing a simple configuration for performing an embodiment of the present invention, in which the above-described process is performed using a plurality of databases.

먼저, 광고용으로 사용되는 자질어를 포함하는 광고용 키워드 사전 데이터베이스(180)와, 수주된 광고 및 광고 키워드를 포함하는 광고 관련 정보가 저장되는 데이터베이스(190), 그리고, 각 광고의 수주시 결정되는 조건들에 의해 각 광고에 대한 집행 정책이 저장되는 광고별 캠페인 정보 데이터베이스(200)가 구성되며, 상기 광고 및 광고 키워드 데이터베이스(190)와 상기 광고별 캠페인 정보 데이터베이 스(200)는 사용자 입력부(210)를 통해 광고 및 광고와 관련된 각종 정보들을 자동 혹은 수동으로 입력받을 수 있다. First, the keyword dictionary database 180 for advertisements including the qualitative language used for the advertisement, the database 190 for storing the received advertisement and advertisement-related information including the advertisement keyword, and the conditions determined at the time of receiving each advertisement The advertisement information campaign information database 200, which stores the execution policy for each advertisement, is configured, and the advertisement and advertisement keyword database 190 and the advertisement information campaign information database 200 are user input units 210. ) Can automatically or manually receive the advertisement and various information related to the advertisement.

여기서, 상기 광고용 키워드 사전 데이터베이스(180)는 광고용으로 자주 사용되는 키워드들(자질어)을 저장하여 해당 키워드들이 발견될 경우 가중치를 주기 위한 용도로 사용될 수 있고, 일반적으로 연상되는 키워드들(예를 들어, 파리라는 키워드가 있는 경우 프랑스라는 키워드)을 추가로 제공하여 컨텐츠에 없더라도 해당 키워드를 추가시키도록 하기 위한 용도로 사용될 수 있으며, 음소가 상이한 유사 키워드(예를 들어, 컨텐츠라는 키워드에 대해서 콘텐츠, contents, content, 컨텐트, 콘텐트라는 유사한 키워드들)를 제공하기 위한 용도로 사용될 수 있다. 해당 광고용 키워드 사전 데이터베이스(180)는 고정된 사전 정보만 사용될 수도 있고, 반복적인 키워드 추출 과정을 학습하는 것으로 가중치를 변경하거나, 새로운 단어를 추가하는 작업이 자동적으로 이루어지도록 구성(미도시)할 수도 있다.Here, the keyword dictionary database 180 for advertising stores keywords (qualifiers) that are frequently used for advertising, and may be used for weighting when the keywords are found. For example, if there is a keyword Paris, it can be used to add an additional keyword even if it is not present in the content. , contents, content, content, and similar keywords such as content). The keyword dictionary database 180 for the advertisement may be configured to use only fixed dictionary information or to automatically change the weight or add a new word by learning a repeated keyword extraction process. have.

상기 광고 및 광고용 키워드 데이터베이스(190)는 광고의 컨텐츠 자체나 광고가 위치하는 주소 정보 및 해당 광고를 수주하면서 광고주가 제공하거나 관리자가 추천하는 대응 키워드들에 대한 정보는 물론이고, 해당 광고에 대한 광고주의 표적화 정보를 선택적으로 더 포함할 수도 있다. 즉, 키워드 매칭 과정을 수행할 경우 단순히 키워드들만을 이용하는 것이 아니라, 해당 키워드들의 대응 관계와 함께 해당 광고의 선택 여부를 결정할 수 있는 부가적인 정보들의 대응 여부도 판단할 수 있는 근거를 제공하는 것으로, 예를 들어 지역 정보, 시간 정보, 제공 시간대 정보, 날씨 정보, 광고의 개시일 및 종료일 정보 등이 추가로 저장될 수 있다.The keyword database 190 for advertisements and advertisements includes information about the contents of the advertisement itself, address information where the advertisement is located, and corresponding keywords provided by the advertiser or recommended by the administrator while receiving the advertisement, as well as advertisers for the advertisement. May optionally further include targeting information for. That is, when performing the keyword matching process, not only the keywords are used but also the basis for determining whether the corresponding information of the corresponding keywords and the additional information for determining whether to select the corresponding advertisements are provided. For example, region information, time information, time zone information, weather information, start date and end date information of an advertisement may be further stored.

상기 광고별 캠페인 정보 데이터베이스(200)는 개별적인 광고의 집행 정책 및 이를 위한 정보들이 저장된다. 상기 광고의 집행 정책이란 광고를 노출시키기 위한 정보들일 수 있으며, 이는 광고주가 제공하는 표적화 정보를 포함한다. 예를 들어, 저녁 7시부터 10시까지는 해당 광고의 노출을 허용하지만 그 외의 시간은 허용하지 않는다는 정책을 광고의 노출에 반영할 수 있는 광고 노출 프로그램을 작성할 수 있으며, 이러한 단위 프로그램을 캠페인이라 한다. 그 외에, 상기 광고가 노출될 수 있는 최대 허용 횟수와 현재까지의 노출 횟수, 클릭된 횟수 등에 대한 정보도 포함될 수 있다. 이는 광고 수주시 광고주에게 캠페인 옵션등을 제공한 후 그 선택에 따라 자동적으로 캠페인 정보를 저장하는 방식으로 적용될 수 있다.The advertisement information database 200 for each advertisement stores an individual advertisement execution policy and information therefor. The execution policy of the advertisement may be information for exposing an advertisement, which includes targeting information provided by an advertiser. For example, you can write an ad exposure program that reflects the ad's exposure policy from 7 pm to 10 pm but not any other time, and this unit program is called a campaign. . In addition, information about the maximum allowable number of times that the advertisement may be exposed, the number of exposures so far, and the number of clicks may be included. This can be applied by providing campaign options to advertisers upon receiving an advertisement and automatically storing campaign information according to the selection.

상기 복수의 데이터베이스들(180~200)을 이용하여 광고 대상 컨텐츠에 적당한 광고를 광고 집행 정책에 맞추어 제공하도록 한 구성을 보면, 우선 상기 광고용 키워드 사전 데이터베이스(180)를 참조하여 광고 대상 컨텐츠로부터 적절한 복수의 키워드들을 추출하는 컨텐츠 키워드 추출부(110)와, 상기 추출된 키워드들을 상기 광고 및 광고 키워드 데이터베이스(190)에 저장된 광고 키워드들과 비교하여 적절한 광고들을 검색한 후 매칭 정도가 높은 상위 N개의 광고들만 선별하는 키워드 매칭부(120)와, 상기 선별된 광고들의 광고 키워드들 클러스터링 방식으로 군집화한 후 유사한 광고군들끼리 병합하여 M개의 그룹으로 집단화하는 광고 군집 처리부(130)와, 상기 M개의 그룹에 포함된 키워드들의 중복도와 상기 추출된 컨텐츠 키워드들의 포함 정도를 근거로 상기 광고 대상 컨텐츠와 가장 상관관계가 높다고 판단되는 광고 집단을 선택한 후 해당 집단에 포함된 키워드들을 광고 키워드로 설정 한 광고들의 목록을 획득하는 상관 관계 연산부(140)와, 상기 상관 관계 연산부(140)가 제공하는 광고 목록에 포함된 광고들 중에서 상기 광고별 캠페인 정보 데이터베이스(200)에 저장된 광고 집행 정책상 노출 가능한 광고들만을 선별하여 최종 광고 가능한 광고들의 목록을 얻는 광고 선택부(150)와, 상기 광고 가능한 광고들의 목록에 포함된 광고와 상기 광고 대상 컨텐츠가 함께 표시될 수 있도록 처리하는 광고 제공부(160)와, 상기 광고 제공부(160)가 제공하는 정보를 상기 광고 대상 컨텐츠를 요청한 일반 사용자에게 시각적으로 제공하는 표시부(170)로 이루어진다.Referring to the configuration in which the advertisement suitable for the advertisement target content is provided in accordance with an advertisement execution policy using the plurality of databases 180 to 200, first, a plurality of advertisements from the target advertisement contents are referred to by referring to the keyword dictionary database 180 for advertisement. The content keyword extraction unit 110 extracts the keywords of the keyword, and compares the extracted keywords with the advertisement keywords stored in the advertisement and advertisement keyword database 190 to search for appropriate advertisements, and then selects the top N advertisements having high matching degree. A keyword matching unit 120 that selects only a group, an advertisement cluster processing unit 130 that clusters advertisement keywords of the selected advertisements in a clustering manner, and then merges similar advertisement groups into M groups, and the M groups. Based on the degree of redundancy of the keywords included in the and the degree of inclusion of the extracted content keywords A correlation operator 140 for selecting a group of advertisements determined to have the highest correlation with the content to be advertised, and then obtaining a list of advertisements in which keywords included in the group are set as advertisement keywords, and the correlation calculator 140 The advertisement selection unit 150 that selects only the ads which can be exposed according to the advertisement execution policy stored in the advertisement information campaign information database 200 among the advertisements included in the advertisement list provided by the user, and obtains a list of the final advertisementable advertisements. The advertisement providing unit 160 processes the advertisement included in the list of advertisements that can be displayed and the advertisement target content to be displayed together, and the general user who requests the advertisement target contents for the information provided by the advertisement providing unit 160. It is made of a display unit 170 that provides a visual.

도 7은 본 발명 다른 실시예의 구성을 보인 블록도로서, 도시한 바와 같이 광고 대상 컨텐츠를 분석하여 적절한 광고를 선택하는 부분, 다양한 데이터베이스들로 이루어진 데이터베이스부(400), 그리고 광고에 관련된 각종 정보들을 제공하는 부분으로 이루어진다.FIG. 7 is a block diagram illustrating a configuration of another embodiment of the present invention. As shown in FIG. 7, a part of selecting an appropriate advertisement by analyzing an advertisement target content, a database unit 400 formed of various databases, and various kinds of information related to the advertisement are illustrated in FIG. It is made up of parts to provide.

먼저, 데이터베이스부(400)의 구성을 보면, 앞서 도 6에서 설명한 광고용 키워드 사전 데이터베이스(410)와 광고 및 광고 키워드 데이터베이스(420), 광고별 캠페인 정보 데이터베이스(450) 외에 효과적인 광고 키워드의 선택 및 저장을 위해 광고 대상 컨텐츠로부터 얻어지는 키워드들을 저장하는 사용자 컨텐츠의 키워드 데이터베이스(430)와, 광고 키워드와 컨텐츠 키워드 매칭시 대중적인 광고 키워드가 선택될 수 있도록 하는 근거를 제공하기 위해 반복 학습을 통해 광고 키워드들의 가중치를 점수로 환산하여 저장하는 키워드 점수 데이터베이스(440)가 더 부가된다. 이 경우, 상기 광고용 키워드 사전 데이터베이스(410)는 광고 대상 컨텐츠에서 키워드를 추출하기 위해 사용됨과 아울러 광고 수주시 해당 광고의 키워드를 입력할 때도 추천 키워드를 제공하기 위해 입력된 키워드에 유사한 키워드들을 추천하기 위한 연관성 정보들이 더 포함될 수 있다.First, referring to the configuration of the database unit 400, in addition to the keyword dictionary database 410, the ad and ad keyword database 420, the campaign information database 450 for each advertisement described in FIG. The keyword database 430 of the user content storing keywords obtained from the content to be advertised for the purpose of advertising, and through the iterative learning to provide a basis for selecting a popular advertising keyword when matching the keyword and the content keyword The keyword score database 440 for converting and storing the weights into scores is further added. In this case, the keyword dictionary database 410 for advertisement is used to extract the keyword from the content to be advertised, and recommends similar keywords to the input keyword to provide a recommendation keyword even when the keyword of the corresponding advertisement is entered when the advertisement is received. Association information may be further included.

먼저, 광고를 수주한 경우 해당 광고 및 광고에 대한 각종 정보들(키워드 포함)을 상기 데이터베이스부(400)의 광고 및 광고 키워드 데이터베이스(420)에 저장하고, 저장한 광고 키워드에 대한 가중치를 학습 방식으로 결정하여 키워드 점수 데이터베이스(440)에 저장하는 구성을 살펴보도록 한다.First, in the case of receiving an advertisement, the advertisement and various information (including keywords) about the advertisement are stored in the advertisement and the advertisement keyword database 420 of the database unit 400, and the weighted value of the stored advertisement keyword is a learning method. Determine the configuration to look at the configuration stored in the keyword score database 440.

상기 광고 정보 입력 인터페이스(IF)부(300)는 직접적인 광고주, 시스템 관리자 등으로부터 제공된 키워드 및 광고 정보들을 수동 입력하는 인터페이스일 수 있고, 자동적으로 광고의 주소에 위치한 광고의 자체 컨텐츠를 클롤링(Crawling)하여 키워드를 추출하는 수단일 수도 있다. 상기 광고 자체의 컨텐츠로부터 키워드를 자동적으로 추출하는 방식은 광고 대상 컨텐츠로부터 키워드를 추출하는 방식을 적용할 수도 있다. 여기서는 광고 키워드 및 광고의 캠페인 정보를 입력하는 부분만 도시하였다.The advertisement information input interface (IF) unit 300 may be an interface for manually inputting keyword and advertisement information provided from a direct advertiser, a system administrator, or the like, and automatically crawls its own content of an advertisement located at an address of the advertisement. May be a means for extracting a keyword. The method of automatically extracting a keyword from the content of the advertisement itself may apply a method of extracting a keyword from the content to be advertised. Here, only a portion for inputting an advertisement keyword and campaign information of an advertisement is shown.

상기 광고 정보 정보 입력 IF부(300)를 통해 입력되는 광고의 키워드는 상기 데이터베이스부(400)의 광고용 키워드 사전 데이터베이스(410), 광고 및 광고 키워드 데이터베이스(420), 사용자 컨텐츠의 키워드 데이터베이스(430)를 참조하는 키워드 추천부(310)에 제공되며, 상기 키워드 추천부(310)는 상기 데이터베이스들(4010, 420, 430)을 검색 대상으로 하여 입력된 광고 키워드에 대한 추천 키워드 목록을 제공한다. The keyword of the advertisement input through the advertisement information input IF unit 300 may be a keyword dictionary database 410 for advertisement of the database unit 400, an advertisement and advertisement keyword database 420, and a keyword database 430 for user content. The keyword recommendation unit 310 is provided to refer to the keyword recommendation unit 310, and the keyword recommendation unit 310 provides a list of recommended keywords for the input advertisement keyword by using the databases 4010, 420, and 430 as a search target.

상기 추천 키워드 목록은 키워드 선택부(320)에 제공되며, 상기 키워드 선택부(320)는 해당 목록을 상기 광고 키워드를 입력한 사용자에게 제공하여 이들 중 적절한 것을 상기 광고 정보 입력 IF부(300)를 통해 선택할 수 있도록 한다. The recommended keyword list is provided to the keyword selector 320, and the keyword selector 320 provides the list to the user who inputs the advertisement keyword, and selects the appropriate one among the advertisement information input IF unit 300. To make a choice.

상기 키워드 선택부(320)를 통해 선택된 키워드는 상기 광고 및 광고 키워드 데이터베이스(420)에 특정 광고에 대해 설정된 키워드로 저장된다. 그리고, 데이터 기계 학습부(330)에도 제공된다. The keyword selected through the keyword selector 320 is stored as a keyword set for a specific advertisement in the advertisement and advertisement keyword database 420. The data machine learning unit 330 is also provided.

상기 데이터 기계 학습부(330)는 상기 키워드 선택부(320)를 통해 제공받은광고 관련 키워드를 상기 광고 및 광고 키워드 데이터베이스(420)의 광고 관련 키워드들을 이용하여 가중치를 계산한 후 상기 가중치 정보를 관련된 광고 정보들과 함께 상기 데이터베이스부(400)의 키워드 점수 데이터베이스(440)에 학습 결과로서 저장시킨다. 상기 데이터 기계 학습부(330)는 데이터베이스에 저장된 키워드들과 상기 입력된 키워드를 비교하여 해당 키워드의 중요도를 파악한 후 가중치를 점수로 환산하는 과정을 반복적으로 실시하는 것으로 높은 빈도로 저장된 동일 키워드에 높은 가중치를 부여함으로써, 이후 광고 대상 컨텐츠로부터 얻어진 키워드를 이용하여 상기 광고 및 광고 키워드 데이터베이스(420)를 검색하여 매칭되는 키워드를 가진 광고를 선별할 경우 상기 키워드 점수 데이터베이스(440)를 참조한 후 부가적인 가중치 정보를 더 활용할 수 있다.The data machine learning unit 330 calculates a weight of an advertisement related keyword provided through the keyword selection unit 320 using the advertisement related keywords of the advertisement and the advertisement keyword database 420, and then relates the weight information. The advertisement scores are stored in the keyword score database 440 of the database unit 400 as a learning result. The data machine learning unit 330 compares the keywords stored in the database with the input keywords to determine the importance of the keywords and then converts the weights into scores. By assigning a weight, the keyword obtained from the advertisement target content is then searched for the advertisement and the keyword keyword database 420 to select an advertisement having a matched keyword. More information is available.

상기 데이터 기계 학습부는 검색 문서의 범주화 학습 알고리즘으로 사용되는 나이브 베이즈(Naive Bayes), knn (k-nearest neighbor), svm(support vector machine), 의사결정 트리(decision tree), 신경망 (neural network), 다중회귀 모 형 (lssf), 백터간 유사 기법 중 하나 이상을 이용할 수 있다.The data machine learning unit includes naive bayes, k-nearest neighbors, support vector machines, decision trees, and neural networks used as a categorization learning algorithm for search documents. , Multiple regression models (lssf) and similar techniques between vectors can be used.

도 8은 상기 키워드 추천부(310)에 대한 보다 상세한 구성을 보인 것으로, 도시한 바와 같이 사용자가 입력한 키워드, 즉 광고 정보 입력 IF부(300)를 통해 제공되는 키워드를 해당 키워드를 포함하는 모든 키워드들(예를 들어, '파리'를 입력한 경우 '파리대왕', '초파리', '왕파리' 등과 같은 키워드들)을 상기 데이터베이스부(400)(특히, 광고 및 광고 키워드 데이터베이스(420), 사용자 컨텐츠의 키워드 데이터베이스(430), 광고용 키워드 사전 데이터베이스(410))를 모두 검색하여 그 결과를 출력하는 문자열 검색부(312)와, 상기 광고 및 광고 키워드 데이터베이스(420)와 사용자 컨텐츠의 키워드 데이터베이스(430)를 참조하여 음소 단위로 분리한 입력 키워드와 유사한 키워드들(예를 들어 '네트워크' 입력시 '네트웍', '네트웍스' 등)을 검색한 후 그 결과를 출력하는 유사 문자열 검색부(311)와, 상기 광고용 키워드 사전 데이터베이스(410)에 저장된 관련 키워드들을 이용하여 입력된 키워드와 관련된 키워드들(예를 들어, '파리' 입력시 '프랑스', '에펠탑' 등)을 검색한 후 그 결과를 출력하는 유사 키워드 검색부(313)가 구성되어 있다. 만일, 상기 입력된 키워드가 복수인 경우 상기 키워드들 간에 유사성이 있는 것으로 판단하여 이들을 상기 광고용 키워드 사전 데이터베이스(410)에 유사성을 가진 키워드들로 등록할 수도 있다.FIG. 8 illustrates a more detailed configuration of the keyword recommendation unit 310. As shown in FIG. 8, all of the keywords including the keyword provided through the advertisement information input IF unit 300 are included. Keywords (for example, 'Paris the Great', 'Drosophila', 'King'fly', etc.) are entered into the database unit 400 (especially, the advertisement and advertisement keyword database 420). A string search unit 312 which searches all of the keyword database 430 of the user content and the keyword dictionary database 410 for advertisements and outputs the result, and the keyword database of the advertisement and advertisement keyword database 420 and the user content ( 430) to search for keywords similar to the input keywords separated by phonemes (for example, 'network', 'networks', etc. when the 'network' is input, and output the result. Keywords related to a keyword input using the similar string search unit 311 and related keywords stored in the keyword dictionary database 410 for the advertisement (for example, 'France', 'Eiffel tower', etc., when the user inputs 'Paris'). ), A similar keyword search unit 313 is configured to output the result. If there are a plurality of input keywords, it may be determined that there is a similarity between the keywords, and they may be registered as keywords having similarities in the keyword dictionary database 410 for advertisement.

상기 유사 문자열 검색부(311)는 입력받은 키워드를 음소 단위로 분리시킨 후 TST(Ternary Search Tree)를 구현하고, 이를 근접 이웃(NearNeighbor) 알고리즘을 적용하여 데이터베이스부(400)로부터 유사한 음소를 가진 단어를 검색하도록 구 현될 수 있다.The similar string search unit 311 separates the input keyword into phoneme units, implements a TST (Ternary Search Tree), and applies the nearest neighbor algorithm to the word having similar phonemes from the database unit 400. It can be implemented to search for.

상기 각 검색부들(311, 312, 313)에서 검색된 내용은 유사 키워드 추천부(315)에서 취합하여 목록으로 출력하며, 상기 목록은 단순 나열이나, 키워드의 가중치에 따른 나열 등으로 정리될 수 있다.The contents searched by the searchers 311, 312, and 313 are collected by the similar keyword recommendation unit 315 and output as a list. The list may be arranged by simple listing or listing by keyword weight.

이제, 다시 도 7에 도시된 광고 대상 컨텐츠에 대응되는 광고를 검색하는 구성부들에 대해 설명하도록 한다. Now, the components for searching for an advertisement corresponding to the advertisement target content shown in FIG. 7 will be described.

먼저, 광고 대상 컨텐츠의 관련 정보들(컨텐츠의 소스, 링크된 컨텐츠들, 해당 컨텐츠를 검색하는데 사용한 키워드들)을 제공하는 컨텐츠 입력부(500)와, 상기 컨텐츠 입력부(500)로부터 얻은 컨텐츠 관련 정보들을 상기 광고용 키워드 사전 데이터베이스(410)를 참조하여 분석하는 것으로 높은 상관성을 가지는 키워드들을 추출하여 목록으로 출력함과 아울러 이 정보를 상기 사용자 컨텐츠의 키워드 데이터베이스(430)에 저장하는 컨텐츠 키워드 추출부(510)와, 상기 컨텐츠 키워드 추출부(510)로부터 얻은 키워드 목록의 키워드들에 대한 가중치를 상기 키워드 점수 데이터베이스(440)로부터 획득한 후 이를 고려하여 상기 광고 및 광고 키워드 데이터베이스(420)를 검색하는 것으로 매칭되는 광고들을 선별한 다음 이들 중 상위 일부 광고들을 목록으로 출력하는 키워드 매칭부(520)와, 상기 키워드 매칭부(520)가 제공하는 광고 목록들을 클러스터링하여 군집화하고 이를 유사 군집들끼리 병합하여 그룹화하는 광고 군집 처리부(530)와, 상기 광고 군집 처리부(530)의 각 그룹들과 상기 광고 대상 컨텐츠의 상관관계를 연산하여 상기 상관관계가 높은 그룹을 선택하는 상관관계 연산부(540)와, 상기 선택된 그룹의 광고들 중에서 광고 집행 정책 상 노출시킬 수 없는 광고들을 상기 광고별 캠페인 정보 데이터베이스(450)를 이용하여 필터링한 광고 목록을 제공하는 광고 선택부(550)와, 상기 광고 선택부(550)가 제공하는 광고 목록을 상기 광고 대상 컨텐츠와 함께 제공하는 광고 제공부(560)로 이루어진다. First, a content input unit 500 that provides related information (source of content, linked contents, keywords used to search for the corresponding content) of the content to be advertised, and content related information obtained from the content input unit 500 are provided. The content keyword extracting unit 510 extracts and outputs keywords having high correlation as a list by analyzing the keyword dictionary database 410 for advertisement and stores the information in the keyword database 430 of the user content. And searching for the advertisement and the advertisement keyword database 420 by acquiring the weights of the keywords in the keyword list obtained from the content keyword extracting unit 510 from the keyword score database 440 and taking them into consideration. Select ads and print some of them in a list The keyword matching unit 520, the advertisement cluster processing unit 530 for clustering and clustering the advertisement lists provided by the keyword matching unit 520 and merging similar clusters into groups, and the advertisement cluster processing unit 530. A correlation calculating unit 540 which calculates a correlation between the respective groups and the content to be advertised, and selects a group having a high correlation with the advertisement; An advertisement selection unit 550 that provides a list of advertisements filtered using the campaign information database 450 for each campaign, and an advertisement providing unit that provides the advertisement list provided by the advertisement selection unit 550 together with the advertisement target content ( 560).

상기 키워드 매칭부(520), 광고 군집 처리부(530) 및 상관관계 연산부(540)는 크게 매칭부로 간주될 수 있으며, 상기 키워드 점수 데이터베이스(440)를 가중치 방식으로 참조하여 1차 매칭 과정을 수행한다는 구체적 구성 외에는 도 3내지 도 5를 통해 설명한 방식과 유사하게 동작하므로 그 구체적인 설명은 생략하도록 한다. The keyword matching unit 520, the advertisement cluster processing unit 530, and the correlation calculating unit 540 may be regarded as matching units, and perform the first matching process by referring to the keyword score database 440 in a weighted manner. Except for the specific configuration, since the operation is similar to that described with reference to FIGS. 3 to 5, the detailed description thereof will be omitted.

도 9는 블로그와 같이 최근 급속히 컨텐츠의 수가 증가하는 광고 대상 컨텐츠를 분석하기 위한 컨텐츠 키워드 추출부의 다른 구성예를 보인 것으로, 이러한 종류의 컨텐츠 데이터(본문, 제목, 태그로 구성됨)가 입력될 경우 상기 컨텐츠 키워드 추출부는 해당 컨텐츠 데이터에서 키워드를 추출하는 키워드 추출부(510)와, 상기 키워드에서 명사를 추출하는 명사 추출부(512)로 이루어지며, 상기 명사 추출부(512)에서 얻어지는 키워드들은 상기 사용자 컨텐츠의 키워드 데이터베이스(430)에 저장되고, 후속되는 광고 검색을 위해 키워드 매칭부(520)에도 제공된다. 여기서, 상기 키워드 추출부(510)는 XML이나 HTML로 이루어진 컨텐츠로부터 태그를 추출하고, 해당 태그들의 출현 빈도를 파악하여 그 출현 빈도가 일정한 값(예를 들어 상위 20%) 이상인 태그들만 선별하여 상기 명사 추출부(512)에 제공하도록 구성될 수 있으며, 상기 명사 추출부(512)는 상기 수신한 태그들 중에서 명사가 아닌 태그 를 제외한 태그를 키워드 목록으로 출력하도록 구성될 수 있다.FIG. 9 illustrates another configuration example of a content keyword extraction unit for analyzing an advertisement target content in which a recent increase in the number of contents such as a blog is performed. When this kind of content data (consisting of a text, a title, and a tag) is input, FIG. The content keyword extracting unit comprises a keyword extracting unit 510 for extracting a keyword from the corresponding content data, and a noun extracting unit 512 for extracting nouns from the keyword, and the keywords obtained by the noun extracting unit 512 are the user. The content is stored in the keyword database 430 and provided to the keyword matching unit 520 for subsequent advertisement search. Here, the keyword extracting unit 510 extracts a tag from content consisting of XML or HTML, grasps the frequency of occurrence of the corresponding tags, and selects only the tags whose frequency of occurrence is equal to or greater than a predetermined value (for example, the top 20%). The noun extracting unit 512 may be configured to provide the noun extracting unit 512. The noun extracting unit 512 may be configured to output a tag except for a tag that is not a noun among the received tags as a keyword list.

상기 전술한 광고 관련 정보 입력 방식과, 광고 대상 컨텐츠로부터 키워드들을 추출하는 방식 및 상기 추출된 키워드들을 이용하여 기 저장된 상기 광고 관련 정보들로부터 효과적으로 적절히 대응되는 광고들을 선별하는 방식을 다양한 수준으로 제공할 수 있으며, 이러한 과정이 검색을 반복하면서 점차 일반적인 컨텐츠에 대한 광고 적중도가 높아질 수 있도록 학습 될 수 있도록 하여 다양한 광고 대상 컨텐츠에 대해서 적절한 광고가 선별 제공될 수 있게 된다.The above-described advertisement related information input method, a method of extracting keywords from advertisement target content, and a method of effectively and appropriately selecting corresponding advertisements from the previously stored advertisement related information using the extracted keywords may be provided at various levels. In addition, such a process can be learned to repeat the search to gradually increase the advertisement hit rate for the general content can be appropriately provided for the various advertisement target content.

이상에서 상술한 바와 같이, 본 발명의 실시예에 따른 온라인 문맥기반 광고 장치 및 방법은 광고 대상 컨텐츠에서 키워드를 추출한 후 이를 근거로 수주된 광고의 키워드를 검색하여 복수의 광고들을 추출하고, 상기 광고들의 키워드들을 군집화한 다음 상기 군집들과 상기 광고 대상 컨텐츠의 상관 관계를 비교하여 가장 높은 상관 관계를 보이는 키워드 집단의 광고들을 선택함으로써, 고속 매칭 방식으로 후보 광고군을 얻고, 이렇게 얻은 제한된 수의 후보 광고군에 대해서만 선택과 연산이 필요한 후속 클러스터링과 상관 관계 연산을 실시하게 되어 처리 속도가 높아지며, 이러한 중복 필터링을 통해 효과적으로 최적 광고들을 선택할 수 있는 효과가 있다.As described above, in the online context-based advertising apparatus and method according to an embodiment of the present invention, after extracting a keyword from an advertisement target content, searching for a keyword of an ad received based on the extracted keyword, and extracting a plurality of advertisements. Grouping the keywords of the group and then comparing the correlation between the clusters and the content to be advertised, and selecting the keyword of the keyword group having the highest correlation, thereby obtaining a candidate ad group by fast matching method, and thus obtaining a limited number of candidates. Subsequent clustering and correlation operations that require selection and calculation are performed only for the ad group, thereby increasing processing speed, and through such overlapping filtering, an effective advertisement can be selected effectively.

본 발명의 실시예에 따른 온라인 문맥기반 광고 장치 및 방법은 광고 대상 컨텐츠에서 키워드를 추출함에 있어 컨텐츠를 구성하는 다양한 정보는 물론이고 상기 컨텐츠와 링크된 컨텐츠 및 상기 컨텐츠를 검색하면서 사용한 키워드도 상기 키 워드 추출 대상이 포함시키도록 함으로써, 키워드 검색 대상을 확장하여 보다 정확한 수준의 키워드 추출이 가능하도록 하며, 이를 통해 적절한 광고를 선택할 수 있는 확률을 비약적으로 높일 수 있는 효과가 있다.In the online context-based advertising apparatus and method according to an embodiment of the present invention, in extracting a keyword from an advertisement target content, as well as various information constituting the content, the content linked to the content and the keyword used while searching the content are the key. By including the word extraction target, it is possible to expand the keyword search target to enable a more accurate level of keyword extraction, thereby significantly increasing the probability of selecting an appropriate advertisement.

본 발명의 실시예에 따른 온라인 문맥기반 광고 장치 및 방법은 광고를 수주하면서 해당 광고가 목적으로 하는 키워드를 입력할 경우 이를 음소 단위로 분리하여 유사한 음소를 가지는 유사 단어를 광고용 키워드 사전과 기존 광고들의 키워드들 및 광고 대상 컨텐츠로부터 추출한 키워드 목록들을 이용하여 유사 키워드로 추천하도록 하고, 상기 추천된 키워드들 중에서 적절한 키워드들을 선택하도록 함으로써, 광고에 대한 키워드를 효과적으로 지정하여 광고의 정확한 노출을 유도할 수 있는 효과가 있다.Online context-based advertising device and method according to an embodiment of the present invention, when receiving an advertisement, and inputs a keyword for the purpose of the advertisement, it is divided into phoneme units and similar words having similar phonemes for the keyword dictionary for advertisement and the existing ads. By using keyword lists extracted from the keywords and the content to be advertised, the keyword is recommended as a similar keyword, and by selecting appropriate keywords among the recommended keywords, the keyword for the advertisement can be effectively designated to induce accurate exposure of the advertisement. It works.

본 발명의 실시예에 따른 온라인 문맥기반 광고 장치 및 방법은 수주한 광고에 대한 키워드를 광고 및 광고에 관련된 키워드를 저장하는 데이터베이스를 이용하는 데이터 기계 학습기를 통해 파악하여 가중치 점수 데이터를 생성한 후 이를 키워드 점수 데이터베이스에 저장하고, 상기 키워드 점수 데이터베이스에 저장된 키워드별 가중키를 고려하면서 광고 대상 컨텐츠로부터 추출된 키워드들과 광고의 매칭 여부를 판단하도록 함으로써, 반복 학습으로 인해 선택될 가능성이 더 높은 광고가 우선 선택되도록 하여 정확한 광고 후보군을 얻을 수 있는 효과가 있다.Online context-based advertising device and method according to an embodiment of the present invention to generate the weighted score data by grasping the keyword for the received ad through a data machine learner using a database that stores the keyword related to the advertisement and the advertisement By storing in the score database and determining the matching of the keywords extracted from the content to be advertised while considering the weighted key for each keyword stored in the keyword score database, ads that are more likely to be selected due to repetitive learning have priority. It is effective to obtain the correct advertisement candidate group by being selected.

Claims (36)

광고 대상 컨텐츠로부터 키워드를 획득하고, 광고 키워드가 설정된 광고와 분류 방식으로 매칭시켜 복수의 광고들을 선택하는 제 1매칭부와; A first matching unit which obtains a keyword from the advertisement target content, selects a plurality of advertisements by matching the advertisement keyword with the set advertisement in a classification manner; 상기 제 1매칭부가 제공하는 광고들의 키워드들을 클러스터링하여 군집화하는 제 2매칭부와; A second matching unit for clustering and clustering keywords of advertisements provided by the first matching unit; 상기 제 2매칭부를 통해 얻은 집단들 중 상기 광고 대상 컨텐츠와 상관 관계가 높은 집단을 선택하여 해당 집단의 광고를 선택하는 제 3매칭부를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.And a third matching unit which selects a group having a high correlation with the advertisement target content among the groups obtained through the second matching unit and selects an advertisement of the corresponding group. 제 1항에 있어서, 상기 제 1매칭부는 The method of claim 1, wherein the first matching portion 광고용 자질어가 저장된 광고용 키워드 사전 데이터베이스와; A keyword dictionary database for advertisements in which the ad qualities are stored; 수주된 광고와 광고 키워드가 저장된 데이터베이스와; A database storing received advertisements and advertisement keywords; 상기 광고용 키워드 사전 데이터베이스에 저장된 자질어를 이용하여 광고 대상 컨텐츠로부터 키워드들을 추출하는 컨텐츠 키워드 추출부와; A content keyword extracting unit extracting keywords from advertisement target content using the qualitative words stored in the keyword dictionary database for advertisement; 상기 수주된 광고와 광고 키워드가 저장된 데이터베이스를 검색하여 상기 컨텐츠 키워드 추출부가 추출한 키워드들과 매칭되는 광고들을 선별하는 키워드 매칭부를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.And a keyword matching unit searching the database storing the received advertisements and the advertisement keywords and selecting advertisements matching the keywords extracted by the content keyword extracting unit. 제 1항에 있어서, 상기 제 1매칭부는 The method of claim 1, wherein the first matching portion 상기 광고 대상 컨텐츠의 내용과 함께, 컨텐츠 내의 메타 태그, 이미지 링크의 파일명, 링크된 내용, 상기 광고 대상 컨텐츠를 제공한 이전 검색 위치(referer URL)의 검색 키워드 중 적어도 하나 이상에 대해 키워드 획득을 실시하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.Along with the content of the advertisement target content, keyword acquisition is performed on at least one of a meta tag in the content, a file name of an image link, a linked content, and a search keyword of a previous searcher URL that provided the advertisement target content. Online context-based advertising device, characterized in that. 제 3항에 있어서, 상기 키워드 획득은 형태소 분석에 의한 명사 획득이며, 그 출현 빈도가 기 설정된 기준 이상인 키워드들 만을 선별하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The online context-based advertising device according to claim 3, wherein the keyword acquisition is a noun acquisition by morphological analysis, and only the keywords whose appearance frequency is higher than or equal to a predetermined criterion are selected. 제 1항에 있어서, 상기 제 2매칭부는 상기 광고들의 키워드들을 이용하여 군집화를 실시하고, 상기 키워드 군집들 간의 상관 관계를 이용하여 유사 군집들을 병합하는 광고 군집 처리부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The online matching method of claim 1, wherein the second matching unit further comprises an advertisement cluster processing unit for performing clustering using keywords of the advertisements and merging similar clusters using correlations between the keyword clusters. Contextual advertising device. 제 1항에 있어서, 상기 제 3매칭부는 상기 집단들에 속한 키워드들이 상기 광고 대상 컨텐츠로부터 추출한 키워드와 얼마나 일치하는지를 비교하며, 상기 집단들에 속한 키워드들의 중복도를 가중치로 고려하는 것으로 상기 집단들과 상기 광고 대상 컨텐츠의 상관 관계를 비교하여 가장 상관관계가 높은 집단을 선택하는 상관관계 연산부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The grouping apparatus of claim 1, wherein the third matching unit compares how the keywords belonging to the groups match the keywords extracted from the advertisement target content, and considers the degree of redundancy of the keywords belonging to the groups as a weight. And a correlation calculator for comparing a correlation between the advertisement target content and a group having the highest correlation. 제 1항에 있어서, 상기 각 광고의 집행 정책을 저장하는 캠페인 데이터베이스와; 2. The system of claim 1, further comprising: a campaign database for storing the execution policy of each advertisement; 상기 제 3매칭부에서 선택된 광고들 중에서 상기 캠페인 데이터베이스에 저장된 광고 집행 정책에 따라 노출 가능한 광고만 선택하는 광고 선택부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.And an advertisement selection unit for selecting only advertisements that can be exposed according to an advertisement execution policy stored in the campaign database among advertisements selected by the third matching unit. 광고 및 키워드에 관련된 정보들을 종류별로 저장하는 데이터베이스부와; A database unit for storing information related to advertisements and keywords for each type; 상기 데이터베이스부에 키워드 관련 정보를 제공하는 키워드 선택부와; A keyword selecting unit which provides keyword related information to the database unit; 광고 대상 컨텐츠로부터 획득한 키워드와 상기 데이터베이스부의 광고 관련 정보를 이용하여 적어도 분류(classifing) 방식과 클러스터링(clustering) 방식을 한번 이상씩 반복 실시하여 상기 방식들에 의해 동일 집단으로 선별 및 구분된 광고들 중 상기 광고 대상 컨텐츠와의 상관 관계가 가장 높은 집단을 선택하여 해당 집단에 포함된 광고 목록을 획득하는 매칭부를 포함하는 것을 특징으로 하는 온라 인 문맥기반 광고 장치.Ads classified and classified into the same group by the above methods by repeatedly performing at least a classifing method and a clustering method by using keywords acquired from the target content and advertisement-related information of the database unit at least once. And a matching unit which selects a group having the highest correlation with the advertisement target content and obtains a list of advertisements included in the corresponding group. 제 8항에 있어서, 상기 데이터베이스부는 광고에 대한 집행 방식 및 그와 관련된 정보를 저장하는 캠페인 정보 데이터베이스를 더 포함하며, The method of claim 8, wherein the database unit further comprises a campaign information database for storing the manner of execution and information associated with the advertisement, 상기 매칭부를 통해 획득한 광고 목록에 포함된 광고의 노출 여부를 상기 캠페인 정보 데이터베이스의 관련 정보를 근거로 결정하여 노출 가능한 광고들에 대한 정보만을 선별 제공하는 선택부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The online context may further include a selection unit configured to determine whether the advertisement included in the advertisement list acquired through the matching unit is exposed based on the related information of the campaign information database, and to provide only the information on the advertisements that can be exposed. Based advertising device. 제 8항에 있어서, 상기 매칭부는 상기 광고 대상 컨텐츠로부터 획득한 키워드에 일치되는 광고들을 분류 방식으로 분류한 후 이들 중 일치도가 높은 소정 광고들만 선택하고, 상기 선택된 광고들의 광고 키워드들을 클러스터링 방식으로 군집화한 다음 다시 상기 군집화된 광고 집단들 중 상기 광고 대상 컨텐츠와 상관관계가 가장 높은 광고 집단을 선택하여 해당 집단에 포함된 광고들의 목록을 획득하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The method of claim 8, wherein the matching unit classifies advertisements matching the keywords obtained from the advertisement target content by a classification method, selects only predetermined advertisements having high matching among them, and clusters the advertisement keywords of the selected advertisements in a clustering manner. And then selecting an advertisement group having the highest correlation with the target content among the clustered advertisement groups to obtain a list of advertisements included in the group. 제 8항에 있어서, 상기 매칭부는 상기 광고 대상 컨텐츠로부터 키워드를 추 출하여 소정 조건 이상의 빈도를 가지는 키워드들만 선별하는 컨텐츠 키워드 추출부와; The apparatus of claim 8, wherein the matching unit comprises: a content keyword extracting unit extracting a keyword from the advertisement target content and selecting only keywords having a frequency greater than or equal to a predetermined condition; 상기 컨텐츠 키워드 추출부가 제공하는 키워드들과 상기 데이터베이스부에 포함된 광고 및 해당 광고에 대한 키워드들을 비교하여 일치하는 광고들 중 일치 정도가 높은 상위 N개의 광고들을 선별하는 키워드 매칭부와; A keyword matching unit for comparing the keywords provided by the content keyword extracting unit with the advertisements included in the database unit and the keywords for the corresponding advertisements to select the top N advertisements having a high degree of matching among the matching advertisements; 상기 매칭된 상위 N개의 광고들을 키워드에 따라 클러스터링하여 군집화하고 이들을 상관 관계에 따라 M개로 병합하는 광고 군집 처리부와; An advertisement cluster processing unit which clusters the matched top N advertisements according to keywords and merges them into M according to a correlation; 상기 광고 군집 처리부에서 병합한 광고 집단들 중 상기 광고 대상 컨텐츠와 상관관계가 가장 높은 집단을 선택하여 해당 집단의 광고들을 선택하는 상관관계 연산부를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.And a correlation calculator configured to select a group having the highest correlation with the advertisement target content among the advertisement groups merged by the advertisement cluster processor and to select advertisements of the corresponding group. 제 11항에 있어서, 상기 컨텐츠 키워드 추출부는 상기 데이터베이스에 포함된 광고용 키워드에 대한 자질어를 더 이용하여 키워드를 추출하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The on-line context-based advertising device of claim 11, wherein the content keyword extractor extracts a keyword further using a feature word for an advertisement keyword included in the database. 제 11항에 있어서, 상기 컨텐츠 키워드 추출부는 상기 추출된 컨텐츠의 키워드를 상기 데이터베이스부에 제공하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The apparatus of claim 11, wherein the content keyword extractor provides the keyword of the extracted content to the database unit. 제 8항에 있어서, 상기 키워드 관련 정보를 제공하는 키워드 선택부는 The method of claim 8, wherein the keyword selection unit for providing the keyword related information 소정 광고에 관련된 키워드를 입력받아 상기 입력된 광고 관련 키워드의 문자열, 유사 문자열, 유사 키워드 중 적어도 한 종류 이상의 검색 방식을 이용하여 상기 데이터베이스를 검색한 후 그 결과 목록을 제공하는 키워드 추천부와; A keyword recommender which receives a keyword related to a predetermined advertisement, searches the database using at least one or more search methods among the inputted text related string, similar string, and similar keyword, and provides a result list; 상기 추천된 키워드 목록을 사용자에게 제공하고, 사용자의 입력에 따라 선택되는 키워드들을 상기 데이터베이스에 소정 광고에 대한 광고 키워드로 저장하는 키워드 선택부를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.And a keyword selector configured to provide the recommended keyword list to a user and store keywords selected according to a user's input as an advertisement keyword for a predetermined advertisement in the database. 제 8항에 있어서, 상기 키워드 관련 정보를 제공하는 키워드 선택부는 상기 광고의 자체 컨텐츠를 크롤링(crawling)하여 관련되는 키워드들을 추출하는 광고 키워드 추출부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The online context-based advertising device of claim 8, wherein the keyword selection unit providing the keyword related information further comprises an advertisement keyword extracting unit which extracts related keywords by crawling the contents of the advertisement. 제 8항에 있어서, 상기 키워드 관련 정보를 제공하는 키워드 선택부는 소정 광고에 관련된 키워드를 입력받아 상기 입력된 광고 관련 키워드를 상기 데이터베이스의 광고 관련 키워드들을 이용하여 가중치를 계산한 후 상기 정보를 관련된 광고 정보들과 함께 상기 데이터베이스에 학습 결과로서 저장시키는 기계학습부를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The method of claim 8, wherein the keyword selecting unit providing the keyword related information receives a keyword related to a predetermined advertisement, calculates a weighted value of the input advertisement related keyword using the advertisement related keywords in the database, and then returns the information related to the advertisement. And a machine learning unit storing information as a learning result in the database. 제 16항에 있어서, 상기 기계학습부는 나이브 베이즈(Naive Bayes), knn (k-nearest neighbor), svm(support vector machine), 의사결정 트리(decision tree), 신경망 (neural network), 다중회귀 모형 (lssf), 백터간 유사 기법 중 하나 이상을 이용하는 문서 범주화 학습 수단을 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The method of claim 16, wherein the machine learning unit is Naive Bayes (k-nearest neighbor), knn (k-nearest neighbor), svm (support vector machine), decision tree, neural network, multiple regression model (lssf), a document categorization learning means using one or more of the similar techniques between vectors. 제 16항에 있어서, 상기 매칭부는 상기 광고 대상 컨텐츠로부터 획득한 키워드와 상기 데이터베이스부의 광고 관련 정보 외에 상기 기계학습부를 통해 학습된 학습 결과를 상기 광고 대상 컨텐츠로부터 획득한 키워드에 따른 광고들을 선별 및 구분하는데 더 이용하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The method of claim 16, wherein the matching unit selects and distinguishes advertisements according to keywords acquired from the target content of the learning result learned through the machine learning unit, in addition to the keyword obtained from the target content and the advertisement related information of the database unit. Online contextual advertising device, characterized in that further use. 제 16항에 있어서, 상기 데이터베이스부는 상기 광고별 광고 키워드와 상기 기계학습 결과에 따른 키워드의 가중치를 점수로 저장하는 키워드 점수 데이터베이스를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 장치.The online context-based advertising device of claim 16, wherein the database unit further comprises a keyword score database that stores a score of the advertisement keyword for each advertisement and a keyword according to the machine learning result as a score. 광고 대상 컨텐츠로부터 하나 이상의 키워드를 획득하는 단계와; Obtaining one or more keywords from the advertisement target content; 상기 획득된 컨텐츠의 키워드와 일치되는 복수의 광고들을 해당 광고에 대해 기 설정된 광고 키워드를 통해 선택하는 단계와; Selecting a plurality of advertisements that match the keywords of the obtained content through a predetermined advertisement keyword for the corresponding advertisement; 상기 선택된 광고들의 키워드들을 클러스터링하여 군집화하고, 상기 군집들 중 유사한 것들을 병합하여 하나 이상의 집단을 형성하는 단계와; Clustering and clustering keywords of the selected advertisements and merging similar ones of the clusters to form one or more populations; 상기 집단들과 상기 광고 대상 컨텐츠에 대한 상관관계가 높은 집단부터 선택하여 해당 집단의 광고들을 선택하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.And selecting advertisements of a corresponding group by selecting a group having a high correlation with the groups and the target content of the advertisement. 제 20항에 있어서, 상기 광고 대상 컨텐츠로부터 하나 이상의 키워드를 획득하는 단계는, 형태소 분석에 의한 명사 획득이며, 그 출현 빈도가 기 설정된 기준 이상인 키워드들 만을 선별하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.21. The method of claim 20, wherein acquiring one or more keywords from the content to be advertised includes acquiring nouns by morphological analysis and selecting only keywords whose occurrence frequency is greater than or equal to a predetermined criterion. . 제 20항에 있어서, 상기 광고 대상 컨텐츠로부터 하나 이상의 키워드를 획득하는 단계는, 기 설정된 광고 키워드를 포함하는 자질어가 저장된 광고용 사전 데이터베이스를 참조하여 키워드를 추출하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.The method of claim 20, wherein the obtaining of the one or more keywords from the advertisement target content comprises extracting a keyword by referring to a dictionary database for advertisements in which a feature word including a predetermined advertisement keyword is stored. 제 20항에 있어서, 광고 대상 컨텐츠로부터 하나 이상의 키워드를 획득하는 단계는 상기 광고 대상 컨텐츠의 내용과 함께, 컨텐츠 내의 메타 태그, 이미지 링크의 파일명, 링크된 내용, 상기 광고 대상 컨텐츠를 제공한 이전 검색 위치(referer URL)의 검색 키워드 중 적어도 하나 이상에 대해 키워드 획득을 실시하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.21. The method of claim 20, wherein acquiring one or more keywords from the content to be advertised includes, together with the content of the content to be advertised, a meta tag in the content, a file name of an image link, a linked content, a previous search for providing the content to be advertised. A method for acquiring a keyword for at least one or more of the search keywords of a referrer URL. 제 20항에 있어서, 상기 집단들과 상기 광고 대상 컨텐츠와의 상관관계가 높은 집단부터 선택하는 단계는 상기 집단들에 속한 키워드들이 상기 광고 대상 컨텐츠로부터 추출한 키워드와 얼마나 일치하는지를 비교하며, 상기 집단들에 속한 키워드들의 중복도를 가중치로 고려하는 것으로 상기 집단들과 상기 광고 대상 컨텐츠와의 상관 정도를 획득하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.21. The method of claim 20, wherein the selecting from the group having a high correlation with the groups and the advertisement target content compares how the keywords belonging to the groups match the keywords extracted from the advertisement target content. And obtaining a degree of correlation between the groups and the content to be advertised by considering the degree of redundancy of keywords belonging to. 제 20항에 있어서, 상기 복수의 광고들에 대해 각 광고의 집행 정책을 결정하는 단계와; 21. The method of claim 20, further comprising: determining an enforcement policy of each advertisement for the plurality of advertisements; 상기 광고 대상 컨텐츠에 대한 상관관계가 높은 집단부터 선택하여 해당 집 단의 광고들을 선택한 후 상기 광고들에 대해 기 결정된 각 광고의 집행 정책에 따라 노출 가능한 광고들만 선별하여 상기 광고 대상 컨텐츠와 함께 제공하는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.Selecting the advertisements of the group by selecting a group having a high correlation with the advertisement target content, and then selecting only advertisements that can be exposed according to a predetermined execution policy of each advertisement for the advertisements and providing the advertisement contents together with the advertisement target content; The online context-based advertising method further comprising the step. 광고 및 해당 광고에 관련된 키워드를 수신하여 광고 관련 정보를 저장하는 데이터베이스부에 저장하는 단계와; Receiving an advertisement and keywords related to the advertisement and storing the advertisement and information related to the advertisement; 광고 대상 컨텐츠를 분석하여 키워드를 추출하는 단계와; Extracting keywords by analyzing advertisement target content; 상기 광고 대상 컨텐츠로부터 추출된 키워드와 상기 데이터베이스부의 광고 관련 정보를 이용하여 적어도 분류 방식과 클러스터링 방식을 한번 이상씩 반복 실시하여 동일 집단으로 선별 및 구분된 광고 집단들을 얻는 단계와; Repeating at least one classification scheme and a clustering scheme one or more times by using keywords extracted from the advertisement target content and advertisement related information of the database unit to obtain advertisement groups selected and classified into the same group; 상기 광고 집단들 중 상기 광고 대상 컨텐츠와의 상관 관계가 가장 높은 집단을 선택하여 해당 집단에 포함된 광고들 중에서 실제 적용할 광고의 목록을 선별하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.Selecting a group having the highest correlation with the target content among the advertisement groups, and selecting a list of advertisements to be actually applied among the advertisements included in the corresponding group. . 제 26항에 있어서, 상기 데이터베이스부에 각 광고의 집행 정책을 포함하는 캠페인 데이터베이스를 구축하는 단계와; 27. The method of claim 26, further comprising: constructing a campaign database including an execution policy of each advertisement in the database unit; 상기 실제 적용할 광고의 목록을 선별하는 단계를 수행한 후에 상기 선별된 광고의 목록에서 상기 데이터베이스부에 포함된 각 광고의 집행 정책에 따라 노출 가능한 광고들만 선별하여 상기 광고 대상 컨텐츠와 함께 제공하는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.After selecting the list of advertisements to be actually applied, selecting only the advertisements that can be exposed according to the execution policy of each advertisement included in the database unit from the selected list of advertisements and providing the selected advertisements together with the target content; Online context-based advertising method characterized in that it further comprises. 제 26항에 있어서, 상기 동일 집단으로 선별 및 구분된 광고 집단들을 얻는 단계는 27. The method of claim 26, wherein obtaining the selected and classified ad groups as the same group 상기 광고 대상 컨텐츠로부터 획득한 키워드에 일치되는 광고들을 분류한 후 이들 중 일치도가 높은 소정 광고들만 선택하는 단계와; Classifying advertisements matching the keywords obtained from the advertisement target content, and then selecting only predetermined advertisements having high matching among them; 상기 선택된 광고들의 광고 키워드들을 클러스터링 방식으로 군집화한 후 필요한 경우 이들을 상관 관계가 높은 것들끼리 병합하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.Clustering the advertising keywords of the selected advertisements in a clustering manner and merging them with highly correlated ones as necessary. 제 26항에 있어서, 상기 데이터베이스부에 광고용 키워드의 자질어를 포함하는 광고용 사전 데이터베이스를 구축하는 단계를 더 포함하며, 상기 광고 대상 컨텐츠를 분석하여 키워드를 추출하는 단계는 형태소 분석에 의한 명사들을 획득하고, 상기 데이터베이스에 구축된 광고용 키워드의 자질어 및 출현 빈도를 참조하여 상기 명사들 중에서 컨텐츠 키워드를 선별하는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.27. The method of claim 26, further comprising the step of constructing an advertising dictionary database including the qualitative words of the advertising keyword in the database unit, and extracting the keyword by analyzing the advertisement target content to obtain nouns by morphological analysis. And selecting a content keyword among the nouns by referring to the feature word and the frequency of appearance of the keyword for the advertisement built in the database. 제 26항에 있어서, 상기 광고 대상 컨텐츠를 분석하여 키워드를 추출하는 단계는 상기 광고 대상 컨텐츠의 내용과 함께, 컨텐츠 내의 메타 태그, 이미지 링크의 파일명, 링크된 내용, 상기 광고 대상 컨텐츠를 제공한 이전 검색 위치(referer URL)의 검색 키워드 중 적어도 하나 이상에 대해 키워드 획득을 실시하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.The method of claim 26, wherein the extracting a keyword by analyzing the content to be advertised includes, together with the content of the content to be advertised, a meta tag in the content, a file name of an image link, a linked content, and providing the content to be advertised. And acquiring a keyword for at least one or more of the search keywords of the referrer URL. 제 26항에 있어서, 상기 광고 집단들 중 상기 광고 대상 컨텐츠와의 상관 관계가 가장 높은 집단을 선택하는 단계는 상기 집단들에 속한 키워드들이 상기 광고 대상 컨텐츠로부터 추출한 키워드와 얼마나 일치하는지를 비교하며, 상기 집단들에 속한 키워드들의 중복도를 가중치로 고려하는 것으로 상기 집단들과 상기 광고 대상 컨텐츠와의 상관 도를 구해 가장 상관관계가 높은 집단을 선택 획득하는 단계를 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.The method of claim 26, wherein selecting a group having the highest correlation with the advertisement target content among the advertisement groups compares how the keywords belonging to the groups match the keywords extracted from the advertisement target content. Taking into account the degree of redundancy of the keywords belonging to the groups as a weight, and obtaining a correlation between the groups and the content to be advertised, and selecting and obtaining the most correlated group. Way. 제 26항에 있어서, 상기 광고 및 해당 광고에 관련된 키워드를 수신하여 광고 관련 정보를 저장하는 데이터베이스부에 저장하는 단계는 The method of claim 26, wherein the step of receiving the advertisement and keywords related to the advertisement and storing the advertisement related information in a database unit stores the advertisement related information. 소정 광고에 관련된 키워드를 입력받아 상기 입력된 광고 관련 키워드의 문자열, 유사 문자열, 유사 키워드 중 적어도 한 종류 이상의 검색 방식을 이용하여 상기 데이터베이스를 검색한 후 그 결과 목록을 제공하는 단계와; Receiving a keyword related to a predetermined advertisement, searching the database using at least one or more search methods among a string, a similar string, and a similar keyword of the input advertisement-related keyword and providing a result list; 상기 추천된 키워드 목록을 사용자에게 제공하고, 사용자의 입력에 따라 선택되는 키워드들을 상기 데이터베이스에 소정 광고에 대한 광고 키워드로 저장하는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.Providing the recommended keyword list to a user, and storing keywords selected according to a user's input as an advertisement keyword for a predetermined advertisement in the database. 제 26항에 있어서, 상기 광고 및 해당 광고에 관련된 키워드를 수신하여 광고 관련 정보를 저장하는 데이터베이스부에 저장하는 단계는 상기 광고의 자체 컨텐츠를 크롤링하여 관련되는 키워드들을 추출하여 이를 광고 키워드로 제공하는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.27. The method of claim 26, wherein the step of receiving the advertisement and the keyword related to the advertisement and storing the advertisement related information in a database unit stores crawling content of the advertisement to extract related keywords and provide the keyword as an advertisement keyword. The online context-based advertising method further comprising the step. 제 26항에 있어서, 상기 광고 및 해당 광고에 관련된 키워드를 수신하여 광고 관련 정보를 저장하는 데이터베이스부에 저장하는 단계는 소정 광고에 관련된 키워드를 입력받아 상기 입력된 광고 관련 키워드를 상기 데이터베이스에 저장된 광고 관련 키워드들을 이용하여 가중치를 계산한 후 상기 정보를 관련된 광고 정보들과 함께 상기 데이터베이스에 학습 결과로서 저장시키는 단계를 더 포함하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.27. The method of claim 26, wherein the receiving of the advertisement and the keyword related to the corresponding advertisement and storing the advertisement related information in a database unit comprises receiving a keyword related to a predetermined advertisement and storing the input advertisement related keyword in the database. And calculating the weight using relevant keywords and storing the information together with related advertisement information as a learning result in the database. 제 34항에 있어서, 상기 광고 관련 키워드에 대한 가중치는 나이브 베이즈, knn, svm, 의사결정 트리, 신경망, 다중회귀 모형, 백터간 유사 기법 중 하나 이상을 이용하는 문서 범주화 학습 방식을 통해 얻는 것을 특징으로 하는 온라인 문맥기반 광고 방법.35. The method of claim 34, wherein the weights for the keyword associated with the advertisement are obtained through a document categorization learning method using one or more of naive Bayes, knn, svm, decision trees, neural networks, multiple regression models, and similar vectors. Online context-based advertising method. 제 34항에 있어서, 상기 동일 집단으로 선별 및 구분된 광고 집단들을 얻는 단계는 상기 광고 대상 컨텐츠로부터 획득한 키워드와 상기 데이터베이스부의 광고 관련 정보 외에 상기 학습 결과로 저장된 키워드의 가중치를 상기 광고 대상 컨텐츠로부터 획득한 키워드에 대응되는 광고들을 선별 및 구분하는데 더 이용하는 것을 특징으로 하는 온라인 문맥기반 광고 방법.35. The method of claim 34, wherein the obtaining of the advertisement groups selected and divided into the same group comprises: weighting the keyword stored in the learning result in addition to the keyword obtained from the advertisement target content and the advertisement related information of the database unit from the advertisement target content. Online context-based advertising method characterized in that it is further used to select and classify ads corresponding to the acquired keywords.
KR1020060104547A 2006-10-26 2006-10-26 On line context aware advertising apparatus and method KR101355945B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060104547A KR101355945B1 (en) 2006-10-26 2006-10-26 On line context aware advertising apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060104547A KR101355945B1 (en) 2006-10-26 2006-10-26 On line context aware advertising apparatus and method

Publications (2)

Publication Number Publication Date
KR20080037413A true KR20080037413A (en) 2008-04-30
KR101355945B1 KR101355945B1 (en) 2014-01-27

Family

ID=39575413

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060104547A KR101355945B1 (en) 2006-10-26 2006-10-26 On line context aware advertising apparatus and method

Country Status (1)

Country Link
KR (1) KR101355945B1 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010024979A2 (en) * 2008-08-29 2010-03-04 Yahoo, Inc. Advertising system for internet discussion forums
KR101012169B1 (en) * 2008-10-23 2011-02-07 엔에이치엔비즈니스플랫폼 주식회사 Method and system for providing advertisement based on relation advertisement grouping
KR101296916B1 (en) * 2011-07-22 2013-08-14 주식회사 바닐라하우스텐 Commercial service method using search word and url
WO2014065466A1 (en) * 2012-10-26 2014-05-01 연세대학교 산학협력단 Online advertisement system and online advertisement method
KR20150124882A (en) * 2014-04-29 2015-11-06 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 Method and apparatus for providing information and method and apparatus for providing search result
GB2536504A (en) * 2015-03-20 2016-09-21 Henry Matthew Stuart-Smith James System for choosing data
KR20190129701A (en) * 2018-05-11 2019-11-20 김영태 The system and algorithm to provide with the matching information among users by using keyword's significance
KR102204712B1 (en) * 2020-08-20 2021-01-19 주식회사 플레이디 Method for providing and recommending main keywords by industrial classification and system therefor
KR20210104526A (en) * 2020-02-17 2021-08-25 주식회사 엘지유플러스 Mehtod and apparatus of outputting keywords of voice on demand(vod) contents

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101839724B1 (en) 2016-12-02 2018-03-16 전현주 A System Providing Advertisement Service Via URL Shortening

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010104873A (en) * 2000-05-16 2001-11-28 임갑철 System for internet site search service using a meta search engine
KR20020025142A (en) * 2002-03-04 2002-04-03 김일 A Keyword Recommend System and Method for Keyword Advertise Service
KR100671284B1 (en) * 2004-09-17 2007-01-18 주식회사 코난테크놀로지 Method and system for providing web site advertisement using content-based classification
WO2006083118A1 (en) * 2005-02-02 2006-08-10 Jung-Han Chae Keyword association advertisement system and method thereof

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010024979A2 (en) * 2008-08-29 2010-03-04 Yahoo, Inc. Advertising system for internet discussion forums
WO2010024979A3 (en) * 2008-08-29 2010-04-15 Yahoo, Inc. Advertising system for internet discussion forums
KR101012169B1 (en) * 2008-10-23 2011-02-07 엔에이치엔비즈니스플랫폼 주식회사 Method and system for providing advertisement based on relation advertisement grouping
KR101296916B1 (en) * 2011-07-22 2013-08-14 주식회사 바닐라하우스텐 Commercial service method using search word and url
WO2014065466A1 (en) * 2012-10-26 2014-05-01 연세대학교 산학협력단 Online advertisement system and online advertisement method
KR101499536B1 (en) * 2012-10-26 2015-03-11 연세대학교 산학협력단 System and method for online advertisement
KR20150124882A (en) * 2014-04-29 2015-11-06 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 Method and apparatus for providing information and method and apparatus for providing search result
GB2536504A (en) * 2015-03-20 2016-09-21 Henry Matthew Stuart-Smith James System for choosing data
KR20190129701A (en) * 2018-05-11 2019-11-20 김영태 The system and algorithm to provide with the matching information among users by using keyword's significance
KR20210104526A (en) * 2020-02-17 2021-08-25 주식회사 엘지유플러스 Mehtod and apparatus of outputting keywords of voice on demand(vod) contents
KR102204712B1 (en) * 2020-08-20 2021-01-19 주식회사 플레이디 Method for providing and recommending main keywords by industrial classification and system therefor

Also Published As

Publication number Publication date
KR101355945B1 (en) 2014-01-27

Similar Documents

Publication Publication Date Title
KR101355945B1 (en) On line context aware advertising apparatus and method
CN103678576B (en) The text retrieval system analyzed based on dynamic semantics
US9317613B2 (en) Large scale entity-specific resource classification
CN100485677C (en) Personalization of placed content ordering in search results
US8078601B1 (en) Determining unambiguous geographic references
US20050267872A1 (en) System and method for automated mapping of items to documents
US20070174255A1 (en) Analyzing content to determine context and serving relevant content based on the context
US20100235343A1 (en) Predicting Interestingness of Questions in Community Question Answering
US20140201180A1 (en) Intelligent Supplemental Search Engine Optimization
US20040049499A1 (en) Document retrieval system and question answering system
US8793252B2 (en) Systems and methods for contextual analysis and segmentation using dynamically-derived topics
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
JP2005302042A (en) Term suggestion for multi-sense query
US20150172299A1 (en) Indexing and retrieval of blogs
JP2008542951A (en) Relevance network
CN114238573B (en) Text countercheck sample-based information pushing method and device
US8121970B1 (en) Method for identifying primary product objects
Vargiu et al. Improving contextual advertising by adopting collaborative filtering
CN115905489B (en) Method for providing bidding information search service
Kantorski et al. Automatic filling of hidden web forms: a survey
US9613135B2 (en) Systems and methods for contextual analysis and segmentation of information objects
Rajkumar et al. Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine
KR101120040B1 (en) Apparatus for recommending related query and method thereof
WO2002037328A2 (en) Integrating search, classification, scoring and ranking
JP2020042545A (en) Information processing device, information processing method, and program

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170118

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180111

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200117

Year of fee payment: 7