KR101327514B1 - System for patent network analysis using semantic patent similarity and method using the same - Google Patents

System for patent network analysis using semantic patent similarity and method using the same Download PDF

Info

Publication number
KR101327514B1
KR101327514B1 KR1020110075208A KR20110075208A KR101327514B1 KR 101327514 B1 KR101327514 B1 KR 101327514B1 KR 1020110075208 A KR1020110075208 A KR 1020110075208A KR 20110075208 A KR20110075208 A KR 20110075208A KR 101327514 B1 KR101327514 B1 KR 101327514B1
Authority
KR
South Korea
Prior art keywords
network
similarity
database
patent network
information
Prior art date
Application number
KR1020110075208A
Other languages
Korean (ko)
Other versions
KR20130013510A (en
Inventor
윤장혁
최성철
임주형
김광수
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020110075208A priority Critical patent/KR101327514B1/en
Publication of KR20130013510A publication Critical patent/KR20130013510A/en
Application granted granted Critical
Publication of KR101327514B1 publication Critical patent/KR101327514B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템이 개시된다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스, 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트, 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들로부터 특허문서들 간의 유사성을 추출하여 유사성 행렬을 생성하고, 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성 서버 및 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허 네트워크 정보를 저장하는 데이터베이스를 포함한다.A patent network analysis system using semantic patent similarity is disclosed. Patent network analysis system using semantic patent similarity according to an embodiment of the present invention is at least one external patent database for storing patent documents to be analyzed, at least one client receiving a keyword for the analysis target, from the client Receives a keyword, retrieves and collects the patent documents to be analyzed from an external patent database using the keyword, extracts the SAO structure from the patent documents, and extracts the similarity between the patent documents from the extracted SAO structures. A patent network generating server and a patent document, a SAO structure, a similarity matrix, a patent network and a patent network information are generated to generate a similarity matrix and generate a patent network and patent network information.

Description

의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법 {System for patent network analysis using semantic patent similarity and method using the same}Patent network analysis system using semantic patent similarity and patent network analysis method using same {System for patent network analysis using semantic patent similarity and method using the same}

본 발명은 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법으로서, 더욱 상세하게는 특허문서의 자연어처리 분석을 바탕으로 핵심 특허 발견, 특허 군집의 특성파악, 그리고 경쟁사의 기술적 역량 파악을 통해 기술관련 전문가들의 의사결정을 지원하는 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법에 관한 것이다.
The present invention is a patent network analysis system using semantic patent similarity and a patent network analysis method using the same, and more specifically, based on the analysis of natural language processing of patent documents, core patent discovery, characterization of patent clusters, and technical capabilities of competitors The present invention relates to a patent network analysis system using semantic patent similarity that supports decision making by technical experts through grasping, and a method of analyzing patent network using the same.

특허는 기술의 진보를 반영하는 신뢰성 있는 최신정보이며, 따라서 특허분석은 기술동향 파악과 기술개발 전략의 수립에 필수적인 요소로 인식되어 왔다. 특허분석을 위한 다양한 도구들 중 특허 네트워크 분석은 특허문서로부터 정보를 추출하고 가공하여 특허들 간의 관계를 시각화함으로써 기술관련 종사자들이 지적 재산권에 대한 추세를 한눈에 파악할 수 있도록 한다는 점에서 매우 유용한 도구이다.Patents are reliable and up-to-date information reflecting the progress of technology, and therefore, patent analysis has been recognized as an essential element in identifying technology trends and establishing technology development strategies. Among the various tools for patent analysis, patent network analysis is a very useful tool in that technology workers can identify trends in intellectual property at a glance by extracting and processing information from patent documents and visualizing the relationship between patents. .

일반적으로 특허 네트워크는 도 1과 같이 특허 데이터베이스로부터 수집된 특허문서가 포함하고 있는 서지적 정보 (예: 출원인, 등록연도, 기술분류 등), 기술적 정보 (예: 초록, 발명의 내용 등), 권리적 정보 (예: 청구항)로부터 분석을 위한 자료를 추출하여, 수집된 특허집합에 대한 전체적인 동향을 시각화함으로써 분석자의 이해를 돕는데 유용하게 사용되는 도구로 정의될 수 있다.Generally, the patent network includes bibliographic information (e.g., applicant, year of registration, technical classification, etc.), technical information (e.g., abstract, contents of invention, etc.) included in a patent document collected from a patent database as shown in FIG. By extracting data for analysis from historical information (eg claims) and visualizing the overall trend of the collected patent set, it can be defined as a tool useful for an analyst's understanding.

일반적으로 특허 네트워크는 특허 간의 인용을 바탕으로 구성된다. 하나의 특허가 이후에 나온 특허들에 많이 인용되었을 경우, 해당 특허는 중요한 특허로 받아들여질 가능성 매우 높으며, 반대로 하나의 특허가 많은 특허를 인용하였다면 해당 특허는 진보된 기술일 가능성이 높다. 이러한 특허간의 인용정도는 특허네트워크를 구성함에 있어 매우 유용한 정보로 사용되며 서지정보 등과 통합하여 다양한 분석이 가능하다. 예를 들면, 출원자의 정보를 바탕으로 특허 간의 인용정도를 분석하면 지식의 흐름이 어떻게 이동하는지 파악하기 용이하다. 또 다른 분석으로 통계적인 접근을 사용하거나 네트워크 분석 방법인 중심성 분석 등을 사용하여 특허정보의 숨겨진 패턴을 파악하기도 한다.Generally, a patent network is constructed based on citations between patents. If a patent is cited many times in subsequent patents, it is very likely that the patent is considered an important patent. On the contrary, if a patent cited many patents, the patent is likely to be an advanced technology. The citation degree between these patents is used as a very useful information in constructing a patent network, and various analysis is possible by integrating bibliographic information. For example, analyzing the citation degree between patents based on the applicant's information makes it easier to understand how the flow of knowledge moves. Another analysis is to identify hidden patterns of patent information by using a statistical approach or central analysis, which is a network analysis method.

특허의 인용, 피인용 관계를 바탕으로 구성한 특허 네트워크는 유용한 특허분석 정보를 제공하지만, 새롭게 출현하는 특허에 대하여는 인용 및 피인용 관계가 나타나지 않아 이에 대한 분석을 지원하기 어렵다. 또한 한국과 일본 등과 같은 나라의 특허 문서에서는 인용 및 피인용의 파악이 어렵다. 따라서 특허 문서내용의 분석을 통한 네트워크 작성방법이 요구된다. 특허 내용의 분석을 위해서 기존에는 전문가의 정성적 판단과 능력에 의존하는 형태인데, 최근 기술의 발전을 통해 전 세계적으로 이루어지는 새로운 발명들이 기하급수적으로 늘어나 전문가의 능력에만 의존하는 것은 시간적 비용적 문제가 수반될 수밖에 없다.
The patent network based on the citation and citation of patents provides useful patent analysis information, but it is difficult to support the analysis of citations and citations as new patents do not appear. It is also difficult to identify citations and citations in patent documents in countries such as Korea and Japan. Therefore, a method for creating a network through analysis of the contents of a patent document is required. For the analysis of patent contents, it is conventionally dependent on the expert's qualitative judgment and ability. As the recent development of technology, new inventions developed around the world grow exponentially and it is only a matter of time and cost. It must be accompanied.

본 발명의 일 실시예는 특허문서로부터 기술정보와 권리정보의 내용에 대해 자연어처리를 통하여 특허의 발명적 특징과 관련되며 문서 내에 포함된 기술적 요소들 간의 연관관계를 명시적으로 표현하는 주체-작용-대상 (SAO: Subject-Action-Object)구조들을 문장으로부터 추출하고, 특허 별로 추출된 SAO 구조들 간의 의미론적 문장 유사성을 계산함으로써 특허들 간의 기술적 유사성을 추출한 후, 특허들의 관계를 네트워크화하는 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법을 제공하고자 한다.
One embodiment of the present invention is a subject-action that explicitly expresses an association between technical elements included in a document and related to the inventive features of the patent through natural language processing on the content of technical information and rights information from the patent document. -Semantic Extraction of Subject-Action-Object (SAO) structures from sentences, semantic sentence similarity between SAO structures extracted for each patent, and technical similarity between patents A patent network analysis system using patent similarity and a patent network analysis method using the same are provided.

본 발명의 일 측면에 따르면, 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스; 상기 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트; 상기 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 상기 특허문서들로부터 SAO 구조를 추출하고, 추출된 상기 SAO 구조들로부터 상기 특허문서들 간의 유사성을 추출하여 유사성 행렬을 생성하고, 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성 서버; 및 상기 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허 네트워크 정보를 저장하는 데이터베이스를 포함하고, 상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 이용하여 생성되는 것을 특징으로 하는 특허 네트워크 분석 시스템이 제공될 수 있다.According to an aspect of the invention, at least one external patent database for storing the patent documents to be analyzed; At least one client receiving a keyword for the analysis subject; Receives a keyword from the client, retrieves and collects the patent documents to be analyzed from the external patent database using the keyword, extracts an SAO structure from the patent documents, and extracts the patent from the extracted SAO structures. A patent network generation server extracting similarities between documents to generate a similarity matrix and generating patent network and patent network information; And a database storing the patent document, SAO structure, similarity matrix, patent network and patent network information, wherein the patent network is generated using the similarity matrix and the cutoff value. Can be.

이때, 상기 특허 네트워크 생성 서버는, 상기 분석대상에 대한 상기 키워드를 상기 클라이언트로부터 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스에서 상기 특허문서를 검색하여 수집한 후 상기 데이터베이스에 저장하는 특허문서 수집부; 상기 데이터베이스에 저장된 상기 특허문서로부터 상기 SAO 구조들을 추출하는 자연어 처리부; 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 상기 유사성 행렬을 생성하는 유사성 분석부; 및 상기 유사성 행렬을 사용하여 상기 특허 네트워크 및 특허정보를 생성하는 특허 네트워크 생성부를 포함할 수 있다.At this time, the patent network generation server, the patent document collection unit for receiving the keyword for the analysis target from the client to retrieve and collect the patent document from the external patent database using the keyword and stores in the database ; A natural language processor extracting the SAO structures from the patent document stored in the database; A similarity analysis unit for extracting semantic sentence similarities between the SAO structures to extract technical similarities between the patent documents, and then generating the similarity matrix between the patent documents; And a patent network generator for generating the patent network and patent information using the similarity matrix.

한편, 상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출할 수 있다.The natural language processor may extract the SAO structures from the technical information or the right information of the patent document.

한편, 상기 특허문서 수집부는, 상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드 하는 특허문서 검색부; 및 다운로드 된 상기 특허문서를 표준언어로 변환하고 표준언어로 변환된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변환부를 포함할 수 있다.The patent document collection unit may include: a patent document search unit that searches for the patent documents in the external patent database and downloads the patent documents using the keyword; And a patent document format converting unit converting the downloaded patent document into a standard language, and converting the patent document converted into a standard language into a format.

한편, 상기 자연어 처리부는, 상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및 미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함할 수 있다.On the other hand, the natural language processing unit, SAO structure extraction unit for extracting the SAO structure from the patent documents; And a stopword processing unit for removing the SAO structures including previously stored stopwords and storing the extracted SAO structures in the database.

이때, 상기 자연어 처리부는, 상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함할 수 있다.The natural language processor may further include a patent document loading unit loading the patent document stored in the database.

한편, 상기 유사성 분석부는, 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및 상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 유사성 행렬 생성부를 포함할 수 있다.On the other hand, the similarity analysis unit, the similarity extraction unit for extracting the technical similarity between the patent documents by extracting the semantic sentence similarity between the SAO structures included in the patent documents; And a similarity matrix generator for generating the similarity matrix of all the pairs of patent documents using the technical similarities between the patent documents, and storing the similarity matrix in the database.

한편, 상기 유사성 분석부는, 상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 더 포함할 수 있다.The similarity analyzer may further include a SAO structure loading unit loading the SAO structures in the database.

한편, 상기 특허 네트워크 생성부는, 상기 유사성 행렬을 이용하여 상기 특허 네트워크의 타입에 따라서 상기 특허 네트워크 정보 및 특허 네트워크를 생성하고 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 특허 네트워크 정보 생성부를 포함하고, 상기 특허 네트워크의 타입에 따라 상기 특허 네트워크 및 특허 네트워크 정보가 달라질 수 있다.The patent network generation unit may include a patent network information generation unit that generates the patent network information and the patent network according to the type of the patent network using the similarity matrix, and stores the patent network and patent network information in the database. The patent network and patent network information may vary according to the type of the patent network.

이때, 상기 특허 네트워크 생성부는,상기 데이터베이스에 저장된 상기 유사성 행렬을 로딩하는 유사성 행렬 로딩부를 더 포함할 수 있다.In this case, the patent network generation unit, may further include a similarity matrix loading unit for loading the similarity matrix stored in the database.

본 발명의 다른 측면에 따르면, (a) 특허 네트워크 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계; (b) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계; (c) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하고 상기 특허문서들 간의 유사성을 분석하여 유사성 행렬을 생성하는 단계; 및 (d) 상기 특허 네트워크 생성 서버가 특허 네트워크 및 특허 네트워크 정보를 생성하는 단계를 포함하고, 상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 기반으로 생성되는 것을 특징으로 하는 특허 네트워크 분석 방법이 제공될 수 있다.According to another aspect of the present invention, the method includes: (a) collecting and storing patent documents from at least one external patent database by a patent network generation server; (b) the patent network generating server extracting the SAO structures from the technical information or the rights information of the patent documents through natural language processing and storing the SAO structures in a database; (c) the patent network generating server extracting semantic sentence similarity between the SAO structures and analyzing the similarity between the patent documents to generate a similarity matrix; And (d) generating a patent network and patent network information by the patent network generation server, wherein the patent network is generated based on the similarity matrix and the cutoff value. Can be.

이때, 상기 (a) 단계는, (a-1) 상기 특허 네트워크 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계; (a-2) 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계; (a-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및 (a-4) 상기 특허 네트워크 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.In this case, step (a) may include: (a-1) retrieving the patent documents from the externally accessible external patent database using a keyword that is the subject of analysis through a communication network; (a-2) downloading the retrieved patent documents by the patent network generation server; (a-3) the patent network generating server converting the technical information or the rights information of the patent documents into a text file; And (a-4) the patent network generating server storing the patent documents in the database.

한편, 상기 (a) 단계는, 상기 (a-2) 단계와 (a-3) 단계 사이에 상기 특허문서들을 표준언어로 변환하는 단계를 더 포함할 수 있다.Meanwhile, step (a) may further include converting the patent documents into a standard language between steps (a-2) and (a-3).

한편, 상기 (a) 단계는, 상기 (a-1) 단계 이전에, 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함할 수 있다.On the other hand, step (a), before the step (a-1), the patent network generation server may further comprise the step of receiving the keyword to be analyzed from the client.

이때, 상기 (a) 단계는, 상기 (a-2)와 (a-3) 단계 사이에, 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함할 수 있다.At this time, the step (a), between the step (a-2) and (a-3), the patent network generating server from the client among the retrieved patent documents that are not relevant to the analysis purpose from the client The method may further include receiving an input.

한편, 상기 (b) 단계는, (b-1) 상기 특허 네트워크 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계; (b-2) 상기 특허 네트워크 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계; (b-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및 (b-4) 상기 특허 네트워크 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.On the other hand, step (b), (b-1) the patent network generating server loading the patent documents stored in the database; (b-2) receiving, by the patent network generation server, an area to be analyzed in the patent documents; (b-3) the patent network generating server extracting the SAO structures by grasping the grammatical role of each word included in a sentence through natural language processing analysis on the text of the technical information or the rights information of the patent documents; ; And (b-4) removing the SAO structures including the stop word predefined by the patent network generation server and storing the SAO structures in the database.

이때, 상기 (b) 단계는, 상기 특허 네트워크 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함할 수 있다.In this case, step (b) may further include the step of delivering the SAO structure extracted by the patent network generation server to the client.

한편, 상기 (c) 단계는, (c-1) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계; (c-2) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계; (c-3) 상기 특허 네트워크 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계; (c-4) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 기술적 유사성을 추출하는 단계; 및 (c-5) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 사용하여 상기 유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.Meanwhile, in the step (c), (c-1) the patent network generation server receives the selected patent document set for analyzing technical similarities between the patent documents and loads the SAO structures of the patent documents from the database. Making; (c-2) receiving, by the patent network generation server, a threshold for automatically determining whether the SAO structures match; (c-3) the patent network generating server extracting semantic sentence similarity between the SAO structures included in the patent documents with reference to conceptual relationship information defining a hierarchical structure of upper and lower relations between concepts; (c-4) extracting, by the patent network generating server, the technical similarities between the patent documents after determining whether the SAO structures match by using semantic sentence similarity between the SAO structures; And (c-5) the patent network generating server generating the similarity matrix using the technical similarity between the patent documents and storing the similarity matrix in the database.

이때, 상기 (c) 단계는, 상기 특허 네트워크 생성 서버가 상기 클라이언트에게 상기 유사성 행열을 전달하는 단계를 더 포함할 수 있다.In this case, step (c) may further include the step of delivering, by the patent network generation server, the similarity matrix to the client.

한편, 상기 (d) 단계는, (d-1) 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 선택된 상기 유사성 행렬을 전달받아 상기 유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계; (d-2) 상기 특허 네트워크 생성 서버가 컷오프 값을 사용하여 특허 네트워크를 생성하는 단계; 및 (d-3) 상기 특허 네트워크 생성 서버가 상기 유사성 행렬 및 특허의 서지정보를 이용하여 특허 네트워크의 타입에 따른 상기 특허 네트워크 정보를 생성하고, 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.On the other hand, step (d), (d-1) the patent network generation server receives the similarity matrix selected from the client and loading the similarity matrix from the database; (d-2) the patent network generating server generating the patent network using the cutoff value; And (d-3) the patent network generation server generating the patent network information according to the type of patent network using the similarity matrix and the bibliographic information of the patent, and storing the patent network and patent network information in the database. It may include a step.

한편, 상기 (d) 단계는, 상기 특허 네트워크 생성 서버가 상기 특허 네트워크 및 특허 네트워크 정보를 상기 클라이언트에게 전달하는 단계를 더 포함할 수 있다.On the other hand, step (d) may further include the step of delivering the patent network and patent network information to the client by the patent network generation server.

이때, 상기 컷오프 값은 민감도 분석을 통해서 결정되어 미리 저장된 값을 사용할 수 있다.In this case, the cutoff value may be determined through sensitivity analysis and may use a pre-stored value.

한편, 상기 특허 네트워크 정보는, DSI, GCI, TII 및 TCI 중 어느 하나 이상의 분석지표를 포함할 수 있다.
Meanwhile, the patent network information may include any one or more analysis indicators of DSI, GCI, TII, and TCI.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법은 특허문서의 내용분석을 통해 기술을 구성하는 요소들간의 관계를 명시적으로 표현하는 SAO 구조들간의 의미론적 유사성 분석을 통해 특허들 간의 기술적 유사성을 추출하여 특허 네트워크를 작성함으로써, 핵심 특허 발견, 군집 특허의 특성파악, 그리고 경쟁사의 기술적 역량 파악 등의 정보를 제공할 수 있다.Patent network analysis system using semantic patent similarity and patent network analysis method using the same according to an embodiment of the present invention between the SAO structures expressly express the relationship between the elements constituting the technology through the content analysis of the patent document By creating a patent network by extracting the technical similarities between patents through semantic similarity analysis of It can provide information such as finding key patents, characterizing cluster patents, and identifying competitors' technological capabilities.

또한, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템이 생성한 특허 네트워크는 빠르게 변화하는 산업의 기술트렌드와 기술수명주기 등을 분석하는 데 용이하고, R&D 업무의 통찰을 제공하는 정보로서 사용될 수 있다. 이를 통한 특허 네트워크 분석은 기술기획을 위한 연구자 또는 R&D 정책 결정자의 의사결정을 지원하는 데 유용하다.
In addition, the patent network generated by the patent network analysis system using semantic patent similarity according to an embodiment of the present invention is easy to analyze technology trends and life cycle of the rapidly changing industry, and provides insight into R & D work. Can be used as information to provide. Patent network analysis through this is useful for supporting decision-making by researchers or R & D policy makers for technology planning.

도 1은 특허 네트워크의 일반적 정의에 대하여 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템의 전체 구성도이다.
도 3은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템의 특허 네트워크 생성 서버의 상세 구성도이다.
도 4는 특허 네트워크 생성 서버의 특허문서 수집부에 대한 상세 구성도이다.
도 5는 특허 네트워크 생성 서버의 자연어 처리부에 대한 상세 구성도이다.
도 6은 특허 네트워크 생성 서버의 유사성 분석부에 대한 상세 구성도이다.
도 7은 특허 네트워크 생성 서버의 특허 네트워크 생성부에 대한 상세 구성도이다.
도 8은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법을 사용하여 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정의 순서도이다.
도 9는 특허 네트워크 생성 서버가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다.
도 10은 특허 네트워크 생성 서버가 특허 유사성 행렬을 생성하는 과정에 대한 순서도이다.
도 11은 특허 유사성 행렬(patent similarity matrix)을 생성하는 과정을 도시한 도면이다.
도 12는 특허 네트워크 생성 서버가 특허 네트워크를 생성하는 과정에 대한 순서도이다.
도 13은 136개의 특허를 대상으로 t가 0.8일 때 생성되는 특허 네트워크의 예제이다.
도 14는 특허 네트워크의 중심성 분석을 통해서 예제인 탄소나노튜브 분야에서 높은 DSI, GCI 값을 가지는 특허들을 추출한 것을 도시하고 있다.
도 15는 탄소나노튜브 분야의 특허 네트워크를 분석하여 8개의 군집특허로 분류된 것을 도시하고 있다.
도 16은 도 15에 표시된 각 군집 특허의 구성 특허와 크기, 밀도를 나타낸 것이다.
도 17은 탄소나노튜브 분야에 대하여 경쟁사의 기술적 역량 파악을 위하여 TII, TCI지표를 분석한 결과이다.
1 is a diagram for explaining a general definition of a patent network.
2 is an overall configuration diagram of a patent network analysis system according to an embodiment of the present invention.
3 is a detailed configuration diagram of a patent network generation server of a patent network analysis system according to an embodiment of the present invention.
4 is a detailed configuration diagram of a patent document collection unit of a patent network generation server.
5 is a detailed configuration diagram of the natural language processing unit of the patent network generation server.
6 is a detailed configuration diagram of the similarity analysis unit of the patent network generation server.
7 is a detailed configuration diagram of a patent network generation unit of a patent network generation server.
8 is a flowchart illustrating a process of collecting and storing patent documents from an external patent database using a patent network analysis method using a patent network analysis system according to an embodiment of the present invention.
9 is a flowchart of a process in which a patent network generating server extracts and stores an SAO structure from a patent document.
10 is a flowchart illustrating a process of generating a patent similarity matrix by a patent network generating server.
FIG. 11 illustrates a process of generating a patent similarity matrix.
12 is a flowchart illustrating a process of generating a patent network by a patent network generating server.
FIG. 13 is an example of a patent network generated when t is 0.8 for 136 patents.
FIG. 14 illustrates the extraction of patents having high DSI and GCI values in the carbon nanotube field as an example through the analysis of the centrality of the patent network.
FIG. 15 illustrates a classification of eight cluster patents by analyzing patent networks in the field of carbon nanotubes.
FIG. 16 illustrates a constituent patent, a size, and a density of each cluster patent shown in FIG. 15.
17 is a result of analyzing the TII, TCI indicators in order to grasp the technical capabilities of competitors in the field of carbon nanotubes.

이하에서는 첨부한 도면을 참조하면서 본 발명의 실시예에 대한 구성 및 작용을 상세하게 설명하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, configurations and operations of embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템의 전체 구성도이다. 도 3은 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템의 특허 네트워크 생성 서버의 상세 구성도이다.2 is an overall configuration diagram of a patent network analysis system using semantic patent similarity according to an embodiment of the present invention. 3 is a detailed configuration diagram of a patent network generation server of a patent network analysis system using semantic patent similarity according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)은 특허 네트워크 생성 서버(100), 데이터베이스(200), 외부 특허 데이터베이스(300) 및 클라이언트(400)를 포함할 수 있다.Referring to FIG. 2, the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention includes a patent network generation server 100, a database 200, an external patent database 300, and a client ( 400).

특허 네트워크 생성 서버(100)는 클라이언트(400)로부터 키워드를 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)에서 특허문서를 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들을 이용하여 특허문서들간의 유사성을 추출하고, 유사성 행렬을 생성한 후 유사성 행렬을 이용하여 특허 네트워크를 생성한다.The patent network generation server 100 receives a keyword from the client 400, searches for and collects a patent document from an external patent database 300 using the keyword, extracts SAO structures from the patent documents, and extracts the extracted SAO structures. We extract the similarity between patent documents using the method, generate the similarity matrix, and then generate the patent network using the similarity matrix.

데이터베이스(200)는 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허정보를 저장한다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)은 데이터베이스(200)가 특허 네트워크 생성 서버(100)와 분리되어 있으나, 데이터베이스가 특허 네트워크 생성 서버(100)에 포함될 수 있다. 또한, 데이터베이스가 다수 개 존재하여 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템에서 필요한 정보 즉, 특허문서, SAO구조, 유사성 행렬, 특허네트워크 및 특허정보를 분리하여 저장할 수 있다.The database 200 stores patent documents, SAO structures, similarity matrices, patent networks, and patent information. In the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention, the database 200 is separated from the patent network generation server 100, but the database is included in the patent network generation server 100. Can be. In addition, since a plurality of databases exist, information necessary for a patent network analysis system using semantic patent similarity according to an embodiment of the present invention, that is, a patent document, a SAO structure, a similarity matrix, a patent network, and patent information may be separately stored. have.

외부 특허 데이터베이스(300)는 분석대상이 되는 특허문서들을 저장하고 있는 외부의 데이터베이스이다.The external patent database 300 is an external database that stores patent documents to be analyzed.

클라이언트(400)는 분석대상에 대한 키워드를 특허 네트워크 생성 서버(100)에 전달한다. 또한, 특허 네트워크 생성 서버(100)로부터 특허네트워크 및 특허정보를 전달받아 사용자 인터페이스에 도시할 수 있다.The client 400 transmits the keyword for the analysis target to the patent network generation server 100. In addition, a patent network and patent information is received from the patent network generation server 100 may be shown in the user interface.

다음으로 특허 네트워크 생성 서버(100)에 대하여 상세하게 설명한다. 도 3을 참조하면, 특허 네트워크 생성 서버(100)는 특허문서 수집부(110), 자연어 처리부(120), 유사성 분석부(130) 및 특허 네트워크 생성부(140)를 포함할 수 있다.Next, the patent network generation server 100 will be described in detail. Referring to FIG. 3, the patent network generating server 100 may include a patent document collecting unit 110, a natural language processing unit 120, a similarity analyzing unit 130, and a patent network generating unit 140.

특허문서 수집부(110)는 사용자 인터페이스를 통해 입력받은 키워드를 클라이언트(400)로부터 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)에서 특허문서를 검색하여 수집한 후 데이터베이스(200)에 저장한다.The patent document collecting unit 110 receives a keyword input through the user interface from the client 400, searches for and collects a patent document from the external patent database 300 using the keyword, and stores the keyword in the database 200.

또한, 특허문서 수집부(110)는 특허문서 검색, 특허문서 포맷 변환과 같은 시스템 기능을 포함할 수 있다. 특허문서 수집부(110)는 사용자의 시스템 기능 실행을 위해 특허문서 검색, 특허문서 내용 보기 및 편집, 수집된 특허문서의 저장과 같은 사용자 인터페이스를 제공할 수 있다.In addition, the patent document collection unit 110 may include system functions such as patent document search and patent document format conversion. The patent document collection unit 110 may provide a user interface such as searching a patent document, viewing and editing the contents of a patent document, and storing the collected patent document to execute a system function of the user.

도 4는 특허 네트워크 생성 서버의 특허문서 수집부에 대한 상세 구성도이다.4 is a detailed configuration diagram of a patent document collection unit of a patent network generation server.

도 4를 참조하면, 특허문서 수집부(110)는 특허문서 검색부(111) 및 특허문서 포맷 변환부(112)를 포함할 수 있다.Referring to FIG. 4, the patent document collecting unit 110 may include a patent document searching unit 111 and a patent document format converting unit 112.

특허문서 검색부(111)는 특허문서 수집 모듈로서, 도 4에 도시된 바와 같이, 특허문서를 검색하고 특허문서를 다운로드한다.The patent document search unit 111 is a patent document collection module, and as shown in FIG. 4, searches for a patent document and downloads a patent document.

특허문서 포맷 변환부(112)는 다운로드 된 특허문서를 포맷 변환하여 데이터베이스에 저장한다. 포맷을 변환할 때, 특허문서들의 기술적 정보 또는 권리적 정보를 추출하여 텍스트 파일 형식으로 변환할 수 있다.The patent document format converter 112 converts the downloaded patent document into a format and stores it in a database. When converting the format, the technical information or the rights information of the patent documents can be extracted and converted into a text file format.

한편, 자연어 처리부(120)는 데이터베이스(200)에 저장된 특허문서의 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출한다. 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출할 때, 기술적 정보 또는 권리적 정보를 특허문서로부터 추출하여 텍스트 등의 파일형태로 변환하여 저장할 수 있다. 즉 자연어 처리부(120)는 특허문서 로딩, SAO 구조 추출, 불용어 처리에 대한 시스템 기능을 제공할 수 있다.Meanwhile, the natural language processor 120 extracts SAO structures from technical information or rights information of a patent document stored in the database 200. When extracting SAO structures from technical information or rights information, technical information or rights information can be extracted from a patent document and converted into a file such as text and stored. That is, the natural language processor 120 may provide system functions for patent document loading, SAO structure extraction, and stopword processing.

도 5는 특허 네트워크 생성 서버의 자연어 처리부에 대한 상세 구성도이다.5 is a detailed configuration diagram of the natural language processing unit of the patent network generation server.

도 5를 참조하면, 자연어 처리부(120)는 사용자의 시스템 기능 실행을 위해 특허문서 로딩, 불용어 설정, SAO 구조 확인 및 편집하고 SAO 구조를 데이터베이스에 저장하는 기능을 제공할 수 있다.Referring to FIG. 5, the natural language processor 120 may provide a function of loading a patent document, setting a stop word, checking and editing a SAO structure, and storing the SAO structure in a database to execute a system function of a user.

자연어 처리부(120)는, 도 5를 참조하면, 특허문서 로딩부(121), SAO 구조 추출부(122) 및 불용어 처리부(123)를 포함할 수 있다.Referring to FIG. 5, the natural language processor 120 may include a patent document loading unit 121, a SAO structure extraction unit 122, and a stop word processing unit 123.

특허문서 로딩부(121)는 데이터베이스(200)에 저장된 특허문서를 로딩한다.The patent document loading unit 121 loads a patent document stored in the database 200.

SAO 구조 추출부(122)는 로딩된 특허문서로부터 SAO 구조를 추출한다. SAO 구조는 스탠포드 파서(Stanford Parser)나 미니파(MiniPar)와 같은 자연어처리 오픈 소스를 활용하거나 날리지스트 2.5 (Knowledgest 2.5)와 같은 상용소프트웨어를 활용하여 추출할 수 있다.The SAO structure extractor 122 extracts the SAO structure from the loaded patent document. SAO structures can be extracted using natural language open source sources such as Stanford Parser or MiniPar, or commercial software such as Knowledgest 2.5.

불용어 처리부(123)는 미리 저장되어 있는 불용어를 포함하고 있는 SAO 구조들을 제거하고, 추출된 SAO 구조를 데이터베이스(200)에 저장한다.The stopword processor 123 removes the SAO structures including the previously stored stopwords and stores the extracted SAO structures in the database 200.

한편, 도 6은 특허 네트워크 생성 서버의 유사성 분석부에 대한 상세 구성도이다.6 is a detailed configuration diagram of the similarity analysis unit of the patent network generation server.

유사성 분석부(130)는 SAO 구조들 간의 의미론적 문장 유사성을 추출함으로써 특허들 간의 기술적 유사성을 도출한 후 모든 특허들 간의 기술적 유사성을 담고 있는 유사성 행렬을 생성한다. 즉 유사성 분석부(130)는 SAO 구조 로딩, 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성 추출을 통한 특허간 기술적 유사성 추출, 특허 유사성 행렬 생성, 생성된 유사성 행렬을 데이터베이스에 저장하는 것과 같은 시스템 기능을 제공할 수 있다.The similarity analysis unit 130 derives technical similarities between patents by extracting semantic sentence similarities between SAO structures, and then generates a similarity matrix containing technical similarities between all patents. That is, the similarity analysis unit 130 may extract the technical similarity between patents through the SAO structure loading, the semantic sentence similarity extraction between the SAO structures included in the patents, generate the patent similarity matrix, and store the generated similarity matrix in a database. Can provide system functionality.

도 6을 참조하면, 유사성 분석부(130)는 사용자의 시스템 기능 실행을 위해 분석대상 특허 선택, 개념 관계 설정, 특허 유사성 행렬 확인, 관련자료의 저장과 같은 사용자 인터페이스를 제공할 수 있다.Referring to FIG. 6, the similarity analyzer 130 may provide a user interface such as selecting an analysis target patent, establishing a conceptual relationship, checking a patent similarity matrix, and storing related data to execute a system function of a user.

또한, 유사성 분석부(130)는 단순히 단어 간의 일치 여부를 활용하여 SAO 구조들 간의 유사성을 계산하는 것이 아니라, 개념 계층구조 내에 존재하는 단어들 간의 의미적 유사성을 계량화하여 측정한 후 SAO 구조들 간의 의미적 유사성을 측정한 후 특허들 간의 기술적 유사성을 자동으로 측정할 수 있다.In addition, the similarity analysis unit 130 does not simply calculate similarities between SAO structures by using the coincidence between words, but measures and measures semantic similarities between words existing in the conceptual hierarchy, and then calculates the similarities between SAO structures. After measuring semantic similarity, the technical similarity between patents can be measured automatically.

유사성 분석부(130)는, 도 6을 참조하면, SAO 구조 로딩부(131), 유사성 추출부(132) 및 유사성 행렬 생성부(133)를 포함할 수 있다.6, the similarity analyzer 130 may include a SAO structure loading unit 131, a similarity extractor 132, and a similarity matrix generator 133.

SAO 구조 로딩부(131)는, 도 6에 도시된 바와 같이, 데이터베이스(200)에서 SAO 구조를 로딩한다. 이 때, SAO 구조를 데이터베이스로부터 로딩하지 않고, SAO 구조를 메모리에 상주시킬 수도 있다. 이렇게 함으로써, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)의 실행속도를 보다 향상시킬 수 있다.The SAO structure loading unit 131 loads the SAO structure from the database 200 as shown in FIG. 6. At this time, the SAO structure may reside in memory without loading the SAO structure from the database. By doing so, it is possible to further improve the execution speed of the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention.

유사성 추출부(132)는, 특허간 기술적 유사성 분석 모듈로서, 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성 계산을 통한 특허간 기술적 유사성을 추출한다. 단순히 단어 간의 일치여부를 활용하여 SAO 구조들 간의 유사성을 계산하는 것이 아니라, 개념 계층구조 내에 존재하는 단어들 간의 의미적 유사성을 계량화하여 측정한 후 SAO 구조들 간의 의미적 유사성을 측정하여 특허들 간의 기술적 유사성을 자동으로 측정할 수 있다. 특허들 간의 기술적 유사성을 측정하는 과정은 이하에서 설명될 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)을 이용한 특허네트워크 분석 방법에서 설명한다.The similarity extractor 132 is a technical similarity analysis module between patents and extracts technical similarity between patents through calculation of semantic sentence similarity between SAO structures included in patents. Rather than simply calculating the similarity between SAO structures by using the coincidence between words, it measures the semantic similarity between words existing in the concept hierarchy and then measures the semantic similarity between SAO structures. Technical similarity can be measured automatically. The process of measuring technical similarity between patents will be described in a patent network analysis method using a patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention to be described below.

한편, 도 7은 특허 네트워크 생성 서버의 특허 네트워크 생성부에 대한 상세 구성도이다.7 is a detailed configuration diagram of a patent network generating unit of a patent network generating server.

특허 네트워크 생성부(140)는 특허 유사성 행렬을 로딩하여 컷어프 값에 따라서 특허 정보를 추출하여 특허 네트워크를 생성한다. 즉 특허 네트워크 생성부(140)는 특허 유사성 행렬을 로딩하고 특허정보 및 시각화된 특허 네트워크를 생성한다.The patent network generator 140 loads a patent similarity matrix and extracts patent information according to a cut-up value to generate a patent network. That is, the patent network generator 140 loads a patent similarity matrix and generates patent information and a visualized patent network.

도 7을 참조하면, 특허 네트워크 생성부(140)는 사용자의 시스템 기능 실행을 위해 특허 네트워크 타입 선택, 생성된 특허 네트워크 확인, 생성된 특허 네트워크의 정보 확인, 특허 네트워크 정보 및 특허 네트워크를 데이터베이스에 저장하는 사용자 인터페이스를 제공할 수 있다.Referring to FIG. 7, the patent network generating unit 140 selects a patent network type, checks a created patent network, checks information of a created patent network, stores patent network information and a patent network in a database to execute a system function of a user. Can provide a user interface.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서 생성되는 특허 네트워크로 핵심 특허 발견, 군집 특허의 특성파악 및 경쟁사의 기술적 역량 파악 등의 정보가 제공될 수 있다.As a patent network generated by the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention, information such as core patent discovery, characterization of cluster patents, and grasp of a competitor's technical capability may be provided. .

특허 네트워크 작성을 위해, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서는 컷오프 값(Cutoff Value)을 활용하여 특정 특허 간의 관계가 있음을 정의할 수 있다. 특허 간의 유사성 행렬을 산정 후 두 특허 간의 유사성이 특정 값을 상회한다면 해당 특허는 강한 연관관계가 있음을 나타낸다고 가정하여 해당 특허들이 관계 있음을 나타낼 수 있다. 특허 네트워크 상에서는 두 특허의 유사성이 컷오프(Cutoff Value)인 P값을 상회 하였다면 관계가 있음으로 나타나고, 링크가 생성될 수 있다.In order to create a patent network, the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention may define a relationship between specific patents by using a cutoff value. If the similarity between two patents exceeds a certain value after calculating the similarity matrix between patents, it can be assumed that the patents are related by assuming that the patents have a strong association. On the patent network, if the similarity between the two patents exceeds the cutoff value P, it may appear to be related, and a link may be created.

특허 네트워크 생성부(140)는, 도 7을 참조하면, 유사성 행렬 로딩부(141) 및 특허 네트워크 정보 생성부(142)를 포함할 수 있다.Referring to FIG. 7, the patent network generation unit 140 may include a similarity matrix loading unit 141 and a patent network information generation unit 142.

유사성 행렬 로딩부(141)는 데이터베이스(200)에 저장된 유사성 행렬을 로딩한다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서는 유사성 행렬을 데이터베이스로부터 로딩하였지만, 유사성 행렬을 데이터베이스(200)로부터 로딩하지 않고 메모리에 유사성 행렬을 상주시킬 수도 있다.The similarity matrix loading unit 141 loads the similarity matrix stored in the database 200. In the patent network analysis system 10 using semantic patent similarity according to an embodiment of the present invention, the similarity matrix is loaded from the database, but the similarity matrix may be resident in memory without loading the similarity matrix from the database 200. .

특허 네트워크 정보 생성부(142)는 유사성 행렬 및 컷오프 값을 이용하여 특허 네트워크의 공간상에 특허문서들을 사상하고 특허 네트워크 타입에 따라서 특허 네트워크 및 특허 네트워크 정보를 생성하며, 생성된 특허 네트워크 및 특허 네트워크 정보를 데이터베이스에 저장한다.The patent network information generation unit 142 maps the patent documents in the space of the patent network using the similarity matrix and the cutoff value, generates the patent network and the patent network information according to the patent network type, and generates the generated patent network and the patent network. Store the information in a database.

이후에 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법에서 상세하게 설명하겠지만, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 특허 네트워크의 타입에 따라 사용자에게 다양한 특허 네트워크 및 특허정보를 제공할 수 있다.
A patent network analysis method using a patent network analysis system using semantic patent similarity according to an embodiment of the present invention will be described in detail later, but a patent network analysis system using semantic patent similarity according to an embodiment of the present invention. Can provide various patent networks and patent information to the user according to the type of patent network.

다음으로, 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법에 대하여 설명한다.Next, a patent network analysis method using a patent network analysis system according to an embodiment of the present invention will be described.

먼저, 특허 네트워크 생성 서버(100)가 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정을 설명한다.First, a process of collecting and storing patent documents from an external patent database by the patent network generation server 100 will be described.

도 8은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법을 사용하여 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정의 순서도이다.8 is a flowchart illustrating a process of collecting and storing patent documents from an external patent database using a patent network analysis method using a patent network analysis system according to an embodiment of the present invention.

도 8을 참조하면, 먼저, 클라이언트(400)가 사용자가 분석하고자 하는 기술과 관련된 주제어, 출원인, 연도 등의 검색조건을 입력받아 특허 네트워크 생성 서버(100)에 전달한다(S110). 이후에, 특허 네트워크 생성 서버(100)가 인트라넷 및 인터넷과 같은 통신망을 통해서 외부의 접속 가능한 외부 특허 데이터베이스(300)로부터 특허문서들을 검색한다(S120).Referring to FIG. 8, first, a client 400 receives a search condition of a main word, an applicant, a year, and the like related to a technology to be analyzed by a user, and transmits the search condition to the patent network generation server 100 (S110). Subsequently, the patent network generation server 100 retrieves patent documents from an externally accessible external patent database 300 through a communication network such as an intranet and the Internet (S120).

다음으로, 특허 네트워크 생성 서버(100)가 검색된 특허문서를 다운로드 한다(S130). 이 때, 사용자가 검색된 특허문서들을 확인한 부 분석목적과 관련성이 없는 특허들을 제거한 후 특허문서 다운로드를 실행할 수 있다.Next, the patent network generation server 100 downloads the retrieved patent document (S130). At this time, the user may remove the patents that are not related to the sub-analysis purpose of checking the searched patent documents and then download the patent document.

이후에, 다운로드된 특허문서 중 표준언어로 작성되지 않은 문서의 경우, SAO분석을 위해 표준언어로 변환한다(S150). 여기에서 표준언어는 영어일 수 있고,다운로드된 특허문서 중 영어로 작성되지 않은 문서의 경우, K2E-PAT과 같은 소프트웨어로 한글과 일본어로 작성된 특허문서를 영어로 변환할 수 있다.Subsequently, in the case of a document which is not written in a standard language among the downloaded patent documents, the document is converted into a standard language for SAO analysis (S150). Here, the standard language may be English, and in the case of a document that is not written in English among downloaded patent documents, a patent document written in Korean and Japanese may be converted into English using software such as K2E-PAT.

이후에, 특허 네트워크 생성 서버(100)가 다운로드된 특허문서들의 집합을 미리 정의된 식별자 이름으로 지정한다(S140).Thereafter, the patent network generation server 100 designates the set of downloaded patent documents as a predefined identifier name (S140).

다음으로, 특허 네트워크 생성 서버(100)가 식별자가 지정된 특허문서들의 집합의 서지적 정보, 기술적 정보 및 권리적 정보를 텍스트 파일 등의 형태로 변환한다(S160).Next, the patent network generation server 100 converts the bibliographic information, the technical information, and the right information of the set of patent documents in which the identifier is specified into a text file (S160).

마지막으로, 특허 네트워크 생성 서버(100)가 특허문서를 데이터베이스(200)에 저장한다(S170).Finally, the patent network generation server 100 stores the patent document in the database 200 (S170).

다음으로, 특허 네트워크 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정을 설명한다.Next, a process of extracting and storing the SAO structure from the patent document by the patent network generation server 100 will be described.

도 9는 특허 네트워크 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다.9 is a flowchart of a process in which the patent network generation server 100 extracts and stores an SAO structure from a patent document.

도 9를 참조하면, 먼저, 특허 네트워크 생성 서버(100)가 데이터베이스(200)에 저장되어 있는 특허문서들을 로딩한다(S210).Referring to FIG. 9, first, a patent network generation server 100 loads patent documents stored in a database 200 (S210).

다음으로, 특허 네트워크 생성 서버(100)가 특허문서에서 분석하고자 하는 영역을 입력받는다(S220).Next, the patent network generation server 100 receives an area to be analyzed in the patent document (S220).

이후에, 특허 네트워크 생성 서버(100)가, SAO 구조를 추출하기 위하여, 특허문서의 기술적 내용 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할 (POS: part-of-speech)을 파악한다(S230).Subsequently, in order to extract the SAO structure, the patent network generation server 100 performs a grammatical role of each word included in a sentence through natural language processing analysis on the technical content of the patent document or the text of the right information (POS: part -of-speech) is identified (S230).

다음으로, 특허 네트워크 생성 서버(100)가 단어들의 POS를 활용하여 명사구와 동사구를 각각 추출한 다음, 주어-동사-목적어의 문법적 패턴을 지니는 관계(SAO 구조)들을 추출하여 각 특허별로 정리한다(S240).Next, the patent network generating server 100 extracts noun phrases and verb phrases using POS of words, and then extracts the relationships (SAO structure) having a grammatical pattern of subject-verb-object words and organizes them for each patent (S240). ).

다음으로, 특허 네트워크 생성 서버(100)가 특허별로 SAO 구조들이 모두 수집된 다음 미리 정의한 불용어를 포함하고 있는 SAO 구조들을 제거한다(S250). 다른 방법으로, 사용자에게 해당 SAO 구조들을 제시하고 이들을 제거할 것인지에 대해서 질의하는 형태로 기능이 구현될 수 있다.Next, the patent network generation server 100 removes all the SAO structures containing the predefined stop words after all the SAO structures are collected for each patent (S250). Alternatively, the functionality can be implemented in the form of presenting the corresponding SAO structures to the user and asking whether to remove them.

이후에, 특허 네트워크 생성 서버(100)가 클라이언트(400)에게 특허별 추출된 SAO 구조를 전달한다(S260). 클라이언트(400)에게 전달된 SAO구조를 사용자 인터페이스를 통하여 사용자가 확인할 수 있다.Thereafter, the patent network generation server 100 delivers the SAO structure extracted for each patent to the client 400 (S260). The SAO structure delivered to the client 400 can be confirmed by the user through the user interface.

마지막으로, 특허 네트워크 생성 서버(100)가 SAO 구조를 데이터베이스(200)에 저장한다(S270).Finally, the patent network generation server 100 stores the SAO structure in the database 200 (S270).

다음으로 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 생성하는 과정에 대하여 설명한다.Next, a process of generating the patent similarity matrix by the patent network generation server 100 will be described.

도 10은 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 생성하는 과정에 대한 순서도이다.10 is a flowchart illustrating a process in which the patent network generation server 100 generates a patent similarity matrix.

도 10을 참조하면, 먼저, 특허 네트워크 생성 서버(100)가 특허들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 특허문서집합의 SAO 구조를 데이터베이스(200)로부터 로딩한다(S310).Referring to FIG. 10, first, the patent network generation server 100 receives a selected patent document set for analyzing technical similarities between patents and loads the SAO structure of the patent document set from the database 200 (S310).

다음으로, 특허 네트워크 생성 서버(100)가 SAO 구조 간의 일치여부에 대한 자동화된 판단을 위한 임계치(threshold)를 입력받는다(S320). 임계치 값은 SAO 구조 간의 일치여부를 엄격하게 적용할 것인지 완화시킬 것인지에 대한 기준이 된다.Next, the patent network generation server 100 receives a threshold for automated determination of whether the SAO structure matches (S320). The threshold value is a criterion for whether to strictly apply or mitigate the agreement between SAO structures.

이후에, 특허 네트워크 생성 서버(100)가 개념들 간의 상하위 관계에 대한 계층구조를 정의하고 있는 워드넷 (WordNet) 또는 기술 도메인 온톨로지와 같은 개념관계 정보를 참조하여 각 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성을 추출한다(S330).Subsequently, the SAO structures included in each patent by referring to the conceptual relationship information, such as WordNet or technology domain ontology, in which the patent network generation server 100 defines a hierarchical structure for the hierarchical relationship between the concepts. The semantic sentence similarity between the two is extracted (S330).

다음으로, 특허 네트워크 생성 서버(100)가 추출된 각 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 SAO 구조들 간의 일치여부를 판단한 후 특허들 간의 의미론적 유사성을 추출한다(S340).Next, the patent network generation server 100 determines whether the SAO structures match by using semantic sentence similarities between the SAO structures included in the extracted patents, and then extracts the semantic similarities between the patents (S340). ).

다음으로, 특허 네트워크 생성 서버(100)가 특허들 간의 의미론적 유사성을 사용하여 의미론적 유사성 행열을 생성한다(S350).Next, the patent network generation server 100 generates a semantic similarity matrix using semantic similarities between patents (S350).

이후에, 특허 네트워크 생성 서버(100)가 클라이언트(400)에게 유사성 행열을 전달한다(S360).Thereafter, the patent network generation server 100 transmits the similarity matrix to the client 400 (S360).

마지막으로, 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 데이터베이스에 저장한다(S370).Finally, the patent network generation server 100 stores the patent similarity matrix in a database (S370).

다음으로, 도 11을 참조하여, 특허 유사성 행렬(patent similarity matrix)을 생성하는 과정을 보다 자세하게 설명한다.Next, referring to FIG. 11, the process of generating a patent similarity matrix will be described in more detail.

특허간의 유사성은 각 특허들이 포함하고 있는 SAO 구조들의 유사성을 측정함으로써 얻어질 수 있다. SAO 구조는 하나의 문장이며, 두 문장 간의 의미론적 문장 유사성 측정은 일반적으로 (1) 문장을 구성하는 단어 단위로 분리하는 토큰화 (tokenizing), (2) 단어의 원형화 (stemming), (3) 단어의 문법적 역할 파악 (POS tagging), (4) 문장에 있는 각 단어들의 적합한 의미(sense) 결정, (5) 품사정보를 고려한 단어들 간의 의미 유사성을 활용하여 계산될 수 있다.The similarity between patents can be obtained by measuring the similarity of SAO structures included in each patent. The SAO structure is a sentence, and the semantic sentence similarity measure between two sentences is generally (1) tokenizing, separating words into units of words, (2) stemming words, (3 ) Can be calculated using POS tagging, (4) determining the appropriate sense of each word in a sentence, and (5) semantic similarity between words considering parts of speech information.

문장에 있는 하나의 단어인 토큰(token) ti와 tj가 있을 때, 이들의 유사성은 0에서 1 사이의 값을 가지며 Resnik의 개념 분류체계 하에서의 두 토큰의 의미론적 유사도 (semantic similarity in a taxonomy)는 수학식 1과 같이 정의된다.
When there is a single word in the sentence, tokens ti and tj, their similarities have a value between 0 and 1 and the semantic similarity in a taxonomy under Resnik's conceptual taxonomy It is defined as in Equation 1.

Figure 112011058528611-pat00001
Figure 112011058528611-pat00001

여기서 lcs는 두 토큰들이 의미를 공유하는 최하 포섭개념(lowest common subsumer)이며, depth는 개념 계층구조(concept hierarchy)에서 토큰의 루트 노드 (root node)로부터의 깊이를 의미한다. 하나의 문장에 포함된 모든 단어들을 토큰으로 분리하게 되면, 두 문장 간의 의미적 유사성 계산은 이분 그래프(bipartite graph)의 최대 매칭의 문제로 해석될 수 있으며, 따라서 SAO 구조들 간의 유사성은 0에서 1 사이의 값을 가질 수 있으며 수학식 2와 같이 정의될 수 있다.
Where lcs is the lowest common subsumer where the two tokens share meaning, and depth is the depth from the root node of the token in the concept hierarchy. By separating all the words in a sentence into tokens, the semantic similarity calculation between the two sentences can be interpreted as a problem of maximum matching of the bipartite graph, so the similarity between SAO structures is 0 to 1 It may have a value between and may be defined as Equation 2.

Figure 112011058528611-pat00002
Figure 112011058528611-pat00002

여기서 Ntoken은 문장 Si에 속해 있는 토큰의 개수를 의미하며, match는 두 문장 속에 존재하는 품사가 동일한 토큰들이 가지는 의미적 유사성의 합을 의미한다. 의미론적인 문장 유사도 측정은 의미는 유사하지만 다른 형태로 표기될 수 있는 문장들 간의 유사도를 측정하는데 유용하다. 이를 이용하여 두 SAO 구조들 간의 유사도가 계산되며, 두 SAO 구조가 동일한지 아닌지를 판별하기 위해 수학식 3과 같이 임계치(p)를 활용한다.
Where N token is the number of tokens in the sentence S i , and match is the sum of the semantic similarities of the same tokens in the two parts of the sentence. Semantic sentence similarity measurement is useful for measuring similarity between sentences that are similar in meaning but can be expressed in different forms. Similarity between two SAO structures is calculated using this, and a threshold value p is used as shown in Equation 3 to determine whether two SAO structures are identical.

Figure 112011058528611-pat00003
Figure 112011058528611-pat00003

즉, 두 SAO 구조의 유사도 값이 p보다 크면, 두 SAO 구조는 동일한 것으로 간주하고, 그렇지 않으면 두 SAO 구조는 다른 것으로 간주할 수 있다. p값의 설정은 분석자의 판단에 따라 결정될 수 있으며, 임계치를 1에 깝게 설정하면 보다 엄격한 유사성 분석이 가능하며, 0에 가까울수록 느슨한 유사도 분석을 수행하게 된다. 다음으로 두 특허들 간의 유사성은 이들이 얼마나 많은 SAO 구조들을 공유하는 지를 활용하여 수학식 4와 같이 정의될 수 있다.
In other words, if the similarity value of the two SAO structures is greater than p, the two SAO structures may be considered identical, otherwise the two SAO structures may be considered different. The value of p can be determined according to the judgment of the analyst. If the threshold is set to 1, the similarity analysis can be more strict. The closer to 0, the looser similarity analysis is performed. Next, the similarity between the two patents can be defined as shown in Equation 4 by utilizing how many SAO structures they share.

Figure 112011058528611-pat00004
Figure 112011058528611-pat00004

여기서 NSAO(X)는 특허 X에 포함된 SAO 구조의 수, NSAO(X,Y)는 특허 X와 Y에 포함된 SAO 구조들 간의 유사도 판별값이 1인 SAO 구조 쌍의 개수이다. SIM(A,B)는 두 특허 사이의 유사도 값으로, 판별 값이 1이면 두 특허는 동일하다고 할 수 있다. 모든 특허들 간의 유사도 분석을 수행하면, 특허들 간의 유사도를 나타내는 행렬을 얻을 수 있다.Where N SAO (X) is the number of SAO structures included in patent X, and N SAO (X, Y) is the number of SAO structure pairs having a similarity discrimination value of 1 between SAO structures included in patents X and Y. SIM (A, B) is a similarity value between two patents. If the discrimination value is 1, the two patents are the same. By performing similarity analysis between all patents, a matrix representing the similarity between patents can be obtained.

다음으로, 특허 네트워크 생성 서버(100)가 특허 네트워크를 생성하는 과정에 대하여 설명한다.Next, a process of generating a patent network by the patent network generation server 100 will be described.

도 12는 특허 네트워크 생성 서버(100)가 특허 네트워크를 시각화하는 과정에 대한 순서도이다.12 is a flowchart illustrating a process in which the patent network generation server 100 visualizes a patent network.

도 12를 참조하면, 먼저 특허 네트워크 생성 서버(100)가 클라이언트(400)로부터 선택된 의미론적 특허 유사성 행렬을 전달받아 유사성 행렬을 데이터베이스로부터 로딩한다(S410).Referring to FIG. 12, a patent network generation server 100 receives a semantic patent similarity matrix selected from a client 400 and loads a similarity matrix from a database (S410).

다음으로, 특허 네트워크 생성 서버(100)가 컷오프 값(Cutoff Value)에 기반한 특허 네트워크를 생성한다(S420). 의미론적 특허 유사성 행렬이 선택되면, 컷오프 값(Cutoff Value)을 바탕으로 특허 네트워크를 생성하게 된다. t 값을 컷오프 값(Cutoff Value)으로 할 경우, SIM(A,B) >= t 이면 특허 네트워크 상에서 두 특허가 연결된다고 볼 수 있다. 이때 t값은 t값의 변화에 따른 특허 네트워크의 변화를 반영하여 최적의 t값을 찾아내는 민감도 분석을 활용하여 전문가의 의해 결정되어 데이터베이스에 저장될 수 있다. 도 13은 136개의 특허를 대상으로 t가 0.8일 때 생성되는 특허 네트워크의 예제이다.Next, the patent network generation server 100 generates a patent network based on the cutoff value (S420). When the semantic patent similarity matrix is selected, a patent network is generated based on the cutoff value. When t is a cutoff value, if SIM (A, B)> = t, two patents are connected on the patent network. In this case, the t value may be determined by an expert and stored in a database by using a sensitivity analysis that finds an optimal t value by reflecting the change of the patent network according to the change of the t value. FIG. 13 is an example of a patent network generated when t is 0.8 for 136 patents.

이후에, 클라이언트가 선택된 특허 네트워크의 타입 (예: 핵심특허, 군집특허, 경쟁사의 기술적 역량 파악)을 입력받아 특허 네트워크 생성 서버(100)에 전달한다(S430).Subsequently, the client receives the type of the selected patent network (eg, core patents, cluster patents, and technical capabilities of competitors) and transmits them to the patent network generation server 100 (S430).

다음으로, 특허 네트워크 생성 서버(100)가 특허의 서지정보 (예: 출원번호, 출원인, 특허 출원 및 등록 연도 등)를 활용하여 특허 네트워크의 타입에 따른 특허 네트워크 정보를 생성한다(S440).Next, the patent network generation server 100 generates patent network information according to the type of the patent network using the bibliographic information of the patent (for example, application number, applicant, patent application and registration year, etc.) (S440).

이후에, 특허 네트워크 생성 서버(100)가 특허 네트워크 및 특허 네트워크 정보를 클라이언트(400)에게 전달한다. 클라이언트(400)는 특허 네트워크 및 특허 네트워크 정보를 사용자 인터페이스를 이용하여 사용자에게 전달한다(S450). 이로써 사용자가 시각적으로 특허 네트워크 및 특허 네트워크 정보를 확인할 수 있다.Thereafter, the patent network generation server 100 transmits the patent network and patent network information to the client 400. The client 400 transmits the patent network and the patent network information to the user using the user interface (S450). This allows the user to visually check the patent network and patent network information.

마지막으로, 특허 네트워크 생성 서버(100)는 특허 네트워크 및 특허 네트워크 정보를 데이터베이스(200)에 저장한다(S460).Finally, the patent network generation server 100 stores the patent network and patent network information in the database 200 (S460).

한편, 도 13은 특허 네트워크 중 핵심특허를 선택했을 경우의 특허 네트워크의 예를 도시하고 있다. 기술 중심성 분석을 통해서 핵심 특허일 가능성이 높은 특허 또는 상대적으로 중요성을 가진 특허를 발견할 수 있다. 사회 연결망 분석(Social Network Analysis)에서 중심성 (centrality)이란 네트워크상의 어떤 노드가 얼마만큼 중심 가까이 자리 잡고 있는지를 나타내는 정도를 의미하는지 표현하는 지표로 특정한 노드가 많은 다른 노드들과 연결을 갖게 될 경우 그 노드는 점차 네트워크의 가운데 쪽으로 위치하게 됨을 의미한다.FIG. 13 shows an example of a patent network in the case of selecting a core patent among patent networks. Technology-centricity analysis can identify patents that are likely to be core patents or patents of relatively high importance. In social network analysis, centrality is an indicator of how much of a node on a network is located near the center. When a node is connected to many other nodes This means that the nodes will gradually be located towards the center of the network.

이러한 중심성 지표가 높은 노드는 네트워크 내 영향력이 크고 다른 노드들에게 많은 영향을 미칠 수 있다. 본 발명에서는 주로 중심성 분석을 적용하여 특허들 간의 내용 전 연관관계를 기반으로 한 수학식 5에 따른 Degree Sum Index(DSI), 수학식 6에 따른 Global Centrality Index(GCI) 지표를 제시한다.Nodes with high centrality indices have a high impact in the network and can have a large impact on other nodes. In the present invention, the degree summation index (DSI) according to Equation 5 and the Global Centrality Index (GCI) index according to Equation 6 are presented based on pre-content relations between patents mainly by applying centrality analysis.

Figure 112011058528611-pat00005
Figure 112011058528611-pat00005

Figure 112011058528611-pat00006
Figure 112011058528611-pat00006

DSI 지표 값이 높은 특허는 다른 특허들과 직접적인 관계가 크기 때문에, 기술 분야에서 핵심적인 특허일 가능성이 높음을 의미한다. GCI 지표 값이 높은 특허는 다양한 특허와 많은 관계가 있기 때문에, 널리 사용되는 기술의 특허일 가능성이 높음을 의미한다.Patents with high DSI index values are likely to be key patents in the technical field because they have a direct relationship with other patents. Patents with high GCI indicators are highly related to various patents, meaning that they are likely to be patents of widely used technologies.

도 14는 특허 네트워크의 중심성 분석을 통해서 예제인 탄소나노튜브 분야에서 높은 DSI, GCI 값을 가지는 특허들을 추출한 것을 도시하고 있다. 전체적으로 1999년부터 2004년 사이에 출원되었거나, 등록된 특허들이 중요한 것으로 나타났음을 알 수 있다.FIG. 14 illustrates the extraction of patents having high DSI and GCI values in the carbon nanotube field as an example through the analysis of the centrality of the patent network. In general, it can be seen that patents filed or registered between 1999 and 2004 appear to be important.

실제로 이 기간 동안 많은 연구자와 기업들이 '아이크 방전'과 '레이저 증기요법'을 발명하였다. 높은 DSI, GCI 값을 가진 특허들 중 많은 수는 탄소나노튜브의 합성과 관련된 넥(NEC), 소니(SONY), 삼성 SDI등과 같은 기업의 특허들이었다. 예를 들어 도 14의 P2 특허 같은 경우 높은 DSI, GCI값을 가지고 있는데, 이는 탄소나노튜브의 '아이크 방전' 기술과 관련된 NEC기업의 원천 특허였다. Indeed, during this period, many researchers and companies invented 'Ike Discharge' and 'Laser Vapor Therapy'. Many of the patents with high DSI and GCI values were patents of companies such as NEC, Sony, Samsung SDI, etc. related to the synthesis of carbon nanotubes. For example, the P2 patent of FIG. 14 has a high DSI and GCI value, which was a source patent of NEC companies related to the 'Ike discharge' technology of carbon nanotubes.

2005년부터 2008년 사이에 출원된 높은 DSI, GCI 값을 가진 새로운 특허들도 출현하였다. 높은 GCI 값을 가진 P110, P135 특허와 같은 새로운 특허는 탄소나노튜브의 합성과 관련된 방법으로서 화학증착법(CVD) 기술이 기존의 '아이크 방전'과 '레이저 증기요법' 기술을 대체하고 있음을 의미한다.New patents with high DSI, GCI values filed between 2005 and 2008 have also emerged. New patents, such as the P110 and P135 patents, which have high GCI values, are related to the synthesis of carbon nanotubes, meaning that chemical vapor deposition (CVD) technology replaces conventional 'ike discharge' and 'laser vapor therapy' technologies. .

또한 삼성 SDI기업의 P110 특허는 지속적인 전극의 대체로 인해 발생하는 문제를 제거하기 위해서 새로운 발명을 제안하였고, 이는 대량생산을 위한 중요 특허로 판명되었다. 따라서 본 발명에서 사용되는 지표들은 사용자들이 특허들 간의 유사성 비교를 통해서 핵심특허일 가능성이 높은 특허를 발견하기 위해 도움을 줄 수 있다. 이는 빠르게 변화하는 산업에서 기술의 가치를 측정하고 새로운 특허들의 가능성을 평가하는 방법이 될 수 있다.In addition, Samsung SDI's P110 patent proposed a new invention to eliminate the problems caused by the continuous replacement of electrodes, which turned out to be an important patent for mass production. Therefore, the indicators used in the present invention can help users to find patents that are likely to be core patents through similarity comparison between patents. This could be a way of measuring the value of technology and evaluating the possibility of new patents in a rapidly changing industry.

도 15는 특허 네트워크 중 군집특허를 선택했을 경우의 특허 네트워크의 예를 도시하고 있다. 특허 네트워크의 군집 특허 분석에서는 밀도(density)와 크기(size)가 특성파악의 주요 요인이 된다. 특허 네트워크 내에서 군집의 크기가 크고, 밀도가 높은 군집 특허는 기술적으로 증명되었거나, 중요한 세부 기술 분야로 이미 많은 발명이 이루어졌고, 유사한 특허들이 많음을 의미한다.Fig. 15 shows an example of a patent network in the case of selecting a cluster patent among patent networks. In cluster patent analysis of patent networks, density and size are the main factors of characterization. Larger, more dense cluster patents within the patent network mean technically proven, many inventions have already been made in important technical fields, and many similar patents.

또한 군집의 크기가 크고, 밀도가 낮은 군집 특허는 유망한 세부 기술 분야로서, 관련 특허들이 충분히 나타나지 않았거나 성숙되지 않음을 의미한다.In addition, large clusters of cluster size and low density cluster patents are promising detailed technical fields, which means that the patents are not sufficiently developed or mature.

마지막으로 군집의 크기가 작고, 밀도가 높은 군집 특허는 독립적인 특성을 지니는 특허집단으로서, 기존의 방법과는 다른 새로운 기술을 의미할 수 있다.Finally, cluster patents with small cluster sizes and high density are patent groups with independent characteristics and may mean new technologies different from existing methods.

도 15는 탄소나노튜브 분야의 특허 네트워크를 분석하여 8개의 군집특허로 분류된 것이다. 도 16은 도 15에 표시된 각 군집 특허의 구성 특허와 크기, 밀도를 나타낸 것이다.15 is classified into eight cluster patents by analyzing a patent network in the field of carbon nanotubes. FIG. 16 illustrates a constituent patent, a size, and a density of each cluster patent shown in FIG. 15.

도 16의 군집 특허 G1, G2 로부터 기술적 영향이 결정될 수 있다. 군집 특허 G1 은 특허 P135, P121, P116, P115 등과 같이 가장 많은 특허 수를 보유하여 크기는 크고, 밀도는 작다. 따라서 군집 특허 G1 내 탄소나노튜브 합성과 관련된 기술('아이크 방전', '레이저 증기요법', '화학 증착법')이 지속적으로 발명될 가능성이 높다. 실제로 탄소나노튜브 관련 연구에서 50.7% 의 특허가 위와 같은 기술 분야에서 출현하고 있었다.The technical influence can be determined from the cluster patents G1 and G2 of FIG. 16. Cluster patent G1 has the largest number of patents, such as patents P135, P121, P116, and P115, and is large in size and small in density. Therefore, there is a high possibility that technologies related to the synthesis of carbon nanotubes in cluster patent G1 ('ike discharge', 'laser vapor therapy', 'chemical vapor deposition') are continuously invented. In fact, 50.7% of patents related to carbon nanotubes have appeared in the above technical field.

군집 특허 G2는 특허 P131, P130, P129, P127, P48, P42, P41로 크기는 작고 밀도는 매우 높게 나타났다. 따라서 각 특허들은 특허들 간의 관계성이 매우 높은 새로운 기술의 발명일 수 있다. 군집 특허 G2에 대해서 서지사항 정보를 분석한 결과 탄소나노튜브의 합성을 위한 '아이크 방전'과 관련된 유사한 발명에 대해서 한 명의 개인이 4개의 특허를 보유하였고, 하나의 기업이 2개의 특허를 보유하고 있었다. 따라서 개인의 특허들을 통해서 관련 기술이 새로운 발명이 될 수 있다고 분석된다.Cluster patent G2 has patents P131, P130, P129, P127, P48, P42, and P41, which are small in size and very high in density. Thus, each patent may be an invention of a new technology having a very high relationship between the patents. Analysis of bibliographic information on cluster patent G2 reveals that one individual owns four patents and one company holds two patents for a similar invention related to 'Ike discharge' for the synthesis of carbon nanotubes. there was. Therefore, it is analyzed that related technology can be a new invention through individual patents.

G2 내의 특허 들은 펄스를 사용하거나 자기장을 사용함과 같이 발명에 차이가 존재하나, 순도 높은 탄소나노튜브의 수집을 위해 연속적으로 탄소막대를 주입하는 공통적인 특성을 가진다. 주입부는 사용한 탄소막대를 저장하고, 손실 없이 반응부에 연속적으로 탄소막대를 주입할 수 있다. 게다가 탄소나노튜브 수집부는 순도를 높이기 위해서 반응부와 저장부의 벽에 응고된 탄소나노튜브를 긁어낼 수 있다. 따라서 군집 특허 G2 내의 발명은 탄소나노튜브의 수집을 효과적으로 하고 합성과정의 생산성을 높이기 위한 새로운 발명이라고 할 수 있다. 실제로 '아이크 방전' 기술의 최근 주요 연구는 대량 생산과 비용절감에 목적을 두고 있다.The patents in G2 differ in inventions, such as using pulses or using magnetic fields, but have the common feature of continuously injecting carbon rods for the collection of high-purity carbon nanotubes. The injection unit stores the carbon rod used, and the carbon rod can be continuously injected into the reaction unit without loss. In addition, the carbon nanotube collector can scrape off the carbon nanotubes solidified on the walls of the reaction and storage compartments to increase purity. Therefore, the invention in the group patent G2 can be said to be a new invention to effectively collect the carbon nanotubes and increase the productivity of the synthesis process. Indeed, recent major research on 'Ike Discharge' technology is aimed at mass production and cost reduction.

한편, 특허 네트워크 분석에서 수학식 7로 표현된 Technological Impact Index (TII), 수학식 8로 표현된 Technological Capability Index(TCI) 등의 지표를 활용하여 경쟁사의 관련 분야의 기술적 역량을 파악할 수 있다.Meanwhile, in the patent network analysis, indicators such as the Technological Impact Index (TII) represented by Equation 7 and the Technological Capability Index (TCI) represented by Equation 8 may be used to identify the technical capabilities of competitors in related fields.

Figure 112011058528611-pat00007
Figure 112011058528611-pat00007

Figure 112011058528611-pat00008
Figure 112011058528611-pat00008

전체 특허의 GCI의 평균값과 각 기업별 특허의 GCI의 평균값으로 계산되는 TII는 기업의 관련 특허의 질적 역량을 나타낸다. TII의 값에 기업의 특허 수를 추가한 TCI는 기업의 관련 특허의 질적, 양적 역량을 나타낸다. 도 17은 탄소나노튜브 분야에 대하여 경쟁사의 기술적 역량 파악을 위하여 TII, TCI지표를 분석한 결과이다. 전체적으로 삼성(SAMSUNG), 엘지(LG), 소니(SONY), 넥(NEC) 등의 기업이 탄소나노튜브 분야에서 강한 기술적 역량을 가지고 있는 것으로 나타났다.The TII, which is calculated as the average of the GCI of all patents and the average of the GCI of each company's patents, represents the qualitative capacity of the company's related patents. TCI, which adds the number of patents of a company to the value of TII, represents the qualitative and quantitative capacity of the company's related patents. 17 is a result of analyzing the TII, TCI indicators in order to grasp the technical capabilities of competitors in the field of carbon nanotubes. In total, companies such as Samsung, LG, Sony, and NNE have strong technical capabilities in the field of carbon nanotubes.

특히, ULVAC사는 TII의 값은 낮게 나타났지만, TCI의 값은 두 번째로 높게 나타났다. 실제로 ULVAC사는 디스플레이와 반도체 분야와 관련된 진공 기술 영역의 선두기업 중 하나이다. 지난 10년 동안, '아이크 방전' 관련 기술을 발명하였고, 최근에는 진공막과 박막증착과 같은 진공기술과 관련된 플라즈마 화학증착법 특허를 출원하였다. 따라서 ULVAC 사는 새로운 경쟁자가 될 가능성이 높음을 파악할 수 있다. TII, TCI 등의 지표를 활용하여 R&D 정책 결정자들은 현재상황의 경쟁자들의 역량을 파악할 수 있다. 본 발명을 통해서 사용자들은 현재 경쟁사와 잠재적 경쟁사의 기술적 역량을 분석하는 데 지원할 수 있다.In particular, ULVAC showed the lowest TII value but the second highest TCI value. In fact, ULVAC is one of the leaders in vacuum technology for display and semiconductors. In the last decade, he has invented 'Ike Discharge' related technology and recently applied for a plasma chemical vapor deposition patent related to vacuum technology such as vacuum film and thin film deposition. As a result, ULVAC is likely to be a new competitor. Using indicators such as TII and TCI, R & D policy makers can identify the capabilities of current competitors. The present invention allows users to assist in analyzing the technical capabilities of current competitors and potential competitors.

한편, 사용자가 상기 제시된 특허 네트워크들에 대해 개별적으로 분석한 정보들은 데이터베이스에 저장될 수 있다.On the other hand, information analyzed by the user individually for the patent networks presented above may be stored in a database.

한편, 상술한 바와 같은 본 발명은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체 (씨디롬, 램, 롬, 플로피디스크, 하드 디스크, 광자기 디스크 등)에서 실행될 수 있으며, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 로컬 컴퓨터에서 단독으로 실행되거나 분산 컴퓨팅 환경에서 인터넷 또는 인트라넷을 통한 정보전송을 통해 구현될 수 있다.On the other hand, the present invention as described above can be implemented in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.) implemented as a program, according to an embodiment of the present invention The patent network analysis system using semantic patent similarity according to the present invention may be executed alone on a local computer or implemented through information transmission through the Internet or an intranet in a distributed computing environment.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법은 연구자 또는 R&D 정책 결정자 등의 기술 분야 전문가들이 기술 기획 및 전략을 수립하는 데 유용하게 활용될 수 있다.Patent network analysis system using semantic patent similarity and a patent network analysis method using the same according to an embodiment of the present invention can be useful for technical experts, such as researchers or R & D policy makers to establish technology planning and strategy have.

이상으로 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징을 변경하지 않고 다른 구체적인 형태로 실시할 수 있다는 것을 이해할 수 있을 것이다. 따라서 이상에서 기술한 실시예는 모든 면에서 예시적인 것이며 한정적이 아닌 것이다.
While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It will be understood. The embodiments described above are therefore to be considered in all respects as illustrative and not restrictive.

10 : 특허 네트워크 분석 시스템 100 : 특허 네트워크 생성 서버
110 : 특허문서 수집부 111 : 특허문서 검색부
112 : 특허문서 포맷 변환부 120 : 자연어 처리부
121 : 특허문서 로딩부 122 : SAO 구조 추출부
123 : 불용어 처리부 130 : 유사성 분석부
131 : SAO 구조 로딩부 132 : 유사성 추출부
133 : 유사성 행렬 생성부 140 : 특허 네트워트 생성부
141 : 유사성 행렬 로딩부 142 : 특허 네트워크 정보 생성부
200 : 데이터베이스 300 : 외부 특허 데이터베이스
400 : 클라이언트
10: patent network analysis system 100: patent network generation server
110: patent document collection unit 111: patent document search unit
112: patent document format conversion unit 120: natural language processing unit
121: Patent document loading unit 122: SAO structure extraction unit
123: stopword processing unit 130: similarity analysis unit
131: SAO structure loading unit 132: similarity extraction unit
133: similarity matrix generator 140: patent network generator
141: similarity matrix loading unit 142: patent network information generation unit
200: database 300: external patent database
400: client

Claims (23)

분석대상에 대한 키워드를 클라이언트로부터 전달받아 상기 키워드를 사용하여 외부 특허 데이터베이스에서 특허문서를 검색하여 수집한 후 데이터베이스에 저장하는 특허문서 수집부;
상기 데이터베이스에 저장된 상기 특허문서로부터 SAO 구조들을 추출하는 자연어 처리부;
상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 유사성 행렬을 생성하는 유사성 분석부; 및
상기 유사성 행렬을 사용하여 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성부;
를 포함하는 특허 네트워크 생성 서버를 포함하고,
상기 특허 네트워크 생성부는 상기 유사성 행렬과 상기 유사성 행렬을 구성하는 특허들 간 유사도 값의 컷오프 값(cutoff value)을 이용하여 상기 특허 네트워크를 생성하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
A patent document collection unit which receives a keyword for an analysis target from a client, searches for and collects a patent document from an external patent database using the keyword, and stores the patent document in a database;
A natural language processor extracting SAO structures from the patent document stored in the database;
A similarity analysis unit for extracting semantic sentence similarities between the SAO structures to extract technical similarities between the patent documents, and generating a similarity matrix between the patent documents; And
A patent network generator for generating a patent network and patent network information using the similarity matrix;
It includes a patent network generation server, including;
The patent network generator generates the patent network using the cutoff value of the similarity value between the similarity matrix and the patents constituting the similarity matrix.
삭제delete 제 1 항에 있어서,
상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 1,
The natural language processor extracts the SAO structures from the technical information or the right information of the patent document.
제 1 항에 있어서,
상기 특허문서 수집부는,
상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드 하는 특허문서 검색부; 및
다운로드 된 상기 특허문서를 표준언어로 변환하고 표준언어로 변환된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변환부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 1,
The patent document collection unit,
A patent document search unit for searching the patent documents and downloading the patent documents from the external patent database using the keyword; And
And converting the downloaded patent document into a standard language, and converting the patent document converted into a standard language into a format and storing the converted patent document in the database.
제 1 항에 있어서,
상기 자연어 처리부는,
상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및
미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 1,
The natural language processing unit,
A SAO structure extraction unit for extracting SAO structures from the patent documents; And
And a terminology processing unit for removing the SAO structures including the terminology stored in advance and storing the extracted SAO structure in the database.
제 5 항에 있어서,
상기 자연어 처리부는,
상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 5, wherein
The natural language processing unit,
Patent network analysis system further comprises a patent document loading unit for loading the patent document stored in the database.
제 1 항에 있어서,
상기 유사성 분석부는,
상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및
상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 유사성 행렬 생성부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 1,
The similarity analysis unit,
A similarity extraction unit for extracting semantic sentence similarities between the SAO structures included in the patent documents to extract technical similarities between the patent documents; And
And a similarity matrix generator for generating the similarity matrix of all the pairs of patent documents using the technical similarities between the patent documents, and storing the similarity matrix in the database.
제 7 항에 있어서,
상기 유사성 분석부는,
상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 7, wherein
The similarity analysis unit,
And a SAO structure loading unit for loading the SAO structures in the database.
제 1 항에 있어서,
상기 특허 네트워크 생성부는,
상기 유사성 행렬을 이용하여 상기 특허 네트워크의 타입에 따라서 상기 특허 네트워크 정보 및 특허 네트워크를 생성하고 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 특허 네트워크 정보 생성부를 포함하고,
상기 특허 네트워크의 타입에 따라 상기 특허 네트워크 및 특허 네트워크 정보가 달라지는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 1,
The patent network generation unit,
A patent network information generation unit for generating the patent network information and the patent network according to the type of the patent network using the similarity matrix and storing the patent network and patent network information in the database;
The patent network analysis system, characterized in that the patent network and patent network information varies according to the type of the patent network.
제 9 항에 있어서,
상기 특허 네트워크 생성부는,
상기 데이터베이스에 저장된 상기 유사성 행렬을 로딩하는 유사성 행렬 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
The method of claim 9,
The patent network generation unit,
And a similarity matrix loading unit for loading the similarity matrix stored in the database.
제 1 항, 제 3 항 내지 제 10 항 중 어느 한 항에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법으로서,
(a) 특허 네트워크 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계;
(b) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계;
(c) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하고 상기 특허문서들 간의 유사성을 분석하여 유사성 행렬을 생성하는 단계; 및
(d) 상기 특허 네트워크 생성 서버가 특허 네트워크 및 특허 네트워크 정보를 생성하는 단계를 포함하고,
상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 기반으로 생성되는 것을 특징으로 하는 특허 네트워크 분석 방법.
A patent network analysis method using a patent network analysis system according to any one of claims 1 and 3 to 10,
(a) a patent network generating server collecting and storing patent documents from at least one external patent database;
(b) the patent network generating server extracting the SAO structures from the technical information or the rights information of the patent documents through natural language processing and storing the SAO structures in a database;
(c) the patent network generating server extracting semantic sentence similarity between the SAO structures and analyzing the similarity between the patent documents to generate a similarity matrix; And
(d) the patent network generating server generating a patent network and patent network information,
Wherein the patent network is generated based on the similarity matrix and the cutoff value.
제 11 항에 있어서,
상기 (a) 단계는,
(a-1) 상기 특허 네트워크 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계;
(a-2) 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계;
(a-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및
(a-4) 상기 특허 네트워크 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함하는 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The step (a)
(a-1) the patent network generating server searching the patent documents from the externally accessible external patent database using a keyword to be analyzed through a communication network;
(a-2) downloading the retrieved patent documents by the patent network generation server;
(a-3) the patent network generating server converting the technical information or the rights information of the patent documents into a text file; And
(a-4) the patent network generating server storing the patent documents in the database.
제 12 항에 있어서,
상기 (a) 단계는,
상기 (a-2) 단계와 (a-3) 단계 사이에 상기 특허문서들을 표준언어로 변환하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
13. The method of claim 12,
The step (a)
And converting the patent documents into a standard language between the steps (a-2) and (a-3).
제 12 항에 있어서,
상기 (a) 단계는,
상기 (a-1) 단계 이전에, 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
13. The method of claim 12,
The step (a)
Before the step (a-1), the patent network analysis method further comprises the step of receiving the keyword to be analyzed by the client from the client.
제 12 항에 있어서,
상기 (a) 단계는,
상기 (a-2)와 (a-3) 단계 사이에, 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
13. The method of claim 12,
The step (a)
Between the steps (a-2) and (a-3), the patent network generating server further comprises the step of receiving from the client the patent documents that are not relevant to the analysis of the retrieved patent documents from the client Patented network analysis method.
제 11 항에 있어서,
상기 (b) 단계는,
(b-1) 상기 특허 네트워크 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계;
(b-2) 상기 특허 네트워크 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계;
(b-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및
(b-4) 상기 특허 네트워크 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The step (b)
(b-1) the patent network generating server loading the patent documents stored in the database;
(b-2) receiving, by the patent network generation server, an area to be analyzed in the patent documents;
(b-3) the patent network generating server extracting the SAO structures by grasping the grammatical role of each word included in a sentence through natural language processing analysis on the text of the technical information or the rights information of the patent documents; ; And
(b-4) removing the SAO structures including the stop word predefined by the patent network generating server and storing the SAO structures in the database.
제 16 항에 있어서,
상기 (b) 단계는,
상기 특허 네트워크 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
17. The method of claim 16,
The step (b)
And transmitting, by the patent network generation server, the SAO structure extracted to the client.
제 11 항에 있어서,
상기 (c) 단계는,
(c-1) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계;
(c-2) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계;
(c-3) 상기 특허 네트워크 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계;
(c-4) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 의미론적 유사성을 추출하는 단계; 및
(c-5) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 의미론적 유사성을 사용하여 상기 유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The step (c)
(c-1) the patent network generation server receiving a selected patent document set for analyzing technical similarities between the patent documents and loading the SAO structures of the patent documents from the database;
(c-2) receiving, by the patent network generation server, a threshold for automatically determining whether the SAO structures match;
(c-3) the patent network generating server extracting semantic sentence similarity between the SAO structures included in the patent documents with reference to conceptual relationship information defining a hierarchical structure of upper and lower relations between concepts;
(c-4) extracting semantic similarities between the patent documents after the patent network generating server determines whether the SAO structures match by using semantic sentence similarity between the SAO structures; And
(c-5) the patent network generating server generating the similarity matrix using semantic similarities between the patent documents and storing the similarity matrix in the database.
제 18 항에 있어서,
상기 (c) 단계는,
상기 특허 네트워크 생성 서버가 상기 클라이언트에게 상기 유사성 행열을 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 18,
The step (c)
And transmitting, by the patent network generation server, the similarity matrix to the client.
제 11 항에 있어서,
상기 (d) 단계는,
(d-1) 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 선택된 상기 유사성 행렬을 전달받아 상기 유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계;
(d-2) 상기 특허 네트워크 생성 서버가 컷오프 값을 사용하여 특허 네트워크를 생성하는 단계; 및
(d-3) 상기 특허 네트워크 생성 서버가 상기 유사성 행렬 및 특허의 서지정보를 이용하여 특허 네트워크의 타입에 따른 상기 특허 네트워크 정보를 생성하고, 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The step (d)
(d-1) the patent network generating server receiving the similarity matrix selected from the client and loading the similarity matrix from the database;
(d-2) the patent network generating server generating the patent network using the cutoff value; And
(d-3) the patent network generating server generating the patent network information according to the type of the patent network using the similarity matrix and the bibliographic information of the patent, and storing the patent network and the patent network information in the database. Patent network analysis method comprising a.
제 20 항에 있어서,
상기 (d) 단계는,
상기 특허 네트워크 생성 서버가 상기 특허 네트워크 및 특허 네트워크 정보를 상기 클라이언트에게 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
21. The method of claim 20,
The step (d)
The patent network generation server further comprises the step of delivering the patent network and patent network information to the client.
제 11 항에 있어서,
상기 컷오프 값은 민감도 분석을 통해서 결정되어 미리 저장된 값을 사용하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The cutoff value is determined by a sensitivity analysis, characterized in that for using a pre-stored value.
제 11 항에 있어서,
상기 특허 네트워크 정보는,
DSI, GCI, TII 및 TCI 중 어느 하나 이상의 분석지표를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
The method of claim 11,
The patent network information,
Patent network analysis method comprising the analysis indicator of any one or more of DSI, GCI, TII and TCI.
KR1020110075208A 2011-07-28 2011-07-28 System for patent network analysis using semantic patent similarity and method using the same KR101327514B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110075208A KR101327514B1 (en) 2011-07-28 2011-07-28 System for patent network analysis using semantic patent similarity and method using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110075208A KR101327514B1 (en) 2011-07-28 2011-07-28 System for patent network analysis using semantic patent similarity and method using the same

Publications (2)

Publication Number Publication Date
KR20130013510A KR20130013510A (en) 2013-02-06
KR101327514B1 true KR101327514B1 (en) 2013-11-08

Family

ID=47893951

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110075208A KR101327514B1 (en) 2011-07-28 2011-07-28 System for patent network analysis using semantic patent similarity and method using the same

Country Status (1)

Country Link
KR (1) KR101327514B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160125721A (en) 2015-04-22 2016-11-01 서울시립대학교 산학협력단 System, server and controlling method for matching intellectual property rights

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101691379B1 (en) * 2014-10-07 2016-12-30 동국대학교 산학협력단 Apparatus and method for recommending technical cooperation partner
KR102032258B1 (en) * 2017-07-04 2019-10-15 울산과학기술원 Method for prediction of converging technologies using link analysis
KR102546476B1 (en) * 2017-11-03 2023-06-27 아주대학교 산학협력단 Apparatus and method for extracting technology Information
KR102525888B1 (en) * 2021-04-05 2023-04-25 건국대학교 산학협력단 Apparatus and method for mining competitive inventor group based on patent data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010075026A (en) * 1998-09-09 2001-08-09 윌리엄 지. 바브릭 Document semantic analysis/selection with knowledge creativity capability
KR20100060734A (en) * 2008-11-28 2010-06-07 한국과학기술원 System for visualization of patent information by forming the keyword based semantic network and method therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010075026A (en) * 1998-09-09 2001-08-09 윌리엄 지. 바브릭 Document semantic analysis/selection with knowledge creativity capability
KR20100060734A (en) * 2008-11-28 2010-06-07 한국과학기술원 System for visualization of patent information by forming the keyword based semantic network and method therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160125721A (en) 2015-04-22 2016-11-01 서울시립대학교 산학협력단 System, server and controlling method for matching intellectual property rights

Also Published As

Publication number Publication date
KR20130013510A (en) 2013-02-06

Similar Documents

Publication Publication Date Title
Dillon et al. Uncovering latent jet substructure
JP5338238B2 (en) Automatic ontology generation using word similarity
CN107992481B (en) Regular expression matching method, device and system based on multi-way tree
US20020078044A1 (en) System for automatically classifying documents by category learning using a genetic algorithm and a term cluster and method thereof
KR101327514B1 (en) System for patent network analysis using semantic patent similarity and method using the same
CN106372122B (en) A kind of Document Classification Method and system based on Wiki semantic matches
CN112148359B (en) Distributed code clone detection and search method, system and medium based on subblock filtering
JP2007219929A (en) Sensitivity evaluation system and method
WO2024078141A1 (en) Subject-based document retrieval prediction method
Trokhymovych et al. Wikicheck: An end-to-end open source automatic fact-checking api based on wikipedia
Suanmali et al. Genetic algorithm based sentence extraction for text summarization
JP5324677B2 (en) Similar document search support device and similar document search support program
KR101268503B1 (en) Method and its system for generation of patent maps
Nazemi et al. Comparison of full-text articles and abstracts for visual trend analytics through natural language processing
JP2012221431A (en) Related word extraction device, related word extraction method, and related word extraction program
CN103034657B (en) Documentation summary generates method and apparatus
Rao et al. An efficient semantic ranked keyword search of big data using map reduce
Khan et al. Data citation and reuse practice in biodiversity-challenges of adopting a standard citation model
JP3553543B2 (en) Related word automatic extraction device, multiple important word extraction program, and upper and lower hierarchy relation extraction program for important words
KR102497151B1 (en) Applicant information filling system and method
Tran et al. Simplified effective method for identifying semantic relations from a knowledge graph
Arslan et al. Extracting Business Insights through Dynamic Topic Modeling and NER.
Wu et al. High efficient methods of content-based 3D model retrieval
KR20170067543A (en) A Study on Identifying Potential Technology Demand Using Patent Information and Open-source Text-mining Analysis
Yu et al. A category-driven approach to deriving domain specific subsets of Wikipedia

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee