KR102298397B1 - Citation Relationship Analysis Method and System Based on Citation Type - Google Patents
Citation Relationship Analysis Method and System Based on Citation Type Download PDFInfo
- Publication number
- KR102298397B1 KR102298397B1 KR1020210008524A KR20210008524A KR102298397B1 KR 102298397 B1 KR102298397 B1 KR 102298397B1 KR 1020210008524 A KR1020210008524 A KR 1020210008524A KR 20210008524 A KR20210008524 A KR 20210008524A KR 102298397 B1 KR102298397 B1 KR 102298397B1
- Authority
- KR
- South Korea
- Prior art keywords
- citation
- phrase
- type
- quoted
- cited
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/382—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using citations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
이하의 개시는 논문 등의 학술 자료의 인용 관계를 정확하고 효율적으로 파악할 수 있는 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 관한 것이다. The following disclosure relates to a citation type-based citation relationship analysis method and system that can accurately and efficiently identify the citation relationship of academic materials such as a thesis.
인용은 논문 등 학술 자료에 반드시 포함되어야 하는, 학문 발전 과정에서 매우 중요한 요소이다. 또한, 인류의 연구가 지속되는 과정에서 논문 등 학술 자료 및 학술 자료가 인용하는 피인용 논문의 수는 계속해서 증가하게 된다. Citation is a very important element in the process of academic development, which must be included in academic materials such as thesis. In addition, as human research continues, academic materials such as papers and the number of cited papers cited by academic materials will continue to increase.
이러한 인용의 중요성과 인용에 대한 정보의 증가로 인해, 문헌간 인용 및 피인용 관계에 대한 다양한 분석들이 이루어지고 있다. 예를 들어, 논문에 대한 연구자 또는 논문별 인용 지수나 인용 강도 분석 등이 수행되고 있다.Due to the importance of such citations and the increase in information on citations, various analyzes of citation and citation relationships between documents are being conducted. For example, a citation index or citation strength analysis for each researcher or thesis on the thesis is being performed.
그러나, 이러한 분석 방법들은 인용 및 피인용 관계를 규정함에 있어 논문 등의 내용이 아닌 그 서지 정보에 의해서만 정의되고 있다. 이 경우, 인용 목적이나 인용으로 인해 파생되는 분석 결과를 제공할 수 없다. However, these analysis methods are defined only by the bibliographic information, not the content of the thesis, in defining the relationship between citation and citation. In this case, the purpose of citation or analysis results derived from citation cannot be provided.
이하의 개시를 통해 논문 등 학술 자료에서의 인용 관계의 실질적 의미를 정확하게 분석하여 제공할 수 있는 인용 유형 기반의 인용 관계 분석 방법 및 시스템을 제공하고자 한다. Through the following disclosure, it is intended to provide a citation type-based citation relationship analysis method and system that can accurately analyze and provide the actual meaning of a citation relationship in academic materials such as a thesis.
상기 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법은, 인용 논문으로부터 인용 구문을 추출하는 단계; 상기 인용 구문이 인용하는 피인용 논문을 특정하는 단계; 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 단계; 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하는 단계; 및 상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 인용 관계를 설정하는 단계;를 포함한다. A citation type-based citation relationship analysis method according to an embodiment of the present invention for solving the above technical problem comprises the steps of extracting a citation phrase from a citation thesis; specifying the cited article cited by the citation phrase; extracting a citation phrase corresponding to the citation phrase from the cited article; classifying a citation type for the quoted phrase of the quoted phrase; and setting a citation relationship between the quoted phrase and the quoted phrase based on the quoted type.
상기 기술적 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법은, 인용 논문의 각 인용 구문 및 상기 각 인용 구문에 대응되는 각 피인용 구문을 매칭시키는 단계; 상기 각 피인용 구문에 대한 인용 유형을 분류하는 단계; 및 상기 각 피인용 구문에 대한 인용 유형에 기반하여 상기 각 피인용 구문이 포함된 피인용 논문의 인용 특성을 결정하는 단계를 포함한다. A citation type-based citation relationship analysis method according to another embodiment of the present invention for solving the above technical problem includes matching each citation phrase of a citation article and each citation phrase corresponding to each citation phrase; classifying a citation type for each citation phrase; and determining a citation characteristic of a citation article including each of the citation phrases based on a citation type for each of the citation phrases.
상기 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 시스템은, 인용 논문에서 인용 구문을 추출하는 인용 구문 추출부; 상기 인용 구문 추출부로부터 수신된 상기 인용 구문에 근거하여 피인용 논문을 검색하여 특정하는 피인용 논문 특정부; 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 피인용 구문 추출부; 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하여 인용 유형 정보를 생성하는 인용 유형 정보 생성부; 및 상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 관계에 대한 인용 관계 정보를 생성하는 인용 관계 정보 생성부;를 포함한다.A citation type-based citation relationship analysis system according to an embodiment of the present invention for solving the above technical problem includes: a citation phrase extraction unit for extracting a citation phrase from a citation thesis; a cited article specifying unit for searching and specifying a cited article based on the cited phrase received from the cited phrase extracting unit; a quoted phrase extraction unit for extracting a quoted phrase corresponding to the quoted phrase from the cited article; a citation type information generation unit for generating citation type information by classifying citation types of the citation phrases of the citation phrases; and a citation relationship information generator configured to generate citation relationship information on a relationship between the quoted phrase and the quoted phrase based on the citation type.
이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문과 피인용 구문의 인용 유형을 분류함으로써 인용 관계, 즉 인용의 목적을 실질적으로 파악할 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, the citation relationship, that is, the purpose of the citation, can be substantially grasped by classifying the citation types of the quoted phrases and the quoted phrases.
이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 피인용 논문의 인용 목적 및 용도를 실질적으로 파악함으로써 피인용 논문의 중요도 또는 활용도를 분석하는데 정확성 및 효율성을 높일 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, accuracy and efficiency are improved in analyzing the importance or utilization of the cited thesis by substantially identifying the citation purpose and use of the citation thesis. can be raised
이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 피인용 논문을 파악함에 있어 그 정확성 및 효율성을 높여 연구자의 연구 및 관련 학문 분야의 발전에 도움을 줄 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, the accuracy and efficiency of identifying citation papers can be increased, thereby helping researchers to develop research and related academic fields. have.
이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 자연어 처리 및 피인용 구문 검색의 정확성 및 효율성을 높임으로써 시스템 리소스 사용을 최적화할 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, it is possible to optimize the use of system resources by increasing the accuracy and efficiency of natural language processing of citation phrases and citation phrase search.
도 1은 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법을 나타내는 순서도이다.
도 2는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 시스템을 나타내는 블록도이다.
도 3은 본 발명의 실시예에 따른 피인용 구문 추출부를 나타내는 블록도이다.
도 4는 본 발명의 실시예에 따른 인용 구문 및 피인용 구문의 매칭 결과를 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.
도 6은 본 발명의 실시예에 따른 인용 유형 분류를 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.
도 8은 본 발명의 실시예에 따른 인용 관계 정보를 나타내는 도면이다.
도 9는 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이다. 1 is a flowchart illustrating a method for analyzing a citation relationship based on a citation type according to an embodiment of the present invention.
2 is a block diagram illustrating a citation relationship analysis system based on a citation type according to an embodiment of the present invention.
3 is a block diagram illustrating a citation phrase extracting unit according to an embodiment of the present invention.
4 is a diagram illustrating a result of matching a quoted phrase and a quoted phrase according to an embodiment of the present invention.
5 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
6 is a diagram illustrating a citation type classification according to an embodiment of the present invention.
7 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
8 is a diagram illustrating citation relation information according to an embodiment of the present invention.
9 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention.
이하 도면을 참고하여, 본 발명의 실시예에 대해 자세히 설명함으로써, 본 발명이 속하는 기술분야 통상의 기술자가 쉽게 실시할 수 있게 한다. 본 발명은 다양한 다른 형태로 실현될 수 있는 것으로, 여기서 설명되는 실시예에 한정되지 않는다. 도면 중의 본 발명을 명확하게 설명하기 위해, 설명과 무관한 부분은 생략하고, 설명서 전체에서, 동일하거나 유사한 구조 요소에 대해 동일한 도면 부호를 부가한다. With reference to the drawings below, by describing the embodiments of the present invention in detail, those skilled in the art to which the present invention pertains can easily practice. The present invention may be embodied in various other forms, and is not limited to the embodiments described herein. In order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and the same reference numerals are assigned to the same or similar structural elements throughout the description.
도 1은 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이고, 도 2는 본 발명의 실시예에 따른 인용 관계 분석 시스템을 나타내는 블록도이다. 1 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention, and FIG. 2 is a block diagram illustrating a citation relationship analysis system according to an embodiment of the present invention.
도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 인용 관계 분석 방법(100)은 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)에서 실행될 수 있고, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 본 발명의 실시예에 따른 인용 관계 분석 방법(100)으로 동작할 수 있다. 다만, 이에 한정되는 것은 아니다. 본 발명의 실시예에 따른 인용 관계 분석 방법(100) 및 인용 관계 분석 시스템(200)은 각각 다른 시스템에서 실행되거나 다른 방법으로 동작할 수도 있다. 이하에서는 설명의 편의를 위해 본 발명의 실시예에 따른 인용 관계 분석 방법(100)이 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)에서 실행되고, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)이 본 발명의 실시예에 따른 인용 관계 분석 방법(100)으로 동작하는 예에 한하여 기술한다. 1 and 2, the citation
본 발명의 실시예에 따른 인용 관계 분석 방법(100)은 인용 논문(QPPR)에서 인용 구문(QSYN)을 추출하는 단계(S110), 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)을 특정하는 단계(S120), 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출하는 단계(S130), 인용 구문(QSYN)의 피인용 구문(CSYN)에 대한 인용 유형을 분류하는 단계(S140) 및 인용 유형에 근거하여 인용 구문(QSYN)과 피인용 구문(CSYN)의 관계를 설정하는 단계(S150)를 포함한다. Citation
본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 인용 구문 추출부(210), 피인용 논문 특정부(220), 피인용 구문 추출부(230), 인용 유형 정보 생성부(240) 및 인용 관계 정보 생성부(250)를 포함하여 본 발명의 실시예에 따른 인용 관계 분석 방법(100)을 실행할 수 있다. 그밖에, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 데이터 또는 정보의 입출력, 처리, 저장 및 네트워킹 등 시스템의 동작에 일반적으로 요구되는 입출력 인터페이서, 프로세서, 저장 장치 및 통신 장치 등을 포함할 수 있고, 그에 대한 도시는 설명의 편의를 위해 생략될 수 있다. Citation
인용 논문(QPPR)으로부터 인용 구문(QSYN)을 추출하는 단계(S110)는 인용 구문 추출부(210)에 의해 수행될 수 있다. 인용 구문 추출부(210)는 인용 관계 분석 시스템(200)의 입출력 인터페이스(미도시)를 통해 외부로부터 인용 논문(QPPR)을 수신할 수 있다. 예를 들어, 인용 논문(QPPR)은 직접 인용 구문 추출부(210)로 전송되거나 해당 논문을 개시하고 있는 사이트의 링크 정보로 인용 구문 추출부(210)에 전송될 수 있다. 또는 인용 논문(QPPR)은 인용 관계 분석 시스템(200)과 직접 또는 네트워크로 연결되는 논문 데이터베이스(PPDB)로부터 수신되거나, 인용 관계 분석 시스템(200)에 구비되는 저장 장치(미도시)로부터 수신될 수도 있다. 이때, 논문 데이터베이스(PPDB)는 인용 관계 분석 시스템(200)에 포함되거나 인용 관계 분석 시스템(200)과 독립적으로 구비될 수 있다. 인용 논문(QPPR)을 수신하여 인용 구문(QSYN)을 추출할 수 있다. 본 발명의 실시예에 따른 인용 구문(QSYN)은 인용 논문(QPPR) 이외의 학술 자료, 예를 들어, 도서, 기사, 판례, 보고서, 및 소셜미디어 게시글 등으로부터 추출될 수도 있다. 인용 논문(QPPR)은 그에 대한 서지 정보(인용 논문 정보(QINF))를 포함할 수 있다. Extracting the quoted phrase (QSYN) from the cited article (QPPR) ( S110 ) may be performed by the quoted
인용 구문 추출부(210)는 입력된 인용 논문(QPPR)을 탐색하여 기 설정된 인용 패턴에 대응되는 식별자를 포함하는 구문을 논문을 인용하고 있는 인용 구문(QSYN)으로 추출할 수 있다. 예를 들어, 인용 논문(QPPR)의 임의의 구문에서 참고문헌의 인용을 나타내는 “[]” 등의 문장 부호 내의 숫자 표시나 각주 등을 추출할 수 있다. 또는 인용 논문(QPPR)의 임의의 구문에서 “( )” 내의 “,”를 기준으로 “(홍길동 외, 2020)”과 같이 저자명 및 연도가 분리되어 함께 기재된 표현을 추출할 수도 있다. The citation
이렇게 추출된 식별자에 대응되는 참고문헌 또는 각주의 내용 중 피인용 논문(CPPR)을 나타내는 표현을 탐색할 수 있다. 예를 들어, 해당 참고문헌 또는 각주에 대한 기재 중 “,” 등의 문장 부호로 분리되는 저자명, 논문명, 학술지명 및 발행년도 등을 기재를 확인함으로써 해당 구문이 인용하는 것이 논문인지 식별할 수 있다. 또는 해당 참고문헌 또는 각주에 대한 기재 중 출판사명, 언론사명 또는 초판, 제2판 등의 판차 사항이 포함되는 경우는 해당 구문이 인용하고 있는 것이 논문이 아닌 것으로 식별할 수 있다. It is possible to search for the expression representing the cited article (CPPR) among the contents of the reference or footnote corresponding to the extracted identifier. For example, by checking the description of the author's name, thesis name, journal name, and publication year, which are separated by punctuation marks such as ",", among the references or footnotes, it is possible to identify whether the article is citing the phrase. . Alternatively, if the name of the publisher, press company, or edition difference such as the first or second edition is included in the description of the reference or footnote, it can be identified that the phrase cited by the phrase is not a thesis.
인용 구문 추출부(210)는 상기의 방법으로 논문을 인용하고 있는 구문을 인용 구문(QSYN)으로 추출하여 출력하고, 그 과정에서 확인된 저자명, 논문명, 학술지명 및 발행년도 등에 대한 정보를 피인용 논문(CPPR)에 대한 피인용 논문 정보(CINF)로 출력한다. The citation
피인용 논문(CPPR)을 특정하는 단계(S120)는 피인용 논문 특정부(220)에 의해 수행될 수 있다. 피인용 논문 특정부(220)는 인용 구문 추출부(210)로부터 수신된 피인용 논문 정보(CINF)에 근거하여 피인용 논문(CPPR)을 획득한다. 예를 들어, 피인용 논문 특정부(220)는 피인용 논문 정보(CINF)를 이용하여 논문 데이터베이스(PPDB)를 검색함으로써 피인용 논문(CPPR)을 획득한다. The step (S120) of specifying the cited article (CPPR) may be performed by the cited
이때, 인용 구문 추출부(210)로부터 수신된 피인용 논문 정보(CINF)가 논문 데이터베이스(PPDB)에서 피인용 논문(CPPR)을 검색하는데 충분하지 않은 경우, 예를 들어, 피인용 논문 정보(CINF)에 논문명이 부재하거나 부정확하여 동일 저자가 동일한 해에 발표한 논문이 다수 검색되거나, 피인용 논문 정보(CINF)에 저자명이 부재하거나 부정확하여 동일 논문명의 논문이 다수 검색되는 경우, 피인용 논문 특정부(220)는 인용 구문 추출부(210)에 추가 정보를 요청하거나, 인터넷 등의 네트워크나 다른 데이터베이스에 대한 검색을 통해 상에서 피인용 논문 정보(CINF)의 완결성을 높일 수 있다. 예를 들어, 피인용 논문 특정부(220)는 인용 구문 추출부(210)에 인용 구문(QSYN)을 수신하여 인용 구문(QSYN)의 내용을 나타내는 키워드를 추출하고, 기 수신된 피인용 논문 정보(CINF)와 해당 키워드를 통해 인터넷 등을 검색하여 누락된 정보를 보충할 수 있다. At this time, when the cited thesis information CINF received from the citation
피인용 구문을 추출하는 단계(S130)는 피인용 구문 추출부(230)에 의해 수행될 수 있다. 피인용 구문 추출부(230)는 인용 구문 추출부(210)로부터 인용 구문(QSYN)을 수신하고 피인용 논문 특정부(220)로부터 피인용 논문(CPPR)을 수신하여, 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출한다. The step of extracting the quoted phrase ( S130 ) may be performed by the quoted
도 3은 본 발명의 실시예에 따른 피인용 구문 추출부를 나타내는 블록도이다.3 is a block diagram illustrating a citation phrase extracting unit according to an embodiment of the present invention.
도 2 및 도 3을 참조하면, 피인용 구문 추출부(230)은 구문 비교 모듈(232), 비교 결과 처리 모듈(234) 및 피인용 구문 선택 모듈(236)을 포함할 수 있다. 2 and 3 , the citation
구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문 단위로 인용 구문(QSYN)과의 비교를 수행할 수 있다. 이때, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 순차적으로 비교하거나 랜덤하게 비교할 수 있다. 또는, 구문 비교 모듈(232)은 인용 구문(QSYN)의 전체 내용으로 피인용 논문(CPPR)의 각 구문과 비교하거나 인용 구문(QSYN) 중 선택된 용어 등에 한정하여 비교를 수행할 수 있다. The
구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 비교한 결과를 생성할 수 있다. 예를 들어, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)의 텍스트상의 유사도 내지 중복도를 “%”나 지수 등으로 나타낼 수 있다. 또는, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)의 의미 상의 관련도를 “%”나 지수 등으로 나타낼 수 있다. 예를 들어, 인용 구문(QSYN)에 “통계”라는 단어가 포함되고 피인용 논문(CPPR)의 구문상에 “조사” 또는 “설문” 등의 단어가 포함된 경우, 텍스트는 다르나 그 의미상의 관련성이 인정될 수 있다The
비교 결과 처리 모듈(234)은 구문 비교 모듈(232)이 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 비교한 결과를 저장하고 그 유사도 내지 중복도 또는 관련도가 높은 순서대로 정렬할 수 있다. 이때, 비교 결과 처리 모듈(234)은 피인용 논문(CPPR)의 각 구문에 대한 비교 결과를 실시간으로 정렬하거나 피인용 논문(CPPR)의 모든 구문에 대한 비교 결과가 도출된 후에 일괄적으로 정렬할 수 있다. 전자의 경우 비교 결과 처리 모듈(234)은 구문 비교 모듈(232)로부터 수신된 피인용 논문(CPPR)의 임의의 구문에 대한 비교 결과가 기준값 이상인 경우, 예를 들어 그 유사도 내지 중복도 또는 관련도가 70% 이상인 경우, 구문 비교 모듈(232)에게 비교 수행을 중지할 것을 지시할 수 있다. The comparison
피인용 구문 선택 모듈(236)은 비교 결과 처리 모듈(234)의 처리 결과에 근거하여 인용 구문(QSYN)과 가장 높은 유사도 내지 중복도 또는 관련도를 갖는 피인용 논문(CPPR)의 구문을 피인용 구문(CSYN)으로 선택하여 출력할 수 있다. 예를 들어, 본 발명의 실시예에 따른 인용 구문 및 피인용 구문의 매칭 결과를 나타내는 도 4와 같이, 인용 논문(QPPR)의 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)이 추출될 수 있다. The citation phrase selection module 236 cites the syntax of the cited article (CPPR) having the highest degree of similarity, overlap or relevance to the cited phrase (QSYN) based on the processing result of the comparison
다시 도 1 및 도 2를 참조하면, 인용 유형을 분류하는 단계(S140)는 인용 유형 정보 생성부(240)에 의해 수행될 수 있다. 인용 유형 정보 생성부(240)는 인용 구문(QSYN)을 기 정의된 인용 유형 중 하나로 분류한다. Referring back to FIGS. 1 and 2 , the step of classifying the citation type ( S140 ) may be performed by the citation type
도 5는 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.5 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
도 2 및 도 5를 참조하면, 인용 유형 정보 생성부(240)는 자연어 처리 모듈(242) 및 인용 유형 매칭 모듈(246)을 포함할 수 있다. 자연어 처리 모듈(242)은 인용 구문(QSYN)에 대한 자연어 처리를 수행하여 인용 구문(QSYN)의 의미를 분석할 수 있다. 이때, 자연어 처리 모듈(242)은 인용 구문(QSYN)에 대해 적어도 하나의 레벨 이상의 자연어 처리 분석기를 포함할 수 있다. 도 5와 같이 3개의 레벨에 대한 분석기(ALZ1~ALZ3)를 포함하는 경우, 제1 레벨 분석기(ALZ1)는 형태소 분석(morphological analysis)을, 제2 레벨 분석기(ALZ2)는 구문 분석(syntax analysis)을, 제3 레벨 분석기(ALZ3)는 의미 분석(semantic analysis)을 수행할 수 있다. 즉, 제1 레벨 분석기(ALZ1)는 인용 구문(QSYN)의 형태소 애매성(morphological ambiguity)를 해결하여 형태소를 판별하고, 제2 레벨 분석기(ALZ2)는 형태소의 문장 성분을 판별하여 구문 트리 또는 파스 트리(parser)를 형성하며, 제3 레벨 분석기(ALZ3)는 형태소의 실제 의미를 파악하는 동작을 수행할 수 있다. 2 and 5 , the citation
다만, 이에 한정되는 것은 아니다. 본 발명의 실시예에 따른 자연어 처리 모듈(242)은 인용 구문(QSYN)의 분석에 요구되는 정확도에 따라 구비하는 분석기의 개수 및 레벨을 달리 할 수 있다. 예를 들어, 자연어 처리 모듈(242)은 제1 레벨 분석기(ALZ1) 및 제2 레벨 분석기(ALZ2) 만을 구비하거나, 화용 분석(pragmatic analysis)을 수행하는 제4 레벨 분석기(미도시)를 더 구비할 수 있다. 또한, 본 발명의 실시예에 따른 자연어 처리 모듈(242)은 상기의 분석 기술 이외의 기술들을 추가적으로 적용할 수 있다. 예를 들어, 자연어 처리 시 사전 학습 모델(Pre-Trained Model)이나 합성곱 신경망(Convolution Neural Network) 등의 기술이 적용될 수 있다. However, the present invention is not limited thereto. The natural
자연어 처리 모듈(242)은 상기의 방식으로 동작하여, 예를 들어, “A는 B로 실험하였다” 또는 “C에 대해 D하는 연구를 시도하였다” 등과 같이 자연어 처리된 인용 구문(QSYN')을 출력하게 된다. The natural
인용 유형 매칭 모듈(246)은 자연어 처리된 인용 구문(QSYN')의 인용 내용 또는 인용 목적에 따라 사전 정의된 인용의 유형으로 분류할 수 있다. 이를 위해 인용 유형 매칭 모듈(246)은 매칭 스토리지(MSTG) 및 인용 유형 선택기(CSLT)를 포함할 수 있다. 매칭 스토리지(MSTG)는 사전 정의된 인용 유형에 대한 정보를 저장할 수 있다. 인용 유형 선택기(CSLT)는 자연어 처리된 인용 구문(QSYN')의 인용 내용 또는 인용 목적에 대응되는 인용 유형을 매칭 스토리지(MSTG)로부터 검색하고 선택하여 인용 유형 정보(CTYP)로 출력할 수 있다. The citation
도 6은 본 발명의 실시예에 따른 인용 유형 분류를 나타내는 도면이다. 6 is a diagram illustrating a citation type classification according to an embodiment of the present invention.
도 5 및 도 6을 참조하면, 본 발명의 실시예에 따른 매칭 스토리지(MSTG)에 저장된 인용 유형은, “용어”, “수식”, “정의”, “특징”, “연구를 통한 사실” 및 “방법론 적용을 통한 사실” 등으로 정의될 수 있다. 인용 유형 선택기(CSLT)는 자연어 처리된 인용 구문(QSYN')의 인용 목적이 용어 자체에 대한 참조인 경우 인용 유형 정보(CTYP)를 “용어”에 대한 것으로, 수식이나 구성 요소 등을 참고하는 경우 “수식”에 대한 것으로, 인용 문구 내 용어의 정의를 참조하는 경우 “정의”에 대한 것으로, 알고리즘이나 구조에 대한 설명인 경우 “특징”에 대한 것으로 출력할 수 있다. 5 and 6 , the citation types stored in the matching storage (MSTG) according to an embodiment of the present invention are “terms”, “formulas”, “definitions”, “features”, “facts through research” and It can be defined as “fact through application of methodology”, etc. The Citation Type Selector (CSLT) uses the citation type information (CTYP) for “terms” when the citation purpose of the Natural Language Processed Quotation Phrases (QSYN') is to refer to the term itself, and when referencing formulas or components, etc. It can be output for “formula”, for “definition” when referring to the definition of a term in a quoted phrase, and for “feature” when it is a description of an algorithm or structure.
또는, 인용 유형 선택기(CSLT)는, 자연어 처리된 인용 구문(QSYN')이 전술된 예의 “A는 B로 실험하였다” 등과 같은 경우, 즉 그 인용 목적이 관련 연구나 사례를 참조하는 경우 인용 유형 정보(CTYP)를 “연구를 통한 사실”에 대한 것으로 출력할 수 있다. 또는, 인용 유형 선택기(CSLT)는, 자연어 처리된 인용 구문(QSYN')이 전술된 예의 또는 “C에 대해 D하는 연구를 시도하였다” 등과 같은 경우, 즉 그 인용 목적이 관련 방법론이나 적용 분야를 사례를 참조하는 경우 인용 유형 정보(CTYP)를 “방법론 적용을 통한 사실”에 대한 것으로 출력할 수 있다.Alternatively, the citation type selector (CSLT) selects the citation type when the natural language processed citation phrase (QSYN') is such as “A experimented with B” in the above example, that is, when the citation purpose refers to a related study or case. Information (CTYP) can be output as about “facts from research”. Alternatively, the citation type selector (CSLT) can be used when the natural language processed citation phrase (QSYN') is such as the above example or “A study was attempted for D for C”, i.e., the purpose of the citation is to determine the relevant methodology or field of application. When referring to a case, the Citation Type Information (CTYP) can be output as for “facts through application of methodology”.
인용 구문과 피인용 구문의 관계를 설정하는 단계(S150)는 인용 관계 정보 생성부(250)에 의해 수행될 수 있다. Setting the relationship between the quoted phrase and the quoted phrase ( S150 ) may be performed by the citation relationship
도 7은 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.7 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
도 7을 참조하면, 본 발명의 실시예에 따른 인용 유형 정보 생성부(240)는 도 5의 인용 유형 정보 생성부(240)와 동일하거나 유사한 동작을 수행하는 자연어 처리 모듈(242) 및 인용 유형 매칭 모듈(246)을 포함하고, 나아가 인용 유형 생성 모듈(246)을 더 포함한다. 인용 유형 생성 모듈(246)은 자연어 처리된 인용 구문(QSYN')를 수신하여 인용 유형 매칭 모듈(246)에서 사전 정의하고 있는 인용 유형으로 분류되기 어려운 경우, 그에 대응되는 새로운 인용 유형을 생성하거나, 사전 정의된 인용 유형을 세분화할 수 있다. 예를 들어, 자연어 처리된 인용 구문(QSYN')이 인용하는 내용에 대한 평가를 목적으로 하는 경우, 인용 유형 생성 모듈(246)은 “평가”를 인용 유형으로 새로이 생성할 수 있다. Referring to FIG. 7 , the citation type
인용 유형 생성 모듈(246)은 새로이 생성된 인용 유형 또는 세분화한 인용 유형에 대한 사항을 업데이트 정보(IUPT)로 인용 유형 매칭 모듈(246)에 전달할 수 있다. The citation
이상에서는 인용 유형 정보 생성부(240)가 자연어 처리를 통해 인용 구문(QSYN)의 의미를 분석하하여 인용 유형을 분류하는 예에 한하여 기술하였으나, 이에 한정되는 것은 아니다. 예를 들어, 본 발명의 실시예에 따른 인용 유형 정보 생성부(240)은 인용 구문(QSYN)으로부터 키 데이터(key data)를 추출하고 이를 매칭 스토리지(MSTG)에 저장된 인용 유형과 매칭시키는 방식으로 인용 관계 정보(RINF)를 생성할 수도 있다. In the above description, only an example in which the citation type
다시 도 1 및 도 2를 참조하면, 인용 구문과 피인용 구문의 관계를 설정하는 단계(S150)은 인용 관계 정보 생성부(250)에서 수행될 수 있다. Referring back to FIGS. 1 and 2 , the step of setting the relationship between the quoted phrase and the quoted phrase ( S150 ) may be performed by the citation relationship
도 8은 본 발명의 실시예에 따른 인용 관계 정보를 나타내는 도면이다. 8 is a diagram illustrating citation relation information according to an embodiment of the present invention.
도 2 및 도 8을 참조하면, 인용 관계 정보 생성부(250)는 인용 구문(QSYN), 피인용 구문(CSYN), 인용 논문 정보(QINF), 피인용 논문 정보(CINF), 인용 유형 정보(CTYP) 등을 결합하여, 인용 구문(QSYN) 및 피인용 구문(CSYN)에 대한 인용 관계 정보(RINF)를 생성할 수 있다. 또한, 인용 관계 정보(RINF)는 인용 구문(QSYN) 및 피인용 구문(CSYN)의 동일성 여부 등에 대한 정보도 더 포함할 수 있다. 2 and 8 , the citation relationship
도 9는 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이다. 9 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention.
도 1, 도 2 및 도 9를 참조하면, 본 발명의 실시예에 따른 인용 관계 분석 방법(100)은, 도 1의 인용 관계 분석 방법(100)과 마찬가지로 인용 논문(QPPR)에서 인용 구문(QSYN)을 추출하는 단계(S110), 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)을 특정하는 단계(S120), 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출하는 단계(S130), 인용 구문(QSYN)의 피인용 구문(CSYN)에 대한 인용 유형을 분류하는 단계(S140) 및 인용 유형에 근거하여 인용 구문(QSYN)과 피인용 구문(CSYN)의 관계를 설정하는 단계(S150)를 포함한다. 1, 2 and 9 , the citation
다만, 도 9의 인용 관계 분석 방법(100)은 도 1의 인용 관계 분석 방법(100)에서 인용 구문(QSYN)을 추출하는 단계(S110) 및 피인용 구문(CSYN)을 추출하는 단계(S130)가 그 식별 및 추출 단계를 세분화될 수 있고, 피인용 구문(CSYN)을 추출하는 단계(S130) 및 인용 유형을 분류하는 단계(S140)가 서로 병행하여 수행될 수도 있음을 명확히 하였다. However, the citation
나아가, 도 9의 인용 관계 분석 방법(100)은 도 1의 인용 관계 분석 방법(100)에서 인용 구문(QSYN)의 정규화(S160) 및/또는 피인용 구문(CSYN)의 정규화(S170)가 추가적으로 수행될 수 있고, 인용 관계 정보(RINF)가 데이터베이스로 구축(S180)될 수 있음을 명확히 하였다.Furthermore, in the citation
인용 구문(QSYN) 및 피인용 구문(CSYN)의 정규화(S160, S170)는, 예를 들어, 인용 구문(QSYN) 및 피인용 구문(CSYN)에서 문장 부호나 불필요한 형용사와 같은 표현을 제거하거나, 구문의 길이가 기준값 이상인 경우 임의의 부분을 삭제하는 등의 과정을 통해 수행될 수 있다. 임의의 부분은 구문의 앞에서부터 기준값(예를 들어 100자) 이후의 부분일 수 있다. 인용 구문(QSYN) 및 피인용 구문(CSYN)의 정규화(S160, S170)를 통해 인용 유형 정보(CTYP) 및/또는 인용 관계 정보(RINF)를 정확하고 효율적으로 생성할 수 있다. 정규화된 인용 구문(QSYN)에 의하여 피인용 구문(CSYN)의 추출(S130)도 정확하고 효율적으로 수행될 수 있다. Normalization (S160, S170) of the quoted phrase (QSYN) and the quoted phrase (CSYN) removes expressions such as punctuation marks or unnecessary adjectives from, for example, the quoted phrase (QSYN) and the quoted phrase (CSYN), When the length of the sentence is greater than or equal to the reference value, it may be performed through a process such as deleting an arbitrary part. The arbitrary part may be a part after the reference value (for example, 100 characters) from the front of the phrase. Quotation type information (CTYP) and/or citation relationship information (RINF) can be accurately and efficiently generated through normalization ( S160 and S170 ) of the quoted phrase (QSYN) and the quoted phrase (CSYN). Extraction (S130) of the quoted phrase (CSYN) by the normalized quoted phrase (QSYN) can also be performed accurately and efficiently.
인용 유형 정보(CTYP)를 포함한 인용 구문(QSYN) 및 피인용 구문(CSYN)의 인용 관계 정보(RINF)에 대한 인용 관계 데이터베이스(미도시)는 인용 관계 분석 시스템(200)의 내부에 구비되거나 네트워크 등을 통해 인용 관계 분석 시스템(200)의 외부에 구비될 수 있다. 이때, 인용 관계 분석 시스템(200)은 인용 관계 정보(RINF)를 인용 관계 데이터베이스로 구축하는 인용 관계 데이터베이스 구축부(미도시)를 포함할 수 있다. A citation relation database (not shown) for citation relation information (RINF) of citation syntax (QSYN) and citation syntax (CSYN) including citation type information (CTYP) is provided in the citation
인용 유형 정보(CTYP) 기반의 구문 단위의 인용 관계 정보(RINF)는 데이터베이스화됨에 있어, 피인용 논문(CPPR)의 각 피인용 구문(CSYN)에 대한 인용 유형 정보(CTYP)를 취합하여 해당 피인용 논문(CPPR)에 대한 인용 특성에 대한 정보가 포함될 수 있다. 나아가 평가, 해당 피인용 논문(CPPR)에 대한 인용 특성에 근거하여 피인용 논문(CPPR)의 중요도 또는 활용도 등이 산출되어 평가될 수 있다. 피인용 논문(CPPR)의 인용 특성 또는 평가 결과 등도 데이터베이스화될 수 있다. Citation type information (CTYP)-based citation relationship information (RINF) in units of syntax is databased, so the citation type information (CTYP) for each citation phrase (CSYN) of the cited article (CPPR) is collected and the corresponding citation type information (CTYP) is collected. Information about the citation characteristics of the cited article (CPPR) may be included. Furthermore, based on the evaluation and the citation characteristics of the cited article (CPPR), the importance or utilization of the cited article (CPPR) may be calculated and evaluated. Citation characteristics or evaluation results of the cited articles (CPPR) may also be databased.
이렇듯, 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 유형을 분류함으로써 인용 관계, 즉 피인용 논문 또는 피인용 논문의 인용 목적 및 용도를 실질적으로 파악할 수 있고, 이를 통해 피인용 논문의 중요도 또는 활용도를 분석하는데 정확성 및 효율성을 높일 수 있다. 또한, 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 자연어 처리 및 피인용 구문 검색의 정확성 및 효율성을 높임으로써 시스템 리소스 사용을 최적화할 수 있다. As such, according to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention, the citation relationship, that is, the citation purpose and use of the cited thesis or citation thesis, can be substantially grasped by classifying the type of citation phrase. , it is possible to increase the accuracy and efficiency in analyzing the importance or utilization of the cited papers. In addition, according to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention, it is possible to optimize the use of system resources by increasing the accuracy and efficiency of natural language processing of citation phrases and retrieval of citation phrases.
이상에서 본 발명의 실시예에 대해 설명하였으나, 본 발명의 기술적 사상은 이상의 설명 중에 개시된 실시예에 한정되는 것은 아니고, 본 발명의 기술적 사상을 이해하는 통상의 기술자는 동일한 기술적 사상의 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등을 통해, 용이하게 다른 실시예를 도출할 수 있고, 이는 또한 본 발명의 기술적 사상에 포함된다. Although the embodiments of the present invention have been described above, the technical spirit of the present invention is not limited to the embodiments disclosed during the above description, and those of ordinary skill in the art understanding the technical spirit of the present invention within the scope of the same technical spirit, Other embodiments can be easily derived by adding, changing, deleting, or adding components, and this is also included in the technical spirit of the present invention.
100: 인용 관계 분석 시스템 방법 200: 인용 관계 분석 시스템
210: 인용 구문 추출부 220: 피인용 논문 특정부
230: 피인용 구문 추출부 240: 인용 유형 정보 생성부
250: 인용 관계 정보 생성부 QPPR: 인용 논문
CPPR: 피인용 논문 QINF: 인용 논문 정보
CINF: 피인용 논문 정보 QSYN: 인용 구문
CSYN: 피인용 구문 CTYP: 인용 유형 정보
RINF: 인용 관계 정보100: citation relation analysis system method 200: citation relation analysis system
210: citation phrase extraction unit 220: cited article specific portion
230: citation phrase extraction unit 240: citation type information generation unit
250: Citation relationship information generating unit QPPR: Citation papers
CPPR: Cited Articles QINF: Cited Articles Information
CINF: Cited article information QSYN: Citation syntax
CSYN: Quotation Syntax CTYP: Citation Type Information
RINF: Citation Relationship Information
Claims (15)
상기 인용 구문이 인용하는 피인용 논문을 특정하는 단계;
상기 인용 구문과의 유사도, 중복도 또는 관련도에 근거하여 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 단계;
상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하는 단계; 및
상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 인용 관계를 설정하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.extracting a quoted phrase from the cited article;
specifying the cited article cited by the citation phrase;
extracting a quoted phrase corresponding to the cited phrase from the cited article based on the degree of similarity, overlap, or relevance with the cited phrase;
classifying a citation type for the quoted phrase of the quoted phrase; and
A citation type-based citation relationship analysis method comprising a; setting a citation relationship between the citation phrase and the citation phrase based on the citation type.
상기 인용 구문과 상기 피인용 논문의 각 구문을 비교하여 각 구문에 대해 유사도 또는 중복도를 산출하는 단계; 및
상기 피인용 논문의 각 구문에 대한 유사도 또는 중복도 중 가장 높은 유사도 또는 중복도를 갖는 구문을 상기 피인용 구문으로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1, wherein the step of extracting the quoted phrase,
calculating a degree of similarity or overlap for each phrase by comparing the quoted phrase with each phrase of the cited article; and
Citation type-based citation relationship analysis method comprising a; selecting a phrase having the highest degree of similarity or redundancy among phrases of the cited article as the cited phrase.
상기 인용 구문과 상기 피인용 논문의 각 구문을 비교하여 각 구문에 대해 관련도를 산출하는 단계; 및
상기 피인용 논문의 각 구문에 대한 관련도 중 가장 높은 관련도를 갖는 구문을 상기 피인용 구문으로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1, wherein the step of extracting the quoted phrase,
calculating a degree of relevance for each phrase by comparing the quoted phrase with each phrase of the cited article; and
Citation type-based citation relationship analysis method comprising a; selecting a phrase having the highest degree of relevance among the relevance of each phrase of the cited article as the cited phrase.
상기 인용 유형을 분류하는 단계는,
상기 인용 구문을 적어도 하나의 레벨 이상의 자연어 처리하여 상기 인용 구문의 의미를 분석하는 단계; 및
상기 자연어 처리된 인용 구문에 대한 인용 유형을 사전 정의된 인용 유형 중 하나로 매칭(matching)하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1,
The step of classifying the citation type is,
analyzing the meaning of the quoted phrase by natural language processing of the quoted phrase at least one level or more; and
A citation type-based citation relationship analysis method comprising a; matching the citation type for the natural language-processed citation phrase to one of the predefined citation types.
상기 인용 유형을 매칭하는 단계는,
상기 인용 구문에 대한 인용 유형을 사전 정의된 용어 인용, 수식 인용, 정의 인용, 특징 인용, 연구를 통한 사실 인용 및 방법론적 사실 인용 중 하나로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.5. The method according to claim 4,
The step of matching the citation type is:
Citation type-based citation relationship analysis method including; selecting a citation type for the citation phrase from among predefined term citation, formula citation, definition citation, feature citation, fact citation through research, and methodological fact citation .
상기 인용 유형을 분류하는 단계는,
상기 자연어 처리된 인용 구문에 근거하여 대응되는 인용 유형을 추가로 생성하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.5. The method according to claim 4,
The step of classifying the citation type is,
Citation type-based citation relationship analysis method further comprising; further generating a corresponding citation type based on the natural language-processed citation phrase.
상기 인용 유형을 분류하는 단계는,
상기 인용 구문으로부터 키 데이터(key data)를 추출하는 단계; 및
상기 키 데이터와 상기 인용 유형을 매칭시키는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1,
The step of classifying the citation type is,
extracting key data from the quoted phrase; and
A citation type-based citation relationship analysis method comprising a; matching the key data with the citation type.
상기 피인용 구문을 추출하는 단계 또는 상기 인용 유형을 분류하는 단계를 수행하기 전에, 상기 인용 구문을 정규화하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1,
Before performing the step of extracting the citation phrase or classifying the citation type, normalizing the citation phrase; citation type-based citation relationship analysis method further comprising a.
상기 인용 관계를 설정하는 단계는,
상기 인용 구문의 내용 및 관련 서지 정보, 상기 피인용 구문의 내용 및 관련 서지 정보 및 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 결합하여 정보화하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.The method according to claim 1,
The step of establishing the citation relationship includes:
Citation type-based citation relationship analysis including; combining the content and related bibliographic information of the quoted phrase, the content and related bibliographic information of the quoted phrase, and the citation type for the quoted phrase of the quoted phrase Way.
상기 정보화된 결과를 취합하여 상기 피인용 논문에 대한 인용 관계 데이터베이스를 구축하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.10. The method of claim 9,
The citation type-based citation relationship analysis method further comprising; building a citation relation database for the cited thesis by collecting the informational results.
상기 각 피인용 구문에 대해 용어, 수식, 정의, 특징, 연구를 통한 사실 및 방법론 적용을 통한 사실 중 적어도 하나의 인용 유형으로 분류하는 단계; 및
상기 각 피인용 구문에 대한 인용 유형에 기반하여 상기 각 피인용 구문이 포함된 피인용 논문의 인용 특성을 결정하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.matching each citation phrase of the cited article and each citation phrase corresponding to each citation phrase;
classifying each cited phrase into at least one citation type among terms, formulas, definitions, characteristics, facts through research, and facts through method application; and
A citation type-based citation relationship analysis method comprising a; determining a citation characteristic of a citation article including each citation phrase based on a citation type for each citation phrase.
상기 인용 구문 추출부로부터 수신된 상기 인용 구문에 근거하여 피인용 논문을 검색하여 특정하는 피인용 논문 특정부;
상기 인용 구문과의 유사도, 중복도 또는 관련도에 근거하여 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 피인용 구문 추출부;
상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하여 인용 유형 정보를 생성하는 인용 유형 정보 생성부; 및
상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 관계에 대한 인용 관계 정보를 생성하는 인용 관계 정보 생성부;를 포함하는 인용 유형 기반의 인용 관계 분석 시스템.a quoted phrase extracting unit for extracting a quoted phrase from a cited article;
a cited article specifying unit for searching and specifying a cited article based on the cited phrase received from the cited phrase extracting unit;
a quoted phrase extraction unit for extracting a quoted phrase corresponding to the quoted phrase from the cited article based on the degree of similarity, overlap, or relevance with the quoted phrase;
a citation type information generation unit for generating citation type information by classifying citation types of the citation phrases of the citation phrases; and
Citation type-based citation relationship analysis system comprising a; citation relationship information generating unit for generating citation relationship information on the relationship between the quoted phrase and the quoted phrase based on the citation type.
상기 인용 유형 정보 생성부는,
상기 인용 구문을 적어도 하나의 레벨 이상의 자연어 처리하여 상기 인용 구문의 의미를 분석하는 자연어 처리 모듈; 및
상기 자연어 처리된 인용 구문에 대한 인용 유형을 사전 정의된 인용 유형 중 하나로 매칭(matching)하는 인용 유형 매칭 모듈;을 포함하는 인용 유형 기반의 인용 관계 분석 시스템.13. The method of claim 12,
The citation type information generating unit,
a natural language processing module for analyzing the meaning of the quoted phrase by performing natural language processing on the quoted phrase at least one level or more; and
A citation type-based citation relationship analysis system comprising a; a citation type matching module for matching the citation type for the natural language-processed citation phrase to one of the predefined citation types.
상기 인용 유형 매칭 모듈은,
상기 인용 구문에 대한 인용 유형을 사전 정의된 용어 인용, 수식 인용, 정의 인용, 특징 인용, 연구를 통한 사실 인용 및 방법론적 사실 인용 중 하나로 선택하는 인용 유형 선택기;를 포함하는 인용 유형 기반의 인용 관계 분석 시스템.14. The method of claim 13,
The citation type matching module is
Citation type-based citation relationship including; analysis system.
상기 인용 유형 정보 생성부는, 상기 자연어 처리된 인용 구문에 근거하여 대응되는 인용 유형을 추가로 생성하는 인용 유형 생성 모듈;을 더 포함하는 인용 유형 기반의 인용 관계 분석 시스템.14. The method of claim 13,
The citation type information generating unit may further include a citation type generation module that additionally generates a corresponding citation type based on the natural language-processed citation phrase.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210008524A KR102298397B1 (en) | 2021-01-21 | 2021-01-21 | Citation Relationship Analysis Method and System Based on Citation Type |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210008524A KR102298397B1 (en) | 2021-01-21 | 2021-01-21 | Citation Relationship Analysis Method and System Based on Citation Type |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102298397B1 true KR102298397B1 (en) | 2021-09-07 |
Family
ID=77797270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210008524A KR102298397B1 (en) | 2021-01-21 | 2021-01-21 | Citation Relationship Analysis Method and System Based on Citation Type |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102298397B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102547402B1 (en) * | 2023-03-17 | 2023-06-23 | 주식회사 무하유 | Apparatus and method for verifying validity and reliability of cited documents |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000357170A (en) * | 1999-06-15 | 2000-12-26 | Fujitsu Ltd | Device that performs information retrieval by using reason of reference to document |
KR101033611B1 (en) * | 2010-07-09 | 2011-05-11 | 한국과학기술정보연구원 | System and method for evaluating the suitability of reference |
KR20200082551A (en) * | 2018-12-30 | 2020-07-08 | 김산 | A method and an apparatus for analyzing relationship of paper reference using a weight |
-
2021
- 2021-01-21 KR KR1020210008524A patent/KR102298397B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000357170A (en) * | 1999-06-15 | 2000-12-26 | Fujitsu Ltd | Device that performs information retrieval by using reason of reference to document |
KR101033611B1 (en) * | 2010-07-09 | 2011-05-11 | 한국과학기술정보연구원 | System and method for evaluating the suitability of reference |
KR20200082551A (en) * | 2018-12-30 | 2020-07-08 | 김산 | A method and an apparatus for analyzing relationship of paper reference using a weight |
Non-Patent Citations (2)
Title |
---|
Shiyan Ou and Hyonil Kim, Unsupervised Citation Sentence Identification Based on Similarity Measurement, iConference 2018: Transforming Digital Worlds pp 384-394. * |
장덕현, 장환석. 기계공학 연구자들의 인용행태 분석: P대학 기계공학부 박사학위 논문을 중심으로. 정보관리연구, vol.38, no.3, 2007. pp. 111-135. 1부.* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102547402B1 (en) * | 2023-03-17 | 2023-06-23 | 주식회사 무하유 | Apparatus and method for verifying validity and reliability of cited documents |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8108204B2 (en) | Text categorization using external knowledge | |
Litvak et al. | Graph-based keyword extraction for single-document summarization | |
US7814102B2 (en) | Method and system for linking documents with multiple topics to related documents | |
US8073838B2 (en) | Pseudo-anchor text extraction | |
CN111767716B (en) | Method and device for determining enterprise multi-level industry information and computer equipment | |
CN107102993B (en) | User appeal analysis method and device | |
Trappey et al. | An R&D knowledge management method for patent document summarization | |
EP2577521A2 (en) | Detection of junk in search result ranking | |
US11893537B2 (en) | Linguistic analysis of seed documents and peer groups | |
KR102107474B1 (en) | Social issue deduction system and method using crawling | |
US11880396B2 (en) | Method and system to perform text-based search among plurality of documents | |
Rakian et al. | A Persian fuzzy plagiarism detection approach | |
Wang et al. | Automatic tagging of cyber threat intelligence unstructured data using semantics extraction | |
KR102298397B1 (en) | Citation Relationship Analysis Method and System Based on Citation Type | |
Hernes et al. | The automatic summarization of text documents in the Cognitive Integrated Management Information System | |
CN101334793B (en) | Method for automatic recognition for dependency relationship of demand | |
CN114238735B (en) | Intelligent internet data acquisition method | |
Arya et al. | Content extraction from news web pages using tag tree | |
KR102296577B1 (en) | Method and System for Providing Citation Type Based Scholarly Information | |
KR20110045927A (en) | Electronic book contents searching service system and electronic book contents searching service method | |
Manna et al. | Information retrieval-based question answering system on foods and recipes | |
Khashfeh et al. | A Text Mining Algorithm Optimising the Determination of Relevant Studies | |
Shahid et al. | TOC generation in PDF Document for smart automated compliance engine | |
US20240086433A1 (en) | Interactive tool for determining a headnote report | |
Khodade et al. | Unsupervised Technique for Web Data Extraction: Trinity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |