KR102298397B1 - Citation Relationship Analysis Method and System Based on Citation Type - Google Patents

Citation Relationship Analysis Method and System Based on Citation Type Download PDF

Info

Publication number
KR102298397B1
KR102298397B1 KR1020210008524A KR20210008524A KR102298397B1 KR 102298397 B1 KR102298397 B1 KR 102298397B1 KR 1020210008524 A KR1020210008524 A KR 1020210008524A KR 20210008524 A KR20210008524 A KR 20210008524A KR 102298397 B1 KR102298397 B1 KR 102298397B1
Authority
KR
South Korea
Prior art keywords
citation
phrase
type
quoted
cited
Prior art date
Application number
KR1020210008524A
Other languages
Korean (ko)
Inventor
정한민
최희석
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020210008524A priority Critical patent/KR102298397B1/en
Application granted granted Critical
Publication of KR102298397B1 publication Critical patent/KR102298397B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/382Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using citations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Disclosed are a citation relationship analysis method based on a citation type and a system thereof. According to an embodiment of the present invention, the citation relationship analysis method comprises a step of extracting a citation phrase from a target academic material; a step of specifying a cited paper cited by the citation phrase; a step of extracting a cited phrase corresponding to the citation phrase from the cited paper; a step of classifying a citation type of the cited phrase of the citation phrase; and a step of establishing a citation relationship between the citation phrase and the cited phrase based on the citation type.

Description

인용 유형 기반의 인용 관계 분석 방법 및 시스템{Citation Relationship Analysis Method and System Based on Citation Type}Citation Relationship Analysis Method and System Based on Citation Type

이하의 개시는 논문 등의 학술 자료의 인용 관계를 정확하고 효율적으로 파악할 수 있는 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 관한 것이다. The following disclosure relates to a citation type-based citation relationship analysis method and system that can accurately and efficiently identify the citation relationship of academic materials such as a thesis.

인용은 논문 등 학술 자료에 반드시 포함되어야 하는, 학문 발전 과정에서 매우 중요한 요소이다. 또한, 인류의 연구가 지속되는 과정에서 논문 등 학술 자료 및 학술 자료가 인용하는 피인용 논문의 수는 계속해서 증가하게 된다. Citation is a very important element in the process of academic development, which must be included in academic materials such as thesis. In addition, as human research continues, academic materials such as papers and the number of cited papers cited by academic materials will continue to increase.

이러한 인용의 중요성과 인용에 대한 정보의 증가로 인해, 문헌간 인용 및 피인용 관계에 대한 다양한 분석들이 이루어지고 있다. 예를 들어, 논문에 대한 연구자 또는 논문별 인용 지수나 인용 강도 분석 등이 수행되고 있다.Due to the importance of such citations and the increase in information on citations, various analyzes of citation and citation relationships between documents are being conducted. For example, a citation index or citation strength analysis for each researcher or thesis on the thesis is being performed.

그러나, 이러한 분석 방법들은 인용 및 피인용 관계를 규정함에 있어 논문 등의 내용이 아닌 그 서지 정보에 의해서만 정의되고 있다. 이 경우, 인용 목적이나 인용으로 인해 파생되는 분석 결과를 제공할 수 없다. However, these analysis methods are defined only by the bibliographic information, not the content of the thesis, in defining the relationship between citation and citation. In this case, the purpose of citation or analysis results derived from citation cannot be provided.

이하의 개시를 통해 논문 등 학술 자료에서의 인용 관계의 실질적 의미를 정확하게 분석하여 제공할 수 있는 인용 유형 기반의 인용 관계 분석 방법 및 시스템을 제공하고자 한다. Through the following disclosure, it is intended to provide a citation type-based citation relationship analysis method and system that can accurately analyze and provide the actual meaning of a citation relationship in academic materials such as a thesis.

상기 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법은, 인용 논문으로부터 인용 구문을 추출하는 단계; 상기 인용 구문이 인용하는 피인용 논문을 특정하는 단계; 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 단계; 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하는 단계; 및 상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 인용 관계를 설정하는 단계;를 포함한다. A citation type-based citation relationship analysis method according to an embodiment of the present invention for solving the above technical problem comprises the steps of extracting a citation phrase from a citation thesis; specifying the cited article cited by the citation phrase; extracting a citation phrase corresponding to the citation phrase from the cited article; classifying a citation type for the quoted phrase of the quoted phrase; and setting a citation relationship between the quoted phrase and the quoted phrase based on the quoted type.

상기 기술적 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법은, 인용 논문의 각 인용 구문 및 상기 각 인용 구문에 대응되는 각 피인용 구문을 매칭시키는 단계; 상기 각 피인용 구문에 대한 인용 유형을 분류하는 단계; 및 상기 각 피인용 구문에 대한 인용 유형에 기반하여 상기 각 피인용 구문이 포함된 피인용 논문의 인용 특성을 결정하는 단계를 포함한다. A citation type-based citation relationship analysis method according to another embodiment of the present invention for solving the above technical problem includes matching each citation phrase of a citation article and each citation phrase corresponding to each citation phrase; classifying a citation type for each citation phrase; and determining a citation characteristic of a citation article including each of the citation phrases based on a citation type for each of the citation phrases.

상기 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 시스템은, 인용 논문에서 인용 구문을 추출하는 인용 구문 추출부; 상기 인용 구문 추출부로부터 수신된 상기 인용 구문에 근거하여 피인용 논문을 검색하여 특정하는 피인용 논문 특정부; 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 피인용 구문 추출부; 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하여 인용 유형 정보를 생성하는 인용 유형 정보 생성부; 및 상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 관계에 대한 인용 관계 정보를 생성하는 인용 관계 정보 생성부;를 포함한다.A citation type-based citation relationship analysis system according to an embodiment of the present invention for solving the above technical problem includes: a citation phrase extraction unit for extracting a citation phrase from a citation thesis; a cited article specifying unit for searching and specifying a cited article based on the cited phrase received from the cited phrase extracting unit; a quoted phrase extraction unit for extracting a quoted phrase corresponding to the quoted phrase from the cited article; a citation type information generation unit for generating citation type information by classifying citation types of the citation phrases of the citation phrases; and a citation relationship information generator configured to generate citation relationship information on a relationship between the quoted phrase and the quoted phrase based on the citation type.

이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문과 피인용 구문의 인용 유형을 분류함으로써 인용 관계, 즉 인용의 목적을 실질적으로 파악할 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, the citation relationship, that is, the purpose of the citation, can be substantially grasped by classifying the citation types of the quoted phrases and the quoted phrases.

이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 피인용 논문의 인용 목적 및 용도를 실질적으로 파악함으로써 피인용 논문의 중요도 또는 활용도를 분석하는데 정확성 및 효율성을 높일 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, accuracy and efficiency are improved in analyzing the importance or utilization of the cited thesis by substantially identifying the citation purpose and use of the citation thesis. can be raised

이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 피인용 논문을 파악함에 있어 그 정확성 및 효율성을 높여 연구자의 연구 및 관련 학문 분야의 발전에 도움을 줄 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, the accuracy and efficiency of identifying citation papers can be increased, thereby helping researchers to develop research and related academic fields. have.

이하에서 개시하는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 자연어 처리 및 피인용 구문 검색의 정확성 및 효율성을 높임으로써 시스템 리소스 사용을 최적화할 수 있다. According to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention disclosed below, it is possible to optimize the use of system resources by increasing the accuracy and efficiency of natural language processing of citation phrases and citation phrase search.

도 1은 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법을 나타내는 순서도이다.
도 2는 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 시스템을 나타내는 블록도이다.
도 3은 본 발명의 실시예에 따른 피인용 구문 추출부를 나타내는 블록도이다.
도 4는 본 발명의 실시예에 따른 인용 구문 및 피인용 구문의 매칭 결과를 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.
도 6은 본 발명의 실시예에 따른 인용 유형 분류를 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.
도 8은 본 발명의 실시예에 따른 인용 관계 정보를 나타내는 도면이다.
도 9는 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이다.
1 is a flowchart illustrating a method for analyzing a citation relationship based on a citation type according to an embodiment of the present invention.
2 is a block diagram illustrating a citation relationship analysis system based on a citation type according to an embodiment of the present invention.
3 is a block diagram illustrating a citation phrase extracting unit according to an embodiment of the present invention.
4 is a diagram illustrating a result of matching a quoted phrase and a quoted phrase according to an embodiment of the present invention.
5 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
6 is a diagram illustrating a citation type classification according to an embodiment of the present invention.
7 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.
8 is a diagram illustrating citation relation information according to an embodiment of the present invention.
9 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention.

이하 도면을 참고하여, 본 발명의 실시예에 대해 자세히 설명함으로써, 본 발명이 속하는 기술분야 통상의 기술자가 쉽게 실시할 수 있게 한다. 본 발명은 다양한 다른 형태로 실현될 수 있는 것으로, 여기서 설명되는 실시예에 한정되지 않는다. 도면 중의 본 발명을 명확하게 설명하기 위해, 설명과 무관한 부분은 생략하고, 설명서 전체에서, 동일하거나 유사한 구조 요소에 대해 동일한 도면 부호를 부가한다. With reference to the drawings below, by describing the embodiments of the present invention in detail, those skilled in the art to which the present invention pertains can easily practice. The present invention may be embodied in various other forms, and is not limited to the embodiments described herein. In order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and the same reference numerals are assigned to the same or similar structural elements throughout the description.

도 1은 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이고, 도 2는 본 발명의 실시예에 따른 인용 관계 분석 시스템을 나타내는 블록도이다. 1 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention, and FIG. 2 is a block diagram illustrating a citation relationship analysis system according to an embodiment of the present invention.

도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 인용 관계 분석 방법(100)은 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)에서 실행될 수 있고, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 본 발명의 실시예에 따른 인용 관계 분석 방법(100)으로 동작할 수 있다. 다만, 이에 한정되는 것은 아니다. 본 발명의 실시예에 따른 인용 관계 분석 방법(100) 및 인용 관계 분석 시스템(200)은 각각 다른 시스템에서 실행되거나 다른 방법으로 동작할 수도 있다. 이하에서는 설명의 편의를 위해 본 발명의 실시예에 따른 인용 관계 분석 방법(100)이 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)에서 실행되고, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)이 본 발명의 실시예에 따른 인용 관계 분석 방법(100)으로 동작하는 예에 한하여 기술한다. 1 and 2, the citation relation analysis method 100 according to the embodiment of the present invention may be executed in the citation relation analysis system 200 according to the embodiment of the present invention, and according to the embodiment of the present invention, The citation relation analysis system 200 may operate as the citation relation analysis method 100 according to an embodiment of the present invention. However, the present invention is not limited thereto. The citation relationship analysis method 100 and the citation relationship analysis system 200 according to an embodiment of the present invention may be executed in different systems or may operate in different ways. Hereinafter, for convenience of explanation, a citation relationship analysis method 100 according to an embodiment of the present invention is executed in the citation relationship analysis system 200 according to an embodiment of the present invention, and a citation relationship analysis according to an embodiment of the present invention An example in which the system 200 operates as the citation relationship analysis method 100 according to an embodiment of the present invention will be described.

본 발명의 실시예에 따른 인용 관계 분석 방법(100)은 인용 논문(QPPR)에서 인용 구문(QSYN)을 추출하는 단계(S110), 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)을 특정하는 단계(S120), 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출하는 단계(S130), 인용 구문(QSYN)의 피인용 구문(CSYN)에 대한 인용 유형을 분류하는 단계(S140) 및 인용 유형에 근거하여 인용 구문(QSYN)과 피인용 구문(CSYN)의 관계를 설정하는 단계(S150)를 포함한다. Citation relationship analysis method 100 according to an embodiment of the present invention extracts a citation phrase (QSYN) from a citation thesis (QPPR) (S110), and specifies the cited article (CPPR) cited by the citation syntax (QSYN) step (S120), extracting the citation phrase (CSYN) corresponding to the citation phrase (QSYN) from the cited article (CPPR) (S130), citation for the citation phrase (CSYN) of the citation phrase (QSYN) It includes a step of classifying the type (S140) and setting a relationship between the quoted phrase (QSYN) and the quoted phrase (CSYN) based on the quoted type (S150).

본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 인용 구문 추출부(210), 피인용 논문 특정부(220), 피인용 구문 추출부(230), 인용 유형 정보 생성부(240) 및 인용 관계 정보 생성부(250)를 포함하여 본 발명의 실시예에 따른 인용 관계 분석 방법(100)을 실행할 수 있다. 그밖에, 본 발명의 실시예에 따른 인용 관계 분석 시스템(200)은 데이터 또는 정보의 입출력, 처리, 저장 및 네트워킹 등 시스템의 동작에 일반적으로 요구되는 입출력 인터페이서, 프로세서, 저장 장치 및 통신 장치 등을 포함할 수 있고, 그에 대한 도시는 설명의 편의를 위해 생략될 수 있다. Citation relationship analysis system 200 according to an embodiment of the present invention includes a citation phrase extracting unit 210, a citation thesis specifying unit 220, a citation phrase extracting unit 230, a citation type information generating unit 240 and The citation relation analysis method 100 according to an embodiment of the present invention may be executed by including the citation relation information generating unit 250 . In addition, the citation relationship analysis system 200 according to an embodiment of the present invention includes an input/output interface, a processor, a storage device, and a communication device that are generally required for the operation of the system, such as input/output, processing, storage, and networking of data or information. and the illustration thereof may be omitted for convenience of description.

인용 논문(QPPR)으로부터 인용 구문(QSYN)을 추출하는 단계(S110)는 인용 구문 추출부(210)에 의해 수행될 수 있다. 인용 구문 추출부(210)는 인용 관계 분석 시스템(200)의 입출력 인터페이스(미도시)를 통해 외부로부터 인용 논문(QPPR)을 수신할 수 있다. 예를 들어, 인용 논문(QPPR)은 직접 인용 구문 추출부(210)로 전송되거나 해당 논문을 개시하고 있는 사이트의 링크 정보로 인용 구문 추출부(210)에 전송될 수 있다. 또는 인용 논문(QPPR)은 인용 관계 분석 시스템(200)과 직접 또는 네트워크로 연결되는 논문 데이터베이스(PPDB)로부터 수신되거나, 인용 관계 분석 시스템(200)에 구비되는 저장 장치(미도시)로부터 수신될 수도 있다. 이때, 논문 데이터베이스(PPDB)는 인용 관계 분석 시스템(200)에 포함되거나 인용 관계 분석 시스템(200)과 독립적으로 구비될 수 있다. 인용 논문(QPPR)을 수신하여 인용 구문(QSYN)을 추출할 수 있다. 본 발명의 실시예에 따른 인용 구문(QSYN)은 인용 논문(QPPR) 이외의 학술 자료, 예를 들어, 도서, 기사, 판례, 보고서, 및 소셜미디어 게시글 등으로부터 추출될 수도 있다. 인용 논문(QPPR)은 그에 대한 서지 정보(인용 논문 정보(QINF))를 포함할 수 있다. Extracting the quoted phrase (QSYN) from the cited article (QPPR) ( S110 ) may be performed by the quoted phrase extracting unit 210 . The citation phrase extraction unit 210 may receive a citation thesis (QPPR) from the outside through an input/output interface (not shown) of the citation relation analysis system 200 . For example, the citation thesis QPPR may be directly transmitted to the citation phrase extraction unit 210 or may be transmitted to the citation syntax extraction unit 210 as link information of a site that discloses the thesis. Alternatively, the citation thesis (QPPR) may be received from a thesis database (PPDB) directly or network-connected to the citation relation analysis system 200 , or may be received from a storage device (not shown) provided in the citation relation analysis system 200 . have. In this case, the thesis database PPDB may be included in the citation relation analysis system 200 or may be provided independently of the citation relation analysis system 200 . It is possible to receive a cited article (QPPR) and extract a citation phrase (QSYN). The quoted phrase (QSYN) according to an embodiment of the present invention may be extracted from academic materials other than the cited thesis (QPPR), for example, books, articles, precedents, reports, and social media posts. The cited article (QPPR) may include bibliographic information about the cited article (QINF).

인용 구문 추출부(210)는 입력된 인용 논문(QPPR)을 탐색하여 기 설정된 인용 패턴에 대응되는 식별자를 포함하는 구문을 논문을 인용하고 있는 인용 구문(QSYN)으로 추출할 수 있다. 예를 들어, 인용 논문(QPPR)의 임의의 구문에서 참고문헌의 인용을 나타내는 “[]” 등의 문장 부호 내의 숫자 표시나 각주 등을 추출할 수 있다. 또는 인용 논문(QPPR)의 임의의 구문에서 “( )” 내의 “,”를 기준으로 “(홍길동 외, 2020)”과 같이 저자명 및 연도가 분리되어 함께 기재된 표현을 추출할 수도 있다. The citation phrase extraction unit 210 may search the input citation thesis (QPPR) and extract a sentence including an identifier corresponding to a preset citation pattern as a citation syntax (QSYN) citing the thesis. For example, it is possible to extract number marks or footnotes in punctuation marks such as “[]” indicating citations of references from arbitrary phrases of the cited article (QPPR). Alternatively, the author name and year may be separated, such as “(Gildong Hong et al., 2020)” based on the “,” in “( )”, in any syntax of the cited article (QPPR), and the expression described together can be extracted.

이렇게 추출된 식별자에 대응되는 참고문헌 또는 각주의 내용 중 피인용 논문(CPPR)을 나타내는 표현을 탐색할 수 있다. 예를 들어, 해당 참고문헌 또는 각주에 대한 기재 중 “,” 등의 문장 부호로 분리되는 저자명, 논문명, 학술지명 및 발행년도 등을 기재를 확인함으로써 해당 구문이 인용하는 것이 논문인지 식별할 수 있다. 또는 해당 참고문헌 또는 각주에 대한 기재 중 출판사명, 언론사명 또는 초판, 제2판 등의 판차 사항이 포함되는 경우는 해당 구문이 인용하고 있는 것이 논문이 아닌 것으로 식별할 수 있다. It is possible to search for the expression representing the cited article (CPPR) among the contents of the reference or footnote corresponding to the extracted identifier. For example, by checking the description of the author's name, thesis name, journal name, and publication year, which are separated by punctuation marks such as ",", among the references or footnotes, it is possible to identify whether the article is citing the phrase. . Alternatively, if the name of the publisher, press company, or edition difference such as the first or second edition is included in the description of the reference or footnote, it can be identified that the phrase cited by the phrase is not a thesis.

인용 구문 추출부(210)는 상기의 방법으로 논문을 인용하고 있는 구문을 인용 구문(QSYN)으로 추출하여 출력하고, 그 과정에서 확인된 저자명, 논문명, 학술지명 및 발행년도 등에 대한 정보를 피인용 논문(CPPR)에 대한 피인용 논문 정보(CINF)로 출력한다. The citation phrase extraction unit 210 extracts and outputs the phrase citing the thesis as a citation syntax (QSYN) by the above method, and cites information on the author name, thesis name, journal name and publication year, etc. confirmed in the process It is output as Cited Paper Information (CINF) for the paper (CPPR).

피인용 논문(CPPR)을 특정하는 단계(S120)는 피인용 논문 특정부(220)에 의해 수행될 수 있다. 피인용 논문 특정부(220)는 인용 구문 추출부(210)로부터 수신된 피인용 논문 정보(CINF)에 근거하여 피인용 논문(CPPR)을 획득한다. 예를 들어, 피인용 논문 특정부(220)는 피인용 논문 정보(CINF)를 이용하여 논문 데이터베이스(PPDB)를 검색함으로써 피인용 논문(CPPR)을 획득한다. The step (S120) of specifying the cited article (CPPR) may be performed by the cited article specifying unit 220 . The cited article specifying unit 220 acquires the cited article (CPPR) based on the cited article information (CINF) received from the cited phrase extraction unit 210 . For example, the cited article specifying unit 220 acquires the cited article (CPPR) by searching the article database (PPDB) using the cited article information (CINF).

이때, 인용 구문 추출부(210)로부터 수신된 피인용 논문 정보(CINF)가 논문 데이터베이스(PPDB)에서 피인용 논문(CPPR)을 검색하는데 충분하지 않은 경우, 예를 들어, 피인용 논문 정보(CINF)에 논문명이 부재하거나 부정확하여 동일 저자가 동일한 해에 발표한 논문이 다수 검색되거나, 피인용 논문 정보(CINF)에 저자명이 부재하거나 부정확하여 동일 논문명의 논문이 다수 검색되는 경우, 피인용 논문 특정부(220)는 인용 구문 추출부(210)에 추가 정보를 요청하거나, 인터넷 등의 네트워크나 다른 데이터베이스에 대한 검색을 통해 상에서 피인용 논문 정보(CINF)의 완결성을 높일 수 있다. 예를 들어, 피인용 논문 특정부(220)는 인용 구문 추출부(210)에 인용 구문(QSYN)을 수신하여 인용 구문(QSYN)의 내용을 나타내는 키워드를 추출하고, 기 수신된 피인용 논문 정보(CINF)와 해당 키워드를 통해 인터넷 등을 검색하여 누락된 정보를 보충할 수 있다. At this time, when the cited thesis information CINF received from the citation phrase extracting unit 210 is not sufficient to search for the cited thesis CPPR in the thesis database PPDB, for example, the cited thesis information CINF ), if multiple papers published by the same author in the same year are searched for due to the absence or inaccuracy of the paper name in the The unit 220 may request additional information from the citation phrase extraction unit 210 or may increase the completeness of the cited thesis information CINF through a search for a network such as the Internet or another database. For example, the cited thesis specifying unit 220 receives the citation phrase (QSYN) from the citation phrase extraction unit 210 to extract a keyword indicating the contents of the citation phrase (QSYN), and the previously received citation thesis information (CINF) and corresponding keywords can be searched on the Internet, etc. to supplement the missing information.

피인용 구문을 추출하는 단계(S130)는 피인용 구문 추출부(230)에 의해 수행될 수 있다. 피인용 구문 추출부(230)는 인용 구문 추출부(210)로부터 인용 구문(QSYN)을 수신하고 피인용 논문 특정부(220)로부터 피인용 논문(CPPR)을 수신하여, 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출한다. The step of extracting the quoted phrase ( S130 ) may be performed by the quoted phrase extracting unit 230 . Citation phrase extraction unit 230 receives the citation phrase (QSYN) from the citation phrase extraction unit 210 and receives the citation thesis (CPPR) from the citation thesis specifying unit 220, the citation thesis (CPPR) Extracts the quoted phrase (CSYN) corresponding to the quoted phrase (QSYN) from

도 3은 본 발명의 실시예에 따른 피인용 구문 추출부를 나타내는 블록도이다.3 is a block diagram illustrating a citation phrase extracting unit according to an embodiment of the present invention.

도 2 및 도 3을 참조하면, 피인용 구문 추출부(230)은 구문 비교 모듈(232), 비교 결과 처리 모듈(234) 및 피인용 구문 선택 모듈(236)을 포함할 수 있다. 2 and 3 , the citation phrase extraction unit 230 may include a syntax comparison module 232 , a comparison result processing module 234 , and a syntax selection module 236 to be cited.

구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문 단위로 인용 구문(QSYN)과의 비교를 수행할 수 있다. 이때, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 순차적으로 비교하거나 랜덤하게 비교할 수 있다. 또는, 구문 비교 모듈(232)은 인용 구문(QSYN)의 전체 내용으로 피인용 논문(CPPR)의 각 구문과 비교하거나 인용 구문(QSYN) 중 선택된 용어 등에 한정하여 비교를 수행할 수 있다. The syntax comparison module 232 may perform comparison with the quoted syntax (QSYN) in units of each syntax of the cited article (CPPR). In this case, the syntax comparison module 232 may sequentially compare each phrase of the cited article (CPPR) and the cited phrase (QSYN) or compare them randomly. Alternatively, the syntax comparison module 232 may compare the entire contents of the quoted phrase QSYN with each phrase of the cited article CPPR or may perform comparison by limiting the selected term among the quoted phrases QSYN.

구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 비교한 결과를 생성할 수 있다. 예를 들어, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)의 텍스트상의 유사도 내지 중복도를 “%”나 지수 등으로 나타낼 수 있다. 또는, 구문 비교 모듈(232)은 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)의 의미 상의 관련도를 “%”나 지수 등으로 나타낼 수 있다. 예를 들어, 인용 구문(QSYN)에 “통계”라는 단어가 포함되고 피인용 논문(CPPR)의 구문상에 “조사” 또는 “설문” 등의 단어가 포함된 경우, 텍스트는 다르나 그 의미상의 관련성이 인정될 수 있다The syntax comparison module 232 may generate a result of comparing each phrase of the cited article (CPPR) with the cited phrase (QSYN). For example, the syntax comparison module 232 may indicate the similarity or redundancy in text between each phrase of the cited article (CPPR) and the cited phrase (QSYN) as “%” or an index. Alternatively, the syntax comparison module 232 may represent the semantic relevance of each phrase of the cited article (CPPR) and the citation phrase (QSYN) in terms of “%” or an exponent. For example, if the citation phrase (QSYN) contains the word “statistic” and the cited article (CPPR) contains the word “research” or “survey”, the text is different but semantically related. this can be acknowledged

비교 결과 처리 모듈(234)은 구문 비교 모듈(232)이 피인용 논문(CPPR)의 각 구문과 인용 구문(QSYN)을 비교한 결과를 저장하고 그 유사도 내지 중복도 또는 관련도가 높은 순서대로 정렬할 수 있다. 이때, 비교 결과 처리 모듈(234)은 피인용 논문(CPPR)의 각 구문에 대한 비교 결과를 실시간으로 정렬하거나 피인용 논문(CPPR)의 모든 구문에 대한 비교 결과가 도출된 후에 일괄적으로 정렬할 수 있다. 전자의 경우 비교 결과 처리 모듈(234)은 구문 비교 모듈(232)로부터 수신된 피인용 논문(CPPR)의 임의의 구문에 대한 비교 결과가 기준값 이상인 경우, 예를 들어 그 유사도 내지 중복도 또는 관련도가 70% 이상인 경우, 구문 비교 모듈(232)에게 비교 수행을 중지할 것을 지시할 수 있다. The comparison result processing module 234 stores the result of the syntax comparison module 232 comparing each phrase of the cited article (CPPR) and the cited phrase (QSYN), and sorts them in the order of their similarity, overlap, or relevance. can do. At this time, the comparison result processing module 234 aligns the comparison results for each phrase of the cited article (CPPR) in real time, or sorts in batches after the comparison results for all the phrases of the cited article (CPPR) are derived. can In the former case, the comparison result processing module 234 determines if the comparison result for any syntax of the cited article (CPPR) received from the syntax comparison module 232 is equal to or greater than a reference value, for example, its similarity, overlap, or relevance. When is 70% or more, it may instruct the syntax comparison module 232 to stop performing the comparison.

피인용 구문 선택 모듈(236)은 비교 결과 처리 모듈(234)의 처리 결과에 근거하여 인용 구문(QSYN)과 가장 높은 유사도 내지 중복도 또는 관련도를 갖는 피인용 논문(CPPR)의 구문을 피인용 구문(CSYN)으로 선택하여 출력할 수 있다. 예를 들어, 본 발명의 실시예에 따른 인용 구문 및 피인용 구문의 매칭 결과를 나타내는 도 4와 같이, 인용 논문(QPPR)의 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)이 추출될 수 있다. The citation phrase selection module 236 cites the syntax of the cited article (CPPR) having the highest degree of similarity, overlap or relevance to the cited phrase (QSYN) based on the processing result of the comparison result processing module 234 . You can select and output with the syntax (CSYN). For example, as shown in FIG. 4 showing the matching result of the quoted phrase and the quoted phrase according to an embodiment of the present invention, the quoted phrase in the cited article (CPPR) cited by the cited phrase (QSYN) of the cited article (QPPR) A quoted phrase (CSYN) corresponding to (QSYN) may be extracted.

다시 도 1 및 도 2를 참조하면, 인용 유형을 분류하는 단계(S140)는 인용 유형 정보 생성부(240)에 의해 수행될 수 있다. 인용 유형 정보 생성부(240)는 인용 구문(QSYN)을 기 정의된 인용 유형 중 하나로 분류한다. Referring back to FIGS. 1 and 2 , the step of classifying the citation type ( S140 ) may be performed by the citation type information generating unit 240 . The citation type information generator 240 classifies the citation phrase QSYN into one of predefined citation types.

도 5는 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.5 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.

도 2 및 도 5를 참조하면, 인용 유형 정보 생성부(240)는 자연어 처리 모듈(242) 및 인용 유형 매칭 모듈(246)을 포함할 수 있다. 자연어 처리 모듈(242)은 인용 구문(QSYN)에 대한 자연어 처리를 수행하여 인용 구문(QSYN)의 의미를 분석할 수 있다. 이때, 자연어 처리 모듈(242)은 인용 구문(QSYN)에 대해 적어도 하나의 레벨 이상의 자연어 처리 분석기를 포함할 수 있다. 도 5와 같이 3개의 레벨에 대한 분석기(ALZ1~ALZ3)를 포함하는 경우, 제1 레벨 분석기(ALZ1)는 형태소 분석(morphological analysis)을, 제2 레벨 분석기(ALZ2)는 구문 분석(syntax analysis)을, 제3 레벨 분석기(ALZ3)는 의미 분석(semantic analysis)을 수행할 수 있다. 즉, 제1 레벨 분석기(ALZ1)는 인용 구문(QSYN)의 형태소 애매성(morphological ambiguity)를 해결하여 형태소를 판별하고, 제2 레벨 분석기(ALZ2)는 형태소의 문장 성분을 판별하여 구문 트리 또는 파스 트리(parser)를 형성하며, 제3 레벨 분석기(ALZ3)는 형태소의 실제 의미를 파악하는 동작을 수행할 수 있다. 2 and 5 , the citation type information generator 240 may include a natural language processing module 242 and a citation type matching module 246 . The natural language processing module 242 may analyze the meaning of the quoted phrase QSYN by performing natural language processing on the quoted phrase QSYN. In this case, the natural language processing module 242 may include a natural language processing analyzer of at least one level or more for the quoted phrase (QSYN). As shown in FIG. 5 , when the analyzers ALZ1 to ALZ3 for three levels are included, the first level analyzer ALZ1 performs morphological analysis, and the second level analyzer ALZ2 performs syntax analysis. , the third level analyzer ALZ3 may perform semantic analysis. That is, the first level analyzer (ALZ1) determines the morpheme by resolving the morphological ambiguity of the quoted phrase (QSYN), and the second level analyzer (ALZ2) determines the sentence component of the morpheme to determine the syntax tree or parse A tree (parser) is formed, and the third level analyzer ALZ3 may perform an operation of grasping the actual meaning of the morpheme.

다만, 이에 한정되는 것은 아니다. 본 발명의 실시예에 따른 자연어 처리 모듈(242)은 인용 구문(QSYN)의 분석에 요구되는 정확도에 따라 구비하는 분석기의 개수 및 레벨을 달리 할 수 있다. 예를 들어, 자연어 처리 모듈(242)은 제1 레벨 분석기(ALZ1) 및 제2 레벨 분석기(ALZ2) 만을 구비하거나, 화용 분석(pragmatic analysis)을 수행하는 제4 레벨 분석기(미도시)를 더 구비할 수 있다. 또한, 본 발명의 실시예에 따른 자연어 처리 모듈(242)은 상기의 분석 기술 이외의 기술들을 추가적으로 적용할 수 있다. 예를 들어, 자연어 처리 시 사전 학습 모델(Pre-Trained Model)이나 합성곱 신경망(Convolution Neural Network) 등의 기술이 적용될 수 있다. However, the present invention is not limited thereto. The natural language processing module 242 according to an embodiment of the present invention may vary the number and level of analyzers provided according to the accuracy required to analyze the quoted phrase (QSYN). For example, the natural language processing module 242 includes only the first level analyzer ALZ1 and the second level analyzer ALZ2, or further includes a fourth level analyzer (not shown) for performing pragmatic analysis. can do. In addition, the natural language processing module 242 according to an embodiment of the present invention may additionally apply techniques other than the above analysis technique. For example, in natural language processing, a technology such as a pre-trained model or a convolutional neural network may be applied.

자연어 처리 모듈(242)은 상기의 방식으로 동작하여, 예를 들어, “A는 B로 실험하였다” 또는 “C에 대해 D하는 연구를 시도하였다” 등과 같이 자연어 처리된 인용 구문(QSYN')을 출력하게 된다. The natural language processing module 242 operates in the above manner to generate, for example, natural language-processed quoted phrases (QSYN') such as “A experimented with B” or “I tried to study D for C”. will output

인용 유형 매칭 모듈(246)은 자연어 처리된 인용 구문(QSYN')의 인용 내용 또는 인용 목적에 따라 사전 정의된 인용의 유형으로 분류할 수 있다. 이를 위해 인용 유형 매칭 모듈(246)은 매칭 스토리지(MSTG) 및 인용 유형 선택기(CSLT)를 포함할 수 있다. 매칭 스토리지(MSTG)는 사전 정의된 인용 유형에 대한 정보를 저장할 수 있다. 인용 유형 선택기(CSLT)는 자연어 처리된 인용 구문(QSYN')의 인용 내용 또는 인용 목적에 대응되는 인용 유형을 매칭 스토리지(MSTG)로부터 검색하고 선택하여 인용 유형 정보(CTYP)로 출력할 수 있다. The citation type matching module 246 may classify the citation into a predefined citation type according to the citation content or citation purpose of the natural language processed citation phrase (QSYN'). To this end, the citation type matching module 246 may include a matching storage (MSTG) and a citation type selector (CSLT). Matching storage (MSTG) may store information about predefined citation types. The citation type selector (CSLT) may search for and select a citation type corresponding to the citation content or citation purpose of the natural language-processed citation phrase (QSYN') from the matching storage (MSTG) and output it as citation type information (CTYP).

도 6은 본 발명의 실시예에 따른 인용 유형 분류를 나타내는 도면이다. 6 is a diagram illustrating a citation type classification according to an embodiment of the present invention.

도 5 및 도 6을 참조하면, 본 발명의 실시예에 따른 매칭 스토리지(MSTG)에 저장된 인용 유형은, “용어”, “수식”, “정의”, “특징”, “연구를 통한 사실” 및 “방법론 적용을 통한 사실” 등으로 정의될 수 있다. 인용 유형 선택기(CSLT)는 자연어 처리된 인용 구문(QSYN')의 인용 목적이 용어 자체에 대한 참조인 경우 인용 유형 정보(CTYP)를 “용어”에 대한 것으로, 수식이나 구성 요소 등을 참고하는 경우 “수식”에 대한 것으로, 인용 문구 내 용어의 정의를 참조하는 경우 “정의”에 대한 것으로, 알고리즘이나 구조에 대한 설명인 경우 “특징”에 대한 것으로 출력할 수 있다. 5 and 6 , the citation types stored in the matching storage (MSTG) according to an embodiment of the present invention are “terms”, “formulas”, “definitions”, “features”, “facts through research” and It can be defined as “fact through application of methodology”, etc. The Citation Type Selector (CSLT) uses the citation type information (CTYP) for “terms” when the citation purpose of the Natural Language Processed Quotation Phrases (QSYN') is to refer to the term itself, and when referencing formulas or components, etc. It can be output for “formula”, for “definition” when referring to the definition of a term in a quoted phrase, and for “feature” when it is a description of an algorithm or structure.

또는, 인용 유형 선택기(CSLT)는, 자연어 처리된 인용 구문(QSYN')이 전술된 예의 “A는 B로 실험하였다” 등과 같은 경우, 즉 그 인용 목적이 관련 연구나 사례를 참조하는 경우 인용 유형 정보(CTYP)를 “연구를 통한 사실”에 대한 것으로 출력할 수 있다. 또는, 인용 유형 선택기(CSLT)는, 자연어 처리된 인용 구문(QSYN')이 전술된 예의 또는 “C에 대해 D하는 연구를 시도하였다” 등과 같은 경우, 즉 그 인용 목적이 관련 방법론이나 적용 분야를 사례를 참조하는 경우 인용 유형 정보(CTYP)를 “방법론 적용을 통한 사실”에 대한 것으로 출력할 수 있다.Alternatively, the citation type selector (CSLT) selects the citation type when the natural language processed citation phrase (QSYN') is such as “A experimented with B” in the above example, that is, when the citation purpose refers to a related study or case. Information (CTYP) can be output as about “facts from research”. Alternatively, the citation type selector (CSLT) can be used when the natural language processed citation phrase (QSYN') is such as the above example or “A study was attempted for D for C”, i.e., the purpose of the citation is to determine the relevant methodology or field of application. When referring to a case, the Citation Type Information (CTYP) can be output as for “facts through application of methodology”.

인용 구문과 피인용 구문의 관계를 설정하는 단계(S150)는 인용 관계 정보 생성부(250)에 의해 수행될 수 있다. Setting the relationship between the quoted phrase and the quoted phrase ( S150 ) may be performed by the citation relationship information generating unit 250 .

도 7은 본 발명의 실시예에 따른 인용 유형 정보 생성부를 나타내는 블록도이다.7 is a block diagram illustrating a citation type information generator according to an embodiment of the present invention.

도 7을 참조하면, 본 발명의 실시예에 따른 인용 유형 정보 생성부(240)는 도 5의 인용 유형 정보 생성부(240)와 동일하거나 유사한 동작을 수행하는 자연어 처리 모듈(242) 및 인용 유형 매칭 모듈(246)을 포함하고, 나아가 인용 유형 생성 모듈(246)을 더 포함한다. 인용 유형 생성 모듈(246)은 자연어 처리된 인용 구문(QSYN')를 수신하여 인용 유형 매칭 모듈(246)에서 사전 정의하고 있는 인용 유형으로 분류되기 어려운 경우, 그에 대응되는 새로운 인용 유형을 생성하거나, 사전 정의된 인용 유형을 세분화할 수 있다. 예를 들어, 자연어 처리된 인용 구문(QSYN')이 인용하는 내용에 대한 평가를 목적으로 하는 경우, 인용 유형 생성 모듈(246)은 “평가”를 인용 유형으로 새로이 생성할 수 있다. Referring to FIG. 7 , the citation type information generating unit 240 according to an embodiment of the present invention includes a natural language processing module 242 and a citation type that perform the same or similar operations as the citation type information generating unit 240 of FIG. 5 . a matching module 246 , and further includes a citation type generation module 246 . The citation type generation module 246 receives the natural language-processed citation phrase (QSYN') and, when it is difficult to classify it as the citation type defined in the citation type matching module 246, generates a new citation type corresponding thereto, or You can refine predefined citation types. For example, when the natural language processing citation phrase (QSYN') aims to evaluate the citation content, the citation type generation module 246 may newly create “evaluation” as a citation type.

인용 유형 생성 모듈(246)은 새로이 생성된 인용 유형 또는 세분화한 인용 유형에 대한 사항을 업데이트 정보(IUPT)로 인용 유형 매칭 모듈(246)에 전달할 수 있다. The citation type generation module 246 may transmit the newly created citation type or the subdivided citation type as update information (IUPT) to the citation type matching module 246 .

이상에서는 인용 유형 정보 생성부(240)가 자연어 처리를 통해 인용 구문(QSYN)의 의미를 분석하하여 인용 유형을 분류하는 예에 한하여 기술하였으나, 이에 한정되는 것은 아니다. 예를 들어, 본 발명의 실시예에 따른 인용 유형 정보 생성부(240)은 인용 구문(QSYN)으로부터 키 데이터(key data)를 추출하고 이를 매칭 스토리지(MSTG)에 저장된 인용 유형과 매칭시키는 방식으로 인용 관계 정보(RINF)를 생성할 수도 있다. In the above description, only an example in which the citation type information generating unit 240 analyzes the meaning of the citation phrase (QSYN) through natural language processing to classify the citation type has been described, but the present invention is not limited thereto. For example, the citation type information generating unit 240 according to an embodiment of the present invention extracts key data from the citation phrase (QSYN) and matches it with the citation type stored in the matching storage (MSTG). Citation relationship information (RINF) may be generated.

다시 도 1 및 도 2를 참조하면, 인용 구문과 피인용 구문의 관계를 설정하는 단계(S150)은 인용 관계 정보 생성부(250)에서 수행될 수 있다. Referring back to FIGS. 1 and 2 , the step of setting the relationship between the quoted phrase and the quoted phrase ( S150 ) may be performed by the citation relationship information generating unit 250 .

도 8은 본 발명의 실시예에 따른 인용 관계 정보를 나타내는 도면이다. 8 is a diagram illustrating citation relation information according to an embodiment of the present invention.

도 2 및 도 8을 참조하면, 인용 관계 정보 생성부(250)는 인용 구문(QSYN), 피인용 구문(CSYN), 인용 논문 정보(QINF), 피인용 논문 정보(CINF), 인용 유형 정보(CTYP) 등을 결합하여, 인용 구문(QSYN) 및 피인용 구문(CSYN)에 대한 인용 관계 정보(RINF)를 생성할 수 있다. 또한, 인용 관계 정보(RINF)는 인용 구문(QSYN) 및 피인용 구문(CSYN)의 동일성 여부 등에 대한 정보도 더 포함할 수 있다. 2 and 8 , the citation relationship information generating unit 250 includes citation syntax (QSYN), citation syntax (CSYN), citation thesis information (QINF), citation thesis information (CINF), citation type information ( CTYP) and the like to generate citation relationship information (RINF) for the quoted phrase (QSYN) and the quoted phrase (CSYN). In addition, the citation relationship information RINF may further include information on whether the citation syntax QSYN and the quoted syntax CSYN are identical.

도 9는 본 발명의 실시예에 따른 인용 관계 분석 방법을 나타내는 순서도이다. 9 is a flowchart illustrating a citation relationship analysis method according to an embodiment of the present invention.

도 1, 도 2 및 도 9를 참조하면, 본 발명의 실시예에 따른 인용 관계 분석 방법(100)은, 도 1의 인용 관계 분석 방법(100)과 마찬가지로 인용 논문(QPPR)에서 인용 구문(QSYN)을 추출하는 단계(S110), 인용 구문(QSYN)이 인용하는 피인용 논문(CPPR)을 특정하는 단계(S120), 피인용 논문(CPPR)에서 인용 구문(QSYN)에 대응되는 피인용 구문(CSYN)을 추출하는 단계(S130), 인용 구문(QSYN)의 피인용 구문(CSYN)에 대한 인용 유형을 분류하는 단계(S140) 및 인용 유형에 근거하여 인용 구문(QSYN)과 피인용 구문(CSYN)의 관계를 설정하는 단계(S150)를 포함한다. 1, 2 and 9 , the citation relationship analysis method 100 according to the embodiment of the present invention, like the citation relationship analysis method 100 of FIG. ) extracting (S110), specifying the cited article (CPPR) cited by the citation phrase (QSYN) (S120), the citation phrase corresponding to the citation phrase (QSYN) in the cited article (CPPR) ( CSYN) extracting (S130), classifying the citation type for the quoted phrase (CSYN) of the quoted phrase (QSYN) (S140), and based on the citation type, the quoted phrase (QSYN) and the quoted phrase (CSYN) ) and setting the relationship (S150).

다만, 도 9의 인용 관계 분석 방법(100)은 도 1의 인용 관계 분석 방법(100)에서 인용 구문(QSYN)을 추출하는 단계(S110) 및 피인용 구문(CSYN)을 추출하는 단계(S130)가 그 식별 및 추출 단계를 세분화될 수 있고, 피인용 구문(CSYN)을 추출하는 단계(S130) 및 인용 유형을 분류하는 단계(S140)가 서로 병행하여 수행될 수도 있음을 명확히 하였다. However, the citation relationship analysis method 100 of FIG. 9 is a step of extracting a quoted phrase (QSYN) in the citation relationship analysis method 100 of FIG. 1 (S110) and a step of extracting a citation phrase (CSYN) (S130) The identification and extraction steps can be subdivided, and the step of extracting the citation phrase (CSYN) (S130) and the step of classifying the citation type (S140) can also be performed in parallel with each other.

나아가, 도 9의 인용 관계 분석 방법(100)은 도 1의 인용 관계 분석 방법(100)에서 인용 구문(QSYN)의 정규화(S160) 및/또는 피인용 구문(CSYN)의 정규화(S170)가 추가적으로 수행될 수 있고, 인용 관계 정보(RINF)가 데이터베이스로 구축(S180)될 수 있음을 명확히 하였다.Furthermore, in the citation relation analysis method 100 of FIG. 9 , the normalization (S160) of the citation syntax (QSYN) and/or the normalization of the quoted syntax (CSYN) in the citation relation analysis method 100 of FIG. 1 (S170) is additionally It has been clarified that it can be performed and that the citation relationship information (RINF) can be built into the database (S180).

인용 구문(QSYN) 및 피인용 구문(CSYN)의 정규화(S160, S170)는, 예를 들어, 인용 구문(QSYN) 및 피인용 구문(CSYN)에서 문장 부호나 불필요한 형용사와 같은 표현을 제거하거나, 구문의 길이가 기준값 이상인 경우 임의의 부분을 삭제하는 등의 과정을 통해 수행될 수 있다. 임의의 부분은 구문의 앞에서부터 기준값(예를 들어 100자) 이후의 부분일 수 있다. 인용 구문(QSYN) 및 피인용 구문(CSYN)의 정규화(S160, S170)를 통해 인용 유형 정보(CTYP) 및/또는 인용 관계 정보(RINF)를 정확하고 효율적으로 생성할 수 있다. 정규화된 인용 구문(QSYN)에 의하여 피인용 구문(CSYN)의 추출(S130)도 정확하고 효율적으로 수행될 수 있다. Normalization (S160, S170) of the quoted phrase (QSYN) and the quoted phrase (CSYN) removes expressions such as punctuation marks or unnecessary adjectives from, for example, the quoted phrase (QSYN) and the quoted phrase (CSYN), When the length of the sentence is greater than or equal to the reference value, it may be performed through a process such as deleting an arbitrary part. The arbitrary part may be a part after the reference value (for example, 100 characters) from the front of the phrase. Quotation type information (CTYP) and/or citation relationship information (RINF) can be accurately and efficiently generated through normalization ( S160 and S170 ) of the quoted phrase (QSYN) and the quoted phrase (CSYN). Extraction (S130) of the quoted phrase (CSYN) by the normalized quoted phrase (QSYN) can also be performed accurately and efficiently.

인용 유형 정보(CTYP)를 포함한 인용 구문(QSYN) 및 피인용 구문(CSYN)의 인용 관계 정보(RINF)에 대한 인용 관계 데이터베이스(미도시)는 인용 관계 분석 시스템(200)의 내부에 구비되거나 네트워크 등을 통해 인용 관계 분석 시스템(200)의 외부에 구비될 수 있다. 이때, 인용 관계 분석 시스템(200)은 인용 관계 정보(RINF)를 인용 관계 데이터베이스로 구축하는 인용 관계 데이터베이스 구축부(미도시)를 포함할 수 있다. A citation relation database (not shown) for citation relation information (RINF) of citation syntax (QSYN) and citation syntax (CSYN) including citation type information (CTYP) is provided in the citation relation analysis system 200 or provided in the network It may be provided outside of the citation relationship analysis system 200 through the like. In this case, the citation relation analysis system 200 may include a citation relation database construction unit (not shown) that constructs the citation relation information RINF as a citation relation database.

인용 유형 정보(CTYP) 기반의 구문 단위의 인용 관계 정보(RINF)는 데이터베이스화됨에 있어, 피인용 논문(CPPR)의 각 피인용 구문(CSYN)에 대한 인용 유형 정보(CTYP)를 취합하여 해당 피인용 논문(CPPR)에 대한 인용 특성에 대한 정보가 포함될 수 있다. 나아가 평가, 해당 피인용 논문(CPPR)에 대한 인용 특성에 근거하여 피인용 논문(CPPR)의 중요도 또는 활용도 등이 산출되어 평가될 수 있다. 피인용 논문(CPPR)의 인용 특성 또는 평가 결과 등도 데이터베이스화될 수 있다. Citation type information (CTYP)-based citation relationship information (RINF) in units of syntax is databased, so the citation type information (CTYP) for each citation phrase (CSYN) of the cited article (CPPR) is collected and the corresponding citation type information (CTYP) is collected. Information about the citation characteristics of the cited article (CPPR) may be included. Furthermore, based on the evaluation and the citation characteristics of the cited article (CPPR), the importance or utilization of the cited article (CPPR) may be calculated and evaluated. Citation characteristics or evaluation results of the cited articles (CPPR) may also be databased.

이렇듯, 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 유형을 분류함으로써 인용 관계, 즉 피인용 논문 또는 피인용 논문의 인용 목적 및 용도를 실질적으로 파악할 수 있고, 이를 통해 피인용 논문의 중요도 또는 활용도를 분석하는데 정확성 및 효율성을 높일 수 있다. 또한, 본 발명의 실시예에 따른 인용 유형 기반의 인용 관계 분석 방법 및 시스템에 의하면 인용 구문의 자연어 처리 및 피인용 구문 검색의 정확성 및 효율성을 높임으로써 시스템 리소스 사용을 최적화할 수 있다. As such, according to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention, the citation relationship, that is, the citation purpose and use of the cited thesis or citation thesis, can be substantially grasped by classifying the type of citation phrase. , it is possible to increase the accuracy and efficiency in analyzing the importance or utilization of the cited papers. In addition, according to the citation type-based citation relationship analysis method and system according to an embodiment of the present invention, it is possible to optimize the use of system resources by increasing the accuracy and efficiency of natural language processing of citation phrases and retrieval of citation phrases.

이상에서 본 발명의 실시예에 대해 설명하였으나, 본 발명의 기술적 사상은 이상의 설명 중에 개시된 실시예에 한정되는 것은 아니고, 본 발명의 기술적 사상을 이해하는 통상의 기술자는 동일한 기술적 사상의 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등을 통해, 용이하게 다른 실시예를 도출할 수 있고, 이는 또한 본 발명의 기술적 사상에 포함된다. Although the embodiments of the present invention have been described above, the technical spirit of the present invention is not limited to the embodiments disclosed during the above description, and those of ordinary skill in the art understanding the technical spirit of the present invention within the scope of the same technical spirit, Other embodiments can be easily derived by adding, changing, deleting, or adding components, and this is also included in the technical spirit of the present invention.

100: 인용 관계 분석 시스템 방법 200: 인용 관계 분석 시스템
210: 인용 구문 추출부 220: 피인용 논문 특정부
230: 피인용 구문 추출부 240: 인용 유형 정보 생성부
250: 인용 관계 정보 생성부 QPPR: 인용 논문
CPPR: 피인용 논문 QINF: 인용 논문 정보
CINF: 피인용 논문 정보 QSYN: 인용 구문
CSYN: 피인용 구문 CTYP: 인용 유형 정보
RINF: 인용 관계 정보
100: citation relation analysis system method 200: citation relation analysis system
210: citation phrase extraction unit 220: cited article specific portion
230: citation phrase extraction unit 240: citation type information generation unit
250: Citation relationship information generating unit QPPR: Citation papers
CPPR: Cited Articles QINF: Cited Articles Information
CINF: Cited article information QSYN: Citation syntax
CSYN: Quotation Syntax CTYP: Citation Type Information
RINF: Citation Relationship Information

Claims (15)

인용 논문으로부터 인용 구문을 추출하는 단계;
상기 인용 구문이 인용하는 피인용 논문을 특정하는 단계;
상기 인용 구문과의 유사도, 중복도 또는 관련도에 근거하여 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 단계;
상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하는 단계; 및
상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 인용 관계를 설정하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
extracting a quoted phrase from the cited article;
specifying the cited article cited by the citation phrase;
extracting a quoted phrase corresponding to the cited phrase from the cited article based on the degree of similarity, overlap, or relevance with the cited phrase;
classifying a citation type for the quoted phrase of the quoted phrase; and
A citation type-based citation relationship analysis method comprising a; setting a citation relationship between the citation phrase and the citation phrase based on the citation type.
청구항 1에 있어서, 상기 피인용 구문을 추출하는 단계는,
상기 인용 구문과 상기 피인용 논문의 각 구문을 비교하여 각 구문에 대해 유사도 또는 중복도를 산출하는 단계; 및
상기 피인용 논문의 각 구문에 대한 유사도 또는 중복도 중 가장 높은 유사도 또는 중복도를 갖는 구문을 상기 피인용 구문으로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1, wherein the step of extracting the quoted phrase,
calculating a degree of similarity or overlap for each phrase by comparing the quoted phrase with each phrase of the cited article; and
Citation type-based citation relationship analysis method comprising a; selecting a phrase having the highest degree of similarity or redundancy among phrases of the cited article as the cited phrase.
청구항 1에 있어서, 상기 피인용 구문을 추출하는 단계는,
상기 인용 구문과 상기 피인용 논문의 각 구문을 비교하여 각 구문에 대해 관련도를 산출하는 단계; 및
상기 피인용 논문의 각 구문에 대한 관련도 중 가장 높은 관련도를 갖는 구문을 상기 피인용 구문으로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1, wherein the step of extracting the quoted phrase,
calculating a degree of relevance for each phrase by comparing the quoted phrase with each phrase of the cited article; and
Citation type-based citation relationship analysis method comprising a; selecting a phrase having the highest degree of relevance among the relevance of each phrase of the cited article as the cited phrase.
청구항 1에 있어서,
상기 인용 유형을 분류하는 단계는,
상기 인용 구문을 적어도 하나의 레벨 이상의 자연어 처리하여 상기 인용 구문의 의미를 분석하는 단계; 및
상기 자연어 처리된 인용 구문에 대한 인용 유형을 사전 정의된 인용 유형 중 하나로 매칭(matching)하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1,
The step of classifying the citation type is,
analyzing the meaning of the quoted phrase by natural language processing of the quoted phrase at least one level or more; and
A citation type-based citation relationship analysis method comprising a; matching the citation type for the natural language-processed citation phrase to one of the predefined citation types.
청구항 4에 있어서,
상기 인용 유형을 매칭하는 단계는,
상기 인용 구문에 대한 인용 유형을 사전 정의된 용어 인용, 수식 인용, 정의 인용, 특징 인용, 연구를 통한 사실 인용 및 방법론적 사실 인용 중 하나로 선택하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
5. The method according to claim 4,
The step of matching the citation type is:
Citation type-based citation relationship analysis method including; selecting a citation type for the citation phrase from among predefined term citation, formula citation, definition citation, feature citation, fact citation through research, and methodological fact citation .
청구항 4에 있어서,
상기 인용 유형을 분류하는 단계는,
상기 자연어 처리된 인용 구문에 근거하여 대응되는 인용 유형을 추가로 생성하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.
5. The method according to claim 4,
The step of classifying the citation type is,
Citation type-based citation relationship analysis method further comprising; further generating a corresponding citation type based on the natural language-processed citation phrase.
청구항 1에 있어서,
상기 인용 유형을 분류하는 단계는,
상기 인용 구문으로부터 키 데이터(key data)를 추출하는 단계; 및
상기 키 데이터와 상기 인용 유형을 매칭시키는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1,
The step of classifying the citation type is,
extracting key data from the quoted phrase; and
A citation type-based citation relationship analysis method comprising a; matching the key data with the citation type.
청구항 1에 있어서,
상기 피인용 구문을 추출하는 단계 또는 상기 인용 유형을 분류하는 단계를 수행하기 전에, 상기 인용 구문을 정규화하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1,
Before performing the step of extracting the citation phrase or classifying the citation type, normalizing the citation phrase; citation type-based citation relationship analysis method further comprising a.
청구항 1에 있어서,
상기 인용 관계를 설정하는 단계는,
상기 인용 구문의 내용 및 관련 서지 정보, 상기 피인용 구문의 내용 및 관련 서지 정보 및 상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 결합하여 정보화하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
The method according to claim 1,
The step of establishing the citation relationship includes:
Citation type-based citation relationship analysis including; combining the content and related bibliographic information of the quoted phrase, the content and related bibliographic information of the quoted phrase, and the citation type for the quoted phrase of the quoted phrase Way.
청구항 9에 있어서,
상기 정보화된 결과를 취합하여 상기 피인용 논문에 대한 인용 관계 데이터베이스를 구축하는 단계;를 더 포함하는 인용 유형 기반의 인용 관계 분석 방법.
10. The method of claim 9,
The citation type-based citation relationship analysis method further comprising; building a citation relation database for the cited thesis by collecting the informational results.
인용 논문의 각 인용 구문 및 상기 각 인용 구문에 대응되는 각 피인용 구문을 매칭시키는 단계;
상기 각 피인용 구문에 대해 용어, 수식, 정의, 특징, 연구를 통한 사실 및 방법론 적용을 통한 사실 중 적어도 하나의 인용 유형으로 분류하는 단계; 및
상기 각 피인용 구문에 대한 인용 유형에 기반하여 상기 각 피인용 구문이 포함된 피인용 논문의 인용 특성을 결정하는 단계;를 포함하는 인용 유형 기반의 인용 관계 분석 방법.
matching each citation phrase of the cited article and each citation phrase corresponding to each citation phrase;
classifying each cited phrase into at least one citation type among terms, formulas, definitions, characteristics, facts through research, and facts through method application; and
A citation type-based citation relationship analysis method comprising a; determining a citation characteristic of a citation article including each citation phrase based on a citation type for each citation phrase.
인용 논문에서 인용 구문을 추출하는 인용 구문 추출부;
상기 인용 구문 추출부로부터 수신된 상기 인용 구문에 근거하여 피인용 논문을 검색하여 특정하는 피인용 논문 특정부;
상기 인용 구문과의 유사도, 중복도 또는 관련도에 근거하여 상기 피인용 논문에서 상기 인용 구문에 대응되는 피인용 구문을 추출하는 피인용 구문 추출부;
상기 인용 구문의 상기 피인용 구문에 대한 인용 유형을 분류하여 인용 유형 정보를 생성하는 인용 유형 정보 생성부; 및
상기 인용 유형에 근거하여 상기 인용 구문과 상기 피인용 구문의 관계에 대한 인용 관계 정보를 생성하는 인용 관계 정보 생성부;를 포함하는 인용 유형 기반의 인용 관계 분석 시스템.
a quoted phrase extracting unit for extracting a quoted phrase from a cited article;
a cited article specifying unit for searching and specifying a cited article based on the cited phrase received from the cited phrase extracting unit;
a quoted phrase extraction unit for extracting a quoted phrase corresponding to the quoted phrase from the cited article based on the degree of similarity, overlap, or relevance with the quoted phrase;
a citation type information generation unit for generating citation type information by classifying citation types of the citation phrases of the citation phrases; and
Citation type-based citation relationship analysis system comprising a; citation relationship information generating unit for generating citation relationship information on the relationship between the quoted phrase and the quoted phrase based on the citation type.
청구항 12에 있어서,
상기 인용 유형 정보 생성부는,
상기 인용 구문을 적어도 하나의 레벨 이상의 자연어 처리하여 상기 인용 구문의 의미를 분석하는 자연어 처리 모듈; 및
상기 자연어 처리된 인용 구문에 대한 인용 유형을 사전 정의된 인용 유형 중 하나로 매칭(matching)하는 인용 유형 매칭 모듈;을 포함하는 인용 유형 기반의 인용 관계 분석 시스템.
13. The method of claim 12,
The citation type information generating unit,
a natural language processing module for analyzing the meaning of the quoted phrase by performing natural language processing on the quoted phrase at least one level or more; and
A citation type-based citation relationship analysis system comprising a; a citation type matching module for matching the citation type for the natural language-processed citation phrase to one of the predefined citation types.
청구항 13에 있어서,
상기 인용 유형 매칭 모듈은,
상기 인용 구문에 대한 인용 유형을 사전 정의된 용어 인용, 수식 인용, 정의 인용, 특징 인용, 연구를 통한 사실 인용 및 방법론적 사실 인용 중 하나로 선택하는 인용 유형 선택기;를 포함하는 인용 유형 기반의 인용 관계 분석 시스템.
14. The method of claim 13,
The citation type matching module is
Citation type-based citation relationship including; analysis system.
청구항 13에 있어서,
상기 인용 유형 정보 생성부는, 상기 자연어 처리된 인용 구문에 근거하여 대응되는 인용 유형을 추가로 생성하는 인용 유형 생성 모듈;을 더 포함하는 인용 유형 기반의 인용 관계 분석 시스템.
14. The method of claim 13,
The citation type information generating unit may further include a citation type generation module that additionally generates a corresponding citation type based on the natural language-processed citation phrase.
KR1020210008524A 2021-01-21 2021-01-21 Citation Relationship Analysis Method and System Based on Citation Type KR102298397B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210008524A KR102298397B1 (en) 2021-01-21 2021-01-21 Citation Relationship Analysis Method and System Based on Citation Type

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210008524A KR102298397B1 (en) 2021-01-21 2021-01-21 Citation Relationship Analysis Method and System Based on Citation Type

Publications (1)

Publication Number Publication Date
KR102298397B1 true KR102298397B1 (en) 2021-09-07

Family

ID=77797270

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210008524A KR102298397B1 (en) 2021-01-21 2021-01-21 Citation Relationship Analysis Method and System Based on Citation Type

Country Status (1)

Country Link
KR (1) KR102298397B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102547402B1 (en) * 2023-03-17 2023-06-23 주식회사 무하유 Apparatus and method for verifying validity and reliability of cited documents

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357170A (en) * 1999-06-15 2000-12-26 Fujitsu Ltd Device that performs information retrieval by using reason of reference to document
KR101033611B1 (en) * 2010-07-09 2011-05-11 한국과학기술정보연구원 System and method for evaluating the suitability of reference
KR20200082551A (en) * 2018-12-30 2020-07-08 김산 A method and an apparatus for analyzing relationship of paper reference using a weight

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357170A (en) * 1999-06-15 2000-12-26 Fujitsu Ltd Device that performs information retrieval by using reason of reference to document
KR101033611B1 (en) * 2010-07-09 2011-05-11 한국과학기술정보연구원 System and method for evaluating the suitability of reference
KR20200082551A (en) * 2018-12-30 2020-07-08 김산 A method and an apparatus for analyzing relationship of paper reference using a weight

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Shiyan Ou and Hyonil Kim, Unsupervised Citation Sentence Identification Based on Similarity Measurement, iConference 2018: Transforming Digital Worlds pp 384-394. *
장덕현, 장환석. 기계공학 연구자들의 인용행태 분석: P대학 기계공학부 박사학위 논문을 중심으로. 정보관리연구, vol.38, no.3, 2007. pp. 111-135. 1부.* *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102547402B1 (en) * 2023-03-17 2023-06-23 주식회사 무하유 Apparatus and method for verifying validity and reliability of cited documents

Similar Documents

Publication Publication Date Title
US8108204B2 (en) Text categorization using external knowledge
Litvak et al. Graph-based keyword extraction for single-document summarization
US7814102B2 (en) Method and system for linking documents with multiple topics to related documents
US8073838B2 (en) Pseudo-anchor text extraction
CN111767716B (en) Method and device for determining enterprise multi-level industry information and computer equipment
CN107102993B (en) User appeal analysis method and device
Trappey et al. An R&D knowledge management method for patent document summarization
EP2577521A2 (en) Detection of junk in search result ranking
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
KR102107474B1 (en) Social issue deduction system and method using crawling
US11880396B2 (en) Method and system to perform text-based search among plurality of documents
Rakian et al. A Persian fuzzy plagiarism detection approach
Wang et al. Automatic tagging of cyber threat intelligence unstructured data using semantics extraction
KR102298397B1 (en) Citation Relationship Analysis Method and System Based on Citation Type
Hernes et al. The automatic summarization of text documents in the Cognitive Integrated Management Information System
CN101334793B (en) Method for automatic recognition for dependency relationship of demand
CN114238735B (en) Intelligent internet data acquisition method
Arya et al. Content extraction from news web pages using tag tree
KR102296577B1 (en) Method and System for Providing Citation Type Based Scholarly Information
KR20110045927A (en) Electronic book contents searching service system and electronic book contents searching service method
Manna et al. Information retrieval-based question answering system on foods and recipes
Khashfeh et al. A Text Mining Algorithm Optimising the Determination of Relevant Studies
Shahid et al. TOC generation in PDF Document for smart automated compliance engine
US20240086433A1 (en) Interactive tool for determining a headnote report
Khodade et al. Unsupervised Technique for Web Data Extraction: Trinity

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant