KR102417779B1 - Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof - Google Patents

Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof Download PDF

Info

Publication number
KR102417779B1
KR102417779B1 KR1020200119639A KR20200119639A KR102417779B1 KR 102417779 B1 KR102417779 B1 KR 102417779B1 KR 1020200119639 A KR1020200119639 A KR 1020200119639A KR 20200119639 A KR20200119639 A KR 20200119639A KR 102417779 B1 KR102417779 B1 KR 102417779B1
Authority
KR
South Korea
Prior art keywords
file
words
knowledge data
electronic document
document
Prior art date
Application number
KR1020200119639A
Other languages
Korean (ko)
Other versions
KR20220037091A (en
Inventor
안정우
이민재
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020200119639A priority Critical patent/KR102417779B1/en
Publication of KR20220037091A publication Critical patent/KR20220037091A/en
Application granted granted Critical
Publication of KR102417779B1 publication Critical patent/KR102417779B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법이 개시된다. 본 발명은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원할 수 있다.Disclosed are an electronic device for generating a knowledge data file for an electronic document based on a container format, and an operating method thereof. According to the present invention, when a knowledge dataization command for the electronic document is received from a user, a file for document information constituting the electronic document, a data set file for important keywords included in the electronic document, and a summary of the electronic document After generating a file for the electronic document, by creating a container format-based knowledge dataization file including a document file for the electronic document, a file for the document information, the data set file, and a file for the summary text, It can support to make knowledge data possible.

Description

컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법{ELECTRONIC DEVICE THAT GENERATES KNOWLEDGE DATA FILES FOR ELECTRONIC DOCUMENTS BASED ON CONTAINER FORMAT AND OPERATING METHOD THEREOF}An electronic device generating a knowledge data file for an electronic document based on a container format and an operating method thereof

본 발명은 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법에 대한 것이다.The present invention relates to an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method thereof.

최근, 기업 등에서 전자 문서를 활용한 업무가 증가함에 따라, 사용자의 전자 문서 사용의 편의를 도모할 수 있도록 지원하는 다양한 기술들이 등장하고 있고, 이러한 기술의 발달로 인해 전자 문서 분야에서 인공지능 기술을 도입하거나 다른 서비스와의 융합 등과 같은 다양화가 시도되고 있다.Recently, as businesses using electronic documents increase, various technologies that support users' convenience in using electronic documents are emerging. Diversification such as introduction or convergence with other services is being attempted.

보통, 전자 문서에는 다양한 정보들이 포함되어 있는데, 사용자가 이러한 정보들 중 필요한 정보만을 추출해서 활용하기 위해서는 많은 시간과 노력이 필요할 수 있다. 그렇기 때문에, 전자 문서의 여러 정보를 사전에 하나의 셋(set)으로 관리할 수 있다면, 전자 문서에 대한 활용성이 매우 커질 수 있을 것이다.In general, an electronic document contains a variety of information, and it may take a lot of time and effort for a user to extract and utilize only necessary information from among such information. Therefore, if various pieces of information of the electronic document can be managed as a set in advance, the utility of the electronic document may be greatly increased.

이와 관련해서, 전자 문서에 포함된 다양한 정보들을 구조화시켜 하나의 지식 데이터화 파일로 구성하는 방안을 고려할 수 있다. 예컨대, 지식 데이터화 파일에 전자 문서를 구성하는 라인 수, 페이지 수 등과 같은 전자 문서 자체의 메타 정보, 전자 문서의 본문, 전자 문서의 요약문, 전자 문서의 중요 키워드에 대한 정보를 포함시킴으로써, 사용자가 상기 지식 데이터화 파일로부터 전자 문서에 포함된 다양한 정보들에 손쉽게 접근할 수 있도록 하는 방안을 고려할 수 있다.In this regard, a method of structuring various information included in the electronic document into one knowledge data file may be considered. For example, by including meta information of the electronic document itself such as the number of lines and pages constituting the electronic document in the knowledge data file, the body of the electronic document, the summary of the electronic document, and information on important keywords of the electronic document, the user can A method of enabling easy access to various information included in an electronic document from a knowledge data file may be considered.

이렇게, 전자 문서에 포함된 정보를 사전에 지식 데이터화 파일로 관리할 경우, 'Time to Market' 서비스에 빠른 대응이 가능하고, 지식 데이터화 파일을 인공지능 학습을 위한 데이터에 활용하는 등과 같이, 다양한 서비스에 접목시킬 수도 있다.In this way, if the information included in the electronic document is managed as a knowledge data file in advance, a quick response to the 'Time to Market' service is possible, and various services such as utilizing the knowledge data file as data for artificial intelligence learning can also be incorporated into

다만, 전자 문서를 지식 데이터화 파일로 구성하는 경우, 해당 전자 문서가 보안이 필요한 문서일 수도 있기 때문에, 허가된 사용자만이 지식 데이터화 파일을 열람할 수 있도록 지원하기 위한 보안 프로토콜이 적용될 필요도 있다.However, when composing an electronic document as a knowledge data file, since the electronic document may be a document requiring security, it is also necessary to apply a security protocol to support only an authorized user to read the knowledge data file.

본 발명에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원한다.According to the present invention, an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method therefor, when a knowledge data format command for the electronic document is received from a user, provides information about document information constituting the electronic document. After generating a file, a data set file for important keywords included in the electronic document, and a file for a summary of the electronic document, a document file for the electronic document, a file for the document information, the data set file, and By creating a container format-based knowledge data file including a file for the summary text, it is supported to enable data dataization of electronic documents.

본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 추출부, 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 문서 정보 생성부, 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 중요 키워드 선정부, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 문장 추출부, 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 요약문 생성부 및 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 지식 데이터화 생성부를 포함한다.In the electronic device for generating a knowledge data data file for an electronic document based on a container format according to an embodiment of the present invention, when a knowledge data data form command for an electronic document is received from a user, the electronic device among words included in the electronic document An extractor that extracts n (n is a natural number greater than or equal to 2) words in the order of frequency of occurrence in the document, and counts the total number of words, the total number of pages, and the total number of lines included in the electronic document. , a document information generating unit that generates document information including the total number of pages and the total number of lines, and generates a file for the document information, after selecting the n words as important keywords for the electronic document, the An important keyword selection unit for generating a file for an important keyword data set including n words, a sentence extraction unit for extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document , a summary sentence generating unit generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary, a file for the document information, and a document file for the electronic document , a knowledge data generation unit for generating a container format-based knowledge data file including a file for the important keyword data set and a document file for the summary sentence.

또한, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 단계, 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 단계, 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 단계, 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 단계 및 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 단계를 포함한다.In addition, in the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention, when a knowledge data conversion command for an electronic document is received from a user, the extracting n (n is a natural number greater than or equal to 2) words in the order of frequency of occurrence in the electronic document among the words, counting the total number of words, total pages, and total lines included in the electronic document generating document information including the total number of words, the total number of pages, and the total number of lines, and generating a file for the document information, after selecting the n words as important keywords for the electronic document, generating a file for an important keyword data set including the n words; extracting at least one sentence including one or more of the n words from among sentences included in the electronic document; the at least one generating a summary by arranging sentences in the electronic document according to the arrangement order in the electronic document, generating a document file for the summary, and a file for the document information, a document file for the electronic document, and the important keyword data set and generating a container format-based knowledge dataization file including a file for , a document file for the summary.

본 발명에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원할 수 있다.According to the present invention, an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method therefor, when a knowledge data format command for the electronic document is received from a user, provides information about document information constituting the electronic document. After generating a file, a data set file for important keywords included in the electronic document, and a file for a summary of the electronic document, a document file for the electronic document, a file for the document information, the data set file, and By creating a container format-based knowledge data file including a file for the summary text, it is possible to support data dataization of electronic documents.

도 1은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 구조를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치를 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.
1 is a diagram illustrating a structure of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
2 is a diagram for explaining an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
3 is a flowchart illustrating an operation method of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.

이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. These descriptions are not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. While describing each drawing, like reference numerals are used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, refer to those of ordinary skill in the art to which the present invention belongs. It has the same meaning as is commonly understood by those who have it.

본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다. In this document, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, in various embodiments of the present invention, each of the components, functional blocks or means may be composed of one or more sub-components, and the electrical, electronic, and mechanical functions performed by each component are electronic. A circuit, an integrated circuit, an ASIC (Application Specific Integrated Circuit), etc. may be implemented as various well-known devices or mechanical elements, and may be implemented separately or two or more may be integrated into one.

한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.On the other hand, the blocks in the accompanying block diagram or steps in the flowchart are computer program instructions that are loaded in a processor or memory of equipment capable of data processing, such as a general-purpose computer, a special-purpose computer, a portable notebook computer, and a network computer, and perform specified functions. can be interpreted as meaning Since these computer program instructions may be stored in a memory provided in a computer device or in a memory readable by a computer, the functions described in the blocks of the block diagrams or the steps of the flowcharts are produced as articles of manufacture containing instruction means for performing the same. it might be In addition, each block or each step may represent a module, segment, or portion of code comprising one or more executable instructions for executing the specified logical function(s). It should also be noted that, in some alternative embodiments, it is also possible for the functions recited in blocks or steps to be executed out of the prescribed order. For example, two blocks or steps shown one after another may be performed substantially simultaneously or in the reverse order, and in some cases, some blocks or steps may be omitted.

도 1은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 구조를 도시한 도면이다.1 is a diagram illustrating a structure of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 추출부(111), 문서 정보 생성부(112), 중요 키워드 선정부(113), 문장 추출부(114), 요약문 생성부(115) 및 지식 데이터화 생성부(116)를 포함한다.Referring to FIG. 1 , an electronic device 110 for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention includes an extractor 111 , a document information generator 112 , and an important It includes a keyword selection unit 113 , a sentence extraction unit 114 , a summary sentence generation unit 115 , and a knowledge dataization generation unit 116 .

추출부(111)는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출한다.The extraction unit 111 receives n (n is a natural number greater than or equal to 2) words in the order of frequency of occurrence in the electronic document among the words included in the electronic document when a command to convert the knowledge to the electronic document is received from the user. extract them

예컨대, 상기 전자 문서에 포함된 단어가 '100개'라고 하고, n을 '5'라고 하는 경우, 추출부(111)는 상기 전자 문서에 포함된 100개의 단어들 중 상기 전자 문서 내에 등장하는 빈도수가 많은 순으로 5개의 단어들을 추출할 수 있다.For example, if the number of words included in the electronic document is '100' and n is '5', the extraction unit 111 is the number of occurrences in the electronic document among 100 words included in the electronic document. Five words can be extracted in the order of the most.

문서 정보 생성부(112)는 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성한다.The document information generating unit 112 generates document information including the total number of words, the total number of pages, and the total number of lines by counting the total number of words, the total number of pages, and the total number of lines included in the electronic document, , to create a file for the document information.

예컨대, 상기 전자 문서에 포함된 총 단어 수가 '2000개', 총 페이지 수가 '20페이지', 총 라인 수가 '350줄'이라고 하는 경우, 문서 정보 생성부(112)는 상기 총 단어 수 '2000개', 상기 총 페이지 수 '20페이지', 상기 총 라인 수 '350줄'을 카운트하여 상기 총 단어수 '2000개', 상기 총 페이지 수 '20페이지', 상기 총 라인 수 '350줄'을 포함하는 상기 문서 정보를 생성하고, '문서 정보.abc'라는 파일명을 갖는 상기 문서 정보에 대한 파일을 생성할 수 있다. For example, if the total number of words included in the electronic document is '2000', the total number of pages is '20 pages', and the total number of lines is '350 lines', the document information generating unit 112 sets the total number of words '2000 ', counting the total number of pages '20 pages' and the total number of lines '350 lines', including the total number of words '2000', the total number of pages '20 pages', and the total number of lines '350 lines' to generate the document information, and a file for the document information having a file name of 'document information.abc' may be created.

중요 키워드 선정부(113)는 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성한다.The important keyword selection unit 113 selects the n words as important keywords for the electronic document, and then creates a file for the important keyword data set including the n words.

예컨대, 전술한 예와 같이, n을 '5'라고 하고, 추출부(111)에서 5개의 단어들이 추출되었다고 하는 경우, 중요 키워드 선정부(113)는 상기 5개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 5개의 단어들을 포함하는 '중요 키워드 데이터 셋.xyz'라는 파일명을 갖는 상기 중요 키워드 데이터 셋에 대한 파일을 생성할 수 있다. For example, as in the above example, when n is '5' and five words are extracted by the extraction unit 111 , the important keyword selector 113 selects the five words as important for the electronic document. After the keyword is selected, a file for the important keyword data set having a file name of 'important keyword data set.xyz' including the five words may be generated.

이때, 본 발명의 일실시예에 따르면, 중요 키워드 선정부(113)는 산출부(117), 특징 벡터 생성부(118), 군집화부(119), 그룹 할당부(120) 및 데이터 셋 생성부(121)를 포함할 수 있다.At this time, according to an embodiment of the present invention, the important keyword selection unit 113 includes the calculation unit 117 , the feature vector generation unit 118 , the clustering unit 119 , the group assignment unit 120 , and the data set generation unit. (121) may be included.

산출부(117)는 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출한다.The calculator 117 calculates an average value of the frequency of appearance of each of the n words in the electronic document and the letter size of each of the n words in the electronic document.

예컨대, 전술한 예와 같이 n을 '5'라고 하고, 추출부(111)에서 추출된 5개의 단어들이 '빨강', '주황', '노랑', '초록', '파랑'이라고 하며, 상기 전자 문서 내에서 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 등장 빈도수가 '20회', '30회', '10회', '40회', '50회'라고 하는 경우, 산출부(117)는 상기 전자 문서 내에서 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 등장 빈도수에 대해 빨강의 등장 빈도수 '20회', 주황의 등장 빈도수 '30회', 노랑의 등장 빈도수 '10회', 초록의 등장 빈도수 '40회', 파랑의 등장 빈도수 '50회'로 확인할 수 있다.For example, as in the above example, let n be '5', and the five words extracted by the extraction unit 111 are called 'red', 'orange', 'yellow', 'green', and 'blue', and the The frequency of occurrence of each of the words 'red', 'orange', 'yellow', 'green', and 'blue' in the electronic document is '20', '30', '10', '40' , '50 times', the calculator 117 determines the frequency of occurrence of each of the words 'red', 'orange', 'yellow', 'green', and 'blue' in the electronic document. You can check the frequency of appearance '20', orange '30', yellow '10', green '40', and blue '50'.

그리고, 산출부(117)는 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출할 수 있다. 관련해서, '빨강'이라고 하는 단어가 상기 전자 문서에서 '20회' 등장하는데, '10회'는 '12pt'라는 글자 크기를 갖고, 나머지 '10회'는 '14pt'라는 글자 크기를 갖는다고 하는 경우, 산출부(117)는 '빨강'이라고 하는 단어의 상기 전자 문서 내에서의 글자 크기의 평균 값을 '13pt'로 산출할 수 있다. 이러한 방식으로, 산출부(117)는 '주황', '노랑', '초록', '파랑'이라고 하는 단어들 각각에 대해서도 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출할 수 있다.In addition, the calculator 117 may calculate an average value of the font size in the electronic document for each of the words 'red', 'orange', 'yellow', 'green', and 'blue'. In this regard, it is said that the word 'red' appears '20 times' in the electronic document, '10 times' has a font size of '12pt', and the remaining '10 times' has a font size of '14pt'. In this case, the calculator 117 may calculate the average value of the letter size of the word 'red' in the electronic document as '13pt'. In this way, the calculator 117 may calculate the average value of the font size in the electronic document even for each of the words 'orange', 'yellow', 'green', and 'blue'.

만약, '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값이 '13pt', '12pt', '16pt', '14pt', '14pt'로 산출되었다고 가정하는 경우, 산출부(117)가 산출한 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 글자 크기의 평균 값은 하기의 표 1과 같이 나타낼 수 있다.If the average value of the font size in each of the words 'red', 'orange', 'yellow', 'green', and 'blue' in the electronic document is '13pt', '12pt', '16pt', When it is assumed that '14pt' and '14pt' are calculated, the words 'red', 'orange', 'yellow', 'green', and 'blue' calculated by the calculator 117 are included in each of the electronic documents. The average value of the frequency of appearance and the size of the letters can be shown in Table 1 below.

단어word 단어의 등장 빈도수frequency of occurrence of a word 단어의 글자 크기의 평균 값The average value of the letter size of a word 빨강Red 20회Episode 20 13pt13pt 주황Orange 30회30 episodes 12pt12pt 노랑yellow 10회10 episodes 16pt16pt 초록green 40회40 episodes 14pt14pt 파랑blue 50회50 episodes 14pt14pt

특징 벡터 생성부(118)는 상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성한다.The feature vector generator 118 generates a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components for each of the n words.

관련해서, 앞선 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라는 단어가 중요 키워드로 추출되었다고 하고, 이때, 상기 전자 문서 내에서 '빨강'이라는 단어의 등장 빈도수가 '20회'이고, 글자 크기의 평균 값이 '13pt'라고 하는 경우, 특징 벡터 생성부(118)는 '빨강'이라는 단어에 대응되는 특징 벡터를 '[20 13]'으로 생성할 수 있다. 이러한 방식으로, 특징 벡터 생성부(118)는 나머지 '주황', '노랑', '초록', '파랑'이라는 단어들 각각에 대응되는 특징 벡터를 생성할 수 있다.In relation to this, as in the previous example, it is said that the words 'red', 'orange', 'yellow', 'green', and 'blue' are extracted as important keywords, and at this time, the word 'red' in the electronic document is When the frequency of appearance is '20 times' and the average value of the letter size is '13pt', the feature vector generator 118 generates a feature vector corresponding to the word 'red' as '[20 13]'. can In this way, the feature vector generator 118 may generate a feature vector corresponding to each of the remaining words 'orange', 'yellow', 'green', and 'blue'.

군집화부(119)는 상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화한다.The clustering unit 119 clusters the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the n words.

여기서, K-평균 군집화란 벡터의 형태로 구성된 데이터를 K개의 그룹으로 묶는 알고리즘을 의미하는 것으로, 데이터가 속한 그룹의 중심과 각 데이터 간의 거리의 차이가 최소가 되도록 데이터들을 K개의 그룹으로 군집화하는 알고리즘이다.Here, K-means clustering refers to an algorithm that groups data in the form of vectors into K groups, and clusters the data into K groups so that the difference between the distance between the center of the group to which the data belongs and the distance between each data is minimized. It is an algorithm.

관련해서, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어가 중요 키워드로 추출되었다고 하고, K를 '3'이라고 가정하는 경우, 군집화부(119)는 '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어들 각각의 특징 벡터를 기초로 K-평균 군집화를 수행하여, '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어들을 3개의 그룹으로 군집화할 수 있다.In relation to, as in the above example, if it is assumed that five words 'red', 'orange', 'yellow', 'green', and 'blue' are extracted as important keywords, and K is '3', The clustering unit 119 performs K-means clustering based on the feature vectors of each of the five words 'red', 'orange', 'yellow', 'green', and 'blue', Five words 'orange', 'yellow', 'green', and 'blue' can be clustered into three groups.

이때, 군집화부(119)는 단어의 등장 빈도수와 글자 크기의 평균 값으로 구성된 특징 벡터를 기초로 상기 n개의 단어들을 K개의 그룹으로 군집화하기 때문에, 상기 n개의 단어들은 단어의 등장 빈도수가 많으면서 글자 크기의 평균 값이 높은 그룹, 단어의 등장 빈도수가 중간이면서 글자 크기의 평균 값이 중간인 그룹, 단어의 등장 빈도수가 적으면서 글자 크기의 평균 값이 낮은 그룹 등으로 군집화될 수 있다.At this time, since the clustering unit 119 clusters the n words into K groups based on a feature vector composed of the average value of the frequency of occurrence of the word and the average value of the letter size, the n words have a high frequency of occurrence while The group may be clustered into a group having a high average value of the letter size, a group having a medium frequency of occurrence of words and a medium value of the average value of the letter size, a group having a low frequency of occurrence of words and a low average value of the letter size, and the like.

그룹 할당부(120)는 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당한다.The group allocator 120 designates words belonging to the same group among the K groups as words having similar importance to each other, and then allocates group information about the group to which each word belongs to each of the n words. .

예컨대, 전술한 예와 같이, 군집화부(119)가 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들을 3개의 그룹으로 군집화한 결과, '빨강'과 '주황'이라고 하는 단어가 '그룹 1'로 군집화되었고, '초록'과 '파랑'이라고 하는 단어가 '그룹 2'로 군집화되었으며, '노랑'이라는 단어가 '그룹 3'으로 군집화되었다고 하는 경우, 그룹 할당부(120)는 상기 3개의 그룹 중 '그룹 1' 내에 속하는 '빨강'과 '주황'이라고 하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정하고, 상기 3개의 그룹 중 '그룹 2' 내에 속하는 '초록'과 '파랑'이라고 하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정하며, 상기 3개의 그룹 중 '그룹 3' 내에 속하는 '노랑'이라고 하는 단어를 서로 유사한 중요도를 갖는 단어로 지정할 수 있다.For example, as in the above example, the clustering unit 119 clusters five words 'red', 'orange', 'yellow', 'green', and 'blue' into three groups. As a result, 'red' If the words 'orange' and 'orange' were clustered into 'group 1', the words 'green' and 'blue' were clustered into 'group 2', and the word 'yellow' was clustered into 'group 3'. , the group assignment unit 120 designates the words 'red' and 'orange' belonging to 'group 1' among the three groups as words having similar importance, and among the three groups, 'group 2' Designate the words 'green' and 'blue' belonging to within as words with similar importance, and designate the word 'yellow' belonging to 'group 3' among the three groups as words with similar importance can

그러고 나서, 그룹 할당부(120)는 '빨강'이라고 하는 단어에 대해 '빨강'이라고 하는 단어가 속해있는 '그룹 1'에 대한 그룹 정보를 할당할 수 있고, '주황'이라고 하는 단어에 대해 '주황'이라고 하는 단어가 속해있는 '그룹 1'에 대한 그룹 정보를 할당할 수 있으며, '노랑'이라고 하는 단어에 대해 '노랑'이라고 하는 단어가 속해있는 '그룹 3'에 대한 그룹 정보를 할당할 수 있고, '초록'이라고 하는 단어에 대해 '초록'이라고 하는 단어가 속해있는 '그룹 2'에 대한 그룹 정보를 할당할 수 있고, '파랑'이라고 하는 단어에 대해 '파랑'이라고 하는 단어가 속해있는 '그룹 2'에 대한 그룹 정보를 할당할 수 있다. Then, the group assignment unit 120 may allocate group information for 'group 1' to which the word 'red' belongs to the word 'red', and ' Group information for 'Group 1' to which the word 'Orange' belongs can be assigned, and for the word 'Yellow', group information for 'Group 3' to which the word 'Yellow' belongs can be assigned. and group information for 'group 2' to which the word 'green' belongs to the word 'green', and the word 'blue' belongs to the word 'blue' Group information for 'group 2' can be assigned.

이렇게, 상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 데이터 셋 생성부(121)는 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성할 수 있다.In this way, when the group information is allocated to each of the n words, the data set generating unit 121 may generate a file for the important keyword data set including the n words to which the group information is allocated. .

문장 추출부(114)는 중요 키워드 선정부(113)에서 상기 중요 키워드 데이터 셋에 대한 파일 생성이 완료되면, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출한다.When the important keyword selection unit 113 completes the creation of the file for the important keyword data set, the sentence extraction unit 114 selects at least one of the n words from among the sentences included in the electronic document. extract the sentence

예컨대, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들이 상기 중요 키워드로 선정되었다고 하는 경우, 문장 추출부(114)는 상기 전자 문서에 포함된 문장들 중 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출할 수 있다.For example, as in the above example, when five words such as 'red', 'orange', 'yellow', 'green', and 'blue' are selected as the important keywords, the sentence extraction unit 114 is At least one sentence including at least one of five words 'red', 'orange', 'yellow', 'green', and 'blue' among sentences included in the electronic document may be extracted.

요약문 생성부(115)는 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성한다.The summary generating unit 115 generates a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generates a document file for the summary.

예컨대, 문장 추출부(114)에서 상기 적어도 하나의 문장으로 30개의 문장이 추출되었다고 하는 경우, 요약문 생성부(115)는 상기 전자 문서에서의 배치 순서에 따라 상기 적어도 하나의 문장인 30개의 문장을 배치하여 요약문을 생성하고, '요약문.hwp'라는 확장자를 갖는 상기 요약문에 대한 문서 파일을 생성할 수 있다.For example, when it is assumed that 30 sentences are extracted as the at least one sentence by the sentence extraction unit 114, the summary sentence generating unit 115 selects the 30 sentences which are the at least one sentence according to the arrangement order in the electronic document. It is possible to generate a summary sentence by disposing it, and to generate a document file for the summary sentence having an extension of 'summary sentence.hwp'.

이렇게, 상기 문서 정보에 대한 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일이 생성되면, 지식 데이터화 생성부(116)는 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성한다.In this way, when the file for the document information, the file for the important keyword data set, and the document file for the summary are generated, the knowledge data generation unit 116 generates the file for the document information and the document file for the electronic document. , a container format-based knowledge dataization file including a file for the important keyword data set and a document file for the summary sentence is generated.

여기서, 컨테이너 포맷이란 상이한 데이터 구성요소들과 메타 데이터들이 컴퓨터 파일 안에서 같이 있을 수 있게 하는 방법을 기술하고 있는 메타 파일 포맷을 의미한다. 예컨대, 다양한 파일들을 하나의 파일로 무손실 압축할 수 있는 포맷인 'zip' 파일이나, 비디오와 오디오 코덱을 하나의 파일로 담고 있는 동영상 포맷인 'mkv' 파일 등이 컨테이너 포맷으로 구성된 파일일 수 있다.Here, the container format refers to a meta file format that describes a method for allowing different data elements and meta data to exist together in a computer file. For example, a 'zip' file, a format that can losslessly compress various files into a single file, or a 'mkv' file, a video format containing video and audio codecs in one file, may be a container format file. .

이때, 본 발명의 일실시예에 따르면, 지식 데이터화 생성부(116)는 상기 지식 데이터화 파일을 'okd'(office knowledge document)라고 하는 확장자를 갖는 파일로 생성할 수 있다.In this case, according to an embodiment of the present invention, the knowledge dataization generation unit 116 may generate the knowledge dataization file as a file having an extension called 'okd' (office knowledge document).

관련해서, 전술한 예와 같이, 상기 문서 정보에 대한 파일이 '문서 정보.abc'로 생성되었고,, 상기 전자 문서에 대한 중요 키워드 데이터 셋에 대한 파일이 '중요 키워드 데이터 셋.xyz'으로 생성되었으며, 상기 전자 문서에 대한 요약문 파일이 '요약문.hwp'으로 생성되었다고 하고, 상기 전자 문서에 대한 문서 파일이 '문서.hwp'라고 하는 경우, 지식 데이터화 생성부(116)는 상기 문서 정보에 대한 파일인 '문서 정보.abc', 상기 전자 문서에 대한 문서 파일인 '문서.hwp', 상기 중요 키워드 데이터 셋에 대한 파일인 '중요 키워드 데이터 셋.xyz', 상기 요약문에 대한 문서 파일인 '요약문.hwp'를 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일로 '지식 데이터화 파일.okd'를 생성할 수 있다.In relation, as in the above example, the file for the document information is created as 'document information.abc', and the file for the important keyword data set for the electronic document is created as 'important keyword data set.xyz' If it is said that the summary file for the electronic document is generated as 'summary.hwp' and the document file for the electronic document is called 'document.hwp', the knowledge data generation unit 116 for the document information A file 'document information.abc', a document file for the electronic document 'document.hwp', a file for the important keyword data set 'important keyword data set.xyz', and a document file for the summary sentence 'summary' 'Knowledge data data file.okd' can be created as a container format-based knowledge data data file including '.hwp'.

이때, 본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 분할부(122), 문서 정보 표시부(123), 본문 표시부(124), 요약문 표시부(125) 및 중요 키워드 표시부(126)를 더 포함할 수 있다. At this time, according to an embodiment of the present invention, the electronic device 110 for generating a knowledge data file for an electronic document based on a container format includes a division unit 122 , a document information display unit 123 , and a text display unit 124 . , a summary text display unit 125 and an important keyword display unit 126 may be further included.

분할부(122)는 지식 데이터화 생성부(116)를 통해 상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할한다.After the knowledge data format file is generated through the knowledge data format generation unit 116, the division unit 122 receives a command to execute the knowledge data format file from the user, the screen display area according to the execution of the knowledge data format file is divided into a document information display area, text display area, summary text display area, and important keyword display area.

관련해서, 분할부(122)는 도 2에 도시된 그림과 같이, 화면 표시 영역을 문서 정보 표시 영역(211), 본문 표시 영역(212), 요약문 표시 영역(213) 및 중요 키워드 표시 영역(214)으로 분할할 수 있다.In this regard, the division unit 122 divides the screen display area into a document information display area 211 , a text display area 212 , a summary text display area 213 , and an important keyword display area 214 as shown in FIG. 2 . ) can be divided into

문서 정보 표시부(123)는 상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역(211)에 상기 문서 정보를 표시한다.The document information display unit 123 displays the document information in the document information display area 211 by executing a file for the document information included in the knowledge data conversion file.

예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 문서 정보에 대한 파일이 '문서 정보.abc'라고 하는 경우, 문서 정보 표시부(123)은 상기 문서 정보에 대한 파일인 '문서 정보.abc' 파일을 실행해서, 상기 문서 정보 표시 영역(211)에 상기 문서 정보를 표시할 수 있다.For example, as in the above example, when the file for the document information included in the 'knowledge data data file.okd' that is the knowledge data data file is 'document information. abc', the document information display unit 123 may display the document information The document information may be displayed in the document information display area 211 by executing a 'document information.abc' file for .

본문 표시부(124)는 상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역(212)에 상기 전자 문서의 본문을 표시한다.The body display unit 124 executes a document file for the electronic document included in the knowledge data file, and displays the body of the electronic document in the body display area 212 .

예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 전자 문서에 대한 파일이 '문서.hwp'라고 하는 경우, 본문 표시부(124)는 상기 전자 문서에 대한 파일인 '문서.hwp' 파일을 실행해서, 상기 본문 표시 영역(212)에 상기 전자 문서의 본문을 표시할 수 있다.For example, as in the above-described example, when the file for the electronic document included in the 'knowledge data data file.okd', which is the knowledge data data file, is called 'document.hwp', the text display unit 124 is By executing the file 'document.hwp', the body of the electronic document may be displayed in the body display area 212 .

요약문 표시부(125)는 상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역(213)에 상기 요약문을 표시한다.The summary text display unit 125 executes a document file for the summary text included in the knowledge data format file, and displays the summary text in the summary text display area 213 .

예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 요약문에 대한 파일이 '요약문.hwp'라고 하는 경우, 요약문 표시부(125)는 상기 요약문에 대한 파일인 '요약문.hwp' 파일을 실행해서, 상기 요약문 표시 영역(213)에 상기 요약문을 표시할 수 있다.For example, as in the above example, when the file for the summary text included in the knowledge data format file 'knowledge data format file.okd' is called 'summary text.hwp', the summary text display unit 125 is a file for the summary text. By executing the 'summary text.hwp' file, the summary text may be displayed in the summary text display area 213 .

중요 키워드 표시부(126)는 상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역(214)에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역(214)에 표시한다.The important keyword display unit 126 executes the important keyword data set file included in the knowledge data file, and displays the n words in the important keyword display area 214 by dividing them into the K groups, and at the same time, A first notification message indicating that the n words are important keywords for the electronic document and a second notification message indicating that words belonging to the same group among the K groups have similar importance are generated to display the important keywords (214) is indicated.

예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 중요 키워드 데이터 셋에 대한 파일이 '중요 키워드 데이터 셋.xyz'라고 하는 경우, 중요 키워드 표시부(126)는 상기 중요 키워드 데이터 셋에 대한 파일인 '중요 키워드 데이터 셋.xyz' 파일을 실행해서, 상기 중요 키워드 표시 영역(214)에 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 단어들을 3개의 그룹별로 구분해서 표시할 수 있다.For example, as in the above-described example, when the file for the important keyword data set included in the knowledge data data file 'knowledge data data file.okd' is 'important keyword data set.xyz', the important keyword display unit 126 executes the 'important keyword data set.xyz' file for the important keyword data set, and displays 'red', 'orange', 'yellow', 'green', and 'blue' in the important keyword display area 214 . The words ' can be displayed by dividing them into three groups.

그리고, 중요 키워드 표시부(126)는 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 3개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 중요 키워드 표시 영역(214)에 표시할 수 있다. 이와 관련해서, 상기 제2 알림 메시지는 상기 3개의 그룹 중 '그룹 1' 내에 속하는 '빨강', '주황'이라고 하는 단어들이 서로 유사한 중요도를 갖는 단어임을 지시하고, '그룹 2' 내에 속하는 '초록', '파랑'이라고 하는 단어들이 서로 유사한 중요도를 갖는 단어임을 지시하며, '그룹 3' 내에 속하는 '노랑'이라고 하는 단어가 서로 유사한 중요도를 갖는 단어임을 지시하는 정보를 담고 있을 수 있다.In addition, the important keyword display unit 126 displays a first notification message indicating that the words 'red', 'orange', 'yellow', 'green', and 'blue' are important keywords for the electronic document and the three groups. A second notification message indicating that words belonging to the same group are words having similar importance may be generated and displayed on the important keyword display area 214 . In this regard, the second notification message indicates that words 'red' and 'orange' belonging to 'group 1' among the three groups have similar importance to each other, and 'green' belonging to 'group 2' It may contain information indicating that the words ' and 'blue' are words having similar importance to each other, and the word 'yellow' belonging to 'group 3' is a word having similar importance to each other.

본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 상기 지식 데이터화 파일에 대한 보안 설정을 가능하게 하기 위한 구성으로, 테이블 유지부(127), 연접번호 생성부(128), 암호화키 추출부(129), 파일 암호화부(130) 및 안내 메시지 표시부(131)를 더 포함할 수 있다.According to an embodiment of the present invention, the electronic device 110 for generating a knowledge data format file for an electronic document based on a container format is configured to enable security setting for the knowledge data format file, and includes a table maintaining unit ( 127), a connection number generation unit 128, an encryption key extraction unit 129, a file encryption unit 130, and a guide message display unit 131 may be further included.

테이블 유지부(127)는 미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지한다.The table maintaining unit 127 stores and maintains a table in which predetermined t (t is a natural number greater than or equal to 2) encryption keys and integers from 0 to t-1 corresponding to each encryption key are recorded.

예컨대, t를 '5'라고 가정하는 경우, 테이블 유지부(127)는 하기의 표 2과 같이 암호화키 테이블을 저장하여 유지하고 있을 수 있다.For example, if t is assumed to be '5', the table maintaining unit 127 may store and maintain the encryption key table as shown in Table 2 below.

5개의 암호화키들5 encryption keys 정수 값integer value 암호화키 1encryption key 1 00 암호화키 2encryption key 2 1One 암호화키 3encryption key 3 22 암호화키 4encryption key 4 33 암호화키 5encryption key 5 44

연접번호 생성부(128)는 상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성한다.After the knowledge data format file is generated, when a security setting command for the knowledge data format file is received from the user, the contact number generator 128 calculates a numerical value indicating the number of words included in each of the K groups in ascending order. Concatenation is performed to generate a concatenated number.

예컨대, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들이 '빨강', '주황'이라고 하는 단어가 포함된 '그룹 1', '초록', '파랑'이라고 하는 단어가 포함된 '그룹 2' 및 '노랑'이라고 하는 단어가 포함된 '그룹 3'으로 구분되었다고 가정하는 경우, 연접번호 생성부(128)는 '그룹 1'에 포함된 '빨강', '주황'이라고 하는 단어의 개수인 '2'개, '그룹 2'에 포함된 '초록', '파랑'이라고 하는 단어의 개수인 '2'개, '그룹 3'에 포함된 '노랑'이라고 하는 단어의 개수인 '1'개를 나타내는 수치를 추출하고, 추출된 상기 3개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접함으로써, '221'이라는 연접번호를 생성할 수 있다.For example, as in the above example, five words 'red', 'orange', 'yellow', 'green', and 'blue' are 'group 1' including the words 'red' and 'orange' If it is assumed that 'group 2' containing the words 'green' and 'blue' and 'group 3' containing the words 'yellow' are divided into 'group 3', '2', the number of words 'red' and 'orange' included in ', '2', the number of words 'green' and 'blue' included in 'Group 2', 'Group 3' By extracting a number representing '1', which is the number of words 'yellow' included in You can create a contact number.

암호화키 추출부(129)는 상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출한다.When the concatenated number is generated, the encryption key extraction unit 129 calculates an operation value by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and the operation value is obtained from the table. Extracts the first encryption key corresponding to .

여기서, 모듈로 연산은 피제수를 제수로 나누는 나눗셈을 수행하여 그에 대한 나머지(remainder)를 산출하는 연산을 의미한다.Here, the modulo operation refers to an operation of dividing a dividend by a divisor to calculate a remainder thereof.

예컨대, 전술한 예와 같이, 상기 t를 '5'라고 하고, 상기 연접번호를 '221'이라고 가정하는 경우, 암호화키 추출부(129)는 상기 연접번호 '221'을 피제수로, 상기 '5'를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값을 '1'과 같이 산출할 수 있다.For example, as in the above example, when it is assumed that t is '5' and the concatenated number is '221', the encryption key extraction unit 129 sets the concatenated number '221' as the dividend, and the '5' By performing a modulo operation of ' as a divisor, the calculated value can be calculated as '1'.

그러고 나서, 암호화키 추출부(129)는 상기 표 2과 같은 상기 테이블로부터 상기 연산 값인 '1'에 대응되는 제1 암호화키로 '암호화키 2'를 추출할 수 있다.Then, the encryption key extraction unit 129 may extract 'encryption key 2' from the table as shown in Table 2 above with the first encryption key corresponding to the operation value '1'.

파일 암호화부(130)는 상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화한다.The file encryption unit 130 encrypts the knowledge data file with the first encryption key.

예컨대, 전술한 예와 같이, 암호화 추출부(129)를 통해, 상기 제1 암호화키로 '암호화키 2'가 추출되면, 파일 암호화부(130)는 상기 지식 데이터화 파일을 상기 제1 암호화키인 '암호화키 2'로 암호화할 수 있다.For example, as in the above example, when 'encryption key 2' is extracted as the first encryption key through the encryption extraction unit 129, the file encryption unit 130 converts the knowledge data file to the 'first encryption key'. It can be encrypted with encryption key 2'.

안내 메시지 표시부(131)는 상기 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시한다.When the data conversion file is encrypted, the guide message display unit 131 displays a guide message indicating that the connection number is a security code for decrypting the knowledge data file on the screen.

이때, 사용자는 상기 안내 메시지를 보고 추후 상기 지식 데이터화 파일의 복호화를 수행하기 위해서 화면 상에 표시되는 상기 보안코드를 숙지해둘 수 있다.In this case, the user can see the guide message and keep in mind the security code displayed on the screen in order to decrypt the knowledge data file later.

이때, 본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 보안코드 입력 메시지 표시부(132) 및 복호화부(133)을 포함할 수 있다.At this time, according to an embodiment of the present invention, the electronic device 110 for generating a knowledge data file for an electronic document based on the container format may include a security code input message display unit 132 and a decryption unit 133 . have.

보안코드 입력 메시지 표시부(132)는 상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시한다.Security code input message display unit 132, after the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, the security instructing the user to input the security code for security release A code input message is displayed on the screen.

예컨대, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 보안코드 입력 메시지 표시부(132)는 상기 사용자에게 '보안코드를 입력하세요'라는 보안코드 입력 메시지와 함께 보안코드 입력창을 화면 상에 표시할 수 있다.For example, when a security release command of the knowledge data file is received from the user, the security code input message display unit 132 displays a security code input window together with a security code input message 'Enter a security code' to the user on the screen. can be displayed in

그러고 나서, 상기 사용자로부터 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 복호화부(133)는 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화한다.Then, when the concatenated number is received in response to the security code input message from the user, the decryption unit 133 performs a modulo operation in which the concatenated number is a dividend and t is a divisor, and the calculated value , and extracts the first encryption key corresponding to the calculated value from the table, and then decrypts the knowledge data file with the first encryption key.

예컨대, 전술한 예와 같이, t를 '5'라고 하고, 상기 연접번호를 '221'이라고 가정하는 경우, 복호화부(133)는 사용자로부터 '221'이라고 하는 연접번호가 보안코드로서 수신되면, 상기 연접번호 '221'을 피제수, 상기 '5'를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값 '1'을 산출할 수 있다.For example, as in the above example, if t is '5' and the concatenated number is '221', the decryption unit 133 receives the contiguous number '221' from the user as a security code. By performing a modulo operation in which the concatenation number '221' is a dividend and '5' is a divisor, an operation value '1' may be calculated.

그러고 나서, 복호화부(133)는 상기 표 2과 같은 상기 테이블로부터 상기 연산 값인 '1'에 대응되는 상기 제1 암호화키로 '암호화키 2'를 추출한 후 '암호화키 2'로 상기 지식 데이터화 파일을 복호화할 수 있다.Then, the decryption unit 133 extracts 'encryption key 2' with the first encryption key corresponding to the operation value '1' from the table as shown in Table 2, and then uses the 'encryption key 2' to convert the knowledge data file can be decrypted.

도 3은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.3 is a flowchart illustrating an operation method of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.

단계(S310)에서는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 전자 문서에 포함된 단어들 중 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출한다.In step S310, when a knowledge dataization command for an electronic document is received from the user, n (n is a natural number greater than or equal to 2) words are extracted in the order of frequency of occurrence in the electronic document among the words included in the electronic document. .

단계(S320)에서는 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성한다.In step S320, the total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and the document information is generated. Create a file for information.

단계(S330)에서는 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성한다.In step S330, after selecting the n words as important keywords for the electronic document, a file for the important keyword data set including the n words is generated.

단계(S340)에서는 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출한다.In step S340, from among the sentences included in the electronic document, at least one sentence including one or more of the n words is extracted.

단계(S350)에서는 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성한다.In step S350, a summary is generated by arranging the at least one sentence according to an arrangement order in the electronic document, and a document file for the summary is generated.

단계(S360)에서는 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성한다.In step S360, a container format-based knowledge data file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence is generated.

이때, 본 발명의 일실시예에 따르면, 단계(S330)에서는 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 단계, 상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 단계, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 단계, 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 단계 및 상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계를 포함할 수 있다.At this time, according to an embodiment of the present invention, in step S330 , the average value of the frequency of appearance of each of the n words in the electronic document and the letter size of each of the n words in the electronic document calculating, for each of the n words, generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components, the n clustering the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the words, words belonging to the same group among the K groups having similar importance allocating group information for a group to which each word belongs to each of the n words after designating them as It may include generating a file for the important keyword data set including the words.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 단계, 상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 단계, 상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 단계, 상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 단계 및 상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, in the method of operating the electronic device, after the knowledge data format file is generated, when an execution command of the knowledge data format file is applied from the user, the method according to the execution of the knowledge data format file dividing the screen display area into a document information display area, a text display area, a summary text display area and an important keyword display area, executing a file for the document information included in the knowledge data format file, and placing the document information display area in the document information display area Displaying document information, executing a document file for the electronic document included in the knowledge data format file, and displaying the body of the electronic document in the text display area; displaying the summary text in the summary text display area by executing a document file for A first notification message indicating that the n words are important keywords for the electronic document and a second notification indicating that words belonging to the same group among the K groups are words having similar importance to each other The method may further include generating a message and displaying it in the important keyword display area.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 단계, 상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 단계, 상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 단계, 상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 단계 및 상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, in the method of operating the electronic device, predetermined t (t is a natural number greater than or equal to 2) encryption keys and an integer of 0 or more and t-1 or less corresponding to each encryption key are recorded in correspondence After the knowledge data format file is created, when a security setting command for the knowledge data format file is received from the user, a numerical value indicating the number of words included in each of the K groups in ascending order generating a concatenated number by concatenation with extracting a first encryption key corresponding to the operation value, encrypting the knowledge data file with the first encryption key, and when the knowledge data file is encrypted, the concatenated number is a security code for decrypting the knowledge data file It may further include the step of displaying a guide message indicating that on the screen.

이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 단계 및 상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 단계를 더 포함할 수 있다.At this time, according to an embodiment of the present invention, in the method of operating the electronic device, after the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, displaying a security code input message instructing to input the security code on a screen, and when the contact number is received from the user in response to the security code input message, divide the contact number as a dividend and divide the t Calculating the calculated value by performing a modulo operation of can do.

이상, 도 3를 참조하여 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 도 1을 이용하여 설명한 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.In the above, a method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention has been described with reference to FIG. 3 . Here, in the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention, a knowledge data file for an electronic document is generated based on the container format described with reference to FIG. 1 . Since it may correspond to the configuration for the operation of the generated electronic device 110, a more detailed description thereof will be omitted.

본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.The method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through combination with a computer.

또한, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention is implemented in the form of a program command that can be executed through various computer means and is a computer-readable medium can be recorded in The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, in the present invention, specific matters such as specific components, etc., and limited embodiments and drawings have been described, but these are only provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. , various modifications and variations are possible from these descriptions by those of ordinary skill in the art to which the present invention pertains.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and not only the claims described below, but also all of the claims and all equivalents or equivalent modifications to the claims will be said to belong to the scope of the spirit of the present invention. .

110: 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치
111: 추출부 112: 문서 정보 생성부
113: 중요 키워드 선정부 114: 문장 추출부
115: 요약문 생성부 116: 지식 데이터화 생성부
117: 산출부 118: 특징 벡터 생성부
119: 군집화부 120: 그룹 할당부
121: 데이터 셋 생성부 122: 분할부
123: 문서 정보 표시부 124: 본문 표시부
125: 요약문 표시부 126: 중요 키워드 표시부
127: 테이블 유지부 128: 연접번호 생성부
129: 암호화키 추출부 130: 파일 암호화부
131: 안내 메시지 표시부 132: 보안코드 입력 메시지 표시부
133: 복호화부
110: Electronic device for generating a knowledge data file for an electronic document based on a container format
111: extraction unit 112: document information generation unit
113: important keyword selection unit 114: sentence extraction unit
115: summary generation unit 116: knowledge dataization generation unit
117: calculator 118: feature vector generator
119: clustering unit 120: group assignment unit
121: data set generating unit 122: dividing unit
123: document information display unit 124: text display unit
125: summary text display unit 126: important keyword display unit
127: table maintenance unit 128: contact number generation unit
129: encryption key extraction unit 130: file encryption unit
131: information message display unit 132: security code input message display unit
133: decryption unit

Claims (12)

사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 추출부;
상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 문서 정보 생성부;
상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 중요 키워드 선정부;
상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 문장 추출부;
상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 요약문 생성부; 및
상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 지식 데이터화 생성부
를 포함하고,
상기 중요 키워드 선정부는
상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 산출부;
상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 특징 벡터 생성부;
상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 군집화부;
상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 그룹 할당부; 및
상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 데이터 셋 생성부
를 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.
an extraction unit for extracting n (n is a natural number equal to or greater than 2) words in an order of increasing frequency among words included in the electronic document in the order of occurrence in the electronic document when a knowledge dataization command for the electronic document is received from the user;
The total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and a file for the document information is generated. a document information generating unit to generate;
an important keyword selecting unit for selecting the n words as important keywords for the electronic document and generating a file for an important keyword data set including the n words;
a sentence extraction unit for extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document;
a summary sentence generator for generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary; and
A knowledge data generation unit that generates a container format-based knowledge data file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence
including,
The important keyword selection section
a calculation unit for calculating an average value of the frequency of appearance of each of the n words in the electronic document and a letter size of each of the n words in the electronic document;
a feature vector generator for generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components for each of the n words;
a clustering unit that clusters the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the n words;
a group allocator for designating words belonging to the same group among the K groups as words having a similar importance to each other and assigning group information about a group to which each word belongs to each of the n words; and
When the group information is assigned to each of the n words, a data set generating unit generating a file for the important keyword data set including the n words to which the group information is assigned
An electronic device for generating a knowledge data file for an electronic document based on a container format comprising a.
삭제delete 제1항에 있어서,
상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 분할부;
상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 문서 정보 표시부;
상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 본문 표시부;
상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 요약문 표시부; 및
상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 중요 키워드 표시부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.
According to claim 1,
After the knowledge data format file is created, when an execution command of the knowledge data format file is applied from the user, the screen display area according to the execution of the knowledge data format file is set to a document information display area, a text display area, a summary display area, and an important a division unit for dividing the keyword display area;
a document information display unit configured to execute a file for the document information included in the knowledge data file and display the document information in the document information display area;
a body display unit executing a document file for the electronic document included in the knowledge data file and displaying the body of the electronic document in the body display area;
a summary text display unit executing a document file for the summary text included in the knowledge data file and displaying the summary text in the summary text display area; and
By executing the important keyword data set file included in the knowledge data file, the n words are displayed separately by the K groups in the important keyword display area, and at the same time, the n words are displayed in the electronic document. An important keyword display unit for generating and displaying a first notification message indicating that an important keyword is an important keyword and a second notification message indicating that words belonging to the same group among the K groups have similar importance to each other
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
제1항에 있어서,
미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 테이블 유지부;
상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 연접번호 생성부;
상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 암호화키 추출부;
상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 파일 암호화부; 및
상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 안내 메시지 표시부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.
According to claim 1,
a table maintaining unit for storing and maintaining a table in which a predetermined number of t (t is a natural number greater than or equal to 2) encryption keys and integers from 0 to t-1 corresponding to each encryption key are recorded;
After the knowledge data file is created, when a security setting command for the knowledge data file is received from the user, the numerical value indicating the number of words included in each of the K groups is concatenated in ascending order to obtain a concatenation number. Contact number generation unit to generate;
When the concatenated number is generated, an operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and a first encryption key corresponding to the operation value is obtained from the table. an encryption key extraction unit to extract;
a file encryption unit that encrypts the knowledge data file with the first encryption key; and
When the knowledge data file is encrypted, a guide message display unit for displaying a guide message indicating that the connection number is a security code for decrypting the knowledge data file on the screen
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
제4항에 있어서,
상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 보안코드 입력 메시지 표시부; 및
상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 복호화부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.
5. The method of claim 4,
After the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, a security code input message instructing the user to input the security code for security release is displayed on the screen Security code input message display unit; and
When the concatenated number is received from the user in response to the security code input message, the operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and the operation value is calculated from the table. After extracting the first encryption key corresponding to the operation value, a decryption unit that decrypts the knowledge data file with the first encryption key
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 단계;
상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 단계;
상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계;
상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 단계;
상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 단계; 및
상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 단계
를 포함하고,
상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계는
상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 단계;
상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 단계;
상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 단계;
상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 단계; 및
상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계
를 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.
extracting n (n is a natural number equal to or greater than 2) words in an order of increasing frequency among words included in the electronic document in the order of occurrence in the electronic document when a knowledge dataization command for the electronic document is received from the user;
The total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and a file for the document information is generated. generating;
selecting the n words as important keywords for the electronic document and then generating a file for an important keyword data set including the n words;
extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document;
generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary; and
Generating a container format-based knowledge dataization file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence
including,
The step of creating a file for the important keyword data set is
calculating an average value of an appearance frequency of each of the n words in the electronic document and a letter size of each of the n words in the electronic document;
generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components for each of the n words;
clustering the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the n words;
designating words belonging to the same group among the K groups as words having similar importance, and then allocating group information about the group to which each word belongs to each of the n words; and
When the group information is assigned to each of the n words, generating a file for the important keyword data set including the n words to which the group information is assigned
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format comprising a.
삭제delete 제6항에 있어서,
상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 단계;
상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 단계;
상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 단계;
상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 단계; 및
상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.
7. The method of claim 6,
After the knowledge data format file is created, when an execution command of the knowledge data format file is applied from the user, the screen display area according to the execution of the knowledge data format file is set to a document information display area, a text display area, a summary display area, and an important dividing into keyword display areas;
displaying the document information in the document information display area by executing a file for the document information included in the knowledge data file;
displaying a body of the electronic document in the text display area by executing a document file for the electronic document included in the knowledge data file;
displaying the summary text in the summary text display area by executing a document file for the summary text included in the knowledge data file; and
By executing the important keyword data set file included in the knowledge data file, the n words are displayed separately by the K groups in the important keyword display area, and at the same time, the n words are displayed in the electronic document. generating and displaying a first notification message notifying that an important keyword is an important keyword and a second notification message indicating that words belonging to the same group among the K groups are words having similar importance to each other and displaying in the important keyword display area
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
제6항에 있어서,
미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 단계;
상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 단계;
상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 단계;
상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 단계; 및
상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.
7. The method of claim 6,
storing and maintaining a table in which predetermined t (t is a natural number greater than or equal to 2) encryption keys and integers from 0 to t-1 corresponding to each encryption key are recorded;
After the knowledge data file is created, when a security setting command for the knowledge data file is received from the user, the numerical value indicating the number of words included in each of the K groups is concatenated in ascending order to obtain a concatenation number. generating;
When the concatenated number is generated, an operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and a first encryption key corresponding to the operation value is obtained from the table. extracting;
encrypting the knowledge data file with the first encryption key; and
When the knowledge data file is encrypted, displaying a guide message indicating that the connection number is a security code for decrypting the knowledge data file on the screen
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
제9항에 있어서,
상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 단계; 및
상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.
10. The method of claim 9,
After the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, a security code input message instructing the user to input the security code for security release is displayed on the screen step; and
When the concatenated number is received from the user in response to the security code input message, the operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and the operation value is calculated from the table. After extracting the first encryption key corresponding to the operation value, decrypting the knowledge data file with the first encryption key
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
제6항, 제8항, 제9항 또는 제10항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer-readable recording medium recording a computer program for executing the method of any one of claims 6, 8, 9, or 10 through combination with a computer. 제6항, 제8항, 제9항 또는 제10항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.A computer program stored in a storage medium for executing the method of any one of claims 6, 8, 9 or 10 in combination with a computer.
KR1020200119639A 2020-09-17 2020-09-17 Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof KR102417779B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200119639A KR102417779B1 (en) 2020-09-17 2020-09-17 Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200119639A KR102417779B1 (en) 2020-09-17 2020-09-17 Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof

Publications (2)

Publication Number Publication Date
KR20220037091A KR20220037091A (en) 2022-03-24
KR102417779B1 true KR102417779B1 (en) 2022-07-06

Family

ID=80935702

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200119639A KR102417779B1 (en) 2020-09-17 2020-09-17 Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof

Country Status (1)

Country Link
KR (1) KR102417779B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014171053A (en) * 2013-03-01 2014-09-18 Sky Com:Kk Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method
JP2020071539A (en) * 2018-10-29 2020-05-07 株式会社スカイコム Management server, document file management method, and document file management program
WO2020111197A1 (en) 2018-11-30 2020-06-04 了宣 山本 Document arrangement support system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060107950A (en) * 2005-04-11 2006-10-16 에스케이 텔레콤주식회사 Internet page structure for settlement of environment and guide for wireless internet user interface
KR102128659B1 (en) * 2018-10-16 2020-06-30 주식회사 포스코아이씨티 System and Method for Extracting Keyword and Generating Abstract

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014171053A (en) * 2013-03-01 2014-09-18 Sky Com:Kk Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method
JP2020071539A (en) * 2018-10-29 2020-05-07 株式会社スカイコム Management server, document file management method, and document file management program
WO2020111197A1 (en) 2018-11-30 2020-06-04 了宣 山本 Document arrangement support system

Also Published As

Publication number Publication date
KR20220037091A (en) 2022-03-24

Similar Documents

Publication Publication Date Title
US10929550B2 (en) Terminal device and computer program
KR101220254B1 (en) Searchable color encoded file composing method and searchable color encoded file system
KR102417779B1 (en) Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof
KR101977128B1 (en) Fixed length encryption apparatus and method for long text strings
KR102395697B1 (en) Video conference system server which is able to take minutes of a video conference and the operating method thereof
KR20140044962A (en) Lock releasing method of electronic device, apparatus thereof, and medium storing program source thereof
KR102466721B1 (en) Electronic device for converting the electronic document to the knowledge data document and the operating method thereof
KR102300444B1 (en) Document editing device to check whether the font applied to the document is a supported font and operating method thereof
KR102300437B1 (en) Electronic document editing apparatus that enables the insertion of special characters at specific locations on the electronic document based on the entered characters and operating method thereof
KR102328051B1 (en) Document editing device that enables display of a document to which a font in unsupported data format is applied and operating method thereof
KR102523794B1 (en) Electronic device that supports tree-structured cataloging of a table inserted into an electronic document and the operating method thereof
KR102119726B1 (en) Apparatus for protecting contents of spread sheet type electric document and operating method thereof
CN114091080A (en) Subtitle file encryption and decryption method, system, storage medium and electronic equipment
KR102683141B1 (en) Electronic terminal apparatus equipped with the ui development tool, which is able to provide an automatic ui components creation function through image analysis of a ui design plan, and the operating method thereof
KR102545264B1 (en) Web contents crawling apparatus which collects web contents data from the body area on the web page, and the operating method thereof
KR102300439B1 (en) Font verification server to verify whether the font applied to a document is authorized and operating method thereof
KR102545262B1 (en) Electronic terminal apparatus for providing information of the associated documents which are associated with the particular document based on simultaneous usage criteria and operating method thereof
EP2947641B1 (en) Information processing device, information processing method, and program
KR102442522B1 (en) Electronic apparatus that recommends shortcut keys according to the editing action input when creating a document and the operating method thereof
KR102466714B1 (en) Electronic device that provides improved object insertion into electronic document through object box and operating method thereof
KR102417811B1 (en) Document translation service server which provides document translation services with personal information protection function and the operating method thereof
KR20240053970A (en) Document conversion service providing server that provides the document conversion service that can convert the electronic document written with a word processor into a presentation document and operating method thereof
KR20220127484A (en) Electronic document management server that performs database processing for electronic document based on identification tag and operating method thereof
KR20240054001A (en) Electronic terminal device capable of automatically converting slides in the format of a presentation document into pages in the format of a word processing document and the operating method thereof
KR20230115177A (en) Service providing server that provides sentiment analysis service for marketing and the operating method thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right