KR102417779B1 - Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof - Google Patents
Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof Download PDFInfo
- Publication number
- KR102417779B1 KR102417779B1 KR1020200119639A KR20200119639A KR102417779B1 KR 102417779 B1 KR102417779 B1 KR 102417779B1 KR 1020200119639 A KR1020200119639 A KR 1020200119639A KR 20200119639 A KR20200119639 A KR 20200119639A KR 102417779 B1 KR102417779 B1 KR 102417779B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- words
- knowledge data
- electronic document
- document
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법이 개시된다. 본 발명은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원할 수 있다.Disclosed are an electronic device for generating a knowledge data file for an electronic document based on a container format, and an operating method thereof. According to the present invention, when a knowledge dataization command for the electronic document is received from a user, a file for document information constituting the electronic document, a data set file for important keywords included in the electronic document, and a summary of the electronic document After generating a file for the electronic document, by creating a container format-based knowledge dataization file including a document file for the electronic document, a file for the document information, the data set file, and a file for the summary text, It can support to make knowledge data possible.
Description
본 발명은 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법에 대한 것이다.The present invention relates to an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method thereof.
최근, 기업 등에서 전자 문서를 활용한 업무가 증가함에 따라, 사용자의 전자 문서 사용의 편의를 도모할 수 있도록 지원하는 다양한 기술들이 등장하고 있고, 이러한 기술의 발달로 인해 전자 문서 분야에서 인공지능 기술을 도입하거나 다른 서비스와의 융합 등과 같은 다양화가 시도되고 있다.Recently, as businesses using electronic documents increase, various technologies that support users' convenience in using electronic documents are emerging. Diversification such as introduction or convergence with other services is being attempted.
보통, 전자 문서에는 다양한 정보들이 포함되어 있는데, 사용자가 이러한 정보들 중 필요한 정보만을 추출해서 활용하기 위해서는 많은 시간과 노력이 필요할 수 있다. 그렇기 때문에, 전자 문서의 여러 정보를 사전에 하나의 셋(set)으로 관리할 수 있다면, 전자 문서에 대한 활용성이 매우 커질 수 있을 것이다.In general, an electronic document contains a variety of information, and it may take a lot of time and effort for a user to extract and utilize only necessary information from among such information. Therefore, if various pieces of information of the electronic document can be managed as a set in advance, the utility of the electronic document may be greatly increased.
이와 관련해서, 전자 문서에 포함된 다양한 정보들을 구조화시켜 하나의 지식 데이터화 파일로 구성하는 방안을 고려할 수 있다. 예컨대, 지식 데이터화 파일에 전자 문서를 구성하는 라인 수, 페이지 수 등과 같은 전자 문서 자체의 메타 정보, 전자 문서의 본문, 전자 문서의 요약문, 전자 문서의 중요 키워드에 대한 정보를 포함시킴으로써, 사용자가 상기 지식 데이터화 파일로부터 전자 문서에 포함된 다양한 정보들에 손쉽게 접근할 수 있도록 하는 방안을 고려할 수 있다.In this regard, a method of structuring various information included in the electronic document into one knowledge data file may be considered. For example, by including meta information of the electronic document itself such as the number of lines and pages constituting the electronic document in the knowledge data file, the body of the electronic document, the summary of the electronic document, and information on important keywords of the electronic document, the user can A method of enabling easy access to various information included in an electronic document from a knowledge data file may be considered.
이렇게, 전자 문서에 포함된 정보를 사전에 지식 데이터화 파일로 관리할 경우, 'Time to Market' 서비스에 빠른 대응이 가능하고, 지식 데이터화 파일을 인공지능 학습을 위한 데이터에 활용하는 등과 같이, 다양한 서비스에 접목시킬 수도 있다.In this way, if the information included in the electronic document is managed as a knowledge data file in advance, a quick response to the 'Time to Market' service is possible, and various services such as utilizing the knowledge data file as data for artificial intelligence learning can also be incorporated into
다만, 전자 문서를 지식 데이터화 파일로 구성하는 경우, 해당 전자 문서가 보안이 필요한 문서일 수도 있기 때문에, 허가된 사용자만이 지식 데이터화 파일을 열람할 수 있도록 지원하기 위한 보안 프로토콜이 적용될 필요도 있다.However, when composing an electronic document as a knowledge data file, since the electronic document may be a document requiring security, it is also necessary to apply a security protocol to support only an authorized user to read the knowledge data file.
본 발명에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원한다.According to the present invention, an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method therefor, when a knowledge data format command for the electronic document is received from a user, provides information about document information constituting the electronic document. After generating a file, a data set file for important keywords included in the electronic document, and a file for a summary of the electronic document, a document file for the electronic document, a file for the document information, the data set file, and By creating a container format-based knowledge data file including a file for the summary text, it is supported to enable data dataization of electronic documents.
본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 추출부, 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 문서 정보 생성부, 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 중요 키워드 선정부, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 문장 추출부, 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 요약문 생성부 및 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 지식 데이터화 생성부를 포함한다.In the electronic device for generating a knowledge data data file for an electronic document based on a container format according to an embodiment of the present invention, when a knowledge data data form command for an electronic document is received from a user, the electronic device among words included in the electronic document An extractor that extracts n (n is a natural number greater than or equal to 2) words in the order of frequency of occurrence in the document, and counts the total number of words, the total number of pages, and the total number of lines included in the electronic document. , a document information generating unit that generates document information including the total number of pages and the total number of lines, and generates a file for the document information, after selecting the n words as important keywords for the electronic document, the An important keyword selection unit for generating a file for an important keyword data set including n words, a sentence extraction unit for extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document , a summary sentence generating unit generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary, a file for the document information, and a document file for the electronic document , a knowledge data generation unit for generating a container format-based knowledge data file including a file for the important keyword data set and a document file for the summary sentence.
또한, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출하는 단계, 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 단계, 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 단계, 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 단계 및 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 단계를 포함한다.In addition, in the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention, when a knowledge data conversion command for an electronic document is received from a user, the extracting n (n is a natural number greater than or equal to 2) words in the order of frequency of occurrence in the electronic document among the words, counting the total number of words, total pages, and total lines included in the electronic document generating document information including the total number of words, the total number of pages, and the total number of lines, and generating a file for the document information, after selecting the n words as important keywords for the electronic document, generating a file for an important keyword data set including the n words; extracting at least one sentence including one or more of the n words from among sentences included in the electronic document; the at least one generating a summary by arranging sentences in the electronic document according to the arrangement order in the electronic document, generating a document file for the summary, and a file for the document information, a document file for the electronic document, and the important keyword data set and generating a container format-based knowledge dataization file including a file for , a document file for the summary.
본 발명에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치 및 그 동작 방법은 사용자로부터 상기 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서를 구성하는 문서 정보에 대한 파일, 상기 전자 문서에 포함된 중요 키워드들에 대한 데이터 셋 파일 및 상기 전자 문서의 요약문에 대한 파일을 생성한 후, 상기 전자 문서에 대한 문서 파일과 상기 문서 정보에 대한 파일, 상기 데이터 셋 파일 및 상기 요약문에 대한 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성함으로써, 전자 문서에 대한 지식 데이터화가 가능하도록 지원할 수 있다.According to the present invention, an electronic device for generating a knowledge data file for an electronic document based on a container format and an operating method therefor, when a knowledge data format command for the electronic document is received from a user, provides information about document information constituting the electronic document. After generating a file, a data set file for important keywords included in the electronic document, and a file for a summary of the electronic document, a document file for the electronic document, a file for the document information, the data set file, and By creating a container format-based knowledge data file including a file for the summary text, it is possible to support data dataization of electronic documents.
도 1은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 구조를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치를 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.1 is a diagram illustrating a structure of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
2 is a diagram for explaining an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
3 is a flowchart illustrating an operation method of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. These descriptions are not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. While describing each drawing, like reference numerals are used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, refer to those of ordinary skill in the art to which the present invention belongs. It has the same meaning as is commonly understood by those who have it.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다. In this document, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, in various embodiments of the present invention, each of the components, functional blocks or means may be composed of one or more sub-components, and the electrical, electronic, and mechanical functions performed by each component are electronic. A circuit, an integrated circuit, an ASIC (Application Specific Integrated Circuit), etc. may be implemented as various well-known devices or mechanical elements, and may be implemented separately or two or more may be integrated into one.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.On the other hand, the blocks in the accompanying block diagram or steps in the flowchart are computer program instructions that are loaded in a processor or memory of equipment capable of data processing, such as a general-purpose computer, a special-purpose computer, a portable notebook computer, and a network computer, and perform specified functions. can be interpreted as meaning Since these computer program instructions may be stored in a memory provided in a computer device or in a memory readable by a computer, the functions described in the blocks of the block diagrams or the steps of the flowcharts are produced as articles of manufacture containing instruction means for performing the same. it might be In addition, each block or each step may represent a module, segment, or portion of code comprising one or more executable instructions for executing the specified logical function(s). It should also be noted that, in some alternative embodiments, it is also possible for the functions recited in blocks or steps to be executed out of the prescribed order. For example, two blocks or steps shown one after another may be performed substantially simultaneously or in the reverse order, and in some cases, some blocks or steps may be omitted.
도 1은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 구조를 도시한 도면이다.1 is a diagram illustrating a structure of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 추출부(111), 문서 정보 생성부(112), 중요 키워드 선정부(113), 문장 추출부(114), 요약문 생성부(115) 및 지식 데이터화 생성부(116)를 포함한다.Referring to FIG. 1 , an
추출부(111)는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 상기 전자 문서에 포함된 단어들 중 상기 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출한다.The
예컨대, 상기 전자 문서에 포함된 단어가 '100개'라고 하고, n을 '5'라고 하는 경우, 추출부(111)는 상기 전자 문서에 포함된 100개의 단어들 중 상기 전자 문서 내에 등장하는 빈도수가 많은 순으로 5개의 단어들을 추출할 수 있다.For example, if the number of words included in the electronic document is '100' and n is '5', the
문서 정보 생성부(112)는 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성한다.The document
예컨대, 상기 전자 문서에 포함된 총 단어 수가 '2000개', 총 페이지 수가 '20페이지', 총 라인 수가 '350줄'이라고 하는 경우, 문서 정보 생성부(112)는 상기 총 단어 수 '2000개', 상기 총 페이지 수 '20페이지', 상기 총 라인 수 '350줄'을 카운트하여 상기 총 단어수 '2000개', 상기 총 페이지 수 '20페이지', 상기 총 라인 수 '350줄'을 포함하는 상기 문서 정보를 생성하고, '문서 정보.abc'라는 파일명을 갖는 상기 문서 정보에 대한 파일을 생성할 수 있다. For example, if the total number of words included in the electronic document is '2000', the total number of pages is '20 pages', and the total number of lines is '350 lines', the document
중요 키워드 선정부(113)는 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성한다.The important
예컨대, 전술한 예와 같이, n을 '5'라고 하고, 추출부(111)에서 5개의 단어들이 추출되었다고 하는 경우, 중요 키워드 선정부(113)는 상기 5개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 5개의 단어들을 포함하는 '중요 키워드 데이터 셋.xyz'라는 파일명을 갖는 상기 중요 키워드 데이터 셋에 대한 파일을 생성할 수 있다. For example, as in the above example, when n is '5' and five words are extracted by the
이때, 본 발명의 일실시예에 따르면, 중요 키워드 선정부(113)는 산출부(117), 특징 벡터 생성부(118), 군집화부(119), 그룹 할당부(120) 및 데이터 셋 생성부(121)를 포함할 수 있다.At this time, according to an embodiment of the present invention, the important
산출부(117)는 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출한다.The
예컨대, 전술한 예와 같이 n을 '5'라고 하고, 추출부(111)에서 추출된 5개의 단어들이 '빨강', '주황', '노랑', '초록', '파랑'이라고 하며, 상기 전자 문서 내에서 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 등장 빈도수가 '20회', '30회', '10회', '40회', '50회'라고 하는 경우, 산출부(117)는 상기 전자 문서 내에서 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 등장 빈도수에 대해 빨강의 등장 빈도수 '20회', 주황의 등장 빈도수 '30회', 노랑의 등장 빈도수 '10회', 초록의 등장 빈도수 '40회', 파랑의 등장 빈도수 '50회'로 확인할 수 있다.For example, as in the above example, let n be '5', and the five words extracted by the
그리고, 산출부(117)는 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출할 수 있다. 관련해서, '빨강'이라고 하는 단어가 상기 전자 문서에서 '20회' 등장하는데, '10회'는 '12pt'라는 글자 크기를 갖고, 나머지 '10회'는 '14pt'라는 글자 크기를 갖는다고 하는 경우, 산출부(117)는 '빨강'이라고 하는 단어의 상기 전자 문서 내에서의 글자 크기의 평균 값을 '13pt'로 산출할 수 있다. 이러한 방식으로, 산출부(117)는 '주황', '노랑', '초록', '파랑'이라고 하는 단어들 각각에 대해서도 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출할 수 있다.In addition, the
만약, '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값이 '13pt', '12pt', '16pt', '14pt', '14pt'로 산출되었다고 가정하는 경우, 산출부(117)가 산출한 '빨강', '주황', '노랑', '초록', '파랑'이라는 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 글자 크기의 평균 값은 하기의 표 1과 같이 나타낼 수 있다.If the average value of the font size in each of the words 'red', 'orange', 'yellow', 'green', and 'blue' in the electronic document is '13pt', '12pt', '16pt', When it is assumed that '14pt' and '14pt' are calculated, the words 'red', 'orange', 'yellow', 'green', and 'blue' calculated by the
특징 벡터 생성부(118)는 상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성한다.The
관련해서, 앞선 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라는 단어가 중요 키워드로 추출되었다고 하고, 이때, 상기 전자 문서 내에서 '빨강'이라는 단어의 등장 빈도수가 '20회'이고, 글자 크기의 평균 값이 '13pt'라고 하는 경우, 특징 벡터 생성부(118)는 '빨강'이라는 단어에 대응되는 특징 벡터를 '[20 13]'으로 생성할 수 있다. 이러한 방식으로, 특징 벡터 생성부(118)는 나머지 '주황', '노랑', '초록', '파랑'이라는 단어들 각각에 대응되는 특징 벡터를 생성할 수 있다.In relation to this, as in the previous example, it is said that the words 'red', 'orange', 'yellow', 'green', and 'blue' are extracted as important keywords, and at this time, the word 'red' in the electronic document is When the frequency of appearance is '20 times' and the average value of the letter size is '13pt', the
군집화부(119)는 상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화한다.The
여기서, K-평균 군집화란 벡터의 형태로 구성된 데이터를 K개의 그룹으로 묶는 알고리즘을 의미하는 것으로, 데이터가 속한 그룹의 중심과 각 데이터 간의 거리의 차이가 최소가 되도록 데이터들을 K개의 그룹으로 군집화하는 알고리즘이다.Here, K-means clustering refers to an algorithm that groups data in the form of vectors into K groups, and clusters the data into K groups so that the difference between the distance between the center of the group to which the data belongs and the distance between each data is minimized. It is an algorithm.
관련해서, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어가 중요 키워드로 추출되었다고 하고, K를 '3'이라고 가정하는 경우, 군집화부(119)는 '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어들 각각의 특징 벡터를 기초로 K-평균 군집화를 수행하여, '빨강', '주황', '노랑', '초록', '파랑'이라는 5개의 단어들을 3개의 그룹으로 군집화할 수 있다.In relation to, as in the above example, if it is assumed that five words 'red', 'orange', 'yellow', 'green', and 'blue' are extracted as important keywords, and K is '3', The
이때, 군집화부(119)는 단어의 등장 빈도수와 글자 크기의 평균 값으로 구성된 특징 벡터를 기초로 상기 n개의 단어들을 K개의 그룹으로 군집화하기 때문에, 상기 n개의 단어들은 단어의 등장 빈도수가 많으면서 글자 크기의 평균 값이 높은 그룹, 단어의 등장 빈도수가 중간이면서 글자 크기의 평균 값이 중간인 그룹, 단어의 등장 빈도수가 적으면서 글자 크기의 평균 값이 낮은 그룹 등으로 군집화될 수 있다.At this time, since the
그룹 할당부(120)는 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당한다.The
예컨대, 전술한 예와 같이, 군집화부(119)가 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들을 3개의 그룹으로 군집화한 결과, '빨강'과 '주황'이라고 하는 단어가 '그룹 1'로 군집화되었고, '초록'과 '파랑'이라고 하는 단어가 '그룹 2'로 군집화되었으며, '노랑'이라는 단어가 '그룹 3'으로 군집화되었다고 하는 경우, 그룹 할당부(120)는 상기 3개의 그룹 중 '그룹 1' 내에 속하는 '빨강'과 '주황'이라고 하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정하고, 상기 3개의 그룹 중 '그룹 2' 내에 속하는 '초록'과 '파랑'이라고 하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정하며, 상기 3개의 그룹 중 '그룹 3' 내에 속하는 '노랑'이라고 하는 단어를 서로 유사한 중요도를 갖는 단어로 지정할 수 있다.For example, as in the above example, the
그러고 나서, 그룹 할당부(120)는 '빨강'이라고 하는 단어에 대해 '빨강'이라고 하는 단어가 속해있는 '그룹 1'에 대한 그룹 정보를 할당할 수 있고, '주황'이라고 하는 단어에 대해 '주황'이라고 하는 단어가 속해있는 '그룹 1'에 대한 그룹 정보를 할당할 수 있으며, '노랑'이라고 하는 단어에 대해 '노랑'이라고 하는 단어가 속해있는 '그룹 3'에 대한 그룹 정보를 할당할 수 있고, '초록'이라고 하는 단어에 대해 '초록'이라고 하는 단어가 속해있는 '그룹 2'에 대한 그룹 정보를 할당할 수 있고, '파랑'이라고 하는 단어에 대해 '파랑'이라고 하는 단어가 속해있는 '그룹 2'에 대한 그룹 정보를 할당할 수 있다. Then, the
이렇게, 상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 데이터 셋 생성부(121)는 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성할 수 있다.In this way, when the group information is allocated to each of the n words, the data
문장 추출부(114)는 중요 키워드 선정부(113)에서 상기 중요 키워드 데이터 셋에 대한 파일 생성이 완료되면, 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출한다.When the important
예컨대, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들이 상기 중요 키워드로 선정되었다고 하는 경우, 문장 추출부(114)는 상기 전자 문서에 포함된 문장들 중 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출할 수 있다.For example, as in the above example, when five words such as 'red', 'orange', 'yellow', 'green', and 'blue' are selected as the important keywords, the
요약문 생성부(115)는 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성한다.The
예컨대, 문장 추출부(114)에서 상기 적어도 하나의 문장으로 30개의 문장이 추출되었다고 하는 경우, 요약문 생성부(115)는 상기 전자 문서에서의 배치 순서에 따라 상기 적어도 하나의 문장인 30개의 문장을 배치하여 요약문을 생성하고, '요약문.hwp'라는 확장자를 갖는 상기 요약문에 대한 문서 파일을 생성할 수 있다.For example, when it is assumed that 30 sentences are extracted as the at least one sentence by the
이렇게, 상기 문서 정보에 대한 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일이 생성되면, 지식 데이터화 생성부(116)는 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성한다.In this way, when the file for the document information, the file for the important keyword data set, and the document file for the summary are generated, the knowledge
여기서, 컨테이너 포맷이란 상이한 데이터 구성요소들과 메타 데이터들이 컴퓨터 파일 안에서 같이 있을 수 있게 하는 방법을 기술하고 있는 메타 파일 포맷을 의미한다. 예컨대, 다양한 파일들을 하나의 파일로 무손실 압축할 수 있는 포맷인 'zip' 파일이나, 비디오와 오디오 코덱을 하나의 파일로 담고 있는 동영상 포맷인 'mkv' 파일 등이 컨테이너 포맷으로 구성된 파일일 수 있다.Here, the container format refers to a meta file format that describes a method for allowing different data elements and meta data to exist together in a computer file. For example, a 'zip' file, a format that can losslessly compress various files into a single file, or a 'mkv' file, a video format containing video and audio codecs in one file, may be a container format file. .
이때, 본 발명의 일실시예에 따르면, 지식 데이터화 생성부(116)는 상기 지식 데이터화 파일을 'okd'(office knowledge document)라고 하는 확장자를 갖는 파일로 생성할 수 있다.In this case, according to an embodiment of the present invention, the knowledge
관련해서, 전술한 예와 같이, 상기 문서 정보에 대한 파일이 '문서 정보.abc'로 생성되었고,, 상기 전자 문서에 대한 중요 키워드 데이터 셋에 대한 파일이 '중요 키워드 데이터 셋.xyz'으로 생성되었으며, 상기 전자 문서에 대한 요약문 파일이 '요약문.hwp'으로 생성되었다고 하고, 상기 전자 문서에 대한 문서 파일이 '문서.hwp'라고 하는 경우, 지식 데이터화 생성부(116)는 상기 문서 정보에 대한 파일인 '문서 정보.abc', 상기 전자 문서에 대한 문서 파일인 '문서.hwp', 상기 중요 키워드 데이터 셋에 대한 파일인 '중요 키워드 데이터 셋.xyz', 상기 요약문에 대한 문서 파일인 '요약문.hwp'를 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일로 '지식 데이터화 파일.okd'를 생성할 수 있다.In relation, as in the above example, the file for the document information is created as 'document information.abc', and the file for the important keyword data set for the electronic document is created as 'important keyword data set.xyz' If it is said that the summary file for the electronic document is generated as 'summary.hwp' and the document file for the electronic document is called 'document.hwp', the knowledge
이때, 본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 분할부(122), 문서 정보 표시부(123), 본문 표시부(124), 요약문 표시부(125) 및 중요 키워드 표시부(126)를 더 포함할 수 있다. At this time, according to an embodiment of the present invention, the
분할부(122)는 지식 데이터화 생성부(116)를 통해 상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할한다.After the knowledge data format file is generated through the knowledge data
관련해서, 분할부(122)는 도 2에 도시된 그림과 같이, 화면 표시 영역을 문서 정보 표시 영역(211), 본문 표시 영역(212), 요약문 표시 영역(213) 및 중요 키워드 표시 영역(214)으로 분할할 수 있다.In this regard, the
문서 정보 표시부(123)는 상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역(211)에 상기 문서 정보를 표시한다.The document
예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 문서 정보에 대한 파일이 '문서 정보.abc'라고 하는 경우, 문서 정보 표시부(123)은 상기 문서 정보에 대한 파일인 '문서 정보.abc' 파일을 실행해서, 상기 문서 정보 표시 영역(211)에 상기 문서 정보를 표시할 수 있다.For example, as in the above example, when the file for the document information included in the 'knowledge data data file.okd' that is the knowledge data data file is 'document information. abc', the document
본문 표시부(124)는 상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역(212)에 상기 전자 문서의 본문을 표시한다.The
예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 전자 문서에 대한 파일이 '문서.hwp'라고 하는 경우, 본문 표시부(124)는 상기 전자 문서에 대한 파일인 '문서.hwp' 파일을 실행해서, 상기 본문 표시 영역(212)에 상기 전자 문서의 본문을 표시할 수 있다.For example, as in the above-described example, when the file for the electronic document included in the 'knowledge data data file.okd', which is the knowledge data data file, is called 'document.hwp', the
요약문 표시부(125)는 상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역(213)에 상기 요약문을 표시한다.The summary
예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 요약문에 대한 파일이 '요약문.hwp'라고 하는 경우, 요약문 표시부(125)는 상기 요약문에 대한 파일인 '요약문.hwp' 파일을 실행해서, 상기 요약문 표시 영역(213)에 상기 요약문을 표시할 수 있다.For example, as in the above example, when the file for the summary text included in the knowledge data format file 'knowledge data format file.okd' is called 'summary text.hwp', the summary
중요 키워드 표시부(126)는 상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역(214)에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역(214)에 표시한다.The important
예컨대, 전술한 예와 같이, 상기 지식 데이터화 파일인 '지식 데이터화 파일.okd'에 포함된 상기 중요 키워드 데이터 셋에 대한 파일이 '중요 키워드 데이터 셋.xyz'라고 하는 경우, 중요 키워드 표시부(126)는 상기 중요 키워드 데이터 셋에 대한 파일인 '중요 키워드 데이터 셋.xyz' 파일을 실행해서, 상기 중요 키워드 표시 영역(214)에 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 단어들을 3개의 그룹별로 구분해서 표시할 수 있다.For example, as in the above-described example, when the file for the important keyword data set included in the knowledge data data file 'knowledge data data file.okd' is 'important keyword data set.xyz', the important
그리고, 중요 키워드 표시부(126)는 '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 3개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 중요 키워드 표시 영역(214)에 표시할 수 있다. 이와 관련해서, 상기 제2 알림 메시지는 상기 3개의 그룹 중 '그룹 1' 내에 속하는 '빨강', '주황'이라고 하는 단어들이 서로 유사한 중요도를 갖는 단어임을 지시하고, '그룹 2' 내에 속하는 '초록', '파랑'이라고 하는 단어들이 서로 유사한 중요도를 갖는 단어임을 지시하며, '그룹 3' 내에 속하는 '노랑'이라고 하는 단어가 서로 유사한 중요도를 갖는 단어임을 지시하는 정보를 담고 있을 수 있다.In addition, the important
본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 상기 지식 데이터화 파일에 대한 보안 설정을 가능하게 하기 위한 구성으로, 테이블 유지부(127), 연접번호 생성부(128), 암호화키 추출부(129), 파일 암호화부(130) 및 안내 메시지 표시부(131)를 더 포함할 수 있다.According to an embodiment of the present invention, the
테이블 유지부(127)는 미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지한다.The
예컨대, t를 '5'라고 가정하는 경우, 테이블 유지부(127)는 하기의 표 2과 같이 암호화키 테이블을 저장하여 유지하고 있을 수 있다.For example, if t is assumed to be '5', the
연접번호 생성부(128)는 상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성한다.After the knowledge data format file is generated, when a security setting command for the knowledge data format file is received from the user, the
예컨대, 전술한 예와 같이, '빨강', '주황', '노랑', '초록', '파랑'이라고 하는 5개의 단어들이 '빨강', '주황'이라고 하는 단어가 포함된 '그룹 1', '초록', '파랑'이라고 하는 단어가 포함된 '그룹 2' 및 '노랑'이라고 하는 단어가 포함된 '그룹 3'으로 구분되었다고 가정하는 경우, 연접번호 생성부(128)는 '그룹 1'에 포함된 '빨강', '주황'이라고 하는 단어의 개수인 '2'개, '그룹 2'에 포함된 '초록', '파랑'이라고 하는 단어의 개수인 '2'개, '그룹 3'에 포함된 '노랑'이라고 하는 단어의 개수인 '1'개를 나타내는 수치를 추출하고, 추출된 상기 3개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접함으로써, '221'이라는 연접번호를 생성할 수 있다.For example, as in the above example, five words 'red', 'orange', 'yellow', 'green', and 'blue' are 'group 1' including the words 'red' and 'orange' If it is assumed that 'group 2' containing the words 'green' and 'blue' and 'group 3' containing the words 'yellow' are divided into 'group 3', '2', the number of words 'red' and 'orange' included in ', '2', the number of words 'green' and 'blue' included in 'Group 2', 'Group 3' By extracting a number representing '1', which is the number of words 'yellow' included in You can create a contact number.
암호화키 추출부(129)는 상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출한다.When the concatenated number is generated, the encryption
여기서, 모듈로 연산은 피제수를 제수로 나누는 나눗셈을 수행하여 그에 대한 나머지(remainder)를 산출하는 연산을 의미한다.Here, the modulo operation refers to an operation of dividing a dividend by a divisor to calculate a remainder thereof.
예컨대, 전술한 예와 같이, 상기 t를 '5'라고 하고, 상기 연접번호를 '221'이라고 가정하는 경우, 암호화키 추출부(129)는 상기 연접번호 '221'을 피제수로, 상기 '5'를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값을 '1'과 같이 산출할 수 있다.For example, as in the above example, when it is assumed that t is '5' and the concatenated number is '221', the encryption
그러고 나서, 암호화키 추출부(129)는 상기 표 2과 같은 상기 테이블로부터 상기 연산 값인 '1'에 대응되는 제1 암호화키로 '암호화키 2'를 추출할 수 있다.Then, the encryption
파일 암호화부(130)는 상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화한다.The
예컨대, 전술한 예와 같이, 암호화 추출부(129)를 통해, 상기 제1 암호화키로 '암호화키 2'가 추출되면, 파일 암호화부(130)는 상기 지식 데이터화 파일을 상기 제1 암호화키인 '암호화키 2'로 암호화할 수 있다.For example, as in the above example, when 'encryption key 2' is extracted as the first encryption key through the
안내 메시지 표시부(131)는 상기 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시한다.When the data conversion file is encrypted, the guide
이때, 사용자는 상기 안내 메시지를 보고 추후 상기 지식 데이터화 파일의 복호화를 수행하기 위해서 화면 상에 표시되는 상기 보안코드를 숙지해둘 수 있다.In this case, the user can see the guide message and keep in mind the security code displayed on the screen in order to decrypt the knowledge data file later.
이때, 본 발명의 일실시예에 따르면, 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)는 보안코드 입력 메시지 표시부(132) 및 복호화부(133)을 포함할 수 있다.At this time, according to an embodiment of the present invention, the
보안코드 입력 메시지 표시부(132)는 상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시한다.Security code input
예컨대, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 보안코드 입력 메시지 표시부(132)는 상기 사용자에게 '보안코드를 입력하세요'라는 보안코드 입력 메시지와 함께 보안코드 입력창을 화면 상에 표시할 수 있다.For example, when a security release command of the knowledge data file is received from the user, the security code input
그러고 나서, 상기 사용자로부터 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 복호화부(133)는 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화한다.Then, when the concatenated number is received in response to the security code input message from the user, the
예컨대, 전술한 예와 같이, t를 '5'라고 하고, 상기 연접번호를 '221'이라고 가정하는 경우, 복호화부(133)는 사용자로부터 '221'이라고 하는 연접번호가 보안코드로서 수신되면, 상기 연접번호 '221'을 피제수, 상기 '5'를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값 '1'을 산출할 수 있다.For example, as in the above example, if t is '5' and the concatenated number is '221', the
그러고 나서, 복호화부(133)는 상기 표 2과 같은 상기 테이블로부터 상기 연산 값인 '1'에 대응되는 상기 제1 암호화키로 '암호화키 2'를 추출한 후 '암호화키 2'로 상기 지식 데이터화 파일을 복호화할 수 있다.Then, the
도 3은 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.3 is a flowchart illustrating an operation method of an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention.
단계(S310)에서는 사용자로부터 전자 문서에 대한 지식 데이터화 명령이 수신되면, 전자 문서에 포함된 단어들 중 전자 문서 내에서 등장하는 빈도수가 많은 순으로 n(n은 2이상 자연수)개의 단어들을 추출한다.In step S310, when a knowledge dataization command for an electronic document is received from the user, n (n is a natural number greater than or equal to 2) words are extracted in the order of frequency of occurrence in the electronic document among the words included in the electronic document. .
단계(S320)에서는 상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성한다.In step S320, the total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and the document information is generated. Create a file for information.
단계(S330)에서는 상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성한다.In step S330, after selecting the n words as important keywords for the electronic document, a file for the important keyword data set including the n words is generated.
단계(S340)에서는 상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출한다.In step S340, from among the sentences included in the electronic document, at least one sentence including one or more of the n words is extracted.
단계(S350)에서는 상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성한다.In step S350, a summary is generated by arranging the at least one sentence according to an arrangement order in the electronic document, and a document file for the summary is generated.
단계(S360)에서는 상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성한다.In step S360, a container format-based knowledge data file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence is generated.
이때, 본 발명의 일실시예에 따르면, 단계(S330)에서는 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 단계, 상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 단계, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 단계, 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 단계 및 상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계를 포함할 수 있다.At this time, according to an embodiment of the present invention, in step S330 , the average value of the frequency of appearance of each of the n words in the electronic document and the letter size of each of the n words in the electronic document calculating, for each of the n words, generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components, the n clustering the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the words, words belonging to the same group among the K groups having similar importance allocating group information for a group to which each word belongs to each of the n words after designating them as It may include generating a file for the important keyword data set including the words.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 단계, 상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 단계, 상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 단계, 상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 단계 및 상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, in the method of operating the electronic device, after the knowledge data format file is generated, when an execution command of the knowledge data format file is applied from the user, the method according to the execution of the knowledge data format file dividing the screen display area into a document information display area, a text display area, a summary text display area and an important keyword display area, executing a file for the document information included in the knowledge data format file, and placing the document information display area in the document information display area Displaying document information, executing a document file for the electronic document included in the knowledge data format file, and displaying the body of the electronic document in the text display area; displaying the summary text in the summary text display area by executing a document file for A first notification message indicating that the n words are important keywords for the electronic document and a second notification indicating that words belonging to the same group among the K groups are words having similar importance to each other The method may further include generating a message and displaying it in the important keyword display area.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 단계, 상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 단계, 상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 단계, 상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 단계 및 상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, in the method of operating the electronic device, predetermined t (t is a natural number greater than or equal to 2) encryption keys and an integer of 0 or more and t-1 or less corresponding to each encryption key are recorded in correspondence After the knowledge data format file is created, when a security setting command for the knowledge data format file is received from the user, a numerical value indicating the number of words included in each of the K groups in ascending order generating a concatenated number by concatenation with extracting a first encryption key corresponding to the operation value, encrypting the knowledge data file with the first encryption key, and when the knowledge data file is encrypted, the concatenated number is a security code for decrypting the knowledge data file It may further include the step of displaying a guide message indicating that on the screen.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 단계 및 상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 단계를 더 포함할 수 있다.At this time, according to an embodiment of the present invention, in the method of operating the electronic device, after the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, displaying a security code input message instructing to input the security code on a screen, and when the contact number is received from the user in response to the security code input message, divide the contact number as a dividend and divide the t Calculating the calculated value by performing a modulo operation of can do.
이상, 도 3를 참조하여 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 도 1을 이용하여 설명한 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.In the above, a method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention has been described with reference to FIG. 3 . Here, in the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention, a knowledge data file for an electronic document is generated based on the container format described with reference to FIG. 1 . Since it may correspond to the configuration for the operation of the generated
본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.The method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through combination with a computer.
또한, 본 발명의 일실시예에 따른 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, the method of operating an electronic device for generating a knowledge data file for an electronic document based on a container format according to an embodiment of the present invention is implemented in the form of a program command that can be executed through various computer means and is a computer-readable medium can be recorded in The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, in the present invention, specific matters such as specific components, etc., and limited embodiments and drawings have been described, but these are only provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. , various modifications and variations are possible from these descriptions by those of ordinary skill in the art to which the present invention pertains.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and not only the claims described below, but also all of the claims and all equivalents or equivalent modifications to the claims will be said to belong to the scope of the spirit of the present invention. .
110: 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치
111: 추출부 112: 문서 정보 생성부
113: 중요 키워드 선정부 114: 문장 추출부
115: 요약문 생성부 116: 지식 데이터화 생성부
117: 산출부 118: 특징 벡터 생성부
119: 군집화부 120: 그룹 할당부
121: 데이터 셋 생성부 122: 분할부
123: 문서 정보 표시부 124: 본문 표시부
125: 요약문 표시부 126: 중요 키워드 표시부
127: 테이블 유지부 128: 연접번호 생성부
129: 암호화키 추출부 130: 파일 암호화부
131: 안내 메시지 표시부 132: 보안코드 입력 메시지 표시부
133: 복호화부110: Electronic device for generating a knowledge data file for an electronic document based on a container format
111: extraction unit 112: document information generation unit
113: important keyword selection unit 114: sentence extraction unit
115: summary generation unit 116: knowledge dataization generation unit
117: calculator 118: feature vector generator
119: clustering unit 120: group assignment unit
121: data set generating unit 122: dividing unit
123: document information display unit 124: text display unit
125: summary text display unit 126: important keyword display unit
127: table maintenance unit 128: contact number generation unit
129: encryption key extraction unit 130: file encryption unit
131: information message display unit 132: security code input message display unit
133: decryption unit
Claims (12)
상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 문서 정보 생성부;
상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 중요 키워드 선정부;
상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 문장 추출부;
상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 요약문 생성부; 및
상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 지식 데이터화 생성부
를 포함하고,
상기 중요 키워드 선정부는
상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 산출부;
상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 특징 벡터 생성부;
상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 군집화부;
상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 그룹 할당부; 및
상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 데이터 셋 생성부
를 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.an extraction unit for extracting n (n is a natural number equal to or greater than 2) words in an order of increasing frequency among words included in the electronic document in the order of occurrence in the electronic document when a knowledge dataization command for the electronic document is received from the user;
The total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and a file for the document information is generated. a document information generating unit to generate;
an important keyword selecting unit for selecting the n words as important keywords for the electronic document and generating a file for an important keyword data set including the n words;
a sentence extraction unit for extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document;
a summary sentence generator for generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary; and
A knowledge data generation unit that generates a container format-based knowledge data file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence
including,
The important keyword selection section
a calculation unit for calculating an average value of the frequency of appearance of each of the n words in the electronic document and a letter size of each of the n words in the electronic document;
a feature vector generator for generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components for each of the n words;
a clustering unit that clusters the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the n words;
a group allocator for designating words belonging to the same group among the K groups as words having a similar importance to each other and assigning group information about a group to which each word belongs to each of the n words; and
When the group information is assigned to each of the n words, a data set generating unit generating a file for the important keyword data set including the n words to which the group information is assigned
An electronic device for generating a knowledge data file for an electronic document based on a container format comprising a.
상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 분할부;
상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 문서 정보 표시부;
상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 본문 표시부;
상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 요약문 표시부; 및
상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 중요 키워드 표시부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.According to claim 1,
After the knowledge data format file is created, when an execution command of the knowledge data format file is applied from the user, the screen display area according to the execution of the knowledge data format file is set to a document information display area, a text display area, a summary display area, and an important a division unit for dividing the keyword display area;
a document information display unit configured to execute a file for the document information included in the knowledge data file and display the document information in the document information display area;
a body display unit executing a document file for the electronic document included in the knowledge data file and displaying the body of the electronic document in the body display area;
a summary text display unit executing a document file for the summary text included in the knowledge data file and displaying the summary text in the summary text display area; and
By executing the important keyword data set file included in the knowledge data file, the n words are displayed separately by the K groups in the important keyword display area, and at the same time, the n words are displayed in the electronic document. An important keyword display unit for generating and displaying a first notification message indicating that an important keyword is an important keyword and a second notification message indicating that words belonging to the same group among the K groups have similar importance to each other
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 테이블 유지부;
상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 연접번호 생성부;
상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 암호화키 추출부;
상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 파일 암호화부; 및
상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 안내 메시지 표시부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.According to claim 1,
a table maintaining unit for storing and maintaining a table in which a predetermined number of t (t is a natural number greater than or equal to 2) encryption keys and integers from 0 to t-1 corresponding to each encryption key are recorded;
After the knowledge data file is created, when a security setting command for the knowledge data file is received from the user, the numerical value indicating the number of words included in each of the K groups is concatenated in ascending order to obtain a concatenation number. Contact number generation unit to generate;
When the concatenated number is generated, an operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and a first encryption key corresponding to the operation value is obtained from the table. an encryption key extraction unit to extract;
a file encryption unit that encrypts the knowledge data file with the first encryption key; and
When the knowledge data file is encrypted, a guide message display unit for displaying a guide message indicating that the connection number is a security code for decrypting the knowledge data file on the screen
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 보안코드 입력 메시지 표시부; 및
상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 복호화부
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치.5. The method of claim 4,
After the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, a security code input message instructing the user to input the security code for security release is displayed on the screen Security code input message display unit; and
When the concatenated number is received from the user in response to the security code input message, the operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and the operation value is calculated from the table. After extracting the first encryption key corresponding to the operation value, a decryption unit that decrypts the knowledge data file with the first encryption key
An electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
상기 전자 문서에 포함된 총 단어 수, 총 페이지 수, 총 라인 수를 카운트하여 상기 총 단어 수, 상기 총 페이지 수, 상기 총 라인 수를 포함하는 문서 정보를 생성하고, 상기 문서 정보에 대한 파일을 생성하는 단계;
상기 n개의 단어들을 상기 전자 문서에 대한 중요 키워드로 선정한 후, 상기 n개의 단어들을 포함하는 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계;
상기 전자 문서에 포함된 문장들 중 상기 n개의 단어들을 하나 이상 포함하고 있는 적어도 하나의 문장을 추출하는 단계;
상기 적어도 하나의 문장을 상기 전자 문서에서의 배치 순서에 따라 배치하여 요약문을 생성하고, 상기 요약문에 대한 문서 파일을 생성하는 단계; 및
상기 문서 정보에 대한 파일, 상기 전자 문서에 대한 문서 파일, 상기 중요 키워드 데이터 셋에 대한 파일, 상기 요약문에 대한 문서 파일을 포함하는 컨테이너 포맷 기반의 지식 데이터화 파일을 생성하는 단계
를 포함하고,
상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계는
상기 n개의 단어들 각각의 상기 전자 문서 내에서의 등장 빈도수와 상기 n개의 단어들 각각의 상기 전자 문서 내에서의 글자 크기의 평균 값을 산출하는 단계;
상기 n개의 단어들 각각에 대해, 상기 등장 빈도수와 상기 평균 값을 성분으로 갖는 2차원 벡터를 구성함으로써, 상기 n개의 단어들 각각에 대응되는 특징 벡터를 생성하는 단계;
상기 n개의 단어들 각각에 대응되는 특징 벡터를 기초로 K-평균 군집화(K-means Clustering)를 수행하여, 상기 n개의 단어들을 K개의 그룹으로 군집화하는 단계;
상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들을 서로 유사한 중요도를 갖는 단어들로 지정한 후 상기 n개의 단어들 각각에 대해, 각 단어가 속해있는 그룹에 대한 그룹 정보를 할당하는 단계; 및
상기 n개의 단어들 각각에 상기 그룹 정보가 할당되면, 상기 그룹 정보가 할당된 상기 n개의 단어들을 포함하는 상기 중요 키워드 데이터 셋에 대한 파일을 생성하는 단계
를 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.extracting n (n is a natural number equal to or greater than 2) words in an order of increasing frequency among words included in the electronic document in the order of occurrence in the electronic document when a knowledge dataization command for the electronic document is received from the user;
The total number of words, the total number of pages, and the total number of lines included in the electronic document are counted to generate document information including the total number of words, the total number of pages, and the total number of lines, and a file for the document information is generated. generating;
selecting the n words as important keywords for the electronic document and then generating a file for an important keyword data set including the n words;
extracting at least one sentence including one or more of the n words from among the sentences included in the electronic document;
generating a summary by arranging the at least one sentence according to an arrangement order in the electronic document, and generating a document file for the summary; and
Generating a container format-based knowledge dataization file including a file for the document information, a document file for the electronic document, a file for the important keyword data set, and a document file for the summary sentence
including,
The step of creating a file for the important keyword data set is
calculating an average value of an appearance frequency of each of the n words in the electronic document and a letter size of each of the n words in the electronic document;
generating a feature vector corresponding to each of the n words by constructing a two-dimensional vector having the frequency of occurrence and the average value as components for each of the n words;
clustering the n words into K groups by performing K-means clustering based on a feature vector corresponding to each of the n words;
designating words belonging to the same group among the K groups as words having similar importance, and then allocating group information about the group to which each word belongs to each of the n words; and
When the group information is assigned to each of the n words, generating a file for the important keyword data set including the n words to which the group information is assigned
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format comprising a.
상기 지식 데이터화 파일이 생성된 이후에, 상기 사용자로부터 상기 지식 데이터화 파일의 실행 명령이 인가되면, 상기 지식 데이터화 파일의 실행에 따른 화면 표시 영역을 문서 정보 표시 영역, 본문 표시 영역, 요약문 표시 영역 및 중요 키워드 표시 영역으로 분할하는 단계;
상기 지식 데이터화 파일에 포함된 상기 문서 정보에 대한 파일을 실행해서, 상기 문서 정보 표시 영역에 상기 문서 정보를 표시하는 단계;
상기 지식 데이터화 파일에 포함된 상기 전자 문서에 대한 문서 파일을 실행해서, 상기 본문 표시 영역에 상기 전자 문서의 본문을 표시하는 단계;
상기 지식 데이터화 파일에 포함된 상기 요약문에 대한 문서 파일을 실행해서, 상기 요약문 표시 영역에 상기 요약문을 표시하는 단계; 및
상기 지식 데이터화 파일에 포함된 상기 중요 키워드 데이터 셋 파일을 실행해서, 상기 중요 키워드 표시 영역에 상기 n개의 단어들을 상기 K개의 그룹별로 구분해서 표시함과 동시에, 상기 n개의 단어들이 상기 전자 문서에 대한 중요 키워드임을 알리는 제1 알림 메시지와 상기 K개의 그룹 중 동일 그룹 내에 속하는 단어들이 서로 유사한 중요도를 갖는 단어임을 알리는 제2 알림 메시지를 생성하여 상기 중요 키워드 표시 영역에 표시하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.7. The method of claim 6,
After the knowledge data format file is created, when an execution command of the knowledge data format file is applied from the user, the screen display area according to the execution of the knowledge data format file is set to a document information display area, a text display area, a summary display area, and an important dividing into keyword display areas;
displaying the document information in the document information display area by executing a file for the document information included in the knowledge data file;
displaying a body of the electronic document in the text display area by executing a document file for the electronic document included in the knowledge data file;
displaying the summary text in the summary text display area by executing a document file for the summary text included in the knowledge data file; and
By executing the important keyword data set file included in the knowledge data file, the n words are displayed separately by the K groups in the important keyword display area, and at the same time, the n words are displayed in the electronic document. generating and displaying a first notification message notifying that an important keyword is an important keyword and a second notification message indicating that words belonging to the same group among the K groups are words having similar importance to each other and displaying in the important keyword display area
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
미리 정해진 t(t는 2이상의 자연수)개의 암호화키들과 각 암호화키에 대응되는 0이상 t-1 이하의 정수가 대응되어 기록된 테이블을 저장하여 유지하는 단계;
상기 지식 데이터화 파일이 생성된 후, 상기 사용자로부터 상기 지식 데이터화 파일에 대한 보안 설정 명령이 수신되면, 상기 K개의 그룹 각각에 포함된 단어들의 개수를 나타내는 수치를 오름차순으로 연접(Concatenation)해서 연접번호를 생성하는 단계;
상기 연접번호가 생성되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로(modulo) 연산을 수행함으로써, 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 제1 암호화키를 추출하는 단계;
상기 지식 데이터화 파일을 상기 제1 암호화키로 암호화하는 단계; 및
상기 지식 데이터화 파일이 암호화되면, 상기 연접번호가 상기 지식 데이터화 파일의 복호화를 위한 보안코드임을 지시하는 안내 메시지를 화면 상에 표시하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.7. The method of claim 6,
storing and maintaining a table in which predetermined t (t is a natural number greater than or equal to 2) encryption keys and integers from 0 to t-1 corresponding to each encryption key are recorded;
After the knowledge data file is created, when a security setting command for the knowledge data file is received from the user, the numerical value indicating the number of words included in each of the K groups is concatenated in ascending order to obtain a concatenation number. generating;
When the concatenated number is generated, an operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and a first encryption key corresponding to the operation value is obtained from the table. extracting;
encrypting the knowledge data file with the first encryption key; and
When the knowledge data file is encrypted, displaying a guide message indicating that the connection number is a security code for decrypting the knowledge data file on the screen
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
상기 지식 데이터화 파일의 암호화가 완료된 이후, 상기 사용자로부터 상기 지식 데이터화 파일의 보안 해제 명령이 수신되면, 상기 사용자에게 보안 해제를 위한 상기 보안코드를 입력하도록 지시하는 보안코드 입력 메시지를 화면 상에 표시하는 단계; 및
상기 사용자로부터, 상기 보안코드 입력 메시지에 대응하여 상기 연접번호가 수신되면, 상기 연접번호를 피제수로, 상기 t를 제수로 하는 모듈로 연산을 수행함으로써, 상기 연산 값을 산출하고, 상기 테이블로부터 상기 연산 값에 대응되는 상기 제1 암호화키를 추출한 후, 상기 제1 암호화키로 상기 지식 데이터화 파일을 복호화하는 단계
를 더 포함하는 컨테이너 포맷을 기반으로 전자 문서에 대한 지식 데이터화 파일을 생성하는 전자 장치의 동작 방법.10. The method of claim 9,
After the encryption of the knowledge data file is completed, when a security release command of the knowledge data file is received from the user, a security code input message instructing the user to input the security code for security release is displayed on the screen step; and
When the concatenated number is received from the user in response to the security code input message, the operation value is calculated by performing a modulo operation in which the concatenated number is a dividend and t is a divisor, and the operation value is calculated from the table. After extracting the first encryption key corresponding to the operation value, decrypting the knowledge data file with the first encryption key
An operating method of an electronic device for generating a knowledge data file for an electronic document based on a container format further comprising a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200119639A KR102417779B1 (en) | 2020-09-17 | 2020-09-17 | Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200119639A KR102417779B1 (en) | 2020-09-17 | 2020-09-17 | Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220037091A KR20220037091A (en) | 2022-03-24 |
KR102417779B1 true KR102417779B1 (en) | 2022-07-06 |
Family
ID=80935702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200119639A KR102417779B1 (en) | 2020-09-17 | 2020-09-17 | Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102417779B1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014171053A (en) * | 2013-03-01 | 2014-09-18 | Sky Com:Kk | Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method |
JP2020071539A (en) * | 2018-10-29 | 2020-05-07 | 株式会社スカイコム | Management server, document file management method, and document file management program |
WO2020111197A1 (en) | 2018-11-30 | 2020-06-04 | 了宣 山本 | Document arrangement support system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060107950A (en) * | 2005-04-11 | 2006-10-16 | 에스케이 텔레콤주식회사 | Internet page structure for settlement of environment and guide for wireless internet user interface |
KR102128659B1 (en) * | 2018-10-16 | 2020-06-30 | 주식회사 포스코아이씨티 | System and Method for Extracting Keyword and Generating Abstract |
-
2020
- 2020-09-17 KR KR1020200119639A patent/KR102417779B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014171053A (en) * | 2013-03-01 | 2014-09-18 | Sky Com:Kk | Electronic document container data file, electronic document container data file generating apparatus, electronic document container data file generating program, server apparatus, and electronic document container data file generating method |
JP2020071539A (en) * | 2018-10-29 | 2020-05-07 | 株式会社スカイコム | Management server, document file management method, and document file management program |
WO2020111197A1 (en) | 2018-11-30 | 2020-06-04 | 了宣 山本 | Document arrangement support system |
Also Published As
Publication number | Publication date |
---|---|
KR20220037091A (en) | 2022-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929550B2 (en) | Terminal device and computer program | |
KR101220254B1 (en) | Searchable color encoded file composing method and searchable color encoded file system | |
KR102417779B1 (en) | Electronic device that generates knowledge data files for electronic documents based on container format and operating method thereof | |
KR101977128B1 (en) | Fixed length encryption apparatus and method for long text strings | |
KR102395697B1 (en) | Video conference system server which is able to take minutes of a video conference and the operating method thereof | |
KR20140044962A (en) | Lock releasing method of electronic device, apparatus thereof, and medium storing program source thereof | |
KR102466721B1 (en) | Electronic device for converting the electronic document to the knowledge data document and the operating method thereof | |
KR102300444B1 (en) | Document editing device to check whether the font applied to the document is a supported font and operating method thereof | |
KR102300437B1 (en) | Electronic document editing apparatus that enables the insertion of special characters at specific locations on the electronic document based on the entered characters and operating method thereof | |
KR102328051B1 (en) | Document editing device that enables display of a document to which a font in unsupported data format is applied and operating method thereof | |
KR102523794B1 (en) | Electronic device that supports tree-structured cataloging of a table inserted into an electronic document and the operating method thereof | |
KR102119726B1 (en) | Apparatus for protecting contents of spread sheet type electric document and operating method thereof | |
CN114091080A (en) | Subtitle file encryption and decryption method, system, storage medium and electronic equipment | |
KR102683141B1 (en) | Electronic terminal apparatus equipped with the ui development tool, which is able to provide an automatic ui components creation function through image analysis of a ui design plan, and the operating method thereof | |
KR102545264B1 (en) | Web contents crawling apparatus which collects web contents data from the body area on the web page, and the operating method thereof | |
KR102300439B1 (en) | Font verification server to verify whether the font applied to a document is authorized and operating method thereof | |
KR102545262B1 (en) | Electronic terminal apparatus for providing information of the associated documents which are associated with the particular document based on simultaneous usage criteria and operating method thereof | |
EP2947641B1 (en) | Information processing device, information processing method, and program | |
KR102442522B1 (en) | Electronic apparatus that recommends shortcut keys according to the editing action input when creating a document and the operating method thereof | |
KR102466714B1 (en) | Electronic device that provides improved object insertion into electronic document through object box and operating method thereof | |
KR102417811B1 (en) | Document translation service server which provides document translation services with personal information protection function and the operating method thereof | |
KR20240053970A (en) | Document conversion service providing server that provides the document conversion service that can convert the electronic document written with a word processor into a presentation document and operating method thereof | |
KR20220127484A (en) | Electronic document management server that performs database processing for electronic document based on identification tag and operating method thereof | |
KR20240054001A (en) | Electronic terminal device capable of automatically converting slides in the format of a presentation document into pages in the format of a word processing document and the operating method thereof | |
KR20230115177A (en) | Service providing server that provides sentiment analysis service for marketing and the operating method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |