KR101605430B1 - SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME - Google Patents

SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME Download PDF

Info

Publication number
KR101605430B1
KR101605430B1 KR1020140066920A KR20140066920A KR101605430B1 KR 101605430 B1 KR101605430 B1 KR 101605430B1 KR 1020140066920 A KR1020140066920 A KR 1020140066920A KR 20140066920 A KR20140066920 A KR 20140066920A KR 101605430 B1 KR101605430 B1 KR 101605430B1
Authority
KR
South Korea
Prior art keywords
question
answer
informative
questions
informational
Prior art date
Application number
KR1020140066920A
Other languages
Korean (ko)
Other versions
KR20150096295A (en
Inventor
김강학
이선호
손정훈
Original Assignee
주식회사 플런티코리아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 플런티코리아 filed Critical 주식회사 플런티코리아
Publication of KR20150096295A publication Critical patent/KR20150096295A/en
Application granted granted Critical
Publication of KR101605430B1 publication Critical patent/KR101605430B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법이 제공된다. 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 시스템에 따르면, 질문과 답변을 포함하는 대화형 메시지를 수집하는 단계; 및 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 단계를 포함한다.A system and method for constructing a questionnaire database, and a retrieval system and method using the same are provided. According to an embodiment of the present invention, there is provided a system for constructing a questionnaire database, comprising: collecting an interactive message including a question and an answer; And extracting from the collected interactive messages an informational question requiring an answer and information required by the informational question and incorporating it into the questionnaire database.

Description

문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법{SYSTEM AND METHOD FOR BUINDING Q&As DATABASE, AND SEARCH SYSTEM AND METHOD USING THE SAME}TECHNICAL FIELD The present invention relates to a system and method for constructing a questionnaire database, a search system and method using the same,

본 발명은 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법에 관한 것으로, 보다 자세하게는 모바일 검색 또는 음성 검색에 적합한 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for constructing a questionnaire database, and a search system and method using the same. More particularly, the present invention relates to a system and method for constructing a questionnaire database suitable for mobile search or voice search, and a search system and method using the same.

스마트폰의 보급과 함께, 스마트폰을 통해 접속할 수 있는 네트워크가 질적, 양적으로 발전함에 따라, 스마트폰을 포함한 모바일 장치를 이용하여 정보를 검색하는 것이 보편화되었다.With the spread of smartphones and the qualitative and quantitative development of networks that can be accessed through smartphones, it has become common to search for information using mobile devices including smartphones.

모바일 장치를 이용하여 정보를 검색하는 방법으로, 포털 사이트(portal site)를 통해 정보를 검색하는 전통적인 방식이 있으며, 사용자의 질문에 자동으로 답변을 하기 위해, 사용자가 원하는 정답이 저장되어 있는 다양한 정보원에 접근하여 정답을 추출하는 기술이 연구되고 있다. 예컨대, 사용자의 질문으로부터 키워드를 추출하고, 검색 엔진을 이용하여 사용자의 질문과 관련된 문서를 검색하고, 검색된 문서를 통해 정답을 추출할 수 있다.There is a conventional method of retrieving information through a portal site, which is a method of retrieving information using a mobile device. In order to automatically answer a user's query, a variety of information sources And extracting correct answers is being studied. For example, a keyword may be extracted from a user's query, a search engine may be used to search for a document related to a user's query, and a correct answer extracted through the retrieved document.

공개번호 제10-2013-0021944호Publication No. 10-2013-0021944

다만, 최근에는 트위터나 페이스북 등의 SNS(Social Networking Service)의 사용이 활발해졌으며, 이에 따라, SNS를 통해 정보를 공유하고 궁금증을 해결하는 경우가 늘고 있다. 더욱이, SNS는 이용자 사이에 형성된 개인적인 신뢰도에 기반하고 있기 때문에, SNS를 통해 공유되는 정보의 정확도는 높을 수 있다.Recently, however, the use of SNS (Social Networking Service) such as Twitter and Facebook has become more active. As a result, more and more people are sharing information and solving their questions through SNS. Moreover, since the SNS is based on personal confidence established between users, the accuracy of the information shared through the SNS can be high.

그러나, 종래 기술의 경우, 질문을 통해 추출된 키워드에 기초하여 웹 사이트에서 관련 문서를 검색할 뿐이며, SNS 등을 통한 양질의 데이터는 이용하고 있지 못하는 실정이다.However, in the case of the related art, only the relevant document is searched on the website based on the keyword extracted through the question, and the quality data through the SNS and the like are not used.

또한, 포털 사이트나 웹 사이트로부터 제공되는 검색 결과는, 상대적으로 내용이 긴 경우가 많으므로, 화면의 크기가 작은 모바일 장치를 통해 검색 결과를 확인하기는 용이하지 않다. 더욱이, 사용자가 음성 검색 서비스를 이용하려는 경우에도, 포털 사이트나 웹 사이트로는 상대적으로 긴 내용의 검색 결과를 제공하기 때문에, 사용자에게 해당 검색 결과에 대한 음성 답변을 제공하기 용이하지 않다.In addition, search results provided from a portal site or a web site are often relatively long, so it is not easy to check a search result through a mobile device having a small screen size. Furthermore, even if a user wants to use a voice search service, it is not easy to provide a voice response to the search result to the user because the search result is relatively long in the portal site or the web site.

본 발명이 해결하고자 하는 기술적 과제는, 질문과 답변을 포함하는 대화형 메시지를 이용하여, 문답 데이터베이스를 구축함으로써, SNS 등을 통한 양질의 데이터를 이용할 수 있는 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법을 제공하고자 하는 것이다.SUMMARY OF THE INVENTION The present invention is directed to a system and method for constructing a questionnaire database that can use high quality data through SNS by constructing a questionnaire database using an interactive message including questions and answers, And to provide a search system and method.

본 발명이 해결하고자 하는 다른 기술적 과제는, 질문과 답변을 포함하는 대화형 메시지를 이용하여, 문답 데이터베이스를 구축함으로써, 대화형 메시지에 포함된 단문형 답변을 제공할 수 있기 때문에, 모바일 검색 및 음성 검색에 적합한 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법을 제공하고자 하는 것이다.Another problem to be solved by the present invention is to provide a mobile communication system which can provide a short message included in an interactive message by constructing a questionnaire database using an interactive message including a question and an answer, A system and method for constructing a questionnaire database suitable for a search, and a search system and method using the same.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical objects of the present invention are not limited to the above-mentioned technical problems, and other technical subjects not mentioned can be clearly understood by those skilled in the art from the following description.

상기 언급된 기술적 과제들을 해결하기 위한, 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 방법은, 질문과 답변을 포함하는 대화형 메시지를 수집하는 단계; 및 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 단계를 포함한다.According to an aspect of the present invention, there is provided a method for constructing a questionnaire database, comprising: collecting an interactive message including a question and an answer; And extracting from the collected interactive messages an informational question requiring an answer and information required by the informational question and incorporating it into the questionnaire database.

상기 언급된 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 방법은, 질문과 답변을 포함하는 대화형 메시지를 수집하는 대화형 메시지 수집 모듈; 및 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 정보성 문답 추출 모듈을 포함한다.According to an aspect of the present invention, there is provided a method for constructing a questionnaire database, comprising: an interactive message collection module for collecting an interactive message including a question and an answer; And an informal dialogue extracting module for extracting from the collected interactive messages an informative question requiring an answer and an informative answer providing information necessary for the informative question, and incorporating it into the questionnaire database.

상기 언급된 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 검색 방법은, 문답 데이터베이스를 이용하여 검색하는 방법으로서, 사용자 단말로부터 사용자 질문을 입력받는 단계; 및 상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말로 제공하는 단계를 포함한다.According to an aspect of the present invention, there is provided a search method using a questionnaire database, the method comprising: receiving a user query from a user terminal; And retrieving a related query from the question database based on the user query and providing an informative answer to the retrieved related query to the user terminal.

상기 언급된 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 검색 시스템은, 문답 데이터베이스; 사용자 단말로부터 사용자 질문을 입력받는 사용자 질문 입력부; 및 상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말로 제공하는 검색 엔진부를 포함한다.According to an aspect of the present invention, there is provided a search system comprising: a questionnaire database; A user inquiry input unit for receiving a user query from a user terminal; And a search engine unit for searching for a related question from the questionnaire database based on the user query and providing an informative answer to the retrieved related query to the user terminal.

상기와 같은 본 발명에 따르면, 질문과 답변을 포함하는 대화형 메시지를 이용하여 문답 데이터베이스를 구축하기 때문에, SNS 등을 통한 양질의 데이터를 이용할 수 있다.According to the present invention as described above, since the questionnaire database is constructed using the interactive message including the questions and the answers, it is possible to use high-quality data through the SNS and the like.

상기와 같은 본 발명에 따르면, 질문과 답변을 포함하는 대화형 메시지를 이용하여 문답 데이터베이스를 구축하기 때문에, 검색 결과로서 대화형 메시지에 포함된 단문형 답변을 제공할 수 있다.According to the present invention, since the questionnaire database is constructed by using the interactive message including the questions and the answers, the short message answers included in the interactive message can be provided as a search result.

도 1은 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 시스템의 개략도이다.
도 2는 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 방법의 순서도이다.
도 3은 도 2의 단계 S10의 구체적인 순서도이다.
도 4는 도 2의 단계 S20의 구체적인 순서도이다.
도 5는 도 4의 단계 S21의 구체적인 순서도이다.
도 6은 도 5의 단계 S21-1에서 사용될 수 있는 특징을 나타내는 표이다.
도 7은 도 4의 단계 S22의 구체적인 순서도이다.
도 8은 도 5의 단계 S22-1에서 사용될 수 있는 특징을 나타내는 표이다.
도 9는 본 발명의 일 실시예에 따른 검색 시스템의 개략도이다.
도 10은 본 발명의 일 실시예에 따른 검색 방법의 순서도이다.
1 is a schematic diagram of a questionnaire database building system according to an embodiment of the present invention.
2 is a flowchart of a method for constructing a questionnaire database according to an embodiment of the present invention.
3 is a specific flowchart of step S10 of FIG.
4 is a detailed flowchart of step S20 of FIG.
5 is a specific flowchart of step S21 in Fig.
6 is a table showing features that can be used in step S21-1 of Fig.
7 is a specific flowchart of step S22 in Fig.
Fig. 8 is a table showing characteristics that can be used in step S22-1 of Fig. 5; Fig.
9 is a schematic diagram of a search system in accordance with an embodiment of the present invention.
10 is a flowchart of a search method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and the manner of achieving them, will be apparent from and elucidated with reference to the embodiments described hereinafter in conjunction with the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. To fully disclose the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless defined otherwise, all terms (including technical and scientific terms) used herein may be used in a sense commonly understood by one of ordinary skill in the art to which this invention belongs. Also, commonly used predefined terms are not ideally or excessively interpreted unless explicitly defined otherwise.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.The terminology used herein is for the purpose of illustrating embodiments and is not intended to be limiting of the present invention. In the present specification, the singular form includes plural forms unless otherwise specified in the specification. The terms " comprises "and / or" comprising "used in the specification do not exclude the presence or addition of one or more other elements in addition to the stated element.

이하, 도면을 참조하여 본 발명의 실시예들에 따른 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법에 대해 설명하기로 한다. 본 발명의 실시예들에 따른 문답 데이터베이스 구축 시스템 및 검색 시스템에 포함되는 "모듈" 및 "부"는 하드웨어적 또는 소프트웨어적으로 구현될 수 있지만, 이에 제한되지 않는다.Hereinafter, a system and method for constructing a questionnaire database according to embodiments of the present invention, and a retrieval system and method using the same will be described with reference to the drawings. "Module" and "part" included in the questionnaire database building system and the search system according to the embodiments of the present invention can be implemented in hardware or software, but are not limited thereto.

우선, 도 1을 참조하여, 문답 데이터베이스 구축 시스템(1)을 설명한다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 문답 데이터베이스 구축 시스템(1)의 개략도가 개시된다.First, referring to Fig. 1, a questionnaire database building system 1 will be described. 1, a schematic diagram of a questionnaire database building system 1 according to an embodiment of the present invention is disclosed.

문답 데이터베이스 구축 시스템(1)은 대화형 메시지 수집 모듈(10), 대화형 메시지 데이터베이스(15), 정보성 문답 추출 모듈(20) 및 문답 데이터베이스(25)를 포함할 수 있다.The questionnaire database building system 1 may include an interactive message collection module 10, an interactive message database 15, an informal dialogue extraction module 20 and a question and answer database 25.

대화형 메시지 수집 모듈(10)은 질문과 답변을 포함하는 대화형 메시지를 수집할 수 있다. 대화형 메시지는 질문과 답변을 포함할 수 있으며, 예컨대, 트위터 메시지와 페이스북 메시지가 대표적인 대화형 메시지일 수 있지만, 이에 제한되지 않으며, 복수의 사용자가 질문과 답변을 주고 받는 구조를 가지는 모든 메시지가 대화형 메시지에 포함될 수 있다.The interactive message collection module 10 may collect interactive messages including questions and answers. The interactive message may include a question and an answer, for example, a Twitter message and a Facebook message may be representative interactive messages, but not limited to, all messages having a structure in which a plurality of users exchange questions and answers May be included in the interactive message.

대화형 메시지 수집 모듈(10)은 웹(web, 5)으로부터 대화형 메시지를 수집할 수 있으며, 예컨대, SNS, 커뮤니티 서비스, 온라인 포럼 서비스 등을 제공하는 서버로부터 대화형 메시지를 수집할 수 있지만, 이에 제한되지 않는다.The interactive message collection module 10 may collect interactive messages from the web 5 and may collect interactive messages from servers providing SNS, community services, online forum services, etc., But is not limited thereto.

구체적으로, 대화형 메시지 수집 모듈(10)은 질문 패턴 정의부(11)와 대화형 메시지 수집부(12)를 포함할 수 있다.Specifically, the interactive message collection module 10 may include a question pattern definition unit 11 and an interactive message collection unit 12.

질문 패턴 정의부(11)는 질문임을 확인하는 기준이 되는 문자 패턴을 정의할 수 있다. 본 실시예에 따른 문답 데이터베이스 구축 시스템(1)에서 문답 데이터베이스(25)를 구축하기 위해서는 대화형 메시지에 질문이 포함되는 것이 필수적이기 때문에, 대화형 메시지에 질문이 포함되어 있음을 확인할 수 있는 특정한 문자 패턴이 질문 패턴 정의부(11)에서 정의될 수 있다. 예컨대, "물음표(?)"를 질문임을 확인하는 문자 패턴으로 정의할 수 있지만, 이에 제한되지 않으며, 품사 배열 패턴, 조동사가 문장의 처음에 위치했는지 여부 등이 문자 패턴으로 정의될 수 있다.The question pattern definition unit 11 can define a character pattern as a reference for confirming the question. In order to construct the question database 25 in the questionnaire database building system 1 according to the present embodiment, it is essential that the question is included in the interactive message. Therefore, A pattern can be defined in the question pattern definition unit 11. [ For example, the question mark (?) May be defined as a character pattern that confirms an inquiry, but the present invention is not limited thereto, and may be defined as a character pattern, such as a partly sparse array pattern or whether a verb is located at the beginning of a sentence.

대화형 메시지 수집부(12)는 정의된 문자 패턴을 이용하여 질문과 답변을 포함하는 대화형 메시지를 수집할 수 있으며, 구체적으로, 대화형 메시지 수집부(12)는 정의된 문자 패턴이 포함되어 있어 질문을 포함하고 있다고 판단되는 대화형 메시지를 수집하여, 대화형 메시지 데이터베이스(15)에 포함시킬 수 있다. 예컨대, 웹 크롤러(web crawler) 또는 공개 API를 통해, 대화형 메시지를 수집할 수 있지만, 이에 제한되지 않는다.The interactive message collecting unit 12 may collect an interactive message including a question and an answer using the defined character pattern. Specifically, the interactive message collecting unit 12 includes a defined character pattern And may be included in the interactive message database 15. In this case, Through, for example, a web crawler or a public API, an interactive message may be collected, but is not limited thereto.

한편, 대화형 메시지 수집 모듈(10), 즉 대화형 메시지 수집부(12)에 의해 수집된 대화형 메시지는 대화형 메시지 데이터베이스(15)에 저장될 수 있다.On the other hand, the interactive message collection module 10, that is, the interactive message collected by the interactive message collection unit 12, can be stored in the interactive message database 15.

그리고, 정보성 문답 추출 모듈(20)은 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스(25)에 포함시킬 수 있다. 즉, 정보성 문답 추출 모듈(20)은 대화형 메시지 데이터베이스(15)에 저장된 대화형 메시지로부터, 질문과 해당 질문에 대한 답을 제공하는 답변을 추출하고, 추출된 질문과 답변을 하나의 문답 데이터로 하여 문답 데이터베이스(25)에 저장시킬 수 있다.Then, the information-based dialogue extracting module 20 extracts an informational question requiring an answer and an informational answer providing information necessary for the informational question from the collected interactive message, . That is, the information and dialogue extraction module 20 extracts questions and answers providing answers to the questions from the interactive messages stored in the interactive message database 15, and extracts the extracted questions and answers as one question data And store it in the question database 25.

구체적으로, 정보성 문답 추출 모듈(20)은 정보성 질문 분류부(21), 정보성 답변 분류부(22) 및 정보성 문답 필터링부(23)를 포함할 수 있다.Specifically, the information-based dialogue extraction module 20 may include an information-based question classifying unit 21, an information-based answer classifying unit 22, and an information-based dialogue filtering unit 23.

정보성 질문 분류부(21)는, 수집된 대화형 메시지에 포함된 질문에 대하여, 답변을 필요로 하는 정보성 질문과 답변을 필요로 하지않는 비정보성 질문을 분류할 수 있다. 정보성 질문은 상대방으로부터 정보를 확인하기 위한 목적을 내포하고 있으므로, 답변을 필요로 할 수 있다. 따라서, 정보성 질문을 분류하고, 이에 대한 답변을 확인할 수 있다면, 특정 주제의 정보가 공유되고 있는 문답 데이터를 얻을 수 있다.The intelligent question classifier 21 can classify informative questions that require answers and non-definite questions that do not require an answer to the questions contained in the collected interactive messages. Informational questions involve the purpose of identifying information from the other party and may require an answer. Thus, if you can categorize and answer the informational questions, you can get the questionnaire data in which the information of a specific topic is shared.

이에 비해, 비정보성 질문은 예컨대 의문문의 형태를 가지고 있지만, 상대방으로부터 정보를 확인하기 위한 목적을 내포하고 있지 않으므로, 답변을 필요로 하지 않을 수 있다. 따라서, 비정보성 질문과 이에 대한 답변을 통해서는 객관적인 정보를 확인하기가 용이하지 않으므로, 비정보성 질문과 이에 대한 답변을 검색 시스템(100)을 위한 문답 데이터베이스(25)에 포함시키지 않는 것이 바람직할 수 있다.On the other hand, non-ambulatory questions have a form of question, for example, but they do not contain the purpose of verifying information from the other party, so they may not need an answer. Therefore, it is preferable not to include non-standard questions and their answers in the questionnaire database 25 for the search system 100 because it is not easy to confirm objective information through non-standard questions and answers thereto have.

정보성 질문과 비정보성 질문은 품사 순서, 어조 등에 있어서 차이가 있을 수 있으며, 이러한 차이가 나는 요소를 특징(feature)으로 할 수 있다. 복수의 특징이 모여 n차원의 특징 벡터를 이룰 수 있으며, 이러한 특징 벡터를 이용하여 기계 학습 모델을 생성할 수 있으며, 생성된 기계 학습 모델을 이용하여, 질문을 정보성 질문과 비정보성 질문으로 분류할 수 있다. 기계 학습 모델의 일례로 서포트 벡터 머신 모델(SVM; Support Vector Machine)을 이용할 수 있지만, 기계 학습 모델은 이에 제한되지 않으며, 본 발명의 실시예들에 다양한 기계 학습 모델이 적용될 수 있다.Informational and non-informal questions may be different in the part-of-speech order, tone, and so on. It is possible to generate n-dimensional feature vectors by gathering a plurality of features. Using these feature vectors, a machine learning model can be generated. Using the generated machine learning model, questions are classified into informational and non-standard questions can do. A support vector machine (SVM) can be used as an example of the machine learning model, but the machine learning model is not limited thereto, and various machine learning models can be applied to the embodiments of the present invention.

정보성 답변 분류부(22)는, 수집된 대화형 메시지에 포함된 답변에 대하여, 질문에서 필요로 하는 정보를 제공하는 정보성 답변과 질문에서 필요로 하는 정보를 제공하지 않는 비정보성 답변을 분류할 수 있다. 다만, 몇몇 실시예에서는, 정보성 답변 분류부(22)는, 정보성 질문 분류부(21)에 의해 정보성 질문으로 분류된 질문을 포함하는 대화형 메시지에 대하여, 해당 대화형 메시지에 포함된 답변이 정보성 답변인지 비정보성 답변인지 분류할 수 있지만, 이에 제한되지 않는다.The information-based answer classification unit 22 classifies the answers included in the collected interactive messages as informative answers that provide the information required by the questions and non-provisional answers that do not provide the information required by the questions can do. However, in some embodiments, the information-based answer classifying section 22 classifies the interactive messages including the questions classified as the informative questions by the information-based question classifying section 21, It is possible, but not limited to, to classify whether the answer is informative or non-benign.

대화형 메시지에는 하나의 질문에 대해 이와 연계된 복수의 답변이 포함될 수 있으며, 질문과 크게 관련이 없는 내용의 답변도 포함될 수 있기 때문에, 문답 데이터베이스(25)를 만들기 위해, 복수의 답변 중에서 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하는 작업이 필요할 수 있다.The interactive message may include a plurality of responses associated with a single question, and may also include answers to content that are not largely related to the question. Thus, in order to create the questionnaire database 25, It may be necessary to extract informative responses that provide the information that is needed.

정보성 답변과 비정보성 답변은 질문과 해당 답변 사이의 주제 유사도, 해당 답변에 은어가 포함된 비율 등에 있어서 차이가 있을 수 있으며, 이러한 차이가 나는 요소를 특징으로 할 수 있다. 복수의 특징이 모여 n차원의 특징 벡터를 이룰 수 있으며, 이러한 특징 벡터를 이용하여 기계 학습 모델을 생성할 수 있으며, 생성된 기계 학습 모델을 이용하여, 답변을 정보성 답변과 비정보성 답변으로 분류할 수 있다.Informative and non-normative responses may differ in the subject similarity between the question and the corresponding answer, the percentage of inclusion of the glossary in the response, and may be characterized by the factor that makes this difference. Multiple features can be gathered to form an n-dimensional feature vector. Using these feature vectors, a machine learning model can be generated. The generated machine learning model can be used to classify answers into informational and non-standard answers can do.

정보성 문답 필터링부(23)는, 수집된 대화형 메시지로부터, 정보성 질문과, 해당 정보성 질문을 포함하는 대화형 메시지의 정보성 답변을 필터링하여 문답 데이터베이스(25)에 포함시킬 수 있다. 즉, 정보성 문답 필터링부(23)는, 정보성 질문 분류부(21)에 의해 정보성 질문으로 분류된 질문과, 해당 질문이 포함된 대화형 메시지에 포함되는 답변 중 정보성 답변으로 분류된 답변을 필터링하여 하나의 문답 데이터로 문답 데이터베이스(25)에 저장시킬 수 있다.The information sexuality filtering unit 23 may filter the informative questions and the informative answers of the interactive messages including the informative questions from the collected interactive messages and include them in the questionnaire database 25. That is, the informal dialogue filtering unit 23 extracts the answers classified into the informative questions by the informative question classifying unit 21 and the answers included in the interactive messages including the relevant questions The answer may be filtered and stored in the questionnaire database 25 as a single questionnaire data.

문답 데이터베이스(25)는 정보성 문답 추출 모듈(20)에 의해, 즉 정보성 문답 필터링부(23)에 의해 필터링된 문답 데이터를 저장할 수 있다. 예컨대, 정보성 질문 분류부(21)에 의해 정보성 질문으로 분류된 질문과, 해당 질문이 포함된 대화형 메시지에 포함되는 답변 중 정보성 답변으로 분류된 답변이 대응되어 하나의 문답 데이터로서 문답 데이터베이스(25)에 저장될 수 있다.The questionnaire database 25 may store the questionnaire data filtered by the informal dialogue extraction module 20, that is, the information-based dialogue filtering unit 23. [ For example, among the answers classified into the informative questions by the information-based question classifying section 21 and the answers included in the interactive messages including the relevant questions, the answers classified as the informative answers are corresponded to one another as one question data And stored in the database 25.

본 발명의 문답 데이터베이스 구축 시스템(1)에 따르면, 질문과 답변을 포함하는 대화형 메시지를 이용하여 문답 데이터베이스(25)가 구축하기 때문에, SNS 등을 통한 양질의 데이터를 활용할 수 있다.According to the questionnaire building system 1 of the present invention, since the questionnaire database 25 is constructed using an interactive message including a question and an answer, it is possible to utilize high-quality data through SNS or the like.

이하, 도 2 내지 도 8을 참조하여, 본 발명의 일 실시예에 따른 문답 데이터베이스(25) 구축 방법을 설명한다. 도 2를 참조하면, 본 발명의 일 실시예에 따른 문답 데이터베이스(25) 구축 방법의 순서도가 개시되고, 도 3을 참조하면, 도 2의 단계 S10의 구체적인 순서도가 개시되고, 도 4를 참조하면, 도 2의 단계 S20의 구체적인 순서도가 개시되고, 도 5를 참조하면, 도 4의 단계 S21의 구체적인 순서도가 개시되고, 도 6을 참조하면, 도 5의 단계 S21-1에서 사용될 수 있는 특징을 나타내는 표가 개시되고, 도 7을 참조하면, 도 4의 단계 S22의 구체적인 순서도가 개시되고, 도 8을 참조하면, 도 5의 단계 S22-1에서 사용될 수 있는 특징을 나타내는 표가 개시된다.Hereinafter, a method for constructing the questionnaire database 25 according to an embodiment of the present invention will be described with reference to FIGS. 2 to 8. FIG. Referring to FIG. 2, a flowchart of a method for constructing a questionnaire database 25 according to an embodiment of the present invention is disclosed. Referring to FIG. 3, a specific flowchart of step S10 of FIG. 2 is disclosed, , A specific flowchart of step S20 of FIG. 2 is described, and with reference to FIG. 5, a specific flowchart of step S21 of FIG. 4 is described, and referring to FIG. 6, a feature that can be used in step S21-1 of FIG. Referring to Fig. 7, a specific flowchart of step S22 of Fig. 4 is disclosed, and with reference to Fig. 8, a table showing features that can be used in step S22-1 of Fig. 5 is disclosed.

우선, 도 2를 참조하여, 질문과 답변을 포함하는 대화형 메시지를 수집할 수 있다(S10). 구체적으로, 도 3을 참조하여, 질문임을 확인하는 기준이 되는 문자 패턴을 정의한 후(S11), 정의된 문자 패턴을 이용하여 질문과 답변을 포함하는 대화형 메시지를 수집할 수 있다.First, referring to FIG. 2, an interactive message including a question and an answer may be collected (S10). Specifically, referring to FIG. 3, after defining a character pattern as a criterion for confirming a question (S11), an interactive message including a question and an answer can be collected using the defined character pattern.

이어서, 도 2를 참조하여, 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스(25)에 포함시킬 수 있다(S20). 구체적으로, 도 4를 참조하여, 수집된 대화형 메시지에 포함된 질문에 대하여, 답변을 필요로 하는 정보성 질문과 답변을 필요로 하지않는 비정보성 질문을 분류하고(S21), 수집된 대화형 메시지에 포함된 답변에 대하여, 질문에서 필요로 하는 정보를 제공하는 정보성 답변과 질문에서 필요로 하는 정보를 제공하지않는 비정보성 답변을 분류할 수 있다(S22). 다만, 몇몇 실시예에서는, 정보성 질문으로 분류된 질문을 포함하는 대화형 메시지에 대하여, 해당 대화형 메시지에 포함된 답변이 정보성 답변인지 비정보성 답변인지 분류할 수 있다. 그리고, 수집된 대화형 메시지로부터, 정보성 질문과, 해당 정보성 질문을 포함하는 대화형 메시지의 정보성 답변을 필터링하여 문답 데이터베이스(25)에 포함시킬 수 있다(S23). Next, referring to FIG. 2, an informational question requiring an answer and an informational answer providing information necessary for the informational question are extracted from the collected interactive message and included in the questionnaire database 25 (S20). Specifically, referring to FIG. 4, an informative question requiring an answer and a non-urgent question not requiring an answer are sorted (S21) for the questions included in the collected interactive message (S21) For the answers included in the message, an informative answer providing information required by the question and a non-responsive answer providing no information required by the question can be categorized (S22). However, in some embodiments, for an interactive message that includes a question classified as an informative question, the answer included in the interactive message may be classified as informative or non-informative. From the collected interactive messages, informative questions and informative answers of the interactive messages including the informative questions can be filtered and included in the questionnaire database 25 (S23).

여기에서, 정보성 질문과 비정보성 질문을 분류하는 단계(S21)를 구체적으로 설명한다. 우선, 도 5를 참조하여, 특징 벡터(feature vector)를 이용하여, 해당 질문이 정보성 질문인지 비정보성 질문인지 분류하도록 기계 학습된 기계 학습 모델을 생성할 수 있다(S21-1). 특징 벡터는 복수의 특징(feature)이 모여 형성된 것이며, 각각의 특징이 하나의 차원을 형성할 수 있으므로, 특징 벡터는 예컨대 n차원일 수 있다.Here, the step S21 of classifying the informative and irregularity questions will be described in detail. First, referring to FIG. 5, a machine learning model can be generated (S21-1) by using a feature vector to classify whether the question is an informational question or an unstructured question. The feature vector is formed by collecting a plurality of features, and each feature can form one dimension, so that the feature vector can be, for example, n-dimensional.

도 6을 참조하면, 질문에 특정한 문자 패턴이 포함되어 있는지 여부가 특징이 될 수 있다. 특정한 문자 패턴이 질문에 포함된 경우, 질문이 정보성 질문이거나 비정보성 질문일 확률이 상당한 경우, 해당되는 특정한 문자 패턴은 질문을 분류하기 위한 척도로 이용될 수 있다.Referring to FIG. 6, whether or not a question includes a specific character pattern can be characterized. When a particular character pattern is included in a query, and the probability that the question is an informational or non-regularity question is significant, the particular character pattern in question can be used as a measure to classify the question.

특정한 문자 패턴은, 예컨대 URL(Uniform Resource Locator), 고유 명사, 강한 어조의 표현, 인용구 및 육하원칙의 구성 요소 중 어느 하나 이상을 포함할 수 있지만, 이에 제한되지 않는다. 또한, 특정한 문자 패턴은 해시태그(#, hash tag), 멘션(@, mention) 및 리트윗(RT, retweet) 중 어느 하나 이상을 더 포함할 수 있지만, 이에 제한되지 않는다. 해시태그, 멘션, 리트윗은 트위터(twitter)에서 사용되는 문자 패턴으로, 질문이 트위터의 메시지인 경우, 유용한 특징으로 이용될 수 있다.A particular character pattern may include, but is not limited to, one or more of, for example, a Uniform Resource Locator (URL), proper nouns, strong tones, quotations, In addition, the specific character pattern may further include at least one of a hash tag (#, hash tag), a mention (@, mention), and a retweet (RT), but is not limited thereto. Hashtags, mentions, and retweets are character patterns used in tweets that can be used as a useful feature if the question is a Twitter message.

이 밖에, 질문을 구성하는 문장의 품사 시퀀스(POS sequence)가 특징이 될 수 있으며, 질문을 구성하는 문장의 품사 시퀀스는 질문을 구성하는 문장의 품사 출현 순서를 의미할 수 있다.In addition, the POS sequence of the sentence constituting the question can be characterized, and the part-of-speech sequence of the sentence constituting the question can mean the part-appearing order of the sentence constituting the question.

이어서, 도 5를 참조하여, 생성된 기계 학습 모델에 질문을 입력한 결과에 기초하여, 질문을 정보성 질문 또는 비정보성 질문으로 분류할 수 있다(S21-2).Next, referring to FIG. 5, the question can be classified into an informational question or an irregularity question based on the result of inputting the question to the generated machine learning model (S21-2).

또한, 정보성 답변과 비정보성 답변을 분류하는 단계(S22)를 구체적으로 설명한다. 우선, 도 7을 참조하여, 특징 벡터를 이용하여, 해당 질문이 정보성 질문인지 비정보성 질문인지 분류하도록 기계 학습된 기계 학습 모델을 생성할 수 있다(S22-1). 특징 벡터는 복수의 특징이 모여 형성된 것이며, 각각의 특징이 하나의 차원을 형성할 수 있으므로, 특징 벡터는 예컨대 n차원일 수 있다.In addition, step S22 for classifying informative answers and non-urgent answers is described in detail. First, referring to FIG. 7, a machine learning model can be generated (S22-1) by using a feature vector to classify whether the question is an informational question or an unstructured question. The feature vector is formed by collecting a plurality of features, and each feature can form one dimension, so that the feature vector can be, for example, n-dimensional.

도 8을 참조하면, 질문과 답변 사이의 관계로부터 도출되는 속성과, 답변 자체의 속성이 정보성 답변과 비정보성 답변을 분류하는 특징이 될 수 있다.Referring to FIG. 8, the attribute derived from the relationship between the question and the answer, and the attribute of the answer itself may be a feature that classifies informative answers and non-normative answers.

질문과 답변 사이의 관계로부터 도출되는 속성으로, 질문과 해당 답변 사이의 거리가 특징이 될 수 있다. 예컨대, 해당 답변이 질문에 대한 직접적인 답변인 경우가, 해당 답변이 다른 답변에 대한 답변인 경우에 비해, 상대적으로 질문과 해당 답변 사이의 거리가 짧다고 정의될 수 있다.An attribute derived from the relationship between a question and an answer, which can be characterized by the distance between the question and the answer. For example, if the answer is a direct answer to a question, then the relative distance between the question and the answer may be defined to be short, compared to when the answer is a response to another answer.

또한, 질문과 답변 사이의 관계로부터 도출되는 속성으로, 질문의 질문자가 해당 답변에 대해 감사를 표현하는 답변이 대화형 메시지에 포함되어 있는지 여부, 질문의 질문자가 해당 답변을 긍정적으로 평가하는 답변이 대화형 메시지에 포함되어 있는지 여부, 질문의 질문자가 해당 답변을 언급한 답변이 대화형 메시지에 포함되어 있는지 여부, 해당 답변에서 질문의 질문자에 대해 재질문을 하는지 여부 및 해당 답변의 작성자가 질문의 질문자인지 여부가 특징이 될 수 있다.In addition, the attribute derived from the relationship between the question and answer. The question is whether the questioner's answer is expressed in an interactive message expressing appreciation for the answer, the questioner's answer is positively evaluated by the questioner Whether it is included in an interactive message, whether the interrogator of the question includes the answer mentioned in the response in the interactive message, whether the question in question is re-questioning the interrogator of the question, Whether or not it is a questioner can be characterized.

그리고, 질문과 답변 사이의 관계로부터 도출되는 속성으로, 질문과 해당 답변 사이의 주제 유사도, 질문과 해당 답변 사이의 단어 유사도, 질문이 답변을 필요로 하는 정보성 질문인지 여부 및 대화형 메시지에 포함된 정보의 총량이 특징이 될 수 있다.The attributes derived from the relationship between the question and answer, including the subject similarity between the question and the corresponding answer, the word similarity between the question and the corresponding answer, whether the question is an informational question requiring an answer, Can be characterized by the total amount of information.

답변 자체의 속성으로, 해당 답변에 은어가 포함된 비율, 해당 답변에 속어가 포함된 비율, 해당 답변에 대명사가 포함된 비율, 해당 답변에 감사 표시 문구가 포함되어 있는지 여부, 해당 답변에 질문의 내용이 포함되어 있는지 여부 및 해당 답변이 문법적으로 자연스러운지 여부가 특징이 될 수 있다.The properties of the answer itself, including the percentage of the answer containing the term, the percentage of the answer containing the slang word, the percentage of the answer containing the pronoun, whether the answer contains a thank you text, It can be characterized by whether the content is included and whether the answer is grammatically natural.

이어서, 도 7를 참조하여, 생성된 기계 학습 모델에 답변을 입력한 결과에 기초하여, 답변을 정보성 답변 또는 비정보성 답변으로 분류할 수 있다(S22-2).Subsequently, referring to FIG. 7, the answer can be classified as an informative answer or a non-urgent answer based on the result of inputting the answer to the generated machine learning model (S22-2).

이하, 도 9를 참조하여, 본 발명의 일 실시예에 따른 검색 시스템(100)을 설명한다. 도 9를 참조하면, 본 발명의 일 실시예에 따른 검색 시스템(100)의 개략도가 개시된다.Hereinafter, a search system 100 according to an embodiment of the present invention will be described with reference to FIG. Referring to FIG. 9, a schematic diagram of a search system 100 in accordance with an embodiment of the present invention is disclosed.

검색 시스템(100)은 문답 데이터베이스(25), 사용자 단말(7)로부터 사용자 질문을 입력받는 사용자 질문 입력부(31) 및 사용자 질문에 기초하여 문답 데이터베이스(25)로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말(7)로 제공하는 검색 엔진부(33)를 포함할 수 있다. 즉, 검색 시스템(100)은, 문답 데이터베이스 구축 시스템(1)에 사용자 질문 입력부(31), 사용자 질문 분석부(32) 및 검색 엔진부(33)를 포함하는 검색 모듈(30)이 부가된 것일 수 있다.The search system 100 includes a question database 25, a user query input unit 31 for receiving a user query from the user terminal 7 and a related query from the question database 25 based on the user query, And a search engine unit 33 for providing an informative answer to the user terminal 7. [ That is, the retrieval system 100 is provided with a query module 30 including a user query input unit 31, a user query analysis unit 32 and a search engine unit 33 in the questionnaire database construction system 1 .

문답 데이터베이스(25)는 정보성 질문으로 분류된 질문과, 해당 질문이 포함된 대화형 메시지에 포함되는 답변 중 정보성 답변으로 분류된 답변이 대응되어 하나의 문답 데이터로서 저장될 수 있다. 즉, 질문과 해당 질문에 대응되는 답변이 대응되어 문답 데이터베이스(25)에 저장될 수 있다.The questionnaire database 25 may be stored as one question data in correspondence with answers classified as informative answers out of the answers classified into the informative question and the answers included in the interactive message including the question. That is, the question and the answer corresponding to the question may correspond to each other and may be stored in the questionnaire database 25.

사용자 질문 입력부(31)는 사용자 단말(7)로부터 사용자 질문을 입력받을 수 있다. 즉, 사용자 단말(7)로부터 사용자 질문이 사용자 질문 입력부(31)로 전송될 수 있으며, 사용자 질문은 문자 또는 음성의 형태일 수 있다. 사용자 단말(7)은 검색 시스템(100)에 접속할 수 있는 장치이면 제한이 없다. 사용자 질문 입력부(31)는 입력받은 사용자 질문을 사용자 질문 분석부(32)에 전송할 수 있다.The user query input unit 31 can receive a user query from the user terminal 7. That is, a user query may be sent from the user terminal 7 to the user query input 31, and the user query may be in the form of a character or a voice. The user terminal 7 is not limited as long as it can access the search system 100. The user question input unit 31 may transmit the inputted user question to the user question analyzing unit 32.

사용자 질문 분석부(32)는 입력받은 사용자 질문을 분석할 수 있다. 예컨대, 사용자 질문을 분석하여 질문 의도 또는 질문 키워드를 도출할 수 있으며, 이를 위해 사용자 질문을 구성하는 문장의 문법적 구조, 단어의 특성 등을 분석하는 방법이 이용될 수 있지만, 이에 제한되지 않는다. 사용자 질문 분석부(32)는 사용자 질문의 분석 결과를 검색 엔진부(33)에 전송할 수 있다.The user question analyzing unit 32 can analyze the inputted user questions. For example, the user's question may be analyzed to derive a question intention or a question keyword. For this purpose, a method of analyzing a grammar structure of a sentence constituting a user question, a characteristic of a word, and the like may be used. The user question analyzing unit 32 may transmit the analysis result of the user query to the search engine unit 33. [

검색 엔진부(33)는 사용자 질문에 기초하여 문답 데이터베이스(25)로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말(7)로 제공할 수 있다. 예컨대, 사용자 질문에 대한 분석 결과에 기초하여 문답 데이터베이스(25)로부터 관련 질문을 검색할 수 있으며, 사용자 단말(7)로 제공되는 정보성 답변은 문자 또는 음성으로 제공될 수 있다.The search engine unit 33 can retrieve related questions from the questionnaire database 25 based on the user questions and provide informative answers to the retrieved related questions to the user terminal 7. [ For example, a related question may be retrieved from the questionnaire database 25 based on the analysis result of the user question, and the informative answer provided to the user terminal 7 may be provided by text or voice.

즉, 문답 데이터베이스(25)에는 질문과 해당 질문에 대응되는 답변이 대응되어 저장되어 있기 때문에, 사용자 질문과 의도 또는 키워드가 관련된 관련 질문이 문답 데이터베이스(25)로부터 검색될 수 있다. 그리고, 검색된 질문에 대응되는 답변을 사용자 단말(7)로 제공할 수 있다.That is, since the question and the answer corresponding to the question are stored in correspondence with each other in the question database 25, a related question related to the user question and the intention or keyword can be retrieved from the question database 25. Then, the user terminal 7 can provide an answer corresponding to the searched question.

본 발명의 검색 시스템(100)에 따르면, 질문과 답변을 포함하는 대화형 메시지로 구축된 문답 데이터베이스(25)를 이용하여 검색하기 때문에, SNS 등을 통한 양질의 데이터를 활용할 수 있다.According to the search system 100 of the present invention, since the search is performed using the questionnaire database 25 constructed of an interactive message including questions and answers, it is possible to utilize high-quality data through SNS or the like.

또한, 본 발명의 검색 시스템(100)에 따르면, 주로 단문으로 구성되는 대화형 메시지로 구축된 문답 데이터베이스(25)를 이용하여 검색하기 때문에, 사용자 단말(7)에 제공되는 답변 또한 단문 메시지로 제공할 수 있다. 따라서, 사용자는 단문의 답변을 제공받음으로써, 모바일 환경의 사용자 단말(7)에서 확인이 용이할 수 있다. 더욱이, 단문의 답변으로 인해, 음성 답변 제공이 가능할 수 있으며, 제공되는 답변이 대화로부터 추출된 것이기 때문에, 음성 답변을 제공받는 사용자가 느끼는 검색 시스템(100)에 거부감이 완화될 수 있다.According to the search system 100 of the present invention, since the search is performed using the question database 25 constructed of an interactive message mainly composed of short texts, the answers provided to the user terminal 7 are also provided as short messages can do. Accordingly, the user can easily check the user terminal 7 in the mobile environment by receiving the short text answer. Moreover, because of the answers to the short sentences, it is possible to provide a spoken answer, and since the answers provided are extracted from the conversation, the sense of rejection can be relaxed in the search system 100 felt by the user receiving the spoken answers.

이하, 도 10을 참조하여, 본 발명의 일 실시예에 따른 검색 방법을 설명한다. 도 10을 참조하면, 본 발명의 일 실시예에 따른 검색 방법의 순서도가 개시된다.Hereinafter, a search method according to an embodiment of the present invention will be described with reference to FIG. Referring to FIG. 10, a flowchart of a search method according to an embodiment of the present invention is disclosed.

우선, 사용자 단말(7)로부터 사용자 질문을 입력받을 수 있고(S31). 이후에, 입력받은 사용자 질문을 분석할 수 있다(S32).First, a user query can be input from the user terminal 7 (S31). Thereafter, the inputted user question can be analyzed (S32).

그리고, 사용자 질문에 기초하여 문답 데이터베이스(25)로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말(7)로 제공할 수 있다(S33). 예컨대, 사용자 질문에 대한 분석 결과에 기초하여 문답 데이터베이스(25)로부터 관련 질문을 검색할 수 있다.Then, the related question is searched from the question database 25 based on the user question, and the informative answer to the searched related question is provided to the user terminal 7 (S33). For example, a related question may be retrieved from the questionnaire database 25 based on the analysis results of the user questions.

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, You will understand. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive.

1: 문답 데이터베이스 구축 시스템 5: 웹
7: 사용자 단말 10: 대화형 메시지 수집 모듈
11: 질문 패턴 정의부 12: 대화형 메시지 수집부
15: 대화형 메시지 데이터베이스 20: 정보성 문답 추출 모듈
21: 정보성 질문 분류부 22: 정보성 답변 분류부
23: 정보성 문답 필터링부 25: 문답 데이터베이스
30: 검색 모듈 31: 사용자 질문 입력부
32: 사용자 질문 분석부 33: 검색 엔진부
100: 검색 시스템
1: Questionnaire database building system 5: Web
7: User terminal 10: Interactive message collection module
11: question pattern definition part 12: interactive message collection part
15: interactive message database 20: informal dialogue extraction module
21: Informative Question Classification Part 22: Informative Answer Classification
23: Intelligent Question-Answering Unit 25: Questionnaire Database
30: Search module 31: User inquiry input
32: user query analysis unit 33: search engine unit
100: Search system

Claims (10)

삭제delete 질문과 답변을 포함하는 대화형 메시지를 수집하는 단계; 및
수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 단계를 포함하고,
상기 수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 단계는,
수집된 대화형 메시지에 포함된 질문에 대하여, 답변을 필요로 하는 정보성 질문과 답변을 필요로 하지않는 비정보성 질문을 분류하는 단계와,
수집된 대화형 메시지에 포함된 답변에 대하여, 질문에서 필요로 하는 정보를 제공하는 정보성 답변과 질문에서 필요로 하는 정보를 제공하지않는 비정보성 답변을 분류하는 단계와,
수집된 대화형 메시지로부터, 정보성 질문과, 해당 정보성 질문을 포함하는 대화형 메시지의 정보성 답변을 필터링하여 문답 데이터베이스에 포함시키는 단계
를 포함하는 것인, 문답 데이터베이스 구축 방법.
Collecting an interactive message including a question and an answer; And
Extracting from the collected interactive messages an informational question requiring an answer and information required from the informational question, and including the informational answer in a questionnaire database,
Extracting from the collected interactive messages an informative question requiring an answer and an informative answer providing information necessary for the informative question,
Classifying non-regular questions that do not require an informational question and an answer that require an answer to a question included in the collected interactive message;
Categorizing the responses contained in the collected interactive messages into informative responses that provide information needed by the questions and non-responsive answers that do not provide the information required by the questions;
Filtering the informative questions and the informative answers of the interactive messages including the informative questions from the collected interactive messages and incorporating them into the questionnaire database
The method comprising the steps of:
질문과 답변을 포함하는 대화형 메시지를 수집하는 단계; 및
수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 단계를 포함하고,
상기 질문과 답변을 포함하는 대화형 메시지를 수집하는 단계는,
질문임을 확인하는 기준이 되는 문자 패턴을 정의하는 단계와,
정의된 문자 패턴을 이용하여 질문과 답변을 포함하는 대화형 메시지를 수집하는 단계
를 포함하는 것인, 문답 데이터베이스 구축 방법.
Collecting an interactive message including a question and an answer; And
Extracting from the collected interactive messages an informational question requiring an answer and information required from the informational question, and including the informational answer in a questionnaire database,
The collecting of the interactive message, including the question and answer,
Defining a character pattern as a criterion for confirming a question;
Collecting an interactive message including a question and an answer using a defined character pattern
The method comprising the steps of:
삭제delete 질문과 답변을 포함하는 대화형 메시지를 수집하는 대화형 메시지 수집 모듈; 및
수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 정보성 문답 추출 모듈을 포함하고,
상기 정보성 문답 추출 모듈은,
수집된 대화형 메시지에 포함된 질문에 대하여, 답변을 필요로 하는 정보성 질문과 답변을 필요로 하지않는 비정보성 질문을 분류하는 정보성 질문 분류부와,
수집된 대화형 메시지에 포함된 답변에 대하여, 질문에서 필요로 하는 정보를 제공하는 정보성 답변과 질문에서 필요로 하는 정보를 제공하지않는 비정보성 답변을 분류하는 정보성 답변 분류부와,
수집된 대화형 메시지로부터, 정보성 질문과, 해당 정보성 질문을 포함하는 대화형 메시지의 정보성 답변을 필터링하여 문답 데이터베이스에 포함시키는 정보성 문답 필터링부
를 포함하는 것인, 문답 데이터베이스 구축 시스템.
An interactive message collection module for collecting interactive messages including questions and answers; And
And an informative dialogue extraction module for extracting informational answering questions from the collected interactive messages, which informational questions require answers and information necessary for the informational questions, and include them in the questionnaire database,
Wherein the informal dialogue extraction module comprises:
An intelligent question classifier for classifying non-definitive questions that do not require an informational question and an answer that require an answer to a question included in the collected interactive message;
An informative answer classifying unit for classifying the answers included in the collected interactive messages into an informative answer providing information necessary for the question and an informal answer not providing the information required in the question;
Filtering an informative question from the collected interactive message and an informative answer of the interactive message including the informative question to include it in the questionnaire database,
The system comprising: a database;
질문과 답변을 포함하는 대화형 메시지를 수집하는 대화형 메시지 수집 모듈; 및
수집된 대화형 메시지로부터, 답변을 필요로 하는 정보성 질문과 해당 정보성 질문에서 필요로 하는 정보를 제공하는 정보성 답변을 추출하여 문답 데이터베이스에 포함시키는 정보성 문답 추출 모듈을 포함하고,
상기 대화형 메시지 수집 모듈은,
질문임을 확인하는 기준이 되는 문자 패턴을 정의하는 질문 패턴 정의부와,
정의된 문자 패턴을 이용하여 질문과 답변을 포함하는 대화형 메시지를 수집하는 대화형 메시지 수집부
를 포함하는 것인, 문답 데이터베이스 구축 시스템.
An interactive message collection module for collecting interactive messages including questions and answers; And
And an informative dialogue extraction module for extracting informational answering questions from the collected interactive messages, which informational questions require answers and information necessary for the informational questions, and include them in the questionnaire database,
Wherein the interactive message collection module comprises:
A question pattern definition unit that defines a character pattern that serves as a criterion for confirming the question;
An interactive message collecting unit for collecting an interactive message including a question and an answer using the defined character pattern;
The system comprising: a database;
제2항 또는 제3항의 방법에 의해 구축된 문답 데이터베이스를 이용하여 검색하는 방법으로서,
사용자 단말로부터 사용자 질문을 입력받는 단계; 및
상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말로 제공하는 단계
를 포함하는 검색 방법.
A method for searching using a questionnaire database constructed by the method of claim 2 or 3,
Receiving a user query from a user terminal; And
Retrieving a related question from the questionnaire database based on the user query, and providing an informative answer to the retrieved related query to the user terminal
/ RTI >
제7항에 있어서,
입력받은 사용자 질문을 분석하는 단계를 더 포함하고,
상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하는 것은, 상기 사용자 질문에 대한 분석 결과에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하는 것인, 검색 방법.
8. The method of claim 7,
Further comprising analyzing an input user query,
Wherein retrieving the related question from the questionnaire database based on the user question is to retrieve the related question from the questionnaire database based on the analysis result for the user question.
제2항 또는 제3항의 방법에 의해 구축된 문답 데이터베이스;
사용자 단말로부터 사용자 질문을 입력받는 사용자 질문 입력부; 및
상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하고, 검색된 관련 질문에 대한 정보성 답변을 사용자 단말로 제공하는 검색 엔진부
를 포함하는 검색 시스템.
A questionnaire database constructed by the method of claim 2 or 3;
A user inquiry input unit for receiving a user query from a user terminal; And
A search engine unit for searching for a related question from the questionnaire database based on the user question and providing an informative answer to the searched related question to the user terminal,
≪ / RTI >
제9항에 있어서,
입력받은 사용자 질문을 분석하는 사용자 질문 분석부를 더 포함하고,
상기 사용자 질문에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하는 것은, 상기 사용자 질문에 대한 분석 결과에 기초하여 상기 문답 데이터베이스로부터 관련 질문을 검색하는 것인, 검색 시스템.
10. The method of claim 9,
Further comprising a user query analyzing section for analyzing the inputted user query,
Wherein retrieving the related question from the questionnaire database based on the user question is to retrieve the related question from the questionnaire database based on the analysis result for the user question.
KR1020140066920A 2014-02-14 2014-06-02 SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME KR101605430B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20140017161 2014-02-14
KR1020140017161 2014-02-14

Publications (2)

Publication Number Publication Date
KR20150096295A KR20150096295A (en) 2015-08-24
KR101605430B1 true KR101605430B1 (en) 2016-03-22

Family

ID=54058836

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020140066916A KR20150096294A (en) 2014-02-14 2014-06-02 Method for classifying question and answer, and computer-readable recording medium storing program for performing the method
KR1020140066920A KR101605430B1 (en) 2014-02-14 2014-06-02 SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020140066916A KR20150096294A (en) 2014-02-14 2014-06-02 Method for classifying question and answer, and computer-readable recording medium storing program for performing the method

Country Status (1)

Country Link
KR (2) KR20150096294A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190080599A (en) 2017-12-28 2019-07-08 주식회사 카카오 Method and server for providing semi-automatic communication using chatbot and consultant
KR20190081374A (en) 2017-12-29 2019-07-09 주식회사 카카오 Server and method for storing context information between chatbot and user device
KR20190104119A (en) 2019-08-28 2019-09-06 주식회사 카카오 Method and server for providing semi-automatic communication using chatbot and consultant
KR20200114173A (en) 2019-03-27 2020-10-07 주식회사 카카오 Method, server and computer program for managing natural language processing engines
EP3828778A1 (en) 2019-11-29 2021-06-02 42 Maru Inc. Method and apparatus for generating q & a model by using adversarial learning
EP3828781A1 (en) 2019-11-28 2021-06-02 42 Maru Inc. Method and apparatus for generating question and answer dataset based on input paragraph
KR20210083731A (en) 2019-12-27 2021-07-07 주식회사 포티투마루 Method and apparatus of generating question-answer learning model through reinforcement learning
US11646981B2 (en) 2017-12-11 2023-05-09 Kakao Corp. Providing instant messaging service

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102050244B1 (en) * 2017-10-16 2019-11-29 한국과학기술원 Interactive chatbot operation method and system based on natural language processing for activation of messenger group chat room
KR102005525B1 (en) * 2017-12-29 2019-07-30 (주)헤르스 Correct answer query management system for chemical safety management using deep learning technology
JP7099521B2 (en) * 2018-05-25 2022-07-12 日本電気株式会社 Scoring device, scoring method, recording medium
KR102018819B1 (en) 2019-01-14 2019-09-04 주식회사 크라우드웍스 Method for automatically generating question-answer datasets related to specific topics and apparatus thereof
CN110175241B (en) * 2019-05-23 2021-08-03 腾讯科技(深圳)有限公司 Question and answer library construction method and device, electronic equipment and computer readable medium
CN111259951A (en) * 2020-01-13 2020-06-09 北京明略软件***有限公司 Case detection method and device, electronic equipment and readable storage medium
KR102427085B1 (en) * 2021-10-06 2022-07-29 이혜정 Electronic apparatus for providing education service and method for operation thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205552A (en) 2008-02-28 2009-09-10 Internatl Business Mach Corp <Ibm> Method, system, and apparatus for supporting personal service
JP2011103018A (en) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> Question answering device, question answering method and question answering program
KR101173556B1 (en) 2008-12-11 2012-08-13 한국전자통신연구원 Topic map based indexing apparatus, topic map based searching apparatus, topic map based searching system and its method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205552A (en) 2008-02-28 2009-09-10 Internatl Business Mach Corp <Ibm> Method, system, and apparatus for supporting personal service
KR101173556B1 (en) 2008-12-11 2012-08-13 한국전자통신연구원 Topic map based indexing apparatus, topic map based searching apparatus, topic map based searching system and its method
JP2011103018A (en) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> Question answering device, question answering method and question answering program

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11646981B2 (en) 2017-12-11 2023-05-09 Kakao Corp. Providing instant messaging service
US11082368B2 (en) 2017-12-28 2021-08-03 Kakao Corp. Semi-automatic communication using chatbot and consultant device
KR20190080599A (en) 2017-12-28 2019-07-08 주식회사 카카오 Method and server for providing semi-automatic communication using chatbot and consultant
KR20190081374A (en) 2017-12-29 2019-07-09 주식회사 카카오 Server and method for storing context information between chatbot and user device
US10972410B2 (en) 2017-12-29 2021-04-06 Kakao Corp Managing context information between chatbot and user device
KR20200114173A (en) 2019-03-27 2020-10-07 주식회사 카카오 Method, server and computer program for managing natural language processing engines
KR20190104119A (en) 2019-08-28 2019-09-06 주식회사 카카오 Method and server for providing semi-automatic communication using chatbot and consultant
EP3828781A1 (en) 2019-11-28 2021-06-02 42 Maru Inc. Method and apparatus for generating question and answer dataset based on input paragraph
KR20210066704A (en) 2019-11-28 2021-06-07 주식회사 포티투마루 Method and apparatus for generating question and answer dataset based on input paragraph
KR20220143804A (en) 2019-11-28 2022-10-25 주식회사 포티투마루 Method and apparatus for generating question and answer dataset based on input paragraph
KR20240049528A (en) 2019-11-28 2024-04-16 주식회사 포티투마루 Method and apparatus for generating question and answer dataset based on input paragraph
KR20210067865A (en) 2019-11-29 2021-06-08 주식회사 포티투마루 Method and apparatus for generating qa model by using adversarial learning
EP3828778A1 (en) 2019-11-29 2021-06-02 42 Maru Inc. Method and apparatus for generating q & a model by using adversarial learning
KR20230141698A (en) 2019-11-29 2023-10-10 주식회사 포티투마루 Method and apparatus for generating qa model by using adversarial learning
KR20210083731A (en) 2019-12-27 2021-07-07 주식회사 포티투마루 Method and apparatus of generating question-answer learning model through reinforcement learning

Also Published As

Publication number Publication date
KR20150096294A (en) 2015-08-24
KR20150096295A (en) 2015-08-24

Similar Documents

Publication Publication Date Title
KR101605430B1 (en) SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME
CN110209897B (en) Intelligent dialogue method, device, storage medium and equipment
Szomszor et al. Semantic modelling of user interests based on cross-folksonomy analysis
Kumar et al. Sanative chatbot for health seekers
US20130311485A1 (en) Method and system relating to sentiment analysis of electronic content
CN110377900A (en) Checking method, device, computer equipment and the storage medium of Web content publication
US20220004871A1 (en) Data searching system and method
CN107992513B (en) Information processing system and method for realizing information processing
US20160188597A1 (en) System and Method for Screening Social Media Content
US11023551B2 (en) Document processing based on proxy logs
CN110880142A (en) Risk entity acquisition method and device
Awrahman et al. Sentiment analysis and opinion mining within social networks using konstanz information miner
CN114915468B (en) Intelligent analysis and detection method for network crime based on knowledge graph
KR101780237B1 (en) Method and device for answering user question based on q&amp;a data provided on online
Gunduz et al. Investigating sentimental relation between social media presence and academic success of Turkish universities
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
CN114706948A (en) News processing method and device, storage medium and electronic equipment
KR102228873B1 (en) Construction system of criminal suspect knowledge network using public security information and Method thereof
Yin et al. Research of integrated algorithm establishment of a spam detection system
Singh et al. What's kooking? characterizing India's emerging social network, Koo
Junior et al. Classifying customer complaints of a large fixed broadband service provider using machine learning
Zolaktaf et al. Modeling community question-answering archives
Bogers et al. Expertise classification: Collaborative classification vs. automatic extraction
CN104484417B (en) A kind of generation method and device of collection information
Nguyen et al. Exploiting social networks as a live mass media channel during disasters for reactions

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200227

Year of fee payment: 5