KR101544639B1 - Method for estimating user emotion from inputted string - Google Patents

Method for estimating user emotion from inputted string Download PDF

Info

Publication number
KR101544639B1
KR101544639B1 KR1020130069706A KR20130069706A KR101544639B1 KR 101544639 B1 KR101544639 B1 KR 101544639B1 KR 1020130069706 A KR1020130069706 A KR 1020130069706A KR 20130069706 A KR20130069706 A KR 20130069706A KR 101544639 B1 KR101544639 B1 KR 101544639B1
Authority
KR
South Korea
Prior art keywords
similarity
syllable
group
phoneme group
word
Prior art date
Application number
KR1020130069706A
Other languages
Korean (ko)
Other versions
KR20140146861A (en
Inventor
이승룡
방재훈
차정훈
정태충
Original Assignee
경희대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경희대학교 산학협력단 filed Critical 경희대학교 산학협력단
Priority to KR1020130069706A priority Critical patent/KR101544639B1/en
Publication of KR20140146861A publication Critical patent/KR20140146861A/en
Application granted granted Critical
Publication of KR101544639B1 publication Critical patent/KR101544639B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 입력되는 문자열에 내포되어 있는 사용자의 감정을 판단하는 방법 및 그 장치에 관한 것으로, 보다 구체적으로 입력되는 문자열의 음절을 음운 단위로 단어의 유사성을 판단함으로써 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식할 수 있으며, 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식함으로써 소셜 네트워크 서비스 또는 메신저를 통해 입력되는 통상의 사용자 대화에서 사용자 감정을 정확하게 판단할 수 있는 사용자 감정 판단 장치에 관한 것이다.The present invention relates to a method and apparatus for judging a feeling of a user contained in an input character string, and more specifically, by determining the similarity of a word using a syllable of a string to be inputted more specifically, The user can recognize a variation word such as an embedded word and recognize a variation word such as a word having a new communication term, an abbreviation, and a punctuation, thereby accurately determining the user's feeling in a normal user conversation input through a social network service or a messenger And a user emotion determination device that can perform the user emotion determination.

Figure R1020130069706
Figure R1020130069706

Description

입력되는 문자열로부터 사용자의 감정을 판단하는 방법{Method for estimating user emotion from inputted string}[0001] The present invention relates to a method for estimating a user's emotion from a string input,

본 발명은 입력되는 문자열에 내포되어 있는 사용자의 감정을 판단하는 방법 및 그 장치에 관한 것으로, 보다 구체적으로 입력되는 문자열의 음절을 음운 단위로 단어의 유사성을 판단함으로써 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식할 수 있으며, 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식함으로써 소셜 네트워크 서비스 또는 메신저를 통해 입력되는 통상의 사용자 대화에서 사용자 감정을 정확하게 판단할 수 있는 사용자 감정 판단 방법에 관한 것이다.The present invention relates to a method and apparatus for judging a feeling of a user contained in an input character string, and more specifically, by determining the similarity of a word using a syllable of a string to be inputted more specifically, The user can recognize a variation word such as an embedded word and recognize a variation word such as a word having a new communication term, an abbreviation, and a punctuation, thereby accurately determining the user's feeling in a normal user conversation input through a social network service or a messenger And a method for judging user's emotions.

일반적으로 문장은 다수의 단어들로 구성되는데, 각각의 단어는 문장에서 변용되고 상황에 따라 다른 뜻을 함축하기도 하지만, 기본적으로 내재하고 있는 단어 자체의 성향이 있다는 것을 알 수 있다. 따라서 글을 쓴 이가 어떤 성향이 내재된 단어를 집중적으로 사용할 수 있으며, 문학적, 인지언어학적, 정신분석학적으로 접근했을 때 인간 보편의 성향에 맞춘 단어의 분석을 통해 단어를 분류할 수 있는 기준을 설정할 수 있고, 그 기준에 따라 언어를 분류하여 글쓴이의 감정을 분류할 수 있게 된다.In general, a sentence consists of a number of words, each of which is transformed in a sentence and implies a different meaning depending on the situation, but it can be seen that there is a tendency of the inherent word itself. Therefore, the author can intensively use words with a certain tendency, and when he approaches literary, cognitive, linguistic, and psychoanalytic, he or she will be able to classify words And classify the author's emotions by classifying the language according to the criteria.

최근에는 스마트폰과 인터넷 사용자가 급증함에 따라 소셜 네트워크 서비스를 통한 다양한 상품이나 서비스가 활성화되거나 메신저나 단문자 서비스를 통해 사용자간 대화하는 경우가 빈번해지고 있다. 이러한 소셜 네트워크 서비스에 대해 사용자는 특정 상품이나 서비스에 대한 평가를 올려놓거나 메신저를 통해 대화를 하며 사용자의 감정을 간단한 문장으로 표현하는 경우가 많아졌다. 예를 들어, 각종 상품평, 영화 감상평, 맛집 평가 등 온라인상에서 짧은 문장으로 다양한 상품에 대한 각종 평가를 하는 경우가 많아졌다. 이러한 문장들은 다른 사람들의 감정이나 구매 성향에 큰 영향을 주기 때문에, 오피니언 마이닝이나 마케팅 측면에서 이러한 온라인상의 각종 문장에 내재된 감정의 분석 및 분류가 어느 때보다 중요해지는 있는 실정이다.
In recent years, as smartphones and Internet users have surged, various products or services through social network services have been activated, and users have frequently interacted with each other through messenger or short text service. For these social network services, users often put ratings on specific products or services, communicate via messenger, and express their emotions in simple sentences. For example, there have been many cases where various evaluations of a variety of products have been conducted in a short sentence such as various product reviews, movie review reviews, and restaurant evaluation online. Since these sentences have a great influence on the emotions and purchasing tendencies of others, the analysis and classification of the emotions inherent in various online sentences in opinion mining and marketing are becoming more important than ever.

그러나 소셜 네트워크 서비스나 메신저를 이용하여 사용자가 문장을 입력하는 형태를 살펴보면, 사용자는 표준어를 사용하여 문장을 입력하기도 하지만 새로이 생성되는 통신 용어, 약어, 오탈자를 구비하는 단어를 사용하여 문장을 입력한다. 더욱이 이러한 표준어, 통신 용어, 약어, 오탈자를 구비하는 단어를 띄어쓰기없이 입력하는 경우가 빈번하다. 이하 표준어를 포함하여 구어체, 문어체의 단어를 기준어라 언급하며, 기준어를 제외하고 사용자가 입력하는 통신 용어, 약어, 오탈자를 구비하는 단어를 변형어라 언급한다.
However, when a user inputs a sentence by using a social network service or a messenger, a user may input a sentence using a standard word, but a sentence is input using a word having a newly generated communication term, abbreviation, and punctuation . Further, words having such standard words, communication terms, abbreviations, and punctuation are often input without spaces. Hereinafter, words in spoken and written language are referred to including standard words, and words except communication terms, abbreviations, and punctuation characters inputted by the user are referred to as 'transitional words'.

종래 문장에 표현되어 있는 단어에 기초하여 사용자의 감정을 판단하는 방법은 문장에 표현되어 있는 단어를 추출하고, 추출한 단어가 어떠한 감정을 나타내는지 감정 데이터베이스에 기초하여 판단하게 된다. 종래 입력되는 문장에서 사용자의 감정을 판단하는 방법은 문장에 포함되어 있는 단어가 감정 데이터베이스에 저장되어 있는 단어와 매칭되어야만 정확하게 사용자의 감정을 판단할 수 있는데, 감정 데이터베이스에는 기준어만이 저장되어 있으며 새로이 생성되는 통신 용어, 약어 및 오탈자가 포함된 단어가 저장되어 있지 않다. 또한 빈번하게 생성되는 통신 용어, 약어를 감정 데이터베이스에 업데이트하기가 곤란하다. 따라서 이러한 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어가 입력되는 경우 사용자의 감정을 정확하게 판단하지 못한다는 문제점을 가진다.A method of determining a user's emotion based on a word expressed in a conventional sentence is performed by extracting a word expressed in a sentence and judging based on the emotion database whether or not the extracted word expresses an emotion. A method of judging a user's emotion in a conventional input sentence can accurately determine the emotion of a user only when a word included in the sentence matches a word stored in the emotion database. In the emotion database, only the reference word is stored, No words containing the generated communication terms, abbreviations, and punctuation are stored. It is also difficult to update frequently generated communication terms and abbreviations to the emotion database. Therefore, when a variant such as a communication term, an abbreviation, or a word including a punctuation is input, the user's emotion can not be accurately determined.

본 발명은 위에서 언급한 종래 문장에 표현되어 있는 사용자의 감정을 판단하는 방법이 가지는 문제점을 해결하기 위한 것으로, 본 발명이 이루고자 하는 목적은 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식하고, 이러한 변형어로부터 사용자 감정을 판단하는 방법을 제공하는 것이다.SUMMARY OF THE INVENTION The present invention has been made to solve the problems of a method of determining a user's emotions expressed in the conventional sentence mentioned above, and it is an object of the present invention to provide an apparatus, And to provide a method for determining the user's emotion from such a variant.

본 발명이 이루고자 하는 다른 목적은 변형어를 포함하는 문장이 입력되는 경우 적은 연산량으로 사용자의 감정을 표현하는 변형어를 인식할 수 있는 사용자 감정 판단 방법을 제공하는 것이다.Another object of the present invention is to provide a user emotion judgment method capable of recognizing a deformed word expressing a user's emotion with a small amount of computation when a sentence including a deformed word is input.

본 발명의 목적을 달성하기 위하여, 본 발명에 따른 사용자 감정 판단 방법은 입력되는 문자열을 음절 단위로 분류하고 문자열의 음절을 구성하는, 음절 단위의 비교 음운 그룹을 생성하는 단계와, 감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 비교 음운 그룹 사이의 유사도를 계산하는 단계와, 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 문자열에 매핑되는 매핑 기준어로 선택하는 단계와, 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 문자열에 대한 사용자 감정을 판단하는 단계를 포함하는 것을 특징으로 한다. According to another aspect of the present invention, there is provided a user emotion determination method comprising: generating a comparison phoneme group of syllable units that classifies input strings into syllable units and syllable strings; Calculating a similarity between a reference phoneme group of a syllable unit and a comparison phoneme group constituting a syllable of a reference word constituting a syllable of a reference phoneme group having a similarity degree equal to or greater than a predetermined threshold similarity based on the similarity, Selecting a mapping reference word mapped to the mapping reference word; and determining a user's feeling on the character string based on the evaluation database identifier including the mapping reference word.

기준 음운 그룹과 상기 비교 음운 그룹의 유사도는 비교하는 단계는 기준어의 기준 음운 그룹 중 기준어의 첫 번째 음절의 기준 음운 그룹과 문자열의 음절을 구성하는 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산하는 단계와, 문자열의 음절을 구성하는 비교 음운 그룹에서 임계 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색하는 단계와, 유사 음운 그룹을 검색하는 경우 유사 음운 그룹부터 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 단계를 포함하는 것을 특징으로 한다.The step of comparing the similarity of the reference phonemic group with the comparison phoneme group sequentially calculates the individual similarities of the reference phoneme group of the first syllable of the reference word and each of the comparative phonemic groups constituting the syllable of the string Searching for a similar phonemic group having a degree of individual similarity equal to or greater than the threshold similarity in the comparison phonemic group constituting the syllable of the character string; And calculating the similarity between the comparison phonemic groups.

바람직하게, 유사 음운 그룹부터 기준어의 음절 수만큼 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 한다. Preferably, the degree of similarity between the reference phonemic group of the reference word and the comparison phonemic group of the string is calculated by the number of syllables of the similar phonemic group to the reference word.

바람직하게, 유사 음운 그룹을 검색하는 단계는 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹에 대해 상기 개별 유사도를 계산하며, 첫 번째 음절의 기준 음운 그룹의 초성과 상이한 초성을 가지는 비교 음운 그룹은 개별 유사도를 계산하지 않는 것을 특징으로 한다.Preferably, the step of searching for a similar phoneme group comprises computing the individual similarity for a comparative phoneme group having the same initiality as that of the reference phoneme group of the first syllable, The comparative phonemic groups having the similarity do not calculate individual similarities.

바람직하게, 본 발명에 따른 사용자 감정 판단 방법은 입력되는 문자열에서 띄어쓰기를 기준으로 문자열을 낱말 단위로 분류하는 단계를 더 포함하며, 낱말 단위로 기준어의 음절 단위의 기준 음운 그룹과 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 한다.Preferably, the user emotion determination method according to the present invention further includes the step of classifying a character string into word units on the basis of the spacing in the input character string, wherein the unit of the reference phoneme group and the comparison phoneme group Is calculated.

여기서 감정 데이터베이스는 긍정 감정 데이터베이스와 부정 감정 데이터베이스로 구분되며, 매핑 기준어가 저장되어 있는 감정 데이터베이스에 기초하여 문자열에 대한 사용자 감정을 판단하는 것을 특징으로 한다.Here, the emotion database is divided into a positive emotion database and a negative emotion database, and the user emotion for the character string is determined based on the emotion database storing the mapping reference word.

한편, 본 발명에 따른 사용자 감정 판단 장치는 입력되는 문자열에서 문자열을 음절 단위로 분류하는 음절 분류부와, 문자열의 음절을 구성하는 음운으로 음절 단위의 비교 음운 그룹을 생성하는 음운 그룹 생성부와, 감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 비교 음운 그룹 사이의 유사도를 계산하는 유사도 계산부와, 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 문자열에 매핑되는 매핑 기준어로 선택하는 매핑 기준어 선택부와, 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 문자열에 대한 사용자 감정을 판단하는 감정 판단부를 포함하는 것을 특징으로 한다. According to another aspect of the present invention, there is provided a user emotion determination apparatus comprising: a syllable classifying unit for classifying a string in an input string into syllable units; a phonemic group generating unit for generating a comparison phoneme group of syllable units using phonemes constituting syllable strings; A similarity calculation unit for calculating a similarity between a reference phoneme group and a comparison phoneme group in a syllable unit and constituting a syllable of a reference word stored in the emotion database; A mapping reference word selection unit for selecting a reference word of a group as a mapping reference word mapped to a character string and an emotion determination unit for determining a user emotion for a character string based on an emotion database identifier including a mapping reference word .

유사도 계산부는 기준어의 기준 음운 그룹 중 기준어의 첫 번째 음절의 기준 음운 그룹과 문자열의 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산하는 개별 유사도 계산부와, 문자열의 음절을 구성하는 비교 음운 그룹에서 임계 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색하는 유사 음운 그룹 검색부와, 유사 음운 그룹을 검색하는 경우 유사 음운 그룹부터 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 전체 유사도 계산부를 포함하는 것을 특징으로 한다. The similarity calculation unit sequentially calculates the individual similarities of the reference phoneme group of the first syllable of the reference word and each of the comparison phonemic groups of the character string of the reference phoneme group of the reference word, A similar phoneme group search unit for searching a similar phoneme group having a degree of individual similarity equal to or greater than the threshold similarity degree and a similar phoneme group searching unit for searching a similar phoneme group from a similar phoneme group to a reference phoneme group and a character string comparison phoneme group And a total similarity calculation unit.

바람직하게, 전체 유사도 계산부는 유사 음운 그룹부터 기준어의 음절 수만큼 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 한다.Preferably, the total similarity calculator calculates the similarity between the reference phoneme group of the reference word and the comparison phoneme group of the string by the number of syllables of the similar phoneme group to the reference word.

바람직하게, 유사도 계산부는 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹을 검색하는 초성 검색부를 더 포함하며, 개별 유사도 계산부는 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹에 대해 개별 유사도를 계산하며, 첫 번째 음절의 기준 음운 그룹의 초성과 상이한 초성을 가지는 비교 음운 그룹은 개별 유사도를 계산하지 않는 것을 특징으로 한다.Preferably, the similarity calculation unit further includes a preliminary search unit for searching for a comparative phoneme group having the same prefix as the prefix of the reference phoneme group of the first syllable, and the individual similarity calculation unit calculates the similarity of the reference phoneme group of the first syllable The individual similarity degrees of the comparison phonemic groups are calculated, and the comparison phoneme group having a different initial value from the initial value of the reference phoneme group of the first syllable does not calculate the individual similarity.

바람직하게, 본 발명에 따른 사용자 감정 판단 장치는 입력되는 문자열에서 띄어쓰기를 기준으로 문자열을 낱말 단위로 분류하는 낱말 분류부를 더 포함하며, 유사도 판단부는 낱말 단위로 기준어의 음절 단위의 기준 음운 그룹과 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 한다.Preferably, the user emotion determination apparatus further includes a word classifying unit for classifying the string into words on the basis of the spacing in the input character string, and the similarity degree determining unit may include a reference phoneme group of the syllable unit of the reference word, And calculating similarities between the comparison phonemic groups.

본 발명에 따른 사용자 감정 평가 방법 및 그 장치는 다음과 같은 효과들을 가진다.The user emotion evaluation method and apparatus according to the present invention have the following effects.

첫째, 본 발명에 따른 사용자 감정 평가 방법은 입력되는 문자열의 음절을 음운 단위로 단어의 유사성을 판단함으로써, 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식할 수 있다.First, the user's emotion evaluation method according to the present invention can recognize a variation word such as a new communication term, an abbreviation, and a word including a punctuation, by judging the similarity of a word with a syllable of a string to be inputted.

둘째, 본 발명에 따른 사용자 감정 평가 방법은 새로운 통신 용어, 약어, 오탈자가 포함된 단어 등의 변형어를 인식함으로써, 소셜 네트워크 서비스 또는 메신저를 통해 입력되는 통상의 사용자 대화에서 사용자 감정을 정확하게 판단할 수 있다.Second, the user's emotional evaluation method according to the present invention recognizes a variation word such as a new communication term, an abbreviation, and a word including a punctuation, thereby accurately determining the user's feeling in a normal user conversation input through a social network service or a messenger .

셋째, 본 발명에 따른 사용자 감정 평가 방법은 입력되는 문장의 문자열에서 기준어의 첫 음절의 기준 음운 그룹과 임계 유사도 이상의 유사도를 가지는 문자열부터 기준어와의 유사도를 판단함으로써, 적은 연산량으로 문자열에 포함되어 있는 사용자 감정을 인식할 수 있다.Third, the user's emotion evaluation method according to the present invention determines the degree of similarity between a character string having similarity to the reference phoneme group of the first syllable of the reference word and the reference word, The user's emotions can be recognized.

넷째, 본 발명에 따른 사용자 감정 평가 방법은 기준어의 첫 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹에 대해서만 개별 유사도를 계산함으로써, 적은 연산량으로 문자열에 포함되어 있는 사용자 감정을 인식할 수 있다.Fourth, the user's emotional evaluation method according to the present invention calculates the individual similarity degree only for the comparison phoneme group having the same initiality as the initiality of the reference phoneme group of the first syllable of the reference word, thereby recognizing the user's feeling can do.

도 1은 본 발명의 일 실시예에 따른, 입력되는 문자열을 통해 사용자의 감정을 판단하는 장치를 설명하기 위한 기능 블록도이다.
도 2는 본 발명의 다른 실시예에 따른, 입력되는 문자열을 통해 사용자의 감정을 판단하는 장치를 설명하기 위한 기능 블록도이다.
도 3은 본 발명에 따른 유사도 판단부를 설명하기 위한 기능 블록도이다.
도 4는 본 발명의 일 실시예에 따른, 입력되는 문자열에서 사용자의 감정을 판단하는 방법을 설명하기 위한 흐름도이다.
도 5는 감정 데이터베이스 중 부정을 나타내는 기준어와 기준 음운 그룹을 저장하는 감정 데이터베이스의 일 예를 도시하고 있다.
도 6은 입력되는 문자열과 각 문자열로부터 생성되는 비교 음운 그룹의 일 예를 도시하고 있다.
도 7은 본 발명의 다른 실시예에 따른, 입력되는 문자열에서 사용자의 감정을 판단하는 방법을 설명하기 위한 흐름도이다.
도 8은 본 발명에 따라 입력되는 문자열과 기준어의 유사도를 계산하는 방법을 설명하기 위한 흐름도이다.
FIG. 1 is a functional block diagram illustrating an apparatus for determining a user's emotion through an input character string according to an exemplary embodiment of the present invention. Referring to FIG.
2 is a functional block diagram illustrating an apparatus for determining a user's emotion through an input character string according to another exemplary embodiment of the present invention.
3 is a functional block diagram illustrating a similarity determination unit according to the present invention.
4 is a flowchart illustrating a method of determining a user's emotion in an input character string according to an exemplary embodiment of the present invention.
FIG. 5 shows an example of an emotion database for storing a reference word and a reference phoneme group, which indicate negation in the emotion database.
FIG. 6 shows an example of a string to be input and a comparison phoneme group generated from each string.
7 is a flowchart illustrating a method of determining a user's emotion in an input character string according to another exemplary embodiment of the present invention.
8 is a flowchart illustrating a method of calculating a similarity between a character string and a reference word according to the present invention.

이하 첨부한 도면을 참고로 본 발명에 따른 사용자 감정 판단 방법에 대해 보다 구체적으로 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings.

본 발명에 따른 사용자 감정 판단 장치는 핸드폰, 스마트폰 등과 같은 모바일 디바이스 또는 개인용 컴퓨터를 통해 메신저 또는 소셜 네트워크 서비스에 입력되는 문자열에서 사용자의 감정을 판단하는 장치로 사용된다. 그러나 본 발명이 적용되는 분야에 따라 메신저 또는 소셜 네트워크 서비스뿐만 아니라 입력되는 문자열을 통해 사용자의 감정을 판단하는 다양한 분야에 사용될 수 있으며 이는 본 발명의 범위에 속한다.
The user emotion determination apparatus according to the present invention is used as a device for determining a user's emotion in a character string input to a messenger or a social network service through a mobile device such as a mobile phone or a smart phone or a personal computer. However, according to the field to which the present invention is applied, it can be used in various fields for judging the emotion of a user through input strings as well as a messenger or a social network service.

도 1은 본 발명의 일 실시예에 따른, 입력되는 문자열을 통해 사용자의 감정을 판단하는 장치를 설명하기 위한 기능 블록도이다.FIG. 1 is a functional block diagram illustrating an apparatus for determining a user's emotion through an input character string according to an exemplary embodiment of the present invention. Referring to FIG.

도 1을 참고로 보다 구체적으로 살펴보면, 음절 분류부(110)는 입력되는 문자열을 음절단위로 분류하며, 음운 그룹 생성부(120)는 분류한 각 음절을 음운 그룹으로 생성한다. 음운 그룹 생성부(120)는 각 음절을 구성하는 음운에 대해 음절 단위로 음운 그룹을 생성한다. 이하 분류한 각 음절에 대해 음운 그룹 생성부(120)에서 생성하는 음절 단위의 음운 그룹을 비교 음운 그룹이라 언급한다.1, the syllable classifying unit 110 classifies input strings into syllable units, and the phoneme group generating unit 120 generates each syllable classified as a phonemic group. The phonemic group generation unit 120 generates a phoneme group in units of syllables for the phonemes constituting each syllable. The phonemic groups of syllable units generated by the phonemic group generation unit 120 for each syllable classified as below are referred to as a comparative phonemic group.

한편, 감정 데이터베이스(140)에는 입력되는 문자열에서 사용자의 감정을 판단하기 위하여, 사용자의 감정을 표현하는 단어들이 음절 단위로 음운 그룹으로 저장되어 있다. 감정 데이터베이스(140)에는 사용자의 감정을 표현하는 구어체 단어, 문어체 단어 등의 기준어가 저장되는데, 감정 데이터베이스(140)에 저장되어 있는 구어체 단어, 문어체 단어는 표준어를 포함하여 사용자의 통상적인 대화에서 표준으로 사용되는 단어를 의미한다. 감정 데이터베이스(140)에는 기준어의 음절단위로 각 음절을 구성하는 음운의 음운 그룹을 저장하고 있는데, 이하 감정 데이터베이스(140)에 저장되어 있는 기준어의 음운 그룹을 기준 음운 그룹이라 언급한다.On the other hand, in the emotion database 140, words expressing emotions of the user are stored in phoneme groups in units of syllables in order to determine the emotion of the user in the input string. The emotion database 140 stores reference words such as colloquial words and written word words expressing the emotion of the user. The colloquial words and the written word words stored in the emotion database 140 are stored in the user's normal conversation, Quot; means < / RTI > The phonemic group of the phonemes constituting each syllable is stored in the emotion database 140. Hereinafter, the phonemic group of the reference word stored in the emotion database 140 is referred to as a reference phoneme group.

유사도 계산부(130)는 입력되는 문자열의 비교 음운 그룹과 기준어의 기준 음운 그룹을 음절 단위로 개별 유사도를 계산하고, 음절 단위의 개별 유사도에 기초하여 입력되는 문자열과 기준어의 유사도를 계산한다. 매핑 기준어 선택부(150)는 입력되는 문자열과 기준어의 유사도에 기초하여 임계 유사도 이상의 유사도를 가지는 기준어를 입력되는 문자열의 매핑 기준어로 선택한다.The similarity calculation unit 130 calculates the individual similarity degrees of the input phonetic group and the reference phoneme group in syllable units and calculates the similarity between the inputted character string and the reference word based on the individual similarity of the syllable unit . The mapping reference word selector 150 selects a reference word having a degree of similarity equal to or greater than the threshold similarity based on the similarity degree between the input character string and the reference word as a mapping reference word of the input character string.

감정 판단부(160)는 선택한 매핑 기준어에 기초하여 입력되는 문자열에 대한 사용자의 감정을 판단한다. 감정 판단부(160)에서 사용자의 감정을 판단하는 방법의 일 예는 선택한 매핑 기준어가 감정 데이터베이스(140)의 어떠한 감정 식별자로 분류된 기준어인지에 기초하여 판단한다. 즉, 감정 데이터베이스(140)에 저장되어 있는 기준어는 사용자의 감정을 나타내는 감정 식별자로 구분되어 저장되어 있는데, 선택한 매핑 기준어가 기쁨을 나타내는 감정 식별자로 구분되어 있는 경우 사용자의 감정을 기쁨으로 판단하고, 선택한 매핑 기준어가 화남을 나타내는 감정 식별자로 구분되어 있는 경우 사용자의 감정을 화남으로 판단한다.The emotion determination unit 160 determines the emotion of the user based on the selected mapped reference word. An example of the method of determining the user's emotion by the emotion determination unit 160 is based on whether the selected mapping reference word is a reference word classified into any emotion identifier of the emotion database 140. [ In other words, the reference word stored in the emotion database 140 is divided into emotion identifiers indicating emotion of the user. When the selected emotion identifier is divided into emotion identifiers indicating joy, the emotion of the user is judged as joy, If the selected mapping criterion is classified into an emotion identifier indicating an anger, the emotion of the user is determined to be an anger.

바람직하게, 본 발명의 일 실시예에 따른 사용자 감정 판단 장치는 초성 검색부(170)를 구비하는데, 초성 검색부(170)는 입력되는 문자열의 비교 음운 그룹과 기준어의 기준 음운 그룹의 초성을 비교하여 초성이 서로 일치하는 비교 음운 그룹을 검색한다. 유사도 계산부(130)는 초성 검색부(170)의 검색 결과에 기초하여 기준 음운 그룹의 초성과 일치하는 초성을 가진 비교 음운 그룹에 대해서만 개별 유사도 또는 유사도를 계산한다. Preferably, the apparatus for judging user's emotions according to an embodiment of the present invention includes a preliminary search unit 170. The preliminary search unit 170 searches for a beginning phoneme of a comparison phoneme group of a string to be input and a reference phoneme group of a reference word And a comparison phoneme group in which the prefixes match each other is searched. The similarity calculation unit 130 calculates the individual similarity or similarity only for the comparison phoneme group having the chaos matching the chaos of the reference phoneme group based on the search result of the chaos search unit 170. [

보다 구체적으로 살펴보면, 초성 검색부(170)는 기준어를 구성하는 음절 중 첫 음절의 기준 음운 그룹의 초성과 입력되는 문자열의 비교 음운 그룹의 초성을 비교하여 서로 일치하는 초성을 가진 비교 음운 그룹을 검색한다. 첫 음절의 기준 음운 그룹의 초성과 일치하는 비교 음운 그룹에 대해서만 개별 유사도 또는 유사도를 계산함으로써, 입력되는 문자열로부터 사용자의 감정을 적은 연산량으로 빠르게 판단할 수 있다.
More specifically, the preliminary search unit 170 compares the prefixes of the reference phonemic group of the first syllable of the reference word with the prefixes of the comparison phonemic group of the input string to obtain a comparison phoneme group Search. It is possible to quickly determine the emotion of the user from the input character string by calculating the individual similarity degree or the similarity degree only for the comparison phoneme group that matches the initiality of the reference phoneme group of the first syllable.

도 2는 본 발명의 다른 실시예에 따른, 입력되는 문자열을 통해 사용자의 감정을 판단하는 장치를 설명하기 위한 기능 블록도이다. 2 is a functional block diagram illustrating an apparatus for determining a user's emotion through an input character string according to another exemplary embodiment of the present invention.

도 2에 도시되어 있는 본 발명의 다른 실시예에 따른 사용자 감정의 판단 장치의 이하 구체적인 설명에서 도 1에서 이미 설명한 본 발명의 일 실시예에 따른 사용자 감정의 판단 장치와 동일한 구성요소에 대해서는 설명의 간소화를 위해 생략하며, 구체적인 설명을 생략한 구성요소는 도 1을 참고로 한다.In the following description of the apparatus for determining user emotion according to another embodiment of the present invention shown in FIG. 2, the same elements as those of the apparatus for determining user emotion according to an embodiment of the present invention, And omitted for the sake of simplicity, and a detailed description thereof will be omitted with reference to Fig.

도 2를 참고로 보다 구체적으로 살펴보면, 낱말 분류부(210)로 문자열이 입력되는 경우, 낱말 분류부(210)는 입력되는 문자열을 낱말 단위로 분류한다. 여기서 낱말 분류부(210)는 단어별로 입력되는 문자열을 낱말로 분류하거나 띄어쓰기를 기준으로 입력되는 문자열을 낱말로 분류한다.2, when a character string is input to the word classifying unit 210, the word classifying unit 210 classifies the input character string into words. Here, the word classifier 210 classifies a character string input into words into words or a character string input with a space between the words into a word.

음절 분류부(220)는 낱말 분류부(210)에서 분류한 문자열의 낱말을 음절단위로 분류하며, 음운 그룹 생성부(230)는 분류한 낱말의 각 음절로부터 음절단위의 비교 음운 그룹을 생성한다. 유사도 계산부(240)는 낱말의 비교 음운 그룹과 감정 데이터베이스(250)에 저정되어 있는 기준어의 기준 음운 그룹을 음절 단위로 개별 유사도를 계산하고, 음절 단위의 개별 유사도에 기초하여 낱말과 기준어의 유사도를 계산한다. 매핑 기준어 선택부(260)는 낱말과 기준어의 유사도에 기초하여 임계 유사도 이상의 유사도를 가지는 기준어를 낱말의 매핑 기준어로 선택한다. The syllable classifying unit 220 classifies the words of the character string classified by the word classifying unit 210 into syllable units and the phoneme group generating unit 230 generates a syllable comparison phoneme group from each syllable of the sorted words . The similarity calculation unit 240 calculates the individual similarity degrees of the reference phoneme group of the reference word stored in the emotion database 250 and the comparison phoneme group of the words in the syllable unit. Based on the individual similarity of the syllable unit, Is calculated. The mapping criterion selector 260 selects a reference word having a degree of similarity equal to or greater than the threshold similarity based on the similarity between the word and the reference word as a mapping reference word of the word.

감정 판단부(270)는 선택한 매핑 기준어에 기초하여 입력되는 문자열에 대한 사용자의 감정을 판단한다. The emotion determination unit 270 determines the emotion of the user based on the selected mapping reference word.

바람직하게, 본 발명의 다른 실시예에 따른 사용자 감정 판단 장치는 초성 검색부(280)를 구비하는데, 초성 검색부(280)는 낱말의 비교 음운 그룹과 기준어 첫 음절의 기준 음운 그룹의 초성을 비교하여 초성이 서로 일치하는 비교 음운 그룹을 검색한다. 유사도 계산부(240)는 초성 검색부(280)의 검색 결과에 기초하여 기준 음운 그룹의 초성과 일치하는 초성을 가진 비교 음운 그룹에 대해서만 개별 유사도 또는 유사도를 계산한다.
Preferably, the apparatus for judging user's emotions according to another embodiment of the present invention includes a preliminary search unit 280. The preliminary search unit 280 searches for a beginning phoneme of a comparison phoneme group of a word and a reference phoneme group of a first syllable And a comparison phoneme group in which the prefixes match each other is searched. The similarity calculation unit 240 calculates the individual similarity or similarity only for the comparison phoneme group having the chaos corresponding to the chaos of the reference phoneme group based on the search result of the chaos search unit 280. [

도 3은 본 발명에 따른 유사도 판단부를 설명하기 위한 기능 블록도이다.3 is a functional block diagram illustrating a similarity determination unit according to the present invention.

도 3을 참고로 본 발명에 따른 유사도 판단부를 보다 구체적으로 살펴보면, 개별 유사도 계산부(131)는 기준어의 기준 음운 그룹 중 기준어의 첫 음절의 기준 음운 그룹과 문자열 또는 낱말의 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산한다. 유사 음운 그룹 검색부(133)는 문자열 또는 낱말의 음절을 구성하는 비교 음운 그룹에서 임계 개별 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색한다.Referring to FIG. 3, the individual similarity calculation unit 131 calculates a similarity degree of the first syllable of the reference word among the reference phoneme groups of the reference word, Are sequentially calculated. The similar-phoneme group searching unit 133 searches for a similar-phoneme group having individual similarities higher than the critical individual similarity in the comparative phoneme group constituting the syllable of a character string or a word.

전체 유사도 계산부(135)는 문자열 또는 낱말에서 유사 음운 그룹을 검색하는 경우, 유사 음운 그룹을 기준으로 유사 음운 그룹부터 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산한다. 바람직하게, 전체 유사도 계산부(135)는 유사 음운 그룹부터 기준어의 음절 수만큼 기준어의 기준 음운 그룹과 문자열 또는 낱말의 비교 음운 그룹 사이의 유사도를 계산한다.When the similar phoneme group is searched in a character string or a word, the total similarity calculation unit 135 calculates a similarity degree between a reference phoneme group of a similar phoneme group and a comparison phoneme group of a character string based on a similar phoneme group. Preferably, the overall similarity calculation unit 135 calculates a similarity degree between the reference phoneme group of the reference word and the comparison phoneme group of the character string or the word, from the similar phoneme group to the reference word.

도 4는 본 발명의 일 실시예에 따른, 입력되는 문자열에서 사용자의 감정을 판단하는 방법을 설명하기 위한 흐름도이다.4 is a flowchart illustrating a method of determining a user's emotion in an input character string according to an exemplary embodiment of the present invention.

도 4를 참고로 보다 구체적으로 살펴보면, 문자열이 입력되는 경우 입력되는 문자열을 음절 단위로 분류하고(S100), 분류한 각 음절을 음운으로 구분하여 각 음절에 대한 비교 음운 그룹을 생성한다(S110). 메신저, 소셜 네트워크 서비스, 또는 이동 디바이스의 단문자로 입력되는 문자열의 입력 형태를 살펴보면, 표준어와 띄어쓰기 법칙에 따라 문자열이 입력되는 경우도 있지만, 종종 띄어쓰기 구분없이 새롭게 생성된 통신 용어, 약어, 오탈자를 포함한 단어들이 입력된다. 이렇게 입력되는 문자열을 음절 단위로 분류하고, 분류한 각 음절을 구성하는 음운으로 구분하여 각 음절에 대한 비교 음운 그룹을 생성한다. 4, when a character string is input, the input character string is classified into syllable units (S100), and the sorted phonemes are divided into phonemes to generate a comparison phoneme group for each syllable (S110) . If a character string is inputted according to a standard word and a space rule, it is often possible to input a communication term, an abbreviation, and a punctuation, which are generated without distinction, from a messenger, a social network service, The words that are included are entered. The input string is classified into syllable units, and a phoneme group is generated for each syllable by dividing the syllable into phonemes constituting each syllable.

입력되는 문자열의 일 예를 살펴보면, "나는 오늘 기분이 좋아"라는 표준 문장의 문자열을 표준 문장으로 입력하는 경우도 있지만, "나는오늘기분이좋아", "나는 오늘기분이 좋아", "나는오늘 기분이좋아", "나는 오늘기분이좋아" 등과 같이 띄어쓰기 구분없이 또는 띄어쓰기 규칙을 무시하고 입력되기도 한다. 또한 기준어를 사용하여 문자열을 입력하는 경우도 있지만, "좋아"라는 기준어 대신 "조타", "조아", "종아", "쪼아" 등과 같이 새로운 통신 용어 또는 약어로 입력되기도 한다. If you look at an example of the input string, "I am feeling good today," the standard sentence of the string of standard sentences, but sometimes, "I feel good today," "I feel good today," "I am today , "I like the mood", "I like the mood today", or ignore the spacing rules. In some cases, a string is input using a reference word, but it may be input as a new communication term or abbreviation, such as "steering", "joe", "slave", "peck"

입력되는 문자열의 비교 음운 그룹과 감정 데이터베이스에 저장되어 있는 기준어의 기준 음운 그룹을 음절 단위로 개별 유사도를 계산하고, 음절 단위의 개별 유사도에 기초하여 입력되는 문자열과 기준어의 유사도를 계산한다(S120). 계산한 유사도가 임계 유사도를 초과하는지 판단하여(S130), 임계 유사도 이상의 유사도를 가지는 기준어를 입력되는 문자열의 매핑 기준어로 선택한다(S140). The similarity of the inputted phoneme group and the reference phoneme group of the reference word stored in the emotion database are calculated in syllable unit and the similarity degree between the inputted character string and the reference word is calculated based on the individual similarity of the syllable unit S120). In operation S140, it is determined whether the calculated similarity exceeds the threshold similarity, and a reference word having a degree of similarity equal to or greater than the threshold similarity is selected as a mapping reference word of the input character string.

선택한 매핑 기준어에 기초하여 매핑 기준어가 저장되어 있는 감정 데이터베이스의 감정 식별자에 기초하여 입력되는 문자열에 대한 사용자의 감정을 판단한다(S150).In operation S150, the user's emotion is input based on the emotion identifier of the emotion database storing the mapping reference word based on the selected mapping reference word.

도 5는 감정 데이터베이스 중 부정을 나타내는 기준어와 각 기준어에 대한 음절 단위의 기준 음운 그룹을 저장하는 감정 데이터베이스의 일 예를 도시하고 있으며, 도 6은 입력되는 문자열과 각 문자열로부터 생성되는 비교 음운 그룹의 일 예를 도시하고 있다. 도 5에 도시되어 있는 바와 같이, 부정적인 표준 단어들, 예를 들어 "싫다", "슬프다"와 이와 상응하여 자주 사용되는 구어체, 예를 들어 "싫어", "싫은데", "슬퍼", "슬픈데" 및 이들 기준어의 각 음절에 대한 기준 음운 그룹이 감정 데이터베이스에 저장되어 있다.FIG. 5 shows an example of an emotion database storing a reference word indicating negation and a reference phoneme group of syllable units for each reference word, FIG. 5 shows an example of an emotion database storing an input character string and a comparison phoneme group As shown in FIG. As shown in FIG. 5, negative standard words such as "dislike", "sad" and corresponding colloquialisms frequently used, such as "hate", "dislike", "sad", "sad And the reference phoneme group for each syllable of these reference words are stored in the emotion database.

한편, 도 6에 도시되어 있는 바와 같이, 입력되는 부정적인 단어의 문자열은 "싫어" 또는 "싫은데"의 기준어에 대해 "실어", "시로", "시러", "실오", "실은데", "시른데" 등의 통신 용어, 약어, 오탈자를 포함한 단어로 입력된다. 그리고 이렇게 입력되는 문자열의 각 음절은 음절 단위로 비교 음운 그룹으로 생성된다.
On the other hand, as shown in Fig. 6, the string of the negative word to be inputted is a word of "no" or "dislike" , "Shirando" and other communication terms, abbreviations, and punctuation. Then, each syllable of the input string is generated as a phoneme group in syllable units.

도 7은 본 발명의 다른 실시예에 따른, 입력되는 문자열에서 사용자의 감정을 판단하는 방법을 설명하기 위한 흐름도이다.7 is a flowchart illustrating a method of determining a user's emotion in an input character string according to another exemplary embodiment of the present invention.

도 7을 참고로 보다 구체적으로 살펴보면, 입력되는 문자열에서 띄어쓰기를 기준으로 입력되는 문자열을 낱말로 분류하고(S210), 다시 분류한 문자열의 낱말을 음절 단위로 분류한다(S220). 분류한 낱말 단위로 각 낱말을 구성하는 음절의 비교 음운 그룹을 생성한다(S230).More specifically, referring to FIG. 7, a character string input on the basis of a space in an input character string is classified into words (S210), and the word of the re-classified character string is classified into syllable units (S220). And generates a comparison phoneme group of syllables constituting each word in the sorted word units (S230).

낱말의 비교 음운 그룹과 감정 데이터베이스에 저정되어 있는 기준어의 기준 음운 그룹을 음절 단위로 개별 유사도를 계산하고, 음절 단위의 개별 유사도에 기초하여 낱말과 기준어의 유사도를 계산한다(S240). 계산한 낱말과 기준어의 유사도가 임계 유사도를 초과하는지 판단하여(S250), 임계 유사도 이상의 유사도를 가지는 기준어를 분류한 낱말에 매핑되는 매핑 기준어로 선택한다(S260). The similarity of the reference phoneme group of the reference word stored in the comparison phoneme group and the emotion database of the word is calculated in syllable unit, and the similarity of the word and the reference word is calculated based on the individual similarity of the syllable unit (S240). The similarity degree between the calculated word and the reference word is judged to exceed the threshold similarity degree (S250), and a reference word having a degree of similarity equal to or greater than the threshold similarity degree is selected as a mapping reference word mapped to the classified word (S260).

선택한 매핑 기준어에 기초하여 입력되는 문자열에 대한 사용자의 감정을 판단한다(S270). 입력되는 문자열이 다수의 낱말로 분류되며 다수의 낱말에 다수의 매핑 기준어가 선택되는 경우, 선택한 다수의 매핑 기준어의 감정 식별자에 기초하여 가장 많은 동일 감정 식별자를 가지는 감정을 사용자의 감정으로 판단하거나 입력되는 문자열 중에서 마지막에 입력되는 문자열로부터 분류된 낱말에 매핑된 기준어의 감정 식별자로 사용자의 감정을 판단한다.
The user's emotion for the input character string is determined based on the selected mapping reference word (S270). When the input character string is classified into a plurality of words and a plurality of mapping reference words are selected for a plurality of words, the emotion having the largest number of identical emotion identifiers based on the emotion identifiers of the selected plurality of mapping reference words is determined as the emotion of the user The user's emotion is determined by the emotion identifier of the reference word mapped to the word classified from the last inputted character string among the inputted strings.

도 8은 본 발명에 따라 입력되는 문자열과 기준어의 유사도를 계산하는 방법을 설명하기 위한 흐름도이다.8 is a flowchart illustrating a method of calculating a similarity between a character string and a reference word according to the present invention.

도 8을 참고로 보다 구체적으로 살펴보면, 입력되는 문자열로부터 생성되는 각 음절의 비교 음운 그룹과 기준어의 첫 음절의 기준 음운 그룹의 초성을 비교하여(S121) 각 음절의 비교 음운 그룹과 기준어의 첫 음절의 기준 음운 그룹의 초성이 서로 일치하는지 판단한다(S123). 초성이 서로 일치하는 경우에만, 기준어의 첫 음절의 기준 음운 그룹과 문자열의 음절을 구성하는 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산한다(S125). 8, a comparison is made between the comparison phoneme group of each syllable generated from the inputted character string and the reference phoneme group of the reference phoneme group of the first syllable of the reference word (S121), and a comparison phoneme group and a reference word It is judged whether or not the first pronunciations of the first phoneme correspond to each other (S123). The individual similarities of the reference phoneme group of the first syllable of the reference word and each of the comparative phonemic groups constituting the syllable of the string are sequentially calculated (S125).

문자열의 음절을 구성하는 비교 음운 그룹 중 임계 개별 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색하였는지 판단하여(S127), 유사 음운 그룹을 검색하는 경우 유사 음운 그룹부터 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 유사도를 계산한다(S128). 바람직하게, 유사 음운 그룹부터 기준어의 음절 수만큼 기준어의 기준 음운 그룹과 문자열의 비교 음운 그룹 사이의 개별 유사도를 계산하고, 음절 수만큼 계산한 개별 유사도로부터 기준어와 문자열 사이의 유사도를 계산한다.(S127). If a similar phonemic group is searched for, it is determined whether or not a similar phoneme group and a reference phoneme group of a reference word have been searched for The similarity between the comparison phonemic groups is calculated (S128). Preferably, the degree of similarity between the reference phonemic group of the reference word and the comparison phonemic group of the string is calculated by the number of syllables of the similar phonemic group to the reference word, and the similarity between the reference word and the character string is calculated from the individual similarity calculated by the number of syllables .

기준 음운 그룹과 비교 음운 그룹의 개별 유사도(ISj)는 아래의 수학식(1)에 의해 계산되며 기준어와 문자열의 유사도(S)는 아래의 수학식(2)에 의해 계산되는데,The individual similarity (IS j ) of the reference phoneme group and the comparison phoneme group is calculated by the following equation (1), and the similarity degree S of the reference word and the character string is calculated by the following equation (2)

[수학식1][Equation 1]

Figure 112013054154647-pat00001
Figure 112013054154647-pat00001

[수학식2]&Quot; (2) "

Figure 112013054154647-pat00002
Figure 112013054154647-pat00002

여기서 n과 k은 각각 기준 음운 그룹을 구성하는 음운의 수와 기준어를 구성하는 음절의 수를 의미하며, si는 기준 음운 그룹과 비교 음운 그룹에서 음운별 일치값을 의미한다. 음운별 서로 일치하는 경우 일치값은 제1 상수를 가지며 일치하지 않는 경우 일치값은 제2 상수를 가진다.Here, n and k mean the number of phonemes constituting the reference phoneme group and the number of syllables constituting the reference word, respectively, and s i means the phoneme correspondence value in the reference phonemic group and the comparison phonemic group, respectively. If the phoneme matches, the matching value has the first constant, and if not, the matching value has the second constant.

한편, 기준어의 첫 음절의 기준 음운 그룹의 초성과 비교 음운 그룹의 초성이 서로 일치하지 않는 경우, 해당 비교 음운 그룹에 대해서는 개별 유사도를 계산하지 않고 다음에 위치하는 음절로 이동하여(S129), 다음 음절의 비교 음운 그룹과 기준어의 첫 음절의 기준 음운 그룹의 초성을 순차적으로 비교한다. 본 발명에서는 통신 용어, 약어 등의 경우에도 초성은 서로 일치한다는 점에 착안하여 초성을 기준으로 입력되는 문자열에 매핑되는 매핑 기준어를 검색함으로써, 적은 연산량으로 정확하게 문자열에 대한 사용자의 감정을 판단할 수 있다.
On the other hand, if the initial value of the reference phoneme group of the first syllable of the reference word does not match with the initial value of the comparison phoneme group, the comparative phoneme group is moved to the next syllable without calculating the individual similarity (S129) Next, the comparison of the phoneme group of the next syllable and the beginnings of the reference phoneme group of the first syllable of the reference word are sequentially compared. In the present invention, attention is paid to the fact that, even in the case of communication terms, abbreviations, etc., the primitives are mutually coincident, and a mapping reference word mapped to a character string inputted on the basis of the primality is searched to determine the emotion of the user accurately .

본 발명의 다른 실시예에 따른 사용자 감정의 판단 방법에서는 낱말을 기준으로 매핑되는 매핑 기준어를 검색하는데, 낱말은 띄어쓰기를 기준으로 판단되며 사용자가 임의적으로 입력되는 문자열을 띄어쓰는 경우, 예를 들어 "나는 오늘 기분이 좋아", "나는오늘기분이 좋아", "나는 오늘 기분이좋아", "나는오늘기분이좋아" 등의 경우에도 기준어와 낱말 사이의 유사도는 기준어의 음절수에 기초하여 기준어의 음절 수만큼 기준어의 기준 음운 그룹과 낱말의 비교 음운 그룹 사이의 개별 유사도를 계산하고, 음절 수만큼 계산한 개별 유사도로부터 기준어와 낱말 사이의 유사도를 계산함으로써, 낱말에 매핑되는 매핑 기준어를 정확하고 빠르게 검색할 수 있다.
In the user emotion determination method according to another embodiment of the present invention, a mapping reference word mapped on the basis of a word is searched. The word is determined on the basis of a space, and when a user arbitrarily inputs a character string, The similarity between the reference word and the word is based on the number of syllables in the reference word even in the case of "I feel good today", "I feel good today", "I feel good today" By calculating the individual similarities between the reference phonemic group of the reference word and the comparative phonemic group of the word as many as the number of syllables of the reference word and calculating the similarity between the reference word and the word from the individual similarity calculated by the number of syllables, You can search for words accurately and quickly.

한편, 상술한 본 발명의 실시 예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록 매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.The above-described embodiments of the present invention can be embodied in a general-purpose digital computer that can be embodied as a program that can be executed by a computer and operates the program using a computer-readable recording medium.

상기 컴퓨터로 읽을 수 있는 기록 매체는 마그네틱 저장 매체(예를 들어, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장 매체를 포함한다.
The computer-readable recording medium may be a magnetic storage medium (e.g., ROM, floppy disk, hard disk, etc.), an optical reading medium (e.g. CD ROM, Lt; / RTI > transmission).

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다. While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art. Accordingly, the true scope of the present invention should be determined by the technical idea of the appended claims.

110, 220: 음절 분류부 120, 230: 음운 그룹 생성부
130, 240: 유사도 계산부 140, 250: 감정 데이터베이스
150, 260: 매핑 기준어 선택부 160, 270: 감정 판단부
170, 280: 초성 검색부 210: 낱말 분류부
131: 개별 유사도 계산부 133: 유사 음운 그룹 검색부
135: 전체 유사도 계산부
110, 220: syllable classifying section 120, 230: phonemic group generating section
130, 240: similarity calculation unit 140, 250: emotion database
150, 260: mapping reference word selection unit 160, 270:
170, 280: initial search unit 210: word classification unit
131: individual similarity calculating unit 133: similar phoneme group searching unit
135: total similarity calculation unit

Claims (12)

입력되는 문자열을 음절 단위로 분류하고, 상기 문자열의 음절을 구성하는, 음절 단위의 비교 음운 그룹을 생성하는 단계;
감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 단계;
상기 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 상기 문자열에 매핑되는 매핑 기준어로 선택하는 단계; 및
상기 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 상기 문자열에 대한 사용자 감정을 판단하는 단계를 포함하며,
상기 기준 음운 그룹과 상기 비교 음운 그룹의 유사도는 비교하는 단계는
상기 기준어의 기준 음운 그룹 중 상기 기준어의 첫 번째 음절의 기준 음운 그룹과 상기 문자열의 음절을 구성하는 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산하는 단계;
상기 문자열의 음절을 구성하는 비교 음운 그룹에서 임계 개별 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색하는 단계; 및
상기 유사 음운 그룹을 검색하는 경우, 상기 유사 음운 그룹부터 상기 기준어의 기준 음운 그룹과 상기 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 사용자 감정 판단 방법.
Generating a comparison phonemic group of syllable units which classifies input strings into syllable units and composes syllables of the strings;
Calculating a degree of similarity between a reference phoneme group of the syllable unit and the comparison phoneme group constituting the syllable of the reference word stored in the emotion database;
Selecting a reference word of a reference phoneme group having a degree of similarity equal to or greater than a predetermined threshold similarity based on the similarity as a mapping reference word mapped to the character string; And
Determining a user emotion for the character string based on an emotion database identifier including the mapping reference word,
Comparing the similarity of the reference phoneme group with the comparison phoneme group
Sequentially calculating an individual similarity degree of a reference phoneme group of a first syllable of the reference word among the reference phoneme groups of the reference word and each of the comparison phonemes constituting the syllable of the character string;
Searching for a similar phoneme group having individual similarities greater than or equal to the threshold individual similarity in the comparison phoneme group constituting the syllable of the character string; And
Calculating a similarity between the reference phoneme group of the reference word and the comparison phoneme group of the character string from the similar phoneme group when the similar phoneme group is searched.
삭제delete 제 1 항에 있어서, 상기 유사 음운 그룹부터 상기 기준어의 음절 수만큼 상기 기준어의 기준 음운 그룹과 상기 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 하는 사용자 감정 판단 방법. The method according to claim 1, wherein the similarity between the reference phoneme group of the reference word and the comparison phoneme group of the character string is calculated by the number of syllables of the reference word from the similar phoneme group. 제 1 항에 있어서, 상기 유사 음운 그룹을 검색하는 단계는
상기 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹에 대해 상기 개별 유사도를 계산하며,
상기 첫 번째 음절의 기준 음운 그룹의 초성과 상이한 초성을 가지는 비교 음운 그룹은 상기 개별 유사도를 계산하지 않는 것을 특징으로 하는 사용자 감정 판단 방법
2. The method of claim 1, wherein searching for the similar phoneme group comprises:
Calculating the individual similarity for a group of comparative phonemes having the same initiality as that of the reference phoneme group of the first syllable,
Wherein the individual similarity degree calculation unit does not calculate the individual similarity degree group having the same initiality as that of the reference phoneme group of the first syllable group,
제 1 항에 있어서,
입력되는 상기 문자열에서 띄어쓰기를 기준으로 상기 문자열을 낱말 단위로 분류하는 단계를 더 포함하며,
상기 낱말 단위로 상기 기준어의 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 하는 사용자 감정 판단 방법.
The method according to claim 1,
Further comprising the step of classifying the input character string into words based on the spacing in the input character string,
Wherein the degree of similarity between the reference phoneme group of the syllable unit of the reference word and the comparison phoneme group is calculated on a word-by-word basis.
입력되는 문자열을 음절 단위로 분류하고, 상기 문자열의 음절을 구성하는, 음절 단위의 비교 음운 그룹을 생성하는 단계;
감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 단계;
상기 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 상기 문자열에 매핑되는 매핑 기준어로 선택하는 단계; 및
상기 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 상기 문자열에 대한 사용자 감정을 판단하는 단계를 포함하며,
상기 감정 데이터베이스는 긍정 감정 데이터베이스와 부정 감정 데이터베이스로 구분되며,
상기 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 상기 문자열에 대한 사용자 감정을 판단하는 것을 특징으로 하는 사용자 감정 판단 방법.
Generating a comparison phonemic group of syllable units which classifies input strings into syllable units and composes syllables of the strings;
Calculating a degree of similarity between a reference phoneme group of the syllable unit and the comparison phoneme group constituting the syllable of the reference word stored in the emotion database;
Selecting a reference word of a reference phoneme group having a degree of similarity equal to or greater than a predetermined threshold similarity based on the similarity as a mapping reference word mapped to the character string; And
Determining a user emotion for the character string based on an emotion database identifier including the mapping reference word,
The emotion database is divided into a positive emotion database and a negative emotion database,
Wherein the user emotion is determined based on the emotion database identifier including the mapping reference word.
입력되는 문자열에서 상기 문자열을 음절 단위로 분류하는 음절 분류부;
상기 문자열의 음절을 구성하는 음운으로 음절 단위의 비교 음운 그룹을 생성하는 음운 그룹 생성부;
감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 유사도 계산부;
상기 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 상기 문자열에 매핑되는 매핑 기준어로 선택하는 매핑 기준어 선택부; 및
상기 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 상기 문자열에 대한 사용자 감정을 판단하는 감정 판단부를 포함하며,
상기 유사도 계산부는
상기 기준어의 기준 음운 그룹 중 상기 기준어의 첫 번째 음절의 기준 음운 그룹과 상기 문자열의 각 비교 음운 그룹의 개별 유사도를 순차적으로 계산하는 개별 유사도 계산부;
상기 문자열의 음절을 구성하는 비교 음운 그룹에서 임계 개별 유사도 이상의 개별 유사도를 가지는 유사 음운 그룹을 검색하는 유사 음운 그룹 검색부; 및
상기 유사 음운 그룹을 검색하는 경우, 상기 유사 음운 그룹부터 상기 기준어의 기준 음운 그룹과 상기 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 전체 유사도 계산부를 포함하는 것을 특징으로 하는 사용자 감정 판단 장치.
A syllable classifying unit for classifying the input character string into syllable units;
A phonemic group generation unit for generating a comparison phoneme group of syllable units by a phoneme constituting a syllable of the character string;
A similarity calculator for calculating a similarity between a reference phoneme group of a syllable unit and the comparison phoneme group constituting a syllable of a reference word stored in an emotion database;
A mapping reference word selector for selecting a reference word of a reference phoneme group having a degree of similarity equal to or greater than a predetermined threshold similarity based on the similarity to a mapping reference word mapped to the character string; And
And an emotion determination unit for determining a user emotion for the character string based on an emotion database identifier including the mapping reference word,
The similarity calculation unit
An individual similarity calculating unit for sequentially calculating individual similarities of a reference phoneme group of the first syllable of the reference word and each of the comparison phonemic groups of the character string among the reference phonemic groups of the reference word;
A similar phonemic group retrieval unit for retrieving a similar phoneme group having individual similarities greater than or equal to the threshold individual similarity in the comparison phoneme group constituting the syllable of the character string; And
And a total similarity calculating unit for calculating a similarity between the reference phoneme group of the reference word and the comparison phoneme group of the character string from the similar phoneme group when the similar phoneme group is searched.
삭제delete 제 7 항에 있어서, 상기 전체 유사도 계산부는
상기 유사 음운 그룹부터 상기 기준어의 음절 수만큼 상기 기준어의 기준 음운 그룹과 상기 문자열의 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 하는 사용자 감정 판단 장치.
8. The apparatus of claim 7, wherein the total similarity calculation unit
Wherein the similarity calculating unit calculates the similarity between the reference phoneme group of the reference word and the comparison phoneme group of the character string by the number of syllables of the reference word from the similar phoneme group.
제 7 항에 있어서, 상기 사용자 감정 판단 장치는
상기 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹을 검색하는 초성 검색부를 더 포함하며,
상기 개별 유사도 계산부는 상기 첫 번째 음절의 기준 음운 그룹의 초성과 동일한 초성을 가지는 비교 음운 그룹에 대해 상기 개별 유사도를 계산하며, 상기 첫 번째 음절의 기준 음운 그룹의 초성과 상이한 초성을 가지는 비교 음운 그룹은 상기 개별 유사도를 계산하지 않는 것을 특징으로 하는 사용자 감정 판단 장치.
8. The apparatus according to claim 7, wherein the user-
Further comprising a prefix search unit for searching for a group of comparative phonemes having the same prefix as the prefixes of the reference phoneme group of the first syllable,
Wherein the individual similarity calculation unit calculates the individual similarity for a comparative phoneme group having the same initiality as the initiality of the reference phoneme group of the first syllable and compares the individual phoneme group of the comparative phoneme group having the initial value different from the initial value of the reference phoneme group of the first syllable, Wherein the calculating unit does not calculate the individual similarity.
제 7 항에 있어서, 상기 사용자 감정 판단 장치는
입력되는 상기 문자열에서 띄어쓰기를 기준으로 상기 문자열을 낱말 단위로 분류하는 낱말 분류부를 더 포함하며,
상기 유사도 판단부는 낱말 단위로 상기 기준어의 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 것을 특징으로 하는 사용자 감정 판단 장치.
8. The apparatus according to claim 7, wherein the user-
And a word classifying unit for classifying the character string into words based on the spacing in the input character string,
Wherein the similarity determination unit calculates the similarity between the reference phoneme group of the syllable unit of the reference word and the comparison phoneme group on a word-by-word basis.
입력되는 문자열에서 상기 문자열을 음절 단위로 분류하는 음절 분류부;
상기 문자열의 음절을 구성하는 음운으로 음절 단위의 비교 음운 그룹을 생성하는 음운 그룹 생성부;
사용자의 감정을 나타내는 기준어와 상기 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹을 저장하는 감정 데이터베이스;
상기 감정 데이터베이스에 저장되어 있는 기준어의 음절을 구성하는, 음절 단위의 기준 음운 그룹과 상기 비교 음운 그룹 사이의 유사도를 계산하는 유사도 계산부;
상기 유사도에 기초하여 기설정한 임계 유사도 이상의 유사도를 가지는 기준 음운 그룹의 기준어를 상기 문자열에 매핑되는 매핑 기준어로 선택하는 매핑 기준어 선택부; 및
상기 매핑 기준어가 포함되어 있는 감정 데이터베이스 식별자에 기초하여 상기 문자열에 대한 사용자 감정을 판단하는 감정 판단부를 포함하는 것을 특징으로 하는 사용자 감정 판단 장치.
A syllable classifying unit for classifying the input character string into syllable units;
A phonemic group generation unit for generating a comparison phoneme group of syllable units by a phoneme constituting a syllable of the character string;
An emotion database for storing a reference word representing the emotion of the user and a reference phoneme group of the syllable unit constituting the syllable of the reference word;
A similarity calculation unit for calculating a similarity between a reference phoneme group of a syllable unit and the comparison phoneme group constituting a syllable of a reference word stored in the emotion database;
A mapping reference word selector for selecting a reference word of a reference phoneme group having a degree of similarity equal to or greater than a predetermined threshold similarity based on the similarity to a mapping reference word mapped to the character string; And
And an emotion determiner for determining a user emotion for the character string based on an emotion database identifier including the mapping reference word.
KR1020130069706A 2013-06-18 2013-06-18 Method for estimating user emotion from inputted string KR101544639B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130069706A KR101544639B1 (en) 2013-06-18 2013-06-18 Method for estimating user emotion from inputted string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130069706A KR101544639B1 (en) 2013-06-18 2013-06-18 Method for estimating user emotion from inputted string

Publications (2)

Publication Number Publication Date
KR20140146861A KR20140146861A (en) 2014-12-29
KR101544639B1 true KR101544639B1 (en) 2015-08-17

Family

ID=52675901

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130069706A KR101544639B1 (en) 2013-06-18 2013-06-18 Method for estimating user emotion from inputted string

Country Status (1)

Country Link
KR (1) KR101544639B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11538278B2 (en) 2019-10-08 2022-12-27 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202007B (en) * 2016-06-28 2018-09-07 电子科技大学 A kind of appraisal procedure of MATLAB program files similarity

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117027A (en) 2000-10-11 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> Feeling information extracting method and recording medium for feeling information extracting program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117027A (en) 2000-10-11 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> Feeling information extracting method and recording medium for feeling information extracting program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11538278B2 (en) 2019-10-08 2022-12-27 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
US11676419B2 (en) 2019-10-08 2023-06-13 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Also Published As

Publication number Publication date
KR20140146861A (en) 2014-12-29

Similar Documents

Publication Publication Date Title
CN109635273B (en) Text keyword extraction method, device, equipment and storage medium
CN107480143B (en) Method and system for segmenting conversation topics based on context correlation
CN108647205B (en) Fine-grained emotion analysis model construction method and device and readable storage medium
CN110413780B (en) Text emotion analysis method and electronic equipment
CN107862087B (en) Emotion analysis method and device based on big data and deep learning and storage medium
KR100775585B1 (en) Method for recommending music about character message and system thereof
WO2017101342A1 (en) Sentiment classification method and apparatus
CN110569496B (en) Entity linking method, device and storage medium
CN109241526B (en) Paragraph segmentation method and device
US20160210963A1 (en) Methods and systems for determining ranking of dialogue sticker based on situation and preference information
KR20180011254A (en) Web page training methods and devices, and search intent identification methods and devices
CN110472043B (en) Clustering method and device for comment text
US9792909B2 (en) Methods and systems for recommending dialogue sticker based on similar situation detection
CN111090771B (en) Song searching method, device and computer storage medium
CN108073571B (en) Multi-language text quality evaluation method and system and intelligent text processing system
JP2015219583A (en) Topic determination device, utterance device, method, and program
CN111126060A (en) Method, device and equipment for extracting subject term and storage medium
Harwath et al. Zero resource spoken audio corpus analysis
CN114491062B (en) Short text classification method integrating knowledge graph and topic model
CN115525763A (en) Emotion analysis method based on improved SO-PMI algorithm and fusion word vector
CN108021565B (en) User satisfaction analysis method and device based on conversation
US11842152B2 (en) Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program
CN112925912B (en) Text processing method, synonymous text recall method and apparatus
KR101544639B1 (en) Method for estimating user emotion from inputted string
CN111428487B (en) Model training method, lyric generation method, device, electronic equipment and medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190625

Year of fee payment: 5