KR20120109943A - 문장에 내재한 감정 분석을 위한 감정 분류 방법 - Google Patents

문장에 내재한 감정 분석을 위한 감정 분류 방법 Download PDF

Info

Publication number
KR20120109943A
KR20120109943A KR1020110027862A KR20110027862A KR20120109943A KR 20120109943 A KR20120109943 A KR 20120109943A KR 1020110027862 A KR1020110027862 A KR 1020110027862A KR 20110027862 A KR20110027862 A KR 20110027862A KR 20120109943 A KR20120109943 A KR 20120109943A
Authority
KR
South Korea
Prior art keywords
emotion
sentence
emotions
speech
words
Prior art date
Application number
KR1020110027862A
Other languages
English (en)
Inventor
강행봉
Original Assignee
가톨릭대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가톨릭대학교 산학협력단 filed Critical 가톨릭대학교 산학협력단
Priority to KR1020110027862A priority Critical patent/KR20120109943A/ko
Priority to PCT/KR2012/002295 priority patent/WO2012134180A2/ko
Publication of KR20120109943A publication Critical patent/KR20120109943A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 문장에 내재한 감정 분석을 위한 감정 분류 방법에 관한 것으로서, 보다 구체적으로는 (1) 형태소 분석기를 이용하여 문장을 구성하는 단어를 품사별로 분류하는 단계; (2) 품사별 감정 사전을 이용하여 상기 단어에 대한 감정 특징을 추출하는 단계; 및 (3) 상기 추출한 감정 특징을 이용하여 미리 훈련된 감정 분류기를 통해 상기 문장의 감정을 분류하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.
본 발명에서 제안하고 있는, 문장에 내재한 감정 분석을 위한 감정 분류 방법에 따르면, 문장을 구성하는 단어의 감정 특징을 추출하고 감정 분류기를 이용하여 문장에 내재된 감정을 분류함으로써, 온라인상에서 수집할 수 있는 감정이나 의견 등을 포함하는 문장의 자동 분석을 통해 오피니언 마이닝을 자동화할 수 있고, 이러한 오피니언 마이닝을 통한 마케팅 전략 수립이 신속하게 이루어질 수 있도록 하며, 기업, 브랜드, 제품, 서비스 등에 대한 평가를 자동 분석하고, 제품 평판 조사, 공공 의견 조사, 고객 성향 분석 등 다양한 영역에서 자동으로 감정 분석을 할 수 있다.

Description

문장에 내재한 감정 분석을 위한 감정 분류 방법{EMOTION CLASSIFICATION METHOD FOR ANALYSIS OF EMOTION IMMANENT IN SENTENCE}
본 발명은 감정 분류 방법에 관한 것으로서, 보다 구체적으로는 문장에 내재한 감정 분석을 위한 감정 분류 방법에 관한 것이다.
통상적으로 글이란 단어가 모여서 문장을 이루고, 문장이 모여서 한 덩이의 완성된 글이 되는데, 글을 이루는 문장의 기초 단위인 단어는 하나의 단어가 다른 단어와 어떤 관계를 맺는가의 문제와 글을 쓰기 위해서 내용상으로 어떠한 단어를 선정하는가의 문제를 내포하고 있다. 이 두 가지의 문제를 해결하는 과정이 통상적으로 글을 집필하는 과정에 일어나는 현상이라고 볼 수 있으며, 이 두 가지의 과정 중에서 두 번째의 문제, 즉 어떠한 단어를 선정하느냐의 문제를 집중적으로 분석하면, 이로부터 글쓴이의 감정을 도출할 수 있다.
즉, 각각의 단어는 문장에서 변용되고 상황에 따라 다른 뜻을 함축하기도 하지만, 기본적으로 내재하고 있는 단어 자체의 성향이 있다는 것을 알 수 있다. 따라서 글을 쓴 이가 어떤 성향이 내재된 단어를 집중적으로 사용할 수 있으며, 문학적, 인지언어학적, 정신분석학적으로 접근했을 때, 인간 보편의 성향에 맞춘 단어의 분석을 통해 단어를 분류할 수 있는 기준을 설정할 수 있고, 그 기준에 따라 단어를 분류하여 글쓴이의 감정을 분류할 수 있게 된다.
최근에는, 스마트폰의 사용자가 급증함에 따라 트위터, 페이스북과 같은 소셜 네트워크 서비스가 활성화되면서 온라인상에서 간단한 문장으로 자신의 감정을 표현하는 경우가 많아졌고, 각종 상품평, 영화 감상평, 맛집 평가 등 온라인상에서 짧은 문장으로 다양한 상품에 대해 각종 평가를 하는 경우도 많아졌다. 이러한 문장들은 다른 사람들의 감정이나 구매 성향에 큰 영향을 주기 때문에, 오피니언 마이닝이나 마케팅 측면에서, 이러한 온라인상의 각종 문장에 내재된 감정의 분석 및 분류가 어느 때보다 중요해지고 있는 실정이다.
본 발명은 기존에 제안된 방법들의 상기와 같은 문제점들을 해결하기 위해 제안된 것으로서, 문장을 구성하는 단어의 감정 특징을 추출하고 감정 분류기를 이용하여 문장에 내재된 감정을 분류함으로써, 온라인상에서 수집할 수 있는 감정이나 의견 등을 포함하는 문장의 자동 분석을 통해 오피니언 마이닝을 자동화할 수 있고, 이러한 오피니언 마이닝을 통한 마케팅 전략 수립이 신속하게 이루어질 수 있도록 하며, 기업, 브랜드, 제품, 서비스 등에 대한 평가를 자동 분석하고, 제품 평판 조사, 공공 의견 조사, 고객 성향 분석 등에 활용할 수 있는, 문장에 내재한 감정 분석을 위한 감정 분류 방법을 제공하는 것을 그 목적으로 한다.
상기한 목적을 달성하기 위한 본 발명의 특징에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법은,
(1) 형태소 분석기를 이용하여 문장을 구성하는 단어를 품사별로 분류하는 단계;
(2) 품사별 감정 사전을 이용하여 상기 단어에 대한 감정 특징을 추출하는 단계; 및
(3) 상기 추출한 감정 특징을 이용하여 미리 훈련된 감정 분류기를 통해 상기 문장의 감정을 분류하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.
바람직하게는, 상기 감정 사전은,
품사별로 감정에 따른 단어와 단어의 감정의 세기를 포함할 수 있다.
바람직하게는, 상기 단계 (2)에서는,
상기 단어에 대한 감정의 종류와 감정의 세기를 감정 특징으로 추출할 수 있다.
바람직하게는, 상기 단계 (3)은,
(a) 상기 추출한 감정 특징을 특징 벡터로 구성하는 단계; 및
(b) 상기 구성한 특징 벡터와 상기 감정 분류기를 통해 상기 문장의 감정을 분류하는 단계를 포함할 수 있다.
더욱 바람직하게는, 상기 단계 (a)에서는,
상기 문장을 구성하는 단어의 감정의 종류에 대한 감정의 세기의 합으로 상기 특징 벡터를 구성할 수 있다.
바람직하게는, 상기 감정 분류기는,
서포트 벡터 머신(Support Vector Machine, SVM)일 수 있다.
바람직하게는, 상기 품사는,
명사, 동사, 형용사, 및 이모티콘을 포함할 수 있다.
본 발명에서 제안하고 있는, 문장에 내재한 감정 분석을 위한 감정 분류 방법에 따르면, 문장을 구성하는 단어의 감정 특징을 추출하고 감정 분류기를 이용하여 문장에 내재된 감정을 분류함으로써, 온라인상에서 수집할 수 있는 감정이나 의견 등을 포함하는 문장의 자동 분석을 통해 오피니언 마이닝을 자동화할 수 있고, 이러한 오피니언 마이닝을 통한 마케팅 전략 수립이 신속하게 이루어질 수 있도록 하며, 기업, 브랜드, 제품, 서비스 등에 대한 평가를 자동 분석하고, 제품 평판 조사, 공공 의견 조사, 고객 성향 분석 등 다양한 영역에서 자동으로 감정 분석을 할 수 있다.
도 1은 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 흐름을 도시한 도면.
도 2는 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법에서 단계 S300의 세부적인 흐름을 도시한 도면.
도 3은 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법을 이용하여 감정을 분류하기 위한 사전 준비 단계의 흐름을 도시한 도면.
이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.
덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 ‘연결’ 되어 있다고 할 때, 이는 ‘직접적으로 연결’ 되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 ‘간접적으로 연결’ 되어 있는 경우도 포함한다. 또한, 어떤 구성요소를 ‘포함’ 한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.
도 1은 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 흐름을 도시한 도면이다. 도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법은, 문장을 구성하는 단어를 품사별로 분류하는 단계(S100), 감정 특징을 추출하는 단계(S200), 및 문장의 감정을 분류하는 단계(S300)를 포함하여 구현될 수 있다.
즉, 감정을 분류하고자 하는 문장에 대한 형태소 분석을 먼저 수행할 수 있다. 형태소 분석기를 통해 문장을 품사별로 분류하고 각 품사별 감정 사전을 이용해 문장에 대한 감정 특징을 추출할 수 있다. 품사별 감정 사전은 각 품사별로 각 감정에 따른 단어와 그 감정의 세기를 포함할 수 있다. 추출된 감정 특징을 이용하여, 미리 훈련된 감정 분류기에 의해 문장을 감정 중 하나로 분류할 수 있다. 이와 같은, 본 발명의 감정 분류 방법에 따르면, 소셜 미디어의 일종인 트위터나 댓글 등에 포함된 감정이나 긍정 부정을 분류할 수 있다. 이하에서는, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 각 단계에 대해 상세히 설명하기로 한다.
단계 S100에서는, 형태소 분석기를 이용하여 문장을 구성하는 단어를 품사별로 분류할 수 있다. 단어를 형태소 분석을 하게 되면, 다양한 활용을 하는 용언도 일치하는 어간으로부터 동일 단어 여부를 판단할 수 있고, 이러한 과정을 거쳐 단어를 품사별로 분류할 수가 있다. 이때 품사는, 명사, 동사, 형용사 및 이모티콘일 수 있다. 즉, 온라인상에서 감정을 강하게 표현하기 위해 사용되는 이모티콘도 하나의 단어로 인식하고 품사로 분류하도록 함으로써, 온라인상의 문장에 내재한 감정을 보다 효율적으로 분석할 수 있다.
단계 S200에서는, 품사별 감정 사전을 이용하여 단어에 대한 감정 특징을 추출할 수 있다. 감정 사전은, 각 품사별로 감정에 따른 단어와 단어의 감정의 세기를 포함할 수 있고, 단어에 대한 감정의 종류와 감정의 세기를 감정 특징으로 추출할 수 있다. 즉, 단계 S200에서는, 단계 S100에서 품사별로 분류한 단어를 품사별 감정 사전에서 검색함으로써, 해당 단어가 어떠한 감정을 나타내고 그 감정의 세기는 어느 정도인지를 감정 특징으로 추출할 수 있다. 단계 S200을 수행하기 위해 미리 품사별 감정 사전을 구축할 수 있으며, 품사별 감정 사전을 구축하는 방법에 대해서는 추후 도 3을 참조하여 상세히 설명하기로 한다.
단계 S300에서는, 추출한 감정 특징을 이용하여 미리 훈련된 감정 분류기를 통해 문장의 감정을 분류할 수 있다. 문장의 감정 분류를 위한 감정 분류기는 서포트 벡터 머신(Support Vector Machine, SVM)을 이용할 수 있다. 단계 S300의 세부적인 흐름에 대해서는, 이하에서 도 2를 참조하여 상세히 설명하도록 한다.
도 2는 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법에서 단계 S300의 세부적인 흐름을 도시한 도면이다. 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 단계 S300은, 감정 특징을 특징 벡터로 구성하는 단계(S310) 및 특징 벡터와 감정 분류기를 통해 문장의 감정을 분류하는 단계(S320)를 포함하여 구현될 수 있다.
단계 S310에서는, 추출한 감정 특징을 특징 벡터로 구성할 수 있다. 단계 S310에서는, 문장을 구성하는 단어의 감정의 종류에 대한 감정의 세기의 합으로 특징 벡터를 구성할 수 있다. 즉, 단계 S200에서 추출한 문장에 포함되는 단어들의 감정 특징을 문장에 대해 종합하여, 감정의 종류별로 감정의 세기를 합함으로써, 문장에 내재된 감정의 특성을 분석하여 벡터로 표현할 수 있다.
예를 들어, 중립, 기쁨, 슬픔, 분노, 공포의 5가지로 감정의 종류를 분류한다면, 감정 분석을 하고자 하는 문장을 구성하는 단어들이 나타내는 감정의 종류별로 감정의 세기를 합하여 특징 벡터를 구성할 수 있다. 따라서 5 종류의 감정에 대한 특징 벡터는 5개의 성분으로 구성될 수 있다.
단계 S320에서는, 구성한 특징 벡터와 감정 분류기를 통해 문장의 감정을 분류할 수 있다. 문장 감정 분류를 위한 감정 분류기는 SVM(Support Vector Machine)을 이용할 수 있다. SVM은 Vapnik에 의해 소개된 기계학습 기법으로 두 개의 클래스의 구성 데이터들을 가장 잘 분리할 수 있는 초평면(hyperplane)을 찾는 모델이다. SVM의 초평면은 다음 수학식 1과 같이 나타낼 수 있다. 수학식 1에서, w는 초평면의 법선벡터(normal vector)이고, x는 테스트 데이터 벡터, 그리고 b는 바이어스(bias) 벡터이다.
Figure pat00001
SVM은 직선으로 나눌 수 있는 문제를 다루는데 사용되었지만, 다차원의 부드러운 곡선을 이용하여 초평면을 구성하거나 사용되는 데이터 차원보다 높은 특징 공간으로 매핑 하여 선형적으로 나눌 수 없는 문제도 해결 할 수 있다. 본 이진 분류(binary classification) 문제를 확장하여 다중 분류(Multi-class classification)문제를 해결하기 위해 ‘one-against-one’ 방법을 이용할 수 있다. 먼저 k개의 class가 존재한다고 하면, k(k-1)/2개의 이진 분류기를 구성하고 각각을 훈련할 수 있다. i번째 클래스와 j번째 클래스의 훈련 데이터로부터의 같은 이진 분류 문제는 다음 수학식 2와 같이 표현될 수 있다.
Figure pat00002
이러한 이진 분류기를 이용해 다중 분류를 하기 위해, 이진 분류기들의 투표 전략(voting strategy)을 이용할 수 있다. 즉, 각각의 이진 분류기는 모든 데이터에 대해서 투표를 하고 마지막에 가장 많은 투표를 받은 클래스로 분류하게 된다. 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 단계 S320에서는, Open CV의 기계학습 라이브러리의 SVM 클래스를 이용할 수 있으며, 커널 함수로는 선형(LINEAR) 함수를 이용할 수 있다.
단계 S320에서는, 미리 훈련된 감정 분류기를 사용하여 문장에 내재한 감정을 분류할 수 있는데, 감정 분류기를 미리 훈련하는 과정에 대해서는, 이하에서 도 3을 참조하여 상세히 설명하도록 한다.
도 3은 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법을 이용하여 감정을 분류하기 위한 사전 준비 단계의 흐름을 도시한 도면이다. 도 3에 도시된 바와 같이, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법에서는, 품사별 감정 사전을 구축하는 단계(S10) 및 감정 분류기를 훈련하는 단계(S20)를 더 포함하여, 감정 분류를 위한 사전 준비를 할 수 있다.
단계 S10에서는, 품사별 감정 사전을 구축할 수 있다. 감정 사전은, 품사별로 감정에 따른 단어와 단어의 감정의 세기를 포함할 수 있다. 일반적인 문장에 대한 감정을 분류하기 위해서는 먼저 각 감정을 나타내는 단어인 감정 특징을 추출해야 한다. 이와 같은 감정 특징은 다양한 문장으로부터 감정이 내재되어 있는 문장으로부터 감정 단어를 품사별로 추출한 다음, 각 단어의 감정 세기를 측정하여 감정 사전을 구축할 수 있다.
예를 들어, 온라인상에서 작성되는 각종 텍스트에 대한 감정 특징을 추출하기 위해 트위터와 같은 소셜 네트워크 서비스, 인터넷 커뮤니티 등에서 감정이 내재되어 있는 문장을 선택하여 문장에 포함되어 있는 감정 단어를 품사별로 추출할 수 있다. 이와 같은 방법으로 추출된 감정 단어만으로는 그 수가 너무 제한적일 수 있기 때문에, 이를 확장하기 위해 유의어 사전 정보를 이용해 단어를 추가할 수 있다. 그 다음 각 단어의 감정 세기를 사람이 직접 점수를 매겨 감정 사전을 구축할 수 있다. 이때, 명사, 형용사, 동사 및 이모티콘에 관련된 감정 사전을 구축함으로써, 온라인상에서 많이 사용되는 이모티콘을 포함하는 각종 감정 단어에 대한 품사별 감정 사전을 구축할 수 있다.
단계 S20에서는, 감정 분류기를 훈련할 수 있다. 단계 S10에서 감정 사전의 구축에 사용된 문장들을 사용하여 문장에 포함되어 있는 단어들의 감정의 종류 및 감정의 세기를 특징 벡터로 구성하여, 이러한 특징 벡터를 훈련용 데이터로 사용할 수 있다. 문장 감정 분류를 위한 분류기는 SVM(Support Vector Machine)을 이용할 수 있다.
[실험예]
트위터와 같은 소셜 네트워크 서비스, 인터넷 커뮤니티 등에서 감정이 내재되어 있는 문장을 선택하여 문장에 포함되어 있는 감정 단어를 품사별로 추출하고, 유의어 사전 정보를 이용해 단어를 더 추가하였다. 각 단어의 감정 세기를 사람이 직접 1에서 5점까지 매겨 명사, 형용사, 동사 및 이모티콘에 관련된 감정 사전을 구축하였다. 이와 같은 방법으로 구축된 품사별 감정 사전의 구성은 다음 표 1과 같다.
Figure pat00003
감정 분류기의 훈련을 위해서는, 먼저 온라인상에서 획득한 감정이 포함되어 있는 문장 72개에 대해서 각 감정별로 기쁨 21개, 슬픔 18개, 분노 22개, 두려움 12개에 대한 특징 벡터를 추출하여 SVM 분류기를 훈련시켰다. 각 특징벡터는 각 문장에 포함되어 있는 감정 단어의 감정 세기의 합으로서 표 1의 각 품사별 감정 사전에 의해 결정하였다.
본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법의 정확도 실험을 위하여, 트위터, me2day, 영화 커뮤니티 등에서 획득된 문장에 대해 사람이 직접 감정을 판단하여 테스트 데이터 DB를 구축하였다. 구축된 테스트 데이터 DB는 다음 표 2와 같다.
Figure pat00004
표 2의 테스트 데이터 DB를 구성하는 트위터, me2day, 영화 커뮤니티 등에서 획득된 문장에 내재한 감정을, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법에 따라 감정 분류를 실험하였다. 본 발명에서 제안하고 있는 감정 분류 방법의 정량적 평가를 위해 정확도를 %로 계산하여 다음 표 3에 나타내었다.
Figure pat00005
표 3에서 확인할 수 있는 바와 같이, 본 발명의 일실시예에 따른 문장에 내재한 감정 분석을 위한 감정 분류 방법은, 전체적으로 70% 이상의 높은 정확도를 나타내고 있음을 확인할 수 있다. 이와 같이, 텍스트 분석을 통해 문장에 내재한 감정을 분류함으로써, 소셜 네트워크 서비스 확산에 따른 오피니언 마이닝을 자동화 할 수 있고, 이를 통한 마케팅 전략 수립에 도움을 줄 수 있다. 또한, 기업 또는 브랜드, 제품, 서비스 등에 대한 평가를 자동 분석하여 제품 개선에 활용할 수 있으며, 제품 평판 조사, 공공 의견 조사, 고객 성향 분석 등에도 활용할 수 있다.
이상 설명한 본 발명은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에 의하여 다양한 변형이나 응용이 가능하며, 본 발명에 따른 기술적 사상의 범위는 아래의 특허청구범위에 의하여 정해져야 할 것이다.
S10: 품사별 감정 사전을 구축하는 단계
S20: 감정 분류기를 훈련하는 단계
S100: 문장을 구성하는 단어를 품사별로 분류하는 단계
S200: 감정 특징을 추출하는 단계
S300: 문장의 감정을 분류하는 단계
S310: 감정 특징을 특징 벡터로 구성하는 단계
S320: 특징 벡터와 감정 분류기를 통해 문장의 감정을 분류하는 단계

Claims (7)

  1. 감정 분류 방법으로서,
    (1) 형태소 분석기를 이용하여 문장을 구성하는 단어를 품사별로 분류하는 단계;
    (2) 품사별 감정 사전을 이용하여 상기 단어에 대한 감정 특징을 추출하는 단계; 및
    (3) 상기 추출한 감정 특징을 이용하여 미리 훈련된 감정 분류기를 통해 상기 문장의 감정을 분류하는 단계를 포함하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  2. 제1항에 있어서, 상기 감정 사전은,
    품사별로 감정에 따른 단어와 단어의 감정의 세기를 포함하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  3. 제1항에 있어서, 상기 단계 (2)에서는,
    상기 단어에 대한 감정의 종류와 감정의 세기를 감정 특징으로 추출하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  4. 제1항에 있어서, 상기 단계 (3)은,
    (a) 상기 추출한 감정 특징을 특징 벡터로 구성하는 단계; 및
    (b) 상기 구성한 특징 벡터와 상기 감정 분류기를 통해 상기 문장의 감정을 분류하는 단계를 포함하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  5. 제4항에 있어서, 상기 단계 (a)에서는,
    상기 문장을 구성하는 단어의 감정의 종류에 대한 감정의 세기의 합으로 상기 특징 벡터를 구성하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  6. 제1항에 있어서, 상기 감정 분류기는,
    서포트 벡터 머신(Support Vector Machine, SVM)인 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
  7. 제1항에 있어서, 상기 품사는,
    명사, 동사, 형용사, 및 이모티콘을 포함하는 것을 특징으로 하는, 문장에 내재한 감정 분석을 위한 감정 분류 방법.
KR1020110027862A 2011-03-28 2011-03-28 문장에 내재한 감정 분석을 위한 감정 분류 방법 KR20120109943A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110027862A KR20120109943A (ko) 2011-03-28 2011-03-28 문장에 내재한 감정 분석을 위한 감정 분류 방법
PCT/KR2012/002295 WO2012134180A2 (ko) 2011-03-28 2012-03-28 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110027862A KR20120109943A (ko) 2011-03-28 2011-03-28 문장에 내재한 감정 분석을 위한 감정 분류 방법

Publications (1)

Publication Number Publication Date
KR20120109943A true KR20120109943A (ko) 2012-10-09

Family

ID=47280985

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110027862A KR20120109943A (ko) 2011-03-28 2011-03-28 문장에 내재한 감정 분석을 위한 감정 분류 방법

Country Status (1)

Country Link
KR (1) KR20120109943A (ko)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101416291B1 (ko) * 2012-10-18 2014-07-09 한국항공대학교산학협력단 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법
KR20150033901A (ko) 2013-09-25 2015-04-02 에스케이텔레콤 주식회사 텍스트 이모티콘 의미 해석 장치, 이를 위한 기록매체
WO2016195196A1 (ko) * 2015-06-05 2016-12-08 주식회사 한국리서치 평가 대상에 대한 평가 결과를 정량화하는 방법
KR101713558B1 (ko) * 2015-10-30 2017-03-08 조선대학교산학협력단 소셜 네트워크 서비스 상의 사용자 게시글 감정 분류 방법
US9792909B2 (en) 2015-01-19 2017-10-17 Ncsoft Corporation Methods and systems for recommending dialogue sticker based on similar situation detection
WO2019039659A1 (ko) * 2017-08-23 2019-02-28 건국대학교 산학협력단 감성 기반의 사용자 관리 방법 및 이를 수행하는 장치들
KR101985904B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠를 소정의 단위로 분할하여 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR101985901B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠 작성자의 메타정보 추론 서비스 제공 방법 및 컴퓨터 프로그램
KR101985903B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠를 문장 단위로 분할하여 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR101985902B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 형태소 특징 및 음절 특징을 고려한 텍스트 콘텐츠 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
WO2019112117A1 (ko) * 2017-12-05 2019-06-13 (주)아크릴 텍스트 콘텐츠 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
CN110019782A (zh) * 2017-09-26 2019-07-16 北京京东尚科信息技术有限公司 用于输出文本类别的方法和装置
WO2019168253A1 (ko) * 2018-02-27 2019-09-06 주식회사 와이즈넛 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법
KR102032091B1 (ko) * 2019-03-15 2019-10-14 배준철 인공지능 기반의 댓글 감성 분석 방법 및 그 시스템
CN112446217A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 情感分析方法、装置及电子设备
KR20210027769A (ko) * 2019-09-03 2021-03-11 한국항공대학교산학협력단 신경망 기반 감정 분석 및 감성 치료 시스템
KR20220144491A (ko) * 2021-04-20 2022-10-27 주식회사 한글과컴퓨터 표현 해석 기반의 채팅 기능을 제공하는 전자 장치 및 그 동작 방법

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101416291B1 (ko) * 2012-10-18 2014-07-09 한국항공대학교산학협력단 규칙기반 다중 에이전트를 이용한 감성 분류 시스템 및 그 방법
KR20150033901A (ko) 2013-09-25 2015-04-02 에스케이텔레콤 주식회사 텍스트 이모티콘 의미 해석 장치, 이를 위한 기록매체
US9792909B2 (en) 2015-01-19 2017-10-17 Ncsoft Corporation Methods and systems for recommending dialogue sticker based on similar situation detection
WO2016195196A1 (ko) * 2015-06-05 2016-12-08 주식회사 한국리서치 평가 대상에 대한 평가 결과를 정량화하는 방법
KR101713558B1 (ko) * 2015-10-30 2017-03-08 조선대학교산학협력단 소셜 네트워크 서비스 상의 사용자 게시글 감정 분류 방법
WO2019039659A1 (ko) * 2017-08-23 2019-02-28 건국대학교 산학협력단 감성 기반의 사용자 관리 방법 및 이를 수행하는 장치들
CN110019782A (zh) * 2017-09-26 2019-07-16 北京京东尚科信息技术有限公司 用于输出文本类别的方法和装置
WO2019112117A1 (ko) * 2017-12-05 2019-06-13 (주)아크릴 텍스트 콘텐츠 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR101985900B1 (ko) * 2017-12-05 2019-09-03 (주)아크릴 텍스트 콘텐츠 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
WO2019168253A1 (ko) * 2018-02-27 2019-09-06 주식회사 와이즈넛 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법
KR20190109614A (ko) * 2018-02-27 2019-09-26 주식회사 와이즈넛 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법
KR101985903B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠를 문장 단위로 분할하여 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR101985902B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 형태소 특징 및 음절 특징을 고려한 텍스트 콘텐츠 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR101985901B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠 작성자의 메타정보 추론 서비스 제공 방법 및 컴퓨터 프로그램
KR101985904B1 (ko) * 2019-02-14 2019-06-04 (주)아크릴 텍스트 콘텐츠를 소정의 단위로 분할하여 작성자의 메타정보를 추론하는 방법 및 컴퓨터 프로그램
KR102032091B1 (ko) * 2019-03-15 2019-10-14 배준철 인공지능 기반의 댓글 감성 분석 방법 및 그 시스템
KR20210027769A (ko) * 2019-09-03 2021-03-11 한국항공대학교산학협력단 신경망 기반 감정 분석 및 감성 치료 시스템
CN112446217A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 情感分析方法、装置及电子设备
CN112446217B (zh) * 2020-11-27 2024-05-28 广州三七互娱科技有限公司 情感分析方法、装置及电子设备
KR20220144491A (ko) * 2021-04-20 2022-10-27 주식회사 한글과컴퓨터 표현 해석 기반의 채팅 기능을 제공하는 전자 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
Ahmed et al. Detection of online fake news using n-gram analysis and machine learning techniques
Saeed et al. An ensemble approach for spam detection in Arabic opinion texts
Santosh et al. Author profiling: Predicting age and gender from blogs
US10642975B2 (en) System and methods for automatically detecting deceptive content
CN103207913B (zh) 商品细粒度语义关系的获取方法和***
Fiarni et al. Sentiment analysis system for Indonesia online retail shop review using hierarchy Naive Bayes technique
CN108563638B (zh) 一种基于主题识别和集成学习的微博情感分析方法
US20160260026A1 (en) Device for collecting contradictory expressions and computer program therefor
Sarawgi et al. Opinion mining: aspect level sentiment analysis using SentiWordNet and Amazon web services
Kiran et al. User specific product recommendation and rating system by performing sentiment analysis on product reviews
Ashraf et al. Bots and Gender Prediction Using Language Independent Stylometry-based Approach.
Fasha et al. Opinion mining using sentiment analysis: a case study of readers’ response on long Litt Woon’s the way through the woods in goodreads
Rathan et al. Every post matters: a survey on applications of sentiment analysis in social media
KR20130103249A (ko) 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
Chumwatana COMMENT ANALYSIS FOR PRODUCT AND SERVICE SATISFACTION FROM THAI CUSTOMERS'REVIEW IN SOCIAL NETWORK
Qian et al. Satiindicator: Leveraging user reviews to evaluate user satisfaction of sourceforge projects
Frankenstein et al. Contextual sentiment analysis
Bouhoula Automated Detection of GDPR Violations in Cookie Notices Using Machine Learning
Akerkar et al. Natural language processing
Bhagat Sentiment Analysis using an ensemble of Feature Selection Algorithms
Piot-Perez-Abadin et al. Gender classification models and feature impact for social media author profiling
Radha et al. A Feature Selection Technique-Based Approach for Author Profiling
Nandan et al. Sentiment Analysis of Twitter Classification by Applying Hybrid-Based Techniques
Muhuri et al. Contextual quality assessment of the newspaper articles based on keyword extraction

Legal Events

Date Code Title Description
A201 Request for examination
E601 Decision to refuse application
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20130313

Effective date: 20140423