KR20230092675A - 인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법 - Google Patents

인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법 Download PDF

Info

Publication number
KR20230092675A
KR20230092675A KR1020220019623A KR20220019623A KR20230092675A KR 20230092675 A KR20230092675 A KR 20230092675A KR 1020220019623 A KR1020220019623 A KR 1020220019623A KR 20220019623 A KR20220019623 A KR 20220019623A KR 20230092675 A KR20230092675 A KR 20230092675A
Authority
KR
South Korea
Prior art keywords
language
data
conversation
service providing
analysis
Prior art date
Application number
KR1020220019623A
Other languages
English (en)
Inventor
진수용
정병규
Original Assignee
진수용
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 진수용 filed Critical 진수용
Publication of KR20230092675A publication Critical patent/KR20230092675A/ko

Links

Images

Classifications

    • G06Q50/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Machine Translation (AREA)

Abstract

인공지능 기반 커뮤니케이션 서비스 제공 장치 및 방법이 개시된다. 상기 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 장치는, 상기 서비스 제공 플랫폼을 통해 사용자의 소셜 네트워크 서비스를 연동되고, 상기 연동된 소셜 네트워크 서비스를 기반으로 대화 데이터를 입력하여 커뮤니케이션을 수행하는 사용자 단말; 및 상기 사용자 단말이 상기 소셜 네트워크 서비스를 기반으로 입력한 대화 데이터를 획득하고, 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하고, 상기 분석 결과를 기반으로 추천 답변을 출력하는 서비스 제공 장치를 포함할 수 있다. 상기에서, 상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고, 상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 한다.

Description

인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법{SYSTEM AND METHOD FOR PROVIDING COMMUNICATION SERVICE THROUGH LANGUAGE PATTERN ANALYSIS BASED ON ARTIFICIAL INTELLIGENCE}
본 개시는 커뮤니케이션 서비스에 대한 것으로, 보다 구체적으로 인공지능을 기반으로 분석된 언어 패턴에 기초하여 커뮤니케이션 서비스를 제공하는 인공지능 기반 커뮤니케이션 서비스 제공 장치 및 방법에 관한 것이다.
최근 스마트폰의 보급이 늘어남에 따라, 언제 어디서나 인터넷에 접속할 수 있는 환경이 제공되고 있다.
이에 따라, 스마트폰의 사용자들은 단순히 통화나 문자를 주고받는 이전의 휴대전화의 기능에서 벗어나, 자신의 필요에 따라 다양한 어플리케이션을 설치하여 컴퓨터가 없어도 인터넷 접속은 물론 그 밖에 여러 가지 작업을 수행할 수 있게 되었다.
대부분의 스마트폰 사용자는 다른 사용자와 메시지, 사진, 영상, 문서 등을 주고받을 수 있는 이른바 SNS(Social Network Service)를 사용하고 있다.
나아가, 최근에는 인공지능 챗봇을 통해 실제 대화 상대가 없이도 고민 상담, 일상 대화 등의 커뮤니케이션 서비스나, 연예인과 대화를 하는 듯한 커뮤니케이션 서비스를 제공하는 SNS에 대한 개발 또한 활발하게 진행되고 있다.
이러한 커뮤니케이션 서비스는 서로 간의 커뮤니케이션이 매끄럽게 이어지지 않거나 대화 상대, 상태 또는 상황에 걸맞지 않는 답변이 계속되면 사용자들의 흥미를 유발할 수 없는 문제점이 있다.
따라서, 단순 흥미 위주의 커뮤니케이션뿐만 아니라 스피치 훈련, 상담/협상 보조, 마케팅 등에 활용될 수 있는 커뮤니케이션 서비스를 제공할 수 있도록 하는 기술이 개발될 필요가 있다.
한국공개특허공보 제10-2012-0137568호 (공개일: 2012.12.24)
상술한 바와 같은 문제점을 해결하기 위한 본 개시는 인공지능을 기반으로 분석된 언어 패턴에 기초하여 다양한 분양에 다양한 상황에 적합한 추천 답변(또는 예상 내지 예측 답변)을 제공하는 인공지능 기반 커뮤니케이션 서비스 제공 장치 및 방법을 제공하는 것이다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 개시의 일면에 따른 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 장치는, 상기 서비스 제공 플랫폼을 통해 사용자의 소셜 네트워크 서비스를 연동되고, 상기 연동된 소셜 네트워크 서비스를 기반으로 대화 데이터를 입력하여 커뮤니케이션을 수행하는 사용자 단말; 및 상기 사용자 단말이 상기 소셜 네트워크 서비스를 기반으로 입력한 대화 데이터를 획득하고, 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하고, 상기 분석 결과를 기반으로 추천 답변을 출력하는 서비스 제공 장치를 포함할 수 있다. 상기에서, 상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고, 상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 한다.
본 개시의 다른 일면에 따른 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 장치는, 저장 모듈; 및 상기 저장 모듈과 통신하는 제어 모듈을 포함하되, 상기 제어 모듈은, 사용자 단말이 상기 서비스 제공 플랫폼을 통해 연동된 사용자의 소셜 네트워크 서비스를 기반으로 입력한 대화 데이터를 획득하고, 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하고, 상기 분석 결과를 기반으로 추천 답변을 출력하도록 제어하되, 상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고, 상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 한다.
본 개시의 일면에 따른 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 방법은, 상기 서비스 제공 플랫폼을 통해 연동된 사용자의 소셜 네트워크 서비스를 기반으로 대화 데이터를 획득하는 단계; 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하는 단계; 및 상기 분석 결과를 기반으로 추천 답변 데이터 출력을 제어하는 단계를 포함하되, 상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고, 상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 한다.
이 외에도, 본 개시를 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
상술한 본 개시에 따르면, 인공지능을 기반으로 분석된 언어 패턴에 기초하여 단순 흥미 위주의 커뮤니케이션뿐만 아니라 스피치 훈련, 상담/협상 보조, 마케팅 등 다양한 분야의 다양한 상황에 맞는 추천 답변(또는 예상 내지 예측 답변)이 포함된 커뮤니케이션 서비스를 제공할 수 있다.
본 개시에 따르면, 상기 커뮤니케이션 서비스를 이용 사용자의 편의성을 향상시켜 서비스 만족도를 개선시킬 수 있다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시의 일 실시예에 따른 인공지능 기반 커뮤니케이션 서비스 제공 시스템의 네트워크 구조를 나타내는 도면이다.
도 2는 본 개시의 일 실시예에 따른 커뮤니케이션 서비스 제공 장치의 구성을 나타내는 블록도이다.
도 3은 본 개시의 일 실시예에 따라 커뮤니케이션 서비스 제공 장치에서 대화 데이터를 기반으로 언어 패턴을 수행함으로써 학습된 데이터를 생성하는 일 예를 나타내는 도면이다.
도 4는 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델의 성능을 향상시키기 위한 절차의 일 예를 나타내는 도면이다.
도 5는 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하는 방법을 나타내는 순서도이다.
도 6은 본 개시의 일 실시예에 따라 커뮤니케이션 서비스 제공 장치에서 대화 데이터를 기반으로 언어 패턴을 수행함으로써 학습된 데이터를 생성하는 일 예를 나타내는 도면이다.
도 7 내지 9는 본 개시의 일 실시예에 따른 커뮤니케이션 서비스 동작을 설명하기 위한 예시를 나타낸 도면이다.
도 10은 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하여 적용하는 절차의 일 예를 나타내는 도면이다.
본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시의 개시가 완전하도록 하고, 본 개시가 속하는 기술 분야의 통상의 기술자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 개시의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하, 첨부된 도면을 참조하여 본 개시의 실시예를 상세하게 설명한다.
도 1은 본 개시의 일 실시예에 따른 인공지능 기반 커뮤니케이션 서비스 제공 시스템의 네트워크 구조를 나타내는 도면이다.
도 1을 참조하면, 본 개시의 일 실시예에 따른 인공지능 기반 커뮤니케이션 서비스 제공 시스템(이하, '서비스 제공 시스템'이라 칭함)은 서비스 제공 장치(100) 및 사용자 단말(200)을 포함하여 구성될 수 있다. 본 개시의 다른 실시예에 따른 서비스 제공 시스템은 도 1에 도시된 구성 이외에 하나 또는 그 이상의 구성요소를 더 포함하여 구성될 수도 있다. 한편, 도 1에서 사용자 단말(200)은 설명의 편의상 1개만 도시하였으나, 이에 한정되는 것은 아니며, 복수 개일 수도 있다.
서비스 제공 장치(100)는 서비스 제공 플랫폼을 기반으로 커뮤니케이션 서비스를 제공하는 제공자(Service Provider)의 장치로서, 일 예로 서비스 서버일 수 있다.
구체적으로, 서비스 제공 장치(100)는 사용자 단말(200)이 서비스 제공 플랫폼에 연동된 소셜 네트워크 서비스(SNS: Social Network Service)를 기반으로 대화 데이터를 입력하면, 그 입력된 대화 데이터를 획득할 수 있다. 이후, 서비스 제공 장치(100)는 획득한 대화 데이터를 기 학습된 머신러닝(Machine Learning) 모델에 입력하여 언어 패턴을 분석하고, 분석 결과를 기반으로 추천 답변 또는 예상 내지 예측 답변(이하, '추천 답변'라 함)이 출력되도록 제어할 수 있다. 따라서 상기 추천 답변은 서비스 제공 플랫폼에 연동된 소셜 네트워크 서비스 상에 표시되어 사용자에게 제공될 수 있다.
상기에서, 기 학습된 머신러닝 모델은 서비스 제공 장치(100)에 기 설정된 기간 동안 누적 저장된 대화 데이터를 기반으로 언어 패턴을 분석하고, 그 분석된 언어 패턴에 대한 유효성 피드백 데이터를 수집 및 반영하여 구축된 학습 데이터를 이용하여 학습을 수행한 것일 수 있다. 이때, 머신러닝 알고리즘으로서 NLP(Natural Language Processing), CNN(Convolution Neural Network) 등 중 적어도 하나가 적용될 수 있다.
한편, 서비스 제공 장치(100)는 언어 패턴을 기 분류된 대화 종류에 대한 빈도를 분석한 것으로서, 이 때 상기 분류되는 대화 종류에는 긍정/중립/부정 관련 언어, 이해득실(득/실) 관련 언어, 시간(과거/현재/미래) 관련 언어, 감각(시각/청각/촉각/생각) 관련 언어 등이 포함될 수 있다. 한편, 상기 분류되는 대화 종류 각각은 추가로 더 세분화되어 새로운 분류 대상인 대화 종류나 해당 분류 대화 종류의 하위 대화로 정의되어 이용될 수도 있다. 다만, 본 개시가 상기 열거한 대화 종류 내지 하위 대화에 한정되는 것은 아니다.
일 예로서, 서비스 제공 장치(100)는, 코퍼스 토큰화 기반 어노테이션, 미완결 텍스트 분석, 기 설정된 주기 간 컨텍스트 분석 및 이미지 데이터 분석 중 적어도 하나를 수행하여 언어 패턴을 분석할 수 있다. 이 때, 도 6을 참조하면, 상기 코퍼스 토큰화 기반 어노테이션, 미완결 텍스트 분석 및 기 설정된 주기 간 컨텍스트 분석을 위해서는 머신러닝 알고리즘으로서 NLP가 이용될 수 있고, 이미지 데이터 분석을 위해서는 머신러닝 알고리즘으로서 CNN이 이용될 수 있다.
사용자 단말(200)은 커뮤니케이션 서비스를 제공받고자 하는 사용자의 단말장치로서, 서비스 제공 플랫폼을 통해 사용자 자신이 원하는 소셜 네트워크 서비스와 연동되고, 연동된 소셜 네트워크 서비스 상에서 대화 데이터를 입력하여 커뮤니케이션을 수행할 수 있다.
사용자는 커뮤니케이션 서비스를 제공받기 위해 사용자 단말(200)에 별도의 어플리케이션 또는 프로그램을 설치할 수도 있고, 사용자 단말(200)을 통해 웹 페이지에 접속하여 커뮤니케이션 서비스를 제공받을 수도 있다.
한편, 사용자 단말(200)은 사용자가 원하는 다수의 응용 프로그램을 설치하여 실행할 수 있는 컴퓨터, UMPC(Ultra Mobile PC), 워크스테이션, 넷북(net-book), PDA(Personal Digital Assistants), 포터블(portable) 컴퓨터, 웹 테블릿(web tablet), 무선 전화기(wireless phone), 모바일 폰(mobile phone), 스마트 폰(smart phone), 패드(Pad), 스마트 워치(Smart watch), 웨어러블(wearable) 단말, e-북(e-book), PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 블랙 박스(black box) 또는 디지털 카메라(digital camera), 기타 이동통신 단말 등일 수 있으며, 앞서 언급한 단말로 한정하지 않는다.
또한, 상기에서, 서비스 제공 플랫폼에 연동되는 소셜 네트워크 서비스(SNS)는 반드시 1개일 필요는 없으며, 그 개수에 제한은 없을 수 있다. 그 밖에, 대화 데이터가 수집 또는 획득되는 소스(source)는 반드시 소셜 네트워크 서비스(SNS)에 한정되지 않고, 대화 데이터를 수집 또는 획득 가능한 소스이면 족하다. 그 밖에, 해당 대화 데이터의 목적이나 용도 등에 제한은 없을 수 있다.
본 발명에 따른 인공지능 기반 커뮤니케이션 서비스 제공을 위하여 학습 모델을 구축하거나 학습하기 위하여 대화 데이터 형식 외의 텍스트, 음성, 이미지, 동영상 등의 형태의 데이터나 신문, 뉴스 등 다양한 매체의 데이터가 참조될 수 있다. 상기에서, 필요한 경우, 이미지 처리 알고리즘이나 STT(Speech to Text)나 TTS(Text to Speech) 등 데이터 추출 및 처리와 관련된 다양한 기술이 참조될 수 있다.
한편, 서비스 제공 플랫폼은 전술한 복수의 사용자가 이용할 수 있는 플랫폼으로서, 서비스 단말(200) 또한 복수 개일 수 있으며, 그 개수를 한정하지 않는다.
도 2는 본 개시의 일 실시예에 따른 커뮤니케이션 서비스 제공 장치의 구성을 나타내는 블록도이다.
도 2를 참조하면, 서비스 제공 장치(100)는 통신모듈(110), 저장모듈(130) 및 제어모듈(150)을 포함하여 구성될 수 있다.
통신모듈(110)은 사용자 단말(200)과 통신을 수행하기 위한 것으로, 무선 인터넷 기술들에 따른 통신망에서 무선 신호를 송수신하도록 한다.
무선 인터넷 기술로는, 예를 들어 WLAN(Wireless LAN), Wi-Fi(Wireless-Fidelity), Wi-Fi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), WiBro(Wireless Broadband), WiMAX(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTE-A(Long Term Evolution-Advanced) 등이 있으며, 서비스 제공 장치(100)는 앞에서 나열되지 않은 인터넷 기술까지 포함한 범위에서 적어도 하나의 무선 인터넷 기술에 따라 데이터를 송수신하게 된다.
근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth™RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다. 이러한, 근거리 무선 통신망(Wireless Area Networks)을 통해 서비스 제공 장치(100) 및 사용자 단말(200) 간 무선 통신을 지원할 수 있다. 이때, 근거리 무선 통신망은 근거리 무선 개인 통신망(Wireless Personal Area Networks)일 수 있다.
저장모듈(130)은 서비스 제공 장치(100)의 다양한 기능을 지원하는 데이터 및/또는 각종 정보들을 저장한다. 서비스 제공 장치(100)에서 구동되는 다수의 응용 프로그램, 서비스 제공 장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 한편, 응용 프로그램은, 제어모듈(150)에 저장되고, 서비스 제공 장치(100) 상에 설치되어, 제어모듈(150)에 의하여 동작(또는 기능)을 수행하도록 구동될 수 있다.
구체적으로, 저장모듈(130)에는 적어도 하나의 사용자 정보, 각 사용자의 사용자 단말(200)로부터 또는 그를 통해 획득된 대화 데이터, 학습 데이터, 머신러닝 모델 등을 저장할 수 있다. 한편, 저장모듈(130)에 저장되는 각 정보들은 각각의 시간정보와 함께 저장될 수도 있다.
이를 위해, 저장모듈(130)은 메모리를 포함할 수 있으며, 메모리는 플래시 메모리 타입(flash memory type), 하드 디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 아울러, 메모리는 일시적, 영구적 또는 반영구적으로 정보를 저장할 수 있으며, 내장형 또는 탈착형으로 제공될 수 있다.
제어모듈(150)은 서비스 제공 장치(100) 내 모든 구성들을 제어하여 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나, 저장모듈(130)에 저장된 명령어, 알고리즘, 응용 프로그램을 실행하여 각종 프로세스를 수행하며, 서비스 제공 플랫폼을 이용하는 각 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
구체적으로, 제어모듈(150)은 사용자 단말(200)이 서비스 제공 플랫폼에 연동된 소셜 네트워크 서비스를 기반으로 대화 데이터를 입력하면, 그 입력된 대화 데이터를 획득하고, 그 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석함으로써, 그 분석 결과를 기반으로 답변을 출력한다. 전술한 바와 같이, 상기 소셜 네트워크 서비스는 반드시 서비스 제공 장치(100)에서 제공하는 서비스 제공 플랫폼에 연동될 필요는 없으며, 그 경우 상기 대화 데이터는 해당 소셜 네트워크 서비스의 제공자를 통해 또는 상기 소셜 네트워크 서비스 제공자 및 사용자 단말(200)을 통해 입력받거나 획득될 수 있다.
한편, 제어모듈(150)은 언어 패턴을 분석할 시, 기 설정된 머신러닝 알고리즘을 이용하여 코퍼스 토큰화 어노테이션, 미완결 텍스트 분석, 기 설정된 주기 간 컨텍스트 분석 및 이미지 데이터 분석 중 적어도 하나를 수행하거나 수행하도록 제어할 수 있다.
도 3은 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하는 방법을 나타내는 순서도이다.
동작 11에서, 서비스 제공 장치(100)는 사용자 단말(200)로부터 서비스 제공 플랫폼에 연동된 소셜 네트워크 서비스(SNS)를 기반으로 대화 데이터를 입력받을 수 있다.
동작 12에서, 서비스 제공 장치(100)는 입력되는 대화 데이터를 획득하여 머신러닝 모델에 입력하여 인공지능 기반으로 언어 패턴을 분석할 수 있다.
동작 13에서, 서비스 제공 장치(100)는 다음으로, 상기 분석 결과를 기반으로 유효성에 대한 피드백 데이터를 수집 및 반영하여 데이터 셋을 생성할 수 있다.
동작 14에서, 서비스 제공 장치(100)는 생성된 데이터 셋을 이용하여 머신러닝 모델에 대한 학습을 수행함으로써 기 학습된 머신러닝 모델을 구축할 수 있다. 대화 데이터가 누적 저장됨에 따라, 기 설정된 주기에 따라 전술한 동작 11 내지 14를 반복하여 수행함으로써, 기 학습된 머신러닝 모델의 성능은 향상될 수 있다. 한편, 상기 과정에서 필요한 경우에는 반드시 사용자 단말(100)의 대화 데이터는 아니라고 하더라도 외부 소스로부터 참조 대화 데이터를 수신하여, 상기 머신러닝 모델의 구축 또는 성능 향상에 참조할 수 있다.
도 4는 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하여 적용하는 절차의 일 예를 나타내는 순서도이다.
도 5는 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하여 적용하는 절차의 일 예를 나타내는 도면이다.
도 6은 본 개시의 일 실시예에 따라 커뮤니케이션 서비스 제공 장치에서 대화 데이터를 기반으로 언어 패턴을 수행함으로써 학습된 데이터를 생성하는 일 예를 나타내는 도면이다.
도 4를 참조하면, 동작 21에서, 서비스 제공 장치(100)는 소셜 네트워크 서비스(SNS) 기반 메신저와 연동할 수 있다.
동작 22에서, 서비스 제공 장치(100)는 상기 연동된 소셜 네트워크 서비스(SNS) 기반 메신저를 통하여 대화 데이터를 수집하고, 수집된 대화 데이터를 파싱하여 로우 데이터(raw data)를 획득할 수 있다.
이 때, 상기 수집되는 대화 데이터는 사용자 단말(100)에 의해 입력된 데이터뿐만 아니라 상기 메신저를 통하여 상기 사용자 단말(100)과 대화를 주고받는 타 사용자 단말에 의해 입력된 데이터도 포함될 수 있다. 한편, 상기 타 사용자 단말에 의해 입력된 데이터는 상기 타 사용자 단말 역시 서비스 제공 장치(100)에 의해 제공되는 소셜 네트워크 서비스(SNS)와 연동한 경우에는 직접 수집 가능하나, 그렇지 않은 경우에는 다르게 처리될 수 있다. 예를 들어, 서비스 제공 장치(100)는 상기 타 사용자 단말에 의해 입력된 데이터를 TTS와 STT 절차, 이미지 처리 등의 과정을 거쳐 획득할 수 있다.
동작 23에서, 서비스 제공 장치(100)는 획득된 로우 데이터로부터 라벨링 데이터(labeling data)를 생성할 수 있다.
이 때, 상기 서비스 제공 장치(100)는, 상기 획득된 로우 데이터로부터 언어적 및 비언어적 표현으로부터 감정 추출을 통해 상기 라벨링 데이터를 생성할 수 있다. 여기서, 상기 비언어적 표현이라 함은 예를 들어, 이모티콘, 이미지, 동영상 등에 의한 표현을 포함할 수 있다.
도 6을 참조하면, 서비스 제공 장치(100)는, 기 설정된 머신러닝 알고리즘을 기반으로 코퍼스 토큰화 기반 어노테이션, 미완결 텍스트 분석, 기 설정된 주기 간 컨텍스트 분석 및 이미지 데이터 분석 중 적어도 하나의 수행을 통하여 상기 라벨링 데이터를 생성할 수 있다.
동작 24에서, 서비스 제공 장치(100)는, 상기 생성된 라벨링 데이터에 기초하여 어노테이션 데이터(예를 들어, 도 6의 어노테이티드 셋)의 개인 정보 비식별화를 수행할 수 있다.
서비스 제공 장치(100)는 상기 어노테이션 데이터에서 개인 정보를 비 식별화 처리를 한 후에 남은 데이터 셋을 추출할 수 있다. 동작 25에서, 상기 서비스 제공 장치(100)는 이렇게 추출된 즉, 개인정보가 비식별화 처리된 데이터 셋을 학습 모델에 입력하여 데이터를 훈련(training)시켜 학습된 데이터를 추출할 수 있다.
동작 26에서, 서비스 제공 장치(100)는, 상기 학습의 완료 여부를 판단할 수 있다.
동작 27에서, 서비스 제공 장치(100)는 상기 동작 25에서의 학습이 완료되지 않았다고 판단되면, 파라미터 튜닝 및 라벨링 검증 동작을 수행할 수 있다. 이를 통해 상기 학습은 계속될 수 있다.
동작 28에서, 서비스 제공 장치(100)는 상기 동작 25에서 학습 완료 여부판단 결과, 상기 학습이 완료된 것으로 판단되면 언어 패턴 분석을 위한 본 개시에 따른 학습된 머신러닝 모델 구축을 완료하고, 언어 패턴 분석 서비스에 적용할 수 있다.
도 5를 참조하면, 서비스 제공 장치(100)는 대화 데이터에 대한 로우 데이터를 획득하여 이를 전처리하여 전처리된 데이터를 확보할 수 있다.
서비스 제공 장치(100)는 이렇게 확보된 전처리된 데이터에 머신러닝 알고리즘을 적용하여 언어 패턴 분석을 위한 머신러닝 모델을 구축하고 실행하여 분석 결과 데이터를 출력 제어(예를 들어, 전개(deployment))할 수 있다.
상기 적용되는 머신러닝 알고리즘은 피팅/튜닝(fitting/tuning) 과정을 거쳐 업데이트(update)될 수 있다.
한편, 도 6을 참조하면, 서비스 제공 장치(100)는 로우 데이터로서 기 설정된 기간 동안 누적하여 저장된 대화 데이터를 획득하고, 미리 기 설정된 알고리즘을 이용하여 획득된 대화 데이터에 대한 언어 패턴을 분석할 수 있다.
이 때, 서비스 제공 장치(100)는 언어 패턴을 분석할 때, 전술한 바와 같이, 머신러닝 알고리즘으로서 텍스트 즉, 자연어 처리와 관련된 NLP를 이용하여 코퍼스 토큰화 기반 어노테이션, 미완결 텍스트 분석 및 기 설정된 주기 간 대화 컨텍스트 분석을 수행하고, 이미지 등 처리와 관련된 CNN을 이용하여 이미지 데이터 분석을 수행할 수 있다. 상기 분석 수행의 결과로, 어노테이티드 셋(annotated set)이 구축될 수 있다. 한편, 상기 NLP는 통상적인 자연어 처리를 넘어 신경언어프로그래밍(Neural Language Progarmming)을 나타낼 수도 있다.
상기에서, 코퍼스 토큰화 기반 어노테이션은 예를 들면, 사용자의 소셜 네트워크 서비스 상에 대화(text) 문장을 코퍼스 단위(예를 들어, 컴퓨터가 인식할 수 있는 의미 최소 단위)로 분절(tokenizing)하고, 분절된 개별 코퍼스에 대하여 감정에 대한 긍정/중립/부정, 이해(득/실), 시간(과거/현재/미래), 감각(시각/청각/촉각/생각) 등으로 어노테이션한 것으로 정의할 수 있다. 전술한 바와 같이, 본 개시는 상기 열거된 어노테이션 분류에만 한정되는 것은 아니다.
상기에서, 미완결 텍스트 분석은, 입력받는 대화 데이터의 전체 맥락에서 표현 빈도 및 표현 맥락을 분석하는 것으로 예를 들어, 단일 자음(ㅋㅋㅋ, ㅎㅎㅎ 등)/모음(ㅠㅠ 등)에 대한 사용자의 대화 내 활용 태양 등 컨텍스트 분석을 통한 잘못된 라벨링을 개선할 수 있다. 예를 들어, 일반적인 라벨링의 경우와 다르게, 사용자가 슬프거나 당황스러울 때 "ㅋㅋㅋㅋ"를 사용한다거나, 재밌거나 귀여울 때 "ㅠㅠㅠㅠ"를 사용하는 등의 활용 태양을 분석을 통하여 라벨링 오류를 바로 잡거나 갱신할 수 있다.
또한, 상기에서, 기 설정된 주기 간 대화 컨텍스트 분석은, 일정 대화 주기간 대화의 컨텍스트를 별도 판정하되 예를 들어, "슬픈 기분" 일 때의 대화 맥락 및 사용 표현과, "즐거운 기분"일 때의 대화 맥락 및 사용 표현 등에 대한 구분을 나타낼 수 있다.
이 때, 구축된 사용자 별 감정 분석 데이터에 기반하여, 1차 대화 컨텍스트를 판정하고, 감정이 판정된 시점으로부터 기 설정된 시간 구간(예를 들어, 6시간 / 하루 / 일주일 / 한달 등) 동안의 대화 맥락을 비교 및 교차 검증하여, 동일한 표현의 다른 감정 라벨링을 추출하고 피드백을 요청할 수 있다.
그 밖에, 이미지 데이터 분석은, 소셜 네트워크 서비스(SNS) 상 대화 맥락에 첨부된 이미지(예를 들어, 사진, GIF(Graphic Interchange Format) 등), 이모티콘, 이모지, 스티커 등의 비언어 또는 비텍스트이지만 감정을 포함하는 표현(expression)의 표정, 사용 빈도, 사용 맥락 등에 대한 분석을 통해 컨텍스트를 도출할 수 있다.
서비스 제공 장치(100)는 이렇게 구축된 이노테이티드 셋에 대한 개인정보 비식별화를 수행하여 데이터 셋(data set)을 구축하고, 그 데이터 셋을 학습 데이터로 하여 머신러닝 모델에 입력함으로써 학습을 수행한다. 이로써, 학습된 데이터가 생성될 수 있다.
도 7 내지 9는 본 개시의 일 실시예에 따른 커뮤니케이션 서비스 동작을 설명하기 위한 예시를 나타낸 도면이다.
상술한 바와 같이, 본 개시는 인공지능 기반으로 대화 데이터를 실시간 분석하여 분석 결과와 발화 의도에 따른 대응 정보 즉, 추천 답변을 제공하는 것이다.
본 개시에 따라 화자의 언어 패턴을 분석하여, 이를 수치화 또는 객관화하여, 화자의 발화 의도와 스트레스 정도를 분석할 수 있는데, 이것은 스피치(프레젠테이션 등) 훈련, 상담/협상 보조, 마케팅 등에 활용될 수도 있다.
본 개시에서는 이를 위해, 분석되는 언어의 패턴 유형을 미리 정의하고, 이를 위한 언어 패턴의 기초 데이터를 수집 가공할 수 있다. 이 때, 상기 정의되는 언어 패턴은, 단지 추상적인 '감정'이 아닌, 수치화/객관화 가능한 복수의 카테고리에 대한 언어 패턴 분석해 발화 의도와 발화 맥락을 분석하여 언어 분석을 정량화하는 것이다. 이 때, 상기 복수의 카테고리에는 예를 들어, 감각, 시간, 이해득실, 판단 등이 포함될 수 있다. 다만, 본 개시가 이에 의해 제한되는 것은 아니다.
본 개시는 예를 들어, 커뮤니케이션에 어려움을 겪는 기업이나 개인을 위해 커뮤니케이션을 원활히 할 수 있도록 적정 대화(예를 들어, 추천 대응)를 지원하여 스트레스를 줄일 수 있도록 하여, 편안하고 효과적인 커뮤니케이션이 가능하도록 돕는 안심 커뮤니케이션 관리 서비스를 제공할 수 있다.
본 개시에 따른 서비스 제공 장치(100)는 인공지능 기반 언어 패턴 분석을 통해 상대방의 의도와 스트레스 정도를 파악해서 수치화 객관화 된 언어 패턴 분석 정보를 상기 분석 정보에 기반한 대응 대화 정보와 함께 제공할 수 있다. 이를 통해, 사용자는 분석 정보의 오류 등을 발견하거나 정정하도록 피드백하여, 추후 상기 서비스 제공 장치(100)의 분석 학습 모델을 업데이트할 수 있다.
따라서, 본 개시는 예를 들어, 심리 상담, 고객 상담, 법률, 세무, 의학과 같은 전문가나 기업체, 선생님과 같은 상담과 소통이 잦은 직업군에 유용할 수 있을 뿐만 아니라 향후 스피치(프레젠테이션) 훈련, 협상/상담 등 특수 커뮤니케이션 보조, 마케팅, 인사 관리 등 다양한 커뮤니케이션 상황에 서비스를 확대 적용할 수 있다.
본 개시에 따른 커뮤니케이션 서비스를 어플리케이션이나 웹 형태로 제공할 수 있으며, 이를 통해 사용자는 시간과 장소의 제약없이 필요할 때 이용할 수 있도록 서비스를 구성할 수 있다.
도 7을 참조하면, 본 개시에 따른 커뮤니케이션 서비스를 위하여, 서비스제공 장치(100)는, 뉴스나 기사 등에 사용되는 어휘뿐만 아니라 통상의 사용자들이 일상생활 속에서 타인과 커뮤니케이션 과정에서 사용되는 어휘를 참조할 수 있다. 특히, 후자의 경우에는 구어체적인 특성이 있기 때문에, 예를 들어 문어체에서 이용되는 단어의 사용이나 의미와 다를 수 있어, 통상의 사용자들의 일상 커뮤니케이션에서 이용되는 예를 들어, 실제 메신저 채팅 등을 통해 나누는 대화나 게시글, 일기, 댓글과 같이 그들이 실제 작성한 글을 대상으로 데이터 수집할 수 있다. 특히, 그러한 단어들 중에서 사전 등에 등재되지 않는 축약어 내지 신조어 등이 다수 포함될 수 있어, 이에 대한 데이터 수집은 본 개시에 의한 커뮤니케이션 서비스 제공 시, 문맥을 이해하거나 오류를 줄이는데 기여될 수 있다.
본 개시에 따른 서비스 제공 장치(100)는, NLP에서 커뮤니케이션 서비스의 개선을 위하여 활용 가능한 대표적인 언어 모델인 메타 모델(표 1)과 밀튼 모델(표 2)를 참조할 수 있다.
메타 모델 상위 카테고리 하위 카테고리
삭제 사물, 사람 누락
가리키는 것이 누락
구체적이지 않은 동사
명사화
왜곡 원인, 결과
마음 읽기
정보의 근원이 없음
일반화 보편적인 수량화
모달 오퍼레이트
밀튼 모델 유형 예시
연결이나 결합 고리를 활용 - 당신이 깊은 숨을 들이쉴 때 당신은 눈을 감게 될 것이다.
- 그 이미지를 더 선명하게 한 후에 당신은 정말로 편안해질 것이다.
- 눈을 감으면 당신은 그 사람을 상상으로 볼 것이다.
- 내 손이 당신의 어깨를 칠 때, 당신은 생각하지 못했던 무엇인가를 기억해 낼 것이다.
모호한 표현을 활용 - 누구십니까?
- 어떠세요?
- 무엇을 원하세요?
- 요즈음 어떤 것에 관심이 많으세요?
전제를 적극 활용 - 지금 사인하시겠습니까? 5분 뒤에 하시겠습니까?
(전제: 이미 사인할 것으로 예상되어 있고, 문제는 그것이 언제인가 이다.)
- 당신은 기분이 얼마나 더 좋습니까? (전제: 당신은 기분이 좋다.)
- 당신은 계속해서 편안할 수 있다. (전 : 당신이 이미 편안하다.)
본 개시의 일 실시예에 따른 서비스 제공 장치(100)는 미리 정한 개수의 분석 척도에 해당하는 말뭉치(언어 기반)을 구축할 수 있다.
본 개시에서 사용되는 "말뭉치(Corpus)"는 언어학에서 주로 구조를 이루고 있는 텍스트 집합을 말한다. 말뭉치는 단일한 언어(단일언어 말뭉치) 또는 여러 언어(다중언어 말뭉치)의 텍스트를 포함하고 있는 경우가 있다. 언어 연구를 더 효과적으로 하기 위해 말뭉치가 종종 말뭉치 주석(annotation, 어노테이션)이라는 과정을 거치기도 한다. 말뭉치 단어의 한 예는 각 단어의 품사 표기(동사, 명사, 형용사 등)에 대한 정보가 말뭉치에 '태그'의 형태로 추가되는 '품사 표기(part-of-speech tagging, POS-tagging)'이다. 어떤 말뭉치는 한층 더 구조적인 수준의 분석이 적용될 수 있는데 특히, 많은 소 말뭉치는 구문 분석이 완전히 이루어질 수 있다. 그러한 말뭉치들은 트리뱅크(Treebank) 또는 분석된 말뭉치(parsed corpora)라고 한다. 형태론, 의미론 또는 화용론적 주석을 포함하는 다른 수준의 언어학적 구조 분석이 가능하다. 말뭉치는 말뭉치 언어학에서의 주요한 지식 기반이며, 또한 다양한 형태의 말뭉치를 분석하고 처리하는 것은 품사 표기 및 다른 목적을 위하여 은닉 마르코프 모델(Hidden Markov Model, HMM)을 만들어 사용하는 전산언어학, 음성 인식, 기계 번역 분야의 연구 대상이기도 하다. 여기에서 파생된 말뭉치와 빈도 목록은 언어 교육에 유용하게 사용될 수 있다.
표 3에서는 예를 들어, 구축되는 말뭉치의 예시를 나타내었다.
감각(시각형) 언어 예시 긍정/중립/부정 언어 예시
- 눈에 선하다
- 모습이 보이는 것 같다
- 새파란 하늘
- 노을이 진 풍경
- 눈에 띄는
- 흐릿하게 보이는
긍정
- ~덕분이다
- 행복하다
- 즐겁다
- 설렌다
- 기대 이상
중립
- 그저 그렇다
- 보통이다
- 잘 모르겠다
부정
- ~탓이다
- 불행하다
- 슬프다
- 지친다
- ~만도 못한
이해득실 언어 예시 시간 언어 예시

- 도움이 된다
- 이득이다
- 개꿀

- ~라면
- ~안한다
- 폐를 끼친다
- 손해
과거
- 예전에
- 매번
- 어제
- 지난 번
현재
- 지금
- 오늘
- 이 순간
미래
- N년/개월/일 후
- 나중에
- 다 크면
- 늙으면
본 개시에 따른 서비스 제공 장치(100)는 예를 들어, 도 7의 (a)에서와 같이 캡쳐나 사진과 같이 정지영상 이미지이나 텍스트 형태로 데이터를 수집하여, 미리 정의된 분류 척도에 해당하는 어휘를 도 7의 (b) 내지 (d)에서와 같이, 바운딩, 전사(OCR: Optical Character Recognition), 및 태깅(tagging)하는 형식으로 가공할 수 있다.
도 7의 (a)는 수집되는 메신저 대화 내용을 도시한 것으로, 상기 대화 내용은 메신저를 캡처한 이미지나 텍스트 데이터 형태일 수 있다.
도 7의 (b)는 이렇게 수집된 메신저 대화 내용으로부터 본 개시에서 미리 분류한 척도에 관련된 어휘를 바운딩한 것을 설명하기 위해 도시한 것이다. 여기서, 도 7의 (b)는 예를 들어, 상기 미리 분류된 척도로 시간을 예로 하여 관련 언어를 바운딩한 화면으로 볼 수 있다.
도 7의 (c)는 상기 도 7의 (b)를 통해 바운딩된 어휘를 추출한 것이다. 이 때, 상기 추출은 전사 즉, OCR 기법이 이용될 수 있으나, 이에 한정되는 것은 아니다. 도 7의 (c) 우측에 도시된 텍스트가 상기 추출된 어휘이다.
도 7의 (d)는 상기 도 7의 (c)를 통해 추출된 어휘를 태깅한 것이다. 도 7의 (d) 우측을 참조하면, 시제 관련 단어, 기타 시간 관련 단어 등이 구분되도록 태깅된 것을 알 수 있다.
시제 관련 단어로, 과거 관련 단어(저번), 현재 관련 단어(아직, 이번에도), 및 미래 관련 단어(내일까지, 늦으면, 받으면)가 태깅되었다.
기타 시간 관련 단어로, 빈도 관련 단어(맨날, 또, 매번 등), 특정 시간 지칭 단어(하루, 삼일, 마감일 등), 및 시간 흐름 관련 단어(지나서 등)가 태깅되었다.
도 7의 (d)의 태깅은 일실시예로서, 도 7의 (b) 내지 (c) 과정을 통해서 바운딩되고 추출된 단어에 따라서 달라질 수 있다.
한편, 도 7은 설명의 편의상 분류 척도를 시간으로 한정하여 설명하였으나, 본 개시가 이에 한정되는 것은 아니다.
예컨대, 도 8은 전술한 도 7의 (b) 내지 (d)의 과정을 거쳐 메신저 사용 내역에 대한 언어 패턴 분석의 예시이다.
도 8은 실제 서비스 제공 장치(100)의 언어 패턴 분석 과정으로 볼 수 있으며, 이것은 단말(200) 제공될 수도 있다. 단말(200)은 이를 확인하여 피드백 데이터를 제공하여, 언어 패턴 분석의 향상이나 개인화에 기여할 수 있다.
도 8의 좌측 대화 화면을 보면, 도 8의 우측 상단에 개시된 예를 들어, 컬러로 구분된 개별 범례(분류 척도)가 표시된 것을 알 수 있다.
한편, 도 8의 우측 하단에는, 상기 각 범례에 따른 빈도 분석 결과를 예시하였다. 예를 들어, 긍정/중립/부정 언어 범례에 대하여, 추출된 단어로 '못하다', '안되다'와 같은 부정적인 언어 패턴의 사용 빈도가 높다는 분석 결과가 제공될 수 있다. 이해득실 언어 범례에 대하여, 부정 언어 사용 패턴의 빈번한 사용과 함께 '실(-)'에 해당하는 언어 패턴 사용 빈도가 높게 나타난다는 분석 결과가 제공될 수 있다. 시간 언어 범례에 대하여, '맨날'이라는 단어의 사용 빈도가 다른 대화 내에서 사용된 '또', '내일'과 같은 시간 언어 사용 빈도 대비 월등히 높다는 분석 결과가 제공될 수 있다. 그리고 감각 언어 범례에 대하여, 해당 대화에서 감각 언어 사용은 크게 두드러지진 않았으나, '동네북이 되다'라는 촉각적 표현이 사용되었음에 관한 분석 결과가 제공될 수 있다.
본 개시의 일실시예에 따른 서비스 제공 장치(100)는 각 범례에 대하여 그 자체로 독립적인 분석을 수행할 수도 있고, 다른 범례와 조합하여 분석을 수행할 수도 있다. 또한, 상기 서비스 제공 장치(100)는 개인화 서비스와 관련하여, 현재의 대화 내용을 그 자체로 분석할 수도 있고, 이전 분석한 결과를 참고하여, 비교 분석 결과를 제공할 수도 있다. 한편, 상기 서비스 제공 장치(100)는 상기와 같은 분석 결과에 기초하여 향후 대화 내용을 예상 또는 예측할 수도 있다. 이 때, 상기 서비스 제공 장치(100)는 상기 미래 대화 내용 예상 내지 예측과 관련하여, 필요한 경우, 사용자의 일정 정보, 건강 정보, 이메일 등 다양한 개인 정보 중 적어도 하나 이상을 참고할 수 있다.
상기 도 7 내지 8의 내용을 참고하여, 본 개시의 일 실시예에 따른 서비스 제공 장치(100)는 도 9의 하단과 같이 추천 답변(예상 또는 예측 답변)을 제공할 수 있다.
도 9를 참조하면, 상기 추천 답변은 제1 정보로, 대화 내용 분석 결과(요약 정보 등) 데이터와 제2 정보로 상기 제1 정보 기반 추천 답변 메시지를 포함할 수 있다. 여기서, 상기 추천 답변의 이용과 관련하여, 해당 추천 답변 메시지를 그대로 이용하는 것에 관란 기능 버튼과 사용자에 의한 직접 작성이나 상기 추천 메시지 수정 등에 관한 기능 버튼 등이 제공될 수 있다.
한편, 도 9에 도시된 추천 답변은, 메시지 형태이나 본 개시는 반드시 이에 한정되는 것은 아니다. 예를 들어, 상기 추천 답변은, 음성, 이미지, 동영상 등 다양한 형태의 정보가 제공되거나 그들의 조합 형태일 수 있다. 즉, 단지 추천 답변으로 예를 들어, '힘내'라는 텍스트 형태만 제공되기 보다는 '힘내'라는 메시지와 별개로 또는 함께 사용자 등의 육성 기반 음성으로 힘내라는 메시지를 제공하는 것이 추천될 수 있다. 또는, 상기 텍스트 형태에 대응하는 동영상이 함께 제공될 수도 있다.
도 10은 본 개시의 일 실시예에 따라 기 학습된 머신러닝 모델을 구축하여 적용하는 절차의 일 예를 나타내는 도면이다.
도 10을 참조하면, 서비스 제공 장치(100)는 사용자 단말(200)에 의해 서비스 제공 플랫폼 상에 소셜 네트워크 서비스(SNS)가 연동되고, 그 연동된 소셜 네트워크 서비스(SNS)에 대화 데이터가 입력되면, 그 입력된 대화 데이터를 획득하여 머신러닝 모델에 입력함으로써 언어 패턴에 대한 분석을 수행(실시)할 수 있다.
서비스 제공 장치(100)는 상기 분석 결과에 대한 유효성에 대한 피드백 데이터를 수집 및 반영하여 데이터 셋을 생성할 수 있다.
서비스 제공 장치(100)는, 상기 생성된 데이터 셋을 이용하여 기 학습된 머신러닝 모델에 대한 학습을 수행함으로써 기 학습된 머신러닝 모델을 구축한다.
또한, 서비스 제공 장치(100)는 상술한 절차를 반복하여 수행하도록 제어하여 기 학습된 머신러닝 모델의 성능을 향상시킬 수 있다.
이상 상술한 바와 같이, 본 개시의 실시예에 따르면, 감정이 아닌 언어 습관에 주목하여 언어 패턴을 분석을 통한 의도나 맥락을 분석할 수 있어, 개인에게 감성 커뮤니케이션 제안을 통한 즐겁고 편안한 대화 경험을 제공할 수 있고, 기업이나 전문가에게는 커뮤니케이션 관리를 통한 리스크 감소와 고객 신뢰 확보에 대한 기대를 제공할 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
본 개시의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
이상, 첨부된 도면을 참조로 하여 본 개시의 실시예를 설명하였지만, 본 개시가 속하는 기술분야의 통상의 기술자는 본 개시가 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
10 : 커뮤니케이션 서비스 제공 시스템 100: 서비스 제공 장치
200: 사용자 단말 110: 통신모듈
130: 저장모듈 150: 제어모듈

Claims (10)

  1. 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 장치에 있어서,
    상기 서비스 제공 플랫폼을 통해 사용자의 소셜 네트워크 서비스를 연동되고, 상기 연동된 소셜 네트워크 서비스를 기반으로 대화 데이터를 입력하여 커뮤니케이션을 수행하는 사용자 단말; 및
    상기 사용자 단말이 상기 소셜 네트워크 서비스를 기반으로 입력한 대화 데이터를 획득하고, 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하고, 상기 분석 결과를 기반으로 추천 답변을 출력하는 서비스 제공 장치를 포함하며,
    상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고,
    상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  2. 제1항에 있어서,
    상기 서비스 제공 장치는,
    상기 소셜 네트워크 서비스 기반 대화 데이터를 수집하고, 수집된 대화 데이터를 파싱하여 로우 데이터를 획득하여, 획득된 로우 데이터로부터 라벨링 데이터를 생성하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  3. 제2항에 있어서,
    상기 서비스 제공 장치는,
    상기 획득된 로우 데이터로부터 언어적 및 비언어적 표현으로부터 감정 추출을 통해 상기 라벨링 데이터를 생성하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  4. 제3항에 있어서,
    상기 서비스 제공 장치는,
    기 설정된 머신러닝 알고리즘을 기반으로 코퍼스 토큰화 기반 어노테이션, 미완결 텍스트 분석, 기 설정된 주기 간 컨텍스트 분석 및 이미지 데이터 분석 중 적어도 하나의 수행을 통하여 상기 라벨링 데이터를 생성하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  5. 제4항에 있어서,
    상기 서비스 제공 장치는,
    상기 생성된 라벨링 데이터에 기초하여 어노테이션 데이터의 개인 정보 비식별화를 수행하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  6. 제5항에 있어서,
    상기 서비스 제공 장치는,
    미리 생성된 학습 모델을 통해 학습하여 학습이 완료되면 언어 패턴 분석을 위한 상기 기 학습된 머신러닝 모델을 구축하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  7. 제6항에 있어서,
    상기 서비스 제공 장치는,
    상기 미리 생성된 학습 모델을 통한 학습 과정에서 파라미터 튜닝 및 라벨링 검증을 통해 상기 학습 완료 여부를 판단하는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  8. 제7항에 있어서,
    상기 기 학습된 머신러닝 모델은,
    기 설정된 기간 동안 누적 저장된 대화 데이터를 기반으로 언어 패턴을 분석하고, 상기 분석된 언어 패턴에 대한 유효성 피드백 데이터를 수집 및 반영하여 구축된 학습 데이터를 이용하여 학습을 수행한 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  9. 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 장치에 있어서,
    저장 모듈; 및
    상기 저장 모듈과 통신하는 제어 모듈을 포함하되, 상기 제어 모듈은,
    사용자 단말이 상기 서비스 제공 플랫폼을 통해 연동된 사용자의 소셜 네트워크 서비스를 기반으로 입력한 대화 데이터를 획득하고, 상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하고, 상기 분석 결과를 기반으로 추천 답변을 출력하도록 제어하되,
    상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고,
    상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 장치.
  10. 인공지능을 기반으로 서비스 제공 플랫폼을 통해 커뮤니케이션 서비스를 제공하는 방법에 있어서,
    상기 서비스 제공 플랫폼을 통해 연동된 사용자의 소셜 네트워크 서비스를 기반으로 대화 데이터를 획득하는 단계;
    상기 획득된 대화 데이터를 기 학습된 머신러닝 모델에 입력하여 언어 패턴을 분석하는 단계; 및
    상기 분석 결과를 기반으로 추천 답변 데이터 출력을 제어하는 단계를 포함하되,
    상기 언어 패턴은, 기 분류된 대화 종류에 대한 빈도를 분석한 것이고,
    상기 기 분류된 대화 종류에는, 긍정/중립/부정 관련 언어, 이해득실 관련 언어, 시간 관련 언어 및 감각 관련 언어가 포함되는 것을 특징으로 하는,
    커뮤니케이션 서비스 제공 방법.
KR1020220019623A 2021-12-17 2022-02-15 인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법 KR20230092675A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210181762 2021-12-17
KR20210181762 2021-12-17

Publications (1)

Publication Number Publication Date
KR20230092675A true KR20230092675A (ko) 2023-06-26

Family

ID=86947563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220019623A KR20230092675A (ko) 2021-12-17 2022-02-15 인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20230092675A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102613698B1 (ko) * 2023-07-31 2023-12-14 주식회사 효돌 사용자 음성 데이터에 기초하여 사용자 유형화를 수행하는방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120137568A (ko) 2011-04-28 2012-12-24 주식회사 코웍스 소셜 네트워크 서비스에 기반한 연예인과 팬 사이의 커뮤니케이션 서비스 제공방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120137568A (ko) 2011-04-28 2012-12-24 주식회사 코웍스 소셜 네트워크 서비스에 기반한 연예인과 팬 사이의 커뮤니케이션 서비스 제공방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102613698B1 (ko) * 2023-07-31 2023-12-14 주식회사 효돌 사용자 음성 데이터에 기초하여 사용자 유형화를 수행하는방법 및 장치

Similar Documents

Publication Publication Date Title
US11871148B1 (en) Artificial intelligence communication assistance in audio-visual composition
US11599808B2 (en) Artificial intelligence assisted hybrid enterprise/candidate employment assistance platform
US20210397793A1 (en) Intelligent Tone Detection and Rewrite
KR102462426B1 (ko) 발화의 의미를 분석하기 위한 전자 장치 및 그의 동작 방법
US20180267955A1 (en) Cognitive lexicon learning and predictive text replacement
KR102041621B1 (ko) 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
US20130211838A1 (en) Apparatus and method for emotional voice synthesis
KR102436549B1 (ko) 딥러닝을 이용한 자연어처리 기반의 faq 및 챗봇을 위한 학습데이터를 자동으로 생성하기 위한 방법 및 이를 위한 장치
Shen et al. Kwickchat: A multi-turn dialogue system for aac using context-aware sentence generation by bag-of-keywords
CN112287085B (zh) 语义匹配方法、***、设备及存储介质
KR20180055680A (ko) 사용자 대화 의도 추출 기능 구비 채트봇을 활용한 헬스케어 지침 제공 방법 및 이를 위한 장치
US11328127B2 (en) Apparatus and method for providing shared contents based on emoticon grammar for NLP on open user participation platform for AI answer dictionary and data set preprocessing
CN116414959A (zh) 数字人的互动控制方法、装置、电子设备和存储介质
KR20230092675A (ko) 인공지능 기반의 언어 패턴 분석을 통한 커뮤니케이션 서비스 제공 장치 및 방법
López-Ludeña et al. LSESpeak: A spoken language generator for Deaf people
Pokhrel et al. AI Content Generation Technology based on Open AI Language Model
CN117352132A (zh) 心理辅导方法、装置、设备及存储介质
Manaswi et al. Developing chatbots
KR102252096B1 (ko) 빅데이터 기반 회의록 가공 서비스 제공 시스템
CN113609833A (zh) 文件的动态生成方法、装置、计算机设备及存储介质
KR101890704B1 (ko) 음성 인식과 언어 모델링을 이용한 간편 메시지 출력장치 및 출력방법
CN115146624A (zh) 用于生成数据的方法和装置
Gaughwin “The Apple Way”: Foucault, Design, Consumerism, and the Shaping of Apple Subjects
KR102601177B1 (ko) 국가직무능력표준 기반 유사도 추출 모델을 이용한 심층 질문형 비대면 면접 시스템
CN117828065B (zh) 一种数字人客服方法、***、装置及储存介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal