KR20190116590A - Apparatus for predicting stock price of company by analyzing news and operating method thereof - Google Patents

Apparatus for predicting stock price of company by analyzing news and operating method thereof Download PDF

Info

Publication number
KR20190116590A
KR20190116590A KR1020180031638A KR20180031638A KR20190116590A KR 20190116590 A KR20190116590 A KR 20190116590A KR 1020180031638 A KR1020180031638 A KR 1020180031638A KR 20180031638 A KR20180031638 A KR 20180031638A KR 20190116590 A KR20190116590 A KR 20190116590A
Authority
KR
South Korea
Prior art keywords
news
stock price
value
impact value
company
Prior art date
Application number
KR1020180031638A
Other languages
Korean (ko)
Other versions
KR102104316B1 (en
Inventor
손윤식
이강우
김경민
성주한
조용진
조현우
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020180031638A priority Critical patent/KR102104316B1/en
Publication of KR20190116590A publication Critical patent/KR20190116590A/en
Application granted granted Critical
Publication of KR102104316B1 publication Critical patent/KR102104316B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

According to the present invention, an apparatus for predicting a stock price of a company by analyzing news and an operating method thereof are capable of calculating similarity between a word vector for extracted words matched to a plurality of preset words among at least one extracted word and a news classification vector matched to each of a plurality of news classification groups, calculating the average similarity for each of the news classification groups based on the calculated similarity, classifying newly uploaded news into a first news classification group among the news classification groups based on the calculated average similarity, calculating a positive influence value, a neutral influence value, and a negative influence value of the newly uploaded news by inputting at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group, and determining a fluctuation rate of a stock price of a preset company based on the calculated positive influence value, neutral influence value, and negative influence value, thereby deriving different output values according to properties of news.

Description

뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법{APPARATUS FOR PREDICTING STOCK PRICE OF COMPANY BY ANALYZING NEWS AND OPERATING METHOD THEREOF}`` APPARATUS FOR PREDICTING STOCK PRICE OF COMPANY BY ANALYZING NEWS AND OPERATING METHOD THEREOF ''

본 발명은 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법에 대한 것이다.The present invention relates to an apparatus for predicting a stock price of an enterprise by analyzing news and a method of operating the same.

주식 시장은 특유의 가격 결정 메커니즘이 존재하고, 이러한 가격 결정 메커니즘은 무수히 많은 변수 데이터에 의해서 영향을 받게 된다. 즉, 주가에 영향을 미치는 펀더멘털 요인들은 너무나도 다양하고 복잡하며 이러한 요인들은 시시각각으로 변동되므로, 과거의 변동 요인들이 현재 주가에 영향을 미치는 식의 순환이 발생하기도 한다.The stock market has its own pricing mechanism, which is influenced by a myriad of variable data. In other words, the fundamental factors affecting the stock price are so diverse and complex that these factors fluctuate from time to time, resulting in a cycle in which past volatility factors affect the current stock price.

최근에는 인터넷 기술의 발달로 인하여, 인간에 의해서 새롭게 만들어지는 거의 모든 정보가 인터넷을 통해서 전파, 공유, 활용되고 있다. 또한, 인터넷을 통해서 이용가능한 정보는 디지털화된 정보이므로 이를 주가 예측을 위한 입력 데이터로 손쉽게 활용될 수 있다. 이렇게 인터넷에 공유되고 있는 많은 데이터들, 이른바 빅 데이터를 활용하여 주가 변동을 예측하기 위해서는 통계 모델을 활용한 빅테이터 분석이 함께 이루어지고 있다.Recently, due to the development of internet technology, almost all information newly created by human beings is spread, shared and utilized through the internet. In addition, since information available through the Internet is digitized information, it can be easily used as input data for stock price prediction. In order to predict share price fluctuations using so-called big data, which is shared on the Internet, big data analysis using statistical model is being performed together.

하지만, 종래의 빅 데이터 분석을 통한 주가 예측은 입력 데이터 간의 영향을 충분히 고려할 수 없었다. 따라서, 주가 변동 예측 결과의 신뢰성을 향상시키기 위해서는 새로운 종류의 통계 모형에 대한 필요성이 요청되고 있다.However, the conventional stock price prediction through big data analysis could not fully consider the influence between input data. Therefore, there is a need for a new kind of statistical model to improve the reliability of the stock price forecasting result.

이러한 필요성에 따라 한국 등록특허 제10-1458004호에서는 증시 관련 데이터를 입력 데이터로 입력받는 입력부, 입력된 복수의 증시 관련 데이터를 제1 복수 노드에 할당하고, 제1 복수 노드에 할당된 데이터별로 제1 가중치를 적용하여 제2 복수 노드에 할당함으로써 인공 신경망 모형을 모델링하는 모델링부, 제2 복수 노드에 할당된 데이터들에 제2 가중치를 적용하여 가중합을 연산한 뒤 활성화 함수에 입력하여 싱글값으로 산출하고, 싱글값을 기 정의된 임계값과 비교하여 싱글값이 임계값보다 크면 출력값으로 하이 값을 출력하고 싱글값이 임계값보다 작으면 출력값으로 로우 값을 출력하는 출력부를 포함한다.In accordance with such a necessity, Korean Patent No. 10-1458004 discloses an input unit for receiving stock-related data as input data, allocating a plurality of inputted stock-related data to the first plurality of nodes, and assigning the data to each of the first plurality of nodes. A modeling unit for modeling an artificial neural network model by assigning a weight to a second plurality of nodes by applying a weight, and calculating a weighted sum by applying a second weight to data allocated to the second plurality of nodes, and inputting the single value into an activation function. And outputting a high value as an output value when the single value is greater than the threshold value by comparing the single value with a predefined threshold value, and outputting a low value as the output value when the single value is less than the threshold value.

그러나, 한국 등록특허 제10-1458004호에서 개시된 주가 예측은 하나의 기업에 대해 하나의 신경망을 운영함으로써, 뉴스의 속성을 구분하지 않은 채 출력 값을 제시한다는 문제점이 있다.However, the stock price prediction disclosed in Korean Patent Registration No. 10-1458004 has a problem of presenting output values without distinguishing attributes of news by operating one neural network for one company.

따라서, 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있는 알고리즘에 대한 연구가 필요하다.Therefore, it is necessary to study an algorithm that can derive different output values according to the nature of news.

본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법은 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있게 하고자 한다.An apparatus for predicting a stock price of an enterprise by analyzing news according to the present invention and a method of operating the same may further include a word vector for an extracted word matching the preset plurality of words among the at least one extracted word and the plurality of news classification groups. Calculating a similarity between the news classification vectors matched to each of the plurality of news classification groups, and calculating the average similarity for each of the plurality of news classification groups based on the calculated similarity, and based on the calculated average similarity, Classifying the classified news into a first news classification group among the plurality of news classification groups, and then inputting at least one word extracted from newly uploaded news as an input value of a news analysis neural network matched to the first news classification group. Calculate positive impact value, neutral impact value and negative impact value of newly uploaded news Based on the positive, neutral and negative impact values, we determine the rate of change of the stock price of a predetermined company so that different output values can be derived according to the nature of the news.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부, 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부, 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부, 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 형태소 분석부, 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 뉴스 분류부 및 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 주가 예측부를 포함한다.An apparatus for predicting a stock price of an enterprise by analyzing news according to an embodiment of the present invention includes a news site storage unit in which a plurality of preset web site addresses to which news data is uploaded are stored, and a plurality of preset news classification groups, respectively. A vector storage unit for matching and storing a news classification vector in a plurality of words, and matching and storing a word vector for each of a plurality of preset words, and a positive influence value, a neutral influence value, and a negative influence value of a news in each of the plurality of news classification groups. A news analysis neural network storage unit for matching and storing news analysis neural networks capable of calculating an influence value, and when news is uploaded from at least one of the plurality of web site addresses, a plurality of news included in the newly uploaded news. Extract sentences and perform a morphological analysis on each of the plurality of sentences A morpheme analysis unit for extracting at least one word constituting each sentence, a word vector for the extracted word matching the preset plurality of words among the extracted at least one word and each of the plurality of news classification groups After calculating the similarity between the news classification vector matched with and calculates the average similarity for each of the plurality of news classification groups based on the calculated similarity, based on the calculated average similarity, the newly uploaded news A news classification unit for classifying a first news classification group among the plurality of news classification groups, and an input of a news analysis neural network matching the at least one word extracted from the newly uploaded news to the first news classification group. Positive impact value, neutral impact value of the newly uploaded news by entering a value After calculating the negative impact value it includes the calculated positive impact value, to determine the price of the stock price deungrakryul of preset companies predicted based on a neutral influence value and negative impact value portion.

또한, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지하는 단계, 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지하는 단계, 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지하는 단계, 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 단계, 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 단계 및 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 단계를 포함한다.In addition, the operating method of the device for predicting the stock price of the enterprise by analyzing the news according to an embodiment of the present invention comprises the steps of maintaining a news site storage that stores a plurality of preset web site addresses to which the news data is uploaded, Maintaining a vector storage unit for matching and storing a news classification vector to each of the plurality of preset news classification groups, and matching and storing a word vector for each of the preset plurality of words, in each of the plurality of news classification groups. Maintaining a news analysis neural network storage for matching and storing news analysis neural networks capable of computing positive impact values, neutral impact values and negative impact values of news, news at at least one website of the plurality of website addresses; Is uploaded, a plurality of sentences included in the newly uploaded news are extracted. Extracting at least one word constituting each of the plurality of sentences by performing a morphological analysis on each of the plurality of sentences, and matching the preset plurality of words among the extracted at least one word. Calculating a similarity between the word vector for the extracted word and the news classification vector matched with each of the plurality of news classification groups, and calculating an average similarity for each of the plurality of news classification groups based on the calculated similarity. Classifying the newly uploaded news into a first news classification group of the plurality of news classification groups based on the calculated average similarity, and the at least one word extracted from the newly uploaded news. 1 by inputting the input value of the news analysis neural network matched to the news classification group After calculating the positive impact value, the neutral impact value and the negative impact value of the newly uploaded news, and determining the percentage of change of the stock price of the preset company based on the calculated positive impact value, the neutral impact value and the negative impact value. Include.

본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법은 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있다.An apparatus for predicting a stock price of an enterprise by analyzing news according to the present invention and a method of operating the same may further include a word vector for an extracted word matching the preset plurality of words among the at least one extracted word and the plurality of news classification groups. Calculating a similarity between the news classification vectors matched to each of the plurality of news classification groups, and calculating the average similarity for each of the plurality of news classification groups based on the calculated similarity, and based on the calculated average similarity, Classifying the classified news into a first news classification group among the plurality of news classification groups, and then inputting at least one word extracted from newly uploaded news as an input value of a news analysis neural network matched to the first news classification group. Calculate positive impact value, neutral impact value and negative impact value of newly uploaded news Different output values can be derived depending on the nature of the news by determining the rate of change of the stock price of the preset company based on the positive, neutral and negative impact values.

도 1은 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법을 도시한 흐름도이다.
1 is a diagram illustrating a configuration of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention.
2 is a flowchart illustrating a method of operating an apparatus for predicting a stock price of an enterprise by analyzing news according to an embodiment of the present invention.

이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. This description is not intended to limit the invention to the specific embodiments, it should be understood to include all changes, equivalents, and substitutes included in the spirit and scope of the invention. In describing the drawings, similar reference numerals are used for similar components, and unless otherwise defined, all terms used in the present specification, including technical or scientific terms, may be used in the art to which the present invention pertains. It has the same meaning as is commonly understood by someone who has it.

도 1은 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 구성을 도시한 도면이다.1 is a diagram illustrating a configuration of an apparatus 100 for analyzing a news and predicting a stock price of a company according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)는 뉴스 사이트 저장부(110), 벡터 저장부(120), 뉴스 분석 신경망 저장부(130), 형태소 분석부(140), 뉴스 분류부(150), 주가 예측부(160), 유사 뉴스 카운트부(170), 주가 등락률 연산부(180) 및 뉴스 분석 신경망 업데이트부(190)를 포함할 수 있다.As shown in FIG. 1, the apparatus 100 for predicting the stock price of a company by analyzing news according to an embodiment of the present invention includes a news site storage unit 110, a vector storage unit 120, and a news analysis neural network storage. The unit 130, the morpheme analysis unit 140, the news classification unit 150, the stock price prediction unit 160, the similar news counting unit 170, the stock price fluctuation rate calculating unit 180, and the news analysis neural network updating unit 190 It may include.

먼저, 뉴스 사이트 저장부(110)는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 하기 표 1과 같이 저장될 수 있다.First, the news site storage unit 110 may store a plurality of preset web site addresses to which news data is uploaded as shown in Table 1 below.

웹 사이트 주소 인덱스Web site address index 웹 사이트 주소 Web site address 웹 사이트 주소 1Web site address 1 www.news.***.co.krwww.news.***.com 웹 사이트 주소 2Web site address 2 www.yonhapnews.co.krwww.yonhapnews.co.kr 웹 사이트 주소 3Web site address 3 www.newssite.krwww.newssite.kr ...... ......

다음으로, 벡터 저장부(120)는 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 하기 표 2와 같이 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 하기 표 3과 같이 저장할 수 있다.Next, the vector storage unit 120 matches a news classification vector to each of a plurality of preset news classification groups, and stores them as shown in Table 2 below, and matches the word vectors for each of the preset plurality of words. Can be stored as shown in 3.

뉴스 분류 인덱스News classification index 뉴스 분류 벡터News classification vector 뉴스 분류 1News classification 1 (0.45, 0.31, -0.13, ..., 0.10) (0.45, 0.31, -0.13, ..., 0.10) 뉴스 분류 2News classification 2 (-0.46, 0.13, 0.11, ..., -0.59) (-0.46, 0.13, 0.11, ..., -0.59) 뉴스 분류 3News classification 3 (0.05, -0.22, 0.91, ..., 0.63) (0.05, -0.22, 0.91, ..., 0.63) ...... ......

여기에서, 예를 들어, 상기 뉴스 분류 1은 ‘실적 관련 뉴스’, 상기 뉴스 분류 2는 ‘제품 관련 뉴스’ 및 상기 뉴스 분류 3은 ‘업황 관련 뉴스’일 수 있으며, 상기 뉴스 분류 벡터는 사전 설정된 다수의 단어들의 개수에 상응하는 원소들로 이루어질 수 있으며, 원소들 각각은 -1 내지 1 사이의 실수 값을 가질 수 있다.Here, for example, the news classification 1 may be 'performance related news', the news classification 2 may be 'product related news' and the news classification 3 may be 'business related news', and the news classification vector may be preset. The elements may correspond to the number of words, and each of the elements may have a real value between -1 and 1.

단어 인덱스Word index 단어 벡터Word vector 단어 1Word 1 (0.75, 0.51, -0.17, ..., 0.75) (0.75, 0.51, -0.17, ..., 0.75) 단어 2Word 2 (0.86, -0.86, -0.46, ..., -0.35) (0.86, -0.86, -0.46, ..., -0.35) 단어 3Word 3 (0.07, 0.56, -0.60, ..., 0.64) (0.07, 0.56, -0.60, ..., 0.64) ...... ......

여기에서, 예를 들어, 상기 단어 1은 ‘실적’, 상기 단어 2는 ‘개선’ 및 상기 단어 3은 ‘악화’일 수 있으며, 상기 단어 벡터는 사전 설정된 다수의 단어들의 개수에 상응하는 원소들로 이루어질 수 있으며, 원소들 각각은 -1 내지 1 사이의 실수 값을 가질 수 있다.뉴스 분석 신경망 저장부(130)는 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 하기 표 4와 같이 저장할 수 있다.Here, for example, the word 1 may be 'performance', the word 2 may be 'improvement' and the word 3 may be 'bad', and the word vector may include elements corresponding to a preset number of words. Each element may have a real value between −1 and 1. The news analysis neural network storage unit 130 may include a positive influence value, a neutral influence value, and a news value in each of the plurality of news classification groups. A news analysis neural network capable of calculating a negative influence value may be matched and stored as shown in Table 4 below.

뉴스 분류 인덱스News classification index 뉴스 분석 신경망News analysis neural network 뉴스 분류 1News classification 1 뉴스 분석 신경망 1News analysis neural network 1 뉴스 분류 2News classification 2 뉴스 분석 신경망 2News analysis neural network 2 뉴스 분류 3News classification 3 뉴스 분석 신경망 3News Analytics Neural Network 3 ...... ......

여기에서, 뉴스 분석 신경망은 입력 값에 대해 사전 설정된 N 회의 컨벌루션 처리를 수행함으로써 3개의 출력 값을 획득할 수 있는 N 개의 필터들로 구성될 수 있다. 여기에서 N은 2 이상의 자연수 중에서 선택될 수 있다. 또한, 컨벌루션 처리는 입력에 대하여 필터를 이용한 컨벌루션 곱을 수행하는 제1 처리, 상기 제1 처리의 결과 데이터에 대하여 정류 선형 처리를 수행하는 제2 처리 및 상기 제2 처리의 결과 데이터에 대하여 풀링 처리를 수행하는 제3 처리로 이루어질 수 있다. 한편, 사전 설정된 N 회의 컨벌루션 처리에 이용되는 필터들은 서로 다를 수 있다.형태소 분석부(140)는 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출할 수 있다. 이때, 형태소 분석부(140)는 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어의 중복 횟수를 카운트할 수 있다.Here, the news analysis neural network may be composed of N filters capable of obtaining three output values by performing preset N convolution processing on the input values. Here, N may be selected from two or more natural numbers. In addition, the convolution process includes a first process of performing a convolution product using a filter on an input, a second process of performing a rectifying linear process on the result data of the first process, and a pooling process on the result data of the second process. It may consist of a third process to be performed. On the other hand, the filters used for the preset N convolution processing may be different. When the news is uploaded from at least one of the plurality of web site addresses, the morphological analyzer 140 may apply to the newly uploaded news. A plurality of sentences may be extracted, and at least one word constituting each of the plurality of sentences may be extracted by performing a morphological analysis on each of the plurality of sentences. In this case, the morpheme analyzer 140 may count the number of overlaps of at least one word constituting each of the plurality of sentences.

예컨대, 상기 새롭게 업로드된 뉴스에서 “15일 오전11시30분 현재 갑 회사는 전거래일보다 5.91% 오른 가격에 거래되고 있다.”는 첫 번째 문장과 “갑 회사의 중국 파트너사는 지난 11일 항암바이러제 중국 임상3상을 오는 12월까지 완료하고 내년 4월에 허가 신청서를 제출한다고 밝혔다.”는 두 번째 문장을 추출하고, 각 문장에 대해 형태소 분석을 수행하여, 상기 첫 번째 문장에서 “15일”, “오전11시30분”, “현재”, “갑 회사”, “전거래일”, “5.91%”, “오름”, “가격” 및 “거래”라고 하는 단어와 “있다”라는 서술어를 추출하고, 상기 두 번째 문장에서 “갑 회사”, “중국”, “파트너사”, “지난”, “11일”, “항암바이러제”, “중국”, “임상3상”, “오는”, “12월”, “완료”, “내년”, “4월”, “허가”, “신청서” 및 “제출”이라는 단어와 “밝히다”라는 서술어를 추출할 수 있다. 이때, 형태소 분석부(140)는 “갑 회사”, “중국”이라는 단어의 중복 횟수를 2회로 카운트하고, 나머지 단어의 중복 횟수를 1회로 카운트할 수 있다.For example, in the newly uploaded news, the first sentence, “As of 15:11 am on the 15th, is trading at 5.91% higher than the previous trading day.” We will complete the phase 3 clinical trials in China by December and submit the application for approval in April next year. ”The second sentence is extracted, and each sentence is subjected to morphological analysis. "Day", "11:30 am", "present", "the former company", "previous trading day", "5.91%", "rising", "price" and "trade" and the words "is" In the second sentence above, "A company", "China", "Partners", "Last", "11 days", "Anti-cancer virus", "China", "Clinical 3 phase", " Coming ”,“ December ”,“ completed ”,“ next year ”,“ April ”,“ permission ”,“ application ”and“ submission ” And the word "clarify" that predicates can be extracted. In this case, the morpheme analysis unit 140 may count the number of duplicates of the words “A company” and “China” twice, and count the number of duplicates of the remaining words once.

뉴스 분류부(150)는 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다.The news classification unit 150 may determine the similarity between the word vector for the extracted word that matches the preset plurality of words among the extracted at least one word and the news classification vector that matches each of the plurality of news classification groups. Calculate an average similarity for each of the plurality of news classification groups based on the calculated similarity, and based on the calculated average similarity, the newly uploaded news is selected from among the plurality of news classification groups. We can classify in 1 news classification group.

예를 들어, 상기 첫 번째 및 두 번째 문장에서 추출된 단어들 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어가 “갑 회사”, “중국”, “항암바이러제”, “임상3상”, “허가”, “신청서” 및 “제출”인 경우, 뉴스 분류부(150)는 상기 “갑 회사”, “중국”, “항암바이러제”, “임상3상”, “허가”, “신청서” 및 “제출”에 매칭되어 있는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도들을 연산한 후 연산된 유사도들의 평균 값을 평균 유사도로 결정하고, 결정된 평균 유사도를 이용하여 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다. 여기에서, 뉴스 분류부(150)는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 하기 수학식 1을 이용하여 연산하며, 평균 유사도는 단어 벡터와 뉴스 분류 벡터 간의 유사도들을 상기 다수의 뉴스 분류 그룹들 각각마다 모두 더한 뒤 유사도들의 개수로 나누어줌으로써 연산할 수 있다.For example, the extracted words matching the preset plurality of words among the words extracted from the first and second sentences may be “A company,” “China,” “Anti-cancer virus,” “Clinical three-phase. , "Permission", "application" and "submission", the news classification unit 150 is the "A company", "China", "anti-cancer virus", "clinical phase 3", "permission", After calculating the similarities between the word vector matching "application" and "submission" and the news classification vector matching each of the plurality of news classification groups, the average value of the calculated similarities is determined as the average similarity, and the determined average Similarity may be used to classify the newly uploaded news into a first news classification group of the plurality of news classification groups. Here, the news classification unit 150 calculates the similarity between the word vector and the news classification vector matched to each of the plurality of news classification groups using Equation 1 below, and the average similarity is the word vector and the news classification vector. The similarity between the two can be calculated by adding all of each of the plurality of news classification groups and dividing by the number of similarities.

Figure pat00001
Figure pat00001

여기에서,

Figure pat00002
는 n개의 원소(xi)들로 이루어진 단어 벡터 x와 n개의 원소(yi)들로 이루어진 뉴스 분류 벡터 y 간의 유사도이다. 예컨대, 뉴스 분류부(150)는 “갑 회사”에 매칭되어 있는 단어 벡터와 상기 뉴스 분류 1에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 수학식 1을 이용하여 연산할 수 있다.From here,
Figure pat00002
It is a news similarity between the classification vector consisting of n elements y (x i) of the word vector x with n elements (y i) consisting of. For example, the news classification unit 150 may calculate the similarity between the word vector matching "A company" and the news classification vector matching the news classification 1 using Equation 1.

주가 예측부(160)는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정할 수 있다. 구체적으로, 주가 예측부(160)는 상기 연산된 긍정 영향 값에서 상기 연산된 부정 영향 값을 감한 값에 30을 곱한 값을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 여기에서, 긍정 영향 값, 중립 영향 값 및 부정 영향 값 각각은 0에서 1 사이의 실수 값을 가지고, 긍정 영향 값, 중립 영향 값 및 부정 영향 값의 총 합은 1이다.The stock price predicting unit 160 inputs the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group, and thus a positive influence value of the newly uploaded news, After calculating the neutral impact value and the negative impact value, the rate of change of the stock price of the predetermined company may be determined based on the calculated positive impact value, the neutral impact value, and the negative impact value. In detail, the stock price predicting unit 160 may determine a value obtained by subtracting the calculated negative influence value from the calculated positive influence value by 30 as the percentage change in the stock price of a predetermined company. Here, each of the positive influence value, the neutral influence value and the negative influence value has a real value between 0 and 1, and the sum of the positive influence value, the neutral influence value and the negative influence value is one.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에서 상기 연산된 부정 영향 값인 0.2를 감한 값인 0.1에 30을 곱한 3을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 3%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, when the calculated positive influence value is 0.3, the calculated neutral influence value is 0.5, and the calculated negative influence value is 0.2, the stock price prediction unit 160 at the calculated positive influence value 0.3 3, which is a value obtained by subtracting 0.2, which is the calculated negative impact value 0.2, is multiplied by 30, may be determined as a percentage change in the stock price of a predetermined company. That is, the stock price predicting unit 160 may determine 3% as the rate of change of the stock price of the predetermined company based on the newly uploaded news.

또한, 상기 주가 예측부(160)는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치(또는, 유사 뉴스의 개수의 제곱에 반비례하는 가중치)를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다. 이를 위하여, 유사 뉴스 카운트부(170)는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트할 수 있다. 여기에서, 상기 새롭게 업로드된 뉴스와의 평균 유사도는 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 각각에서 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 각각에 대한 평균 유사도를 연산함으로써 획득될 수 있다. 이에 따라, 중복되는 뉴스에 의해 상기 기업의 주식 가격의 등락률이 높게 평가되는 것을 방지할 수 있다.In addition, the stock price prediction unit 160 may include a weight inversely proportional to the number of similar news counted among the news found during the preset trading day period (or a weight inversely proportional to the square of the number of similar news). The rate of change of the stock price of the firm may be determined by applying the neutral impact value and the negative impact value. To this end, the similar news counting unit 170 may count the number of similar news items whose average similarity with the newly uploaded news is greater than or equal to a preset reference similarity among the news items retrieved during the preset trading day period. Here, the average similarity with the newly uploaded news is extracted from each of the news vectors found for the extracted word matching the preset plurality of words among the extracted at least one word and the news retrieved during the preset trading day period. Calculating the similarity between the word vectors for the extracted words matching the preset plurality of words among the at least one word, and then calculating the average similarity for each of the news retrieved during the preset trading day period based on the calculated similarity. Can be obtained by operation. Accordingly, it is possible to prevent the rate of change of the stock price of the company from being high due to the overlapping news.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2이며, 카운트된 유사 뉴스의 개수가 5인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에 1/5를 곱한 값에서 상기 연산된 부정 영향 값인 0.2에 1/5를 곱한 값을 감한 값인 0.02에 30을 곱한 0.6을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 0.6%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, when the calculated positive influence value is 0.3, the calculated neutral influence value is 0.5, the calculated negative influence value is 0.2, and the number of similar news counts is 5, the stock price predicting unit 160 ) Is 0.6 by multiplying the calculated positive influence value 0.3 by 1/5, subtracting the calculated negative influence value 0.2 by 1/5, and 0.6, which is 0.02 multiplied by 30, as the rate of change of the stock price of a predetermined company. You can decide. That is, the stock price predicting unit 160 may determine 0.6% as the rate of change of the stock price of the predetermined company based on the newly uploaded news.

또한, 상기 주가 예측부(160)는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다. 이에 따라, 적은 뉴스 매체에서만 주목하는 뉴스에 의해 상기 기업의 주식 가격의 등락률이 높게 평가되는 것을 방지할 수 있다.In addition, the stock price predicting unit 160 calculates a news upload rate of the web sites addresses uploaded with the similar news or the newly uploaded news for the plurality of web site addresses, and then counts the similar news counts. The percentage change of the stock price of the company may be determined by applying a weight that is inversely proportional to the multiplied value of the news upload rate to the positive impact value, the neutral impact value, and the negative impact value. As a result, the fluctuation rate of the stock price of the company can be prevented from being highly evaluated by the news that only a small amount of news media pays attention to.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2이며, 카운트된 유사 뉴스의 개수가 5이며, 뉴스 업로드 비율이 1%(즉, 0.01)인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값인 1/500을 곱한 값에서 상기 연산된 부정 영향 값인 0.2에 1/500을 곱한 값을 감한 값인 0.0002에 30을 곱한 0.006을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 0.006%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, the calculated positive influence value is 0.3, the calculated neutral influence value is 0.5, the calculated negative influence value is 0.2, the number of similar news counted is 5, and the news upload rate is 1%. (Ie, 0.01), the stock price prediction unit 160 calculates the calculated negative value by multiplying the calculated positive influence value 0.3 by the number of similar news counts multiplied by the news upload ratio, 1/500, to calculate the negative value. You can determine 0.006, the percentage change in the stock price of a pre-set company, by subtracting 0.2, multiplied by 1/500, the impact value, by multiplying 0.0002 by 30. In other words, the stock price predicting unit 160 may determine 0.006% as a percentage change in the stock price of a predetermined company based on the newly uploaded news.

이후, 주가 등락률 연산부(180)는 상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산할 수 있다.Thereafter, the price fluctuation rate calculator 180 may calculate the actual fluctuation rate according to the actual stock price of the company between the actual stock price of the company and the predetermined valuation time when the newly uploaded news is uploaded.

뉴스 분석 신경망 업데이트부(190)는 상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부(160)에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트할 수 있다.The news analysis neural network updater 190 matches the first news classification group when the actual fluctuation rate for the company and the fluctuation rate determined by the stock price prediction unit 160 have different slope codes. Can be updated.

예를 들어, 상기 기업에 대한 상기 실제 등락률이 -3%이고 상기 주가 예측부(160)에서 결정된 상기 등락률이 2%로 서로 다른 기울기 부호를 가지면, 뉴스 분석 신경망 업데이트부(190)는 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트할 수 있다.For example, if the actual rate of change for the enterprise is -3% and the rate of change determined by the stock price predicting unit 160 has different slope signs, such as 2%, the news analysis neural network updater 190 is configured to perform the first change. The news analysis neural network matching the news classification group may be updated.

이때, 상기 뉴스 분석 신경망 업데이트부(190)는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트할 수 있다.In this case, the news analysis neural network updating unit 190 is a positive influence calculated when the at least one word extracted from the newly uploaded news is input as an input value of the news analysis neural network matched to the first news classification group. Modifying the filter coefficients of the news analysis neural network matched to the first news classification group such that a value, a neutral impact value and a negative impact value have a positive impact value, a neutral impact value and a negative impact value corresponding to the actual fluctuation rate. The news analysis neural network matched to the first news classification group may be updated.

예를 들어, 상기 기업에 대한 상기 실제 등락률이 -3%이고 상기 주가 예측부(160)에서 결정된 상기 등락률이 2%로 서로 다른 기울기 부호를 가지는 경우, 상기 뉴스 분석 신경망 업데이트부(190)는 상기 실제 등락률에 상응하는 긍정 영향 값에서 상기 실제 등락률에 상응하는 부정 영향 값을 감한 값이 -0.001이 나오도록(즉, -0.001에 30을 곱한 값이 -0.03(-3%)이 나오도록) 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정할 수 있다.For example, when the actual rise and fall rate for the company is -3% and the rise and fall rate determined by the stock price predicting unit 160 has a different slope code, which is 2%, the news analysis neural network updater 190 is configured to include the above. Recall that the positive influence value corresponding to the actual change rate is subtracted from the negative influence value corresponding to the actual change rate, so that -0.001 is obtained (that is, -0.001 times 30 is -0.03 (-3%)). The filter coefficients of the news analysis neural network matched to the first news classification group may be modified.

상술한 바와 같은 본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)는 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있다.The apparatus 100 for predicting a stock price of an enterprise by analyzing news according to the present invention as described above includes a word vector for an extracted word that matches the preset plurality of words among the extracted at least one word and the plurality of words. Calculating a similarity between news classification vectors matched to each of the news classification groups, and calculating average similarity for each of the plurality of news classification groups based on the calculated similarity, and based on the calculated average similarity, An input value of a news analysis neural network in which the newly uploaded news is classified into a first news classification group among the plurality of news classification groups, and then at least one word extracted from the newly uploaded news is matched to the first news classification group. To calculate the positive, neutral and negative impact values for newly uploaded news By determining the computed value of the positive impact Neutral impact and value to deungrakryul the share price of companies based on pre-set negative impact on the property values according to the news you can obtain different output values.

도 2는 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법을 도시한 흐름도이다.2 is a flowchart illustrating a method of operating the apparatus 100 for predicting a stock price of an enterprise by analyzing news according to an embodiment of the present invention.

도 2를 참조하면, 단계(S210)에서는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지할 수 있다.Referring to FIG. 2, in step S210, a news site storage unit may store a plurality of preset web site addresses to which news data is uploaded.

단계(S220)에서는 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지할 수 있다.In operation S220, a news storage vector may be matched and stored in each of a plurality of preset news classification groups, and a vector storage unit for matching and storing a word vector for each of the preset plurality of words may be maintained.

단계(S230)에서는 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지할 수 있다.In operation S230, a news analysis neural network storage unit configured to match and store a news analysis neural network capable of calculating a positive influence value, a neutral influence value, and a negative influence value of each of the plurality of news classification groups may be stored.

단계(S240)에서는 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출할 수 있다.In step S240, when news is uploaded from at least one web site among the plurality of web site addresses, a plurality of sentences included in the newly uploaded news are extracted, and a morphological analysis is performed for each of the plurality of sentences. At least one word constituting each of the plurality of sentences may be extracted.

단계(S250)에서는 상기 추출된 적어도 하나의 단어에 매칭되어 있는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 평균 유사도를 연산하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다.In operation S250, an average similarity between a word vector matching the extracted at least one word and a news classification vector matching each of the plurality of news classification groups is calculated to calculate the newly uploaded news. The news classification group may be classified into a first news classification group.

단계(S260)에서는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정할 수 있다.In step S260, by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group, the positive impact value and the neutral impact of the newly uploaded news. After calculating the value and the negative impact value, the rate of change of the stock price of the predetermined company may be determined based on the calculated positive impact value, the neutral impact value, and the negative impact value.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법은 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스에서 상기 추출된 적어도 하나의 단어에 매칭되어 있는 단어 벡터와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 단계를 더 포함하고, 단계(S260)에서는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다.According to an embodiment of the present invention, an operation method of an apparatus 100 for predicting a stock price of an enterprise by analyzing news may be based on at least one word extracted from the newly uploaded news among news found during the preset trading day period. And counting the number of similar news items whose average similarity with the matched word vector is equal to or greater than a predetermined reference similarity level, and in step S260, the number of similar news counts among the news items found during the preset trading day period is counted. An inverse weight may be applied to the positive impact value, the neutral impact value, and the negative impact value to determine the rate of change of the stock price of the company.

또한, 상기 단계(S260)에서는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다.In operation S260, after calculating the news upload ratio of the similar news or the newly uploaded news uploaded web site addresses with respect to the plurality of web site addresses, the number of similar news counts is calculated. A weight that is inversely proportional to the multiplied value of the news upload rate may be applied to the positive impact value, the neutral impact value, and the negative impact value to determine the rate of change of the stock price of the company.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법은 상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 단계 및 상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 단계를 더 포함할 수 있다.The operating method of the apparatus 100 for predicting the stock price of a company by analyzing news according to an embodiment of the present invention may include: the company between the actual stock price of the company at the time when the newly uploaded news is uploaded and a preset valuation time point. Calculating a real fluctuation rate according to an actual stock price of the; and analyzing the news matched to the first news classification group if the real fluctuation rate for the enterprise and the fluctuation rate determined by the stock price prediction unit have different slope signs. The method may further include updating the neural network.

또한, 상기 뉴스 분석 신경망 업데이트 단계는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트할 수 있다.The news analysis neural network updating step may include a positive influence value and a neutral value calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. The first news by modifying filter coefficients of a news analysis neural network matched to the first news classification group such that an impact value and a negative impact value have a positive impact value, a neutral impact value, and a negative impact value corresponding to the actual fluctuation rate. Update the news analysis neural network matching the classification group.

이상, 도 2를 참조하여 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 도 1을 이용하여 설명한 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.In the above, the operating method of the apparatus for predicting the stock price of an enterprise by analyzing news according to an embodiment of the present invention has been described with reference to FIG. 2. Here, the operation method of the apparatus for predicting the stock price of a company by analyzing the news according to an embodiment of the present invention may correspond to the configuration of the operation of the apparatus for predicting the stock price of the company by analyzing the news described with reference to FIG. 1. Therefore, more detailed description thereof will be omitted.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.An operating method of an apparatus for predicting a stock price of an enterprise by analyzing news according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through a combination with a computer.

또한, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, the operating method of the apparatus for predicting the stock price of an enterprise by analyzing news according to an embodiment of the present invention may be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. In the present invention as described above has been described by the specific embodiments, such as specific components and limited embodiments and drawings, but this is provided to help a more general understanding of the present invention, the present invention is not limited to the above embodiments. For those skilled in the art, various modifications and variations are possible from these descriptions.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and all the things that are equivalent to or equivalent to the claims as well as the following claims will belong to the scope of the present invention. .

Claims (12)

뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부;
사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부;
상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부;
상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 형태소 분석부;
상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 뉴스 분류부; 및
상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 주가 예측부
를 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치.
A news site storage unit for storing a plurality of preset web site addresses to which news data is uploaded;
A vector storage unit for matching and storing a news classification vector to each of a plurality of preset news classification groups, and matching and storing a word vector for each of a plurality of preset words;
A news analysis neural network storage unit configured to match and store news analysis neural networks capable of calculating a positive influence value, a neutral influence value, and a negative influence value of each of the plurality of news classification groups;
When news is uploaded from at least one of the plurality of web site addresses, the plurality of sentences included in the newly uploaded news are extracted, and each of the plurality of sentences is subjected to morphological analysis. A morpheme analysis unit configured to extract at least one word constituting each of the sentences of the sentence;
The similarity between the word vector for the extracted word matching the preset plurality of words among the extracted at least one word and the news classification vector matched with each of the plurality of news classification groups, and then calculating the similarity. Calculate an average similarity for each of the plurality of news classification groups, and classify the newly uploaded news into a first news classification group of the plurality of news classification groups based on the calculated average similarity. News classification; And
A positive influence value, a neutral influence value and a negative influence value of the newly uploaded news are input by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group. A stock price predicting unit for determining a rate of change of the stock price of a predetermined company based on the calculated positive impact value, neutral impact value and negative impact value after calculating
Device for predicting the stock price of the company by analyzing the news.
제1항에 있어서,
상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 유사 뉴스 카운트부;
를 더 포함하고,
상기 주가 예측부는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
The method of claim 1,
A similar news counting unit for counting the number of similar news among the news retrieved during the preset trading day period, wherein the average similarity with the newly uploaded news is equal to or greater than a preset reference similarity;
More,
The stock price predicting unit determines a fluctuation rate of the stock price of the company by applying a weight inversely proportional to the number of similar news counted among the news retrieved during the preset trading day period to the positive impact value, the neutral impact value, and the negative impact value.
A device that analyzes news to predict a company's stock price.
제2항에 있어서,
상기 주가 예측부는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
The method of claim 2,
The stock price predicting unit calculates a news upload ratio of the similar news or the newly uploaded news uploaded web site addresses for the plurality of web site addresses, and then adds the news upload rate to the count of similar news counts. A weight that is inversely proportional to the multiplied value is applied to the positive impact value, the neutral impact value, and the negative impact value to determine the rate of change of the stock price of the enterprise.
A device that analyzes news to predict a company's stock price.
제3항에 있어서,
상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 주가 등락률 연산부; 및
상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 뉴스 분석 신경망 업데이트부
를 더 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치.
The method of claim 3,
A stock price fluctuation rate calculator configured to calculate an actual fluctuation rate according to the actual stock price of the company between the actual stock price of the company and the preset valuation time point when the newly uploaded news is uploaded; And
A news analysis neural network updating unit for updating the news analysis neural network matched to the first news classification group when the actual fluctuation rate for the enterprise and the fluctuation rate determined by the stock price prediction unit have different slope codes;
Device for predicting the stock price of the enterprise by analyzing the news further comprising.
제4항에 있어서,
상기 뉴스 분석 신경망 업데이트부는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
The method of claim 4, wherein
The news analysis neural network updating unit includes a positive influence value, a neutral influence value calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. Modifying the filter coefficients of the news analysis neural network matched to the first news classification group such that a negative impact value has a positive impact value, a neutral impact value, and a negative impact value corresponding to the actual fluctuation rate. To update the matched news analytics neural network
A device that analyzes news to predict a company's stock price.
뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지하는 단계;
사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지하는 단계;
상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지하는 단계;
상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 단계;
상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 단계; 및
상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 단계
를 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
Maintaining a news site storage in which a plurality of preset web site addresses to which news data is uploaded are stored;
Maintaining a vector storage unit for matching and storing a news classification vector to each of a plurality of preset news classification groups, and matching and storing a word vector for each of the preset plurality of words;
Maintaining a news analysis neural network storage unit configured to match and store news analysis neural networks capable of calculating positive influence values, neutral influence values, and negative influence values of each of the plurality of news classification groups;
When news is uploaded from at least one of the plurality of web site addresses, the plurality of sentences included in the newly uploaded news are extracted, and each of the plurality of sentences is subjected to morphological analysis. Extracting at least one word constituting each of the sentences of the;
The similarity between the word vector for the extracted word matching the preset plurality of words among the extracted at least one word and the news classification vector matched with each of the plurality of news classification groups, and then calculating the similarity. Calculate an average similarity for each of the plurality of news classification groups, and classify the newly uploaded news into a first news classification group of the plurality of news classification groups based on the calculated average similarity. step; And
A positive influence value, a neutral influence value and a negative influence value of the newly uploaded news are input by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group. Determining a rate of change of the stock price of a predetermined company based on the calculated positive impact value, neutral impact value and negative impact value after calculating
Method of operation of the device for predicting the stock price of the enterprise by analyzing the news.
제6항에 있어서,
상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 단계;
를 더 포함하고,
상기 주식 가격 등락률 결정 단계는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 6,
Counting the number of similar news among the news retrieved during the preset trading day period, wherein the average similarity with the newly uploaded news is equal to or greater than a preset reference similarity;
More,
The stock price fluctuation rate determining step may be performed by applying a weight that is inversely proportional to the number of similar news counted among the news found during the preset trading day period to the positive impact value, the neutral impact value, and the negative impact value. To determine
A method of operation of a device that analyzes news to predict a company's stock price.
제7항에 있어서,
상기 주식 가격 등락률 결정 단계는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 7, wherein
The stock price fluctuation rate determining step includes calculating a news upload ratio of the similar news or the newly uploaded news uploaded web site addresses for the plurality of web site addresses, and then adding the news to the counted number of similar news. A weight that is inversely proportional to the multiplied upload ratio is applied to the positive impact value, the neutral impact value, and the negative impact value to determine the rate of change of the stock price of the enterprise.
A method of operation of a device that analyzes news to predict a company's stock price.
제8항에 있어서,
상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 단계; 및
상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 단계
를 더 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 8,
Calculating an actual change rate according to the actual stock price of the company between the actual stock price of the company and the preset valuation time point when the newly uploaded news is uploaded; And
Updating the news analysis neural network matching the first news classification group when the actual fluctuation rate for the enterprise and the fluctuation rate determined by the stock price prediction unit have different slope codes.
Operating method of the device for predicting the stock price of the enterprise by analyzing the news further comprising.
제9항에 있어서,
상기 뉴스 분석 신경망 업데이트 단계는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 9,
The news analysis neural network updating step includes a positive influence value and a neutral influence value calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. And modifying the filter coefficients of the news analysis neural network matched to the first news classification group such that a negative impact value has a positive impact value, a neutral impact value, and a negative impact value corresponding to the actual fluctuation rate. To update the news analysis neural network matched to
A method of operation of a device that analyzes news to predict a company's stock price.
제6항 내지 제10항 중 어느 한 항의 방법을 컴퓨터로 하여금 수행하도록 하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer readable recording medium having recorded thereon a program for causing a computer to perform the method of any one of claims 6 to 10. 제6항 내지 제10항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.A computer program stored in a storage medium for executing the method of any one of claims 6 to 10 in combination with a computer.
KR1020180031638A 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof KR102104316B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Publications (2)

Publication Number Publication Date
KR20190116590A true KR20190116590A (en) 2019-10-15
KR102104316B1 KR102104316B1 (en) 2020-04-27

Family

ID=68209438

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Country Status (1)

Country Link
KR (1) KR102104316B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102142928B1 (en) * 2020-01-13 2020-08-10 미래에셋대우 주식회사 Method for forecast range of future stock price, and system for stock price prediction using the same
CN112036157A (en) * 2020-08-04 2020-12-04 林树 Foundation manager tone text analysis method and device
KR20210069888A (en) 2019-12-04 2021-06-14 한국전자통신연구원 Method and apparatus of predicting stock price direction based on machine learning using supply and demand data
WO2021199657A1 (en) * 2020-03-31 2021-10-07 国立大学法人東京大学 Information processing device, method of controlling same, program, and learned model
KR20220111406A (en) 2021-02-02 2022-08-09 주식회사 프리시전에스씨엠 Statistical Algorithm for the Short-term Forecasts of Product Prices Based on Natural Language Processing of Domestic and Foreign News

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102461825B1 (en) 2021-01-11 2022-11-07 대한민국 Apparatus for Searching Fraudulent News and Driving Method Thereof, and Computer Readable Recording Medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081548A (en) * 2006-02-13 2007-08-17 주식회사 디알에프앤 Stock information providing system using news

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081548A (en) * 2006-02-13 2007-08-17 주식회사 디알에프앤 Stock information providing system using news

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210069888A (en) 2019-12-04 2021-06-14 한국전자통신연구원 Method and apparatus of predicting stock price direction based on machine learning using supply and demand data
KR102142928B1 (en) * 2020-01-13 2020-08-10 미래에셋대우 주식회사 Method for forecast range of future stock price, and system for stock price prediction using the same
WO2021199657A1 (en) * 2020-03-31 2021-10-07 国立大学法人東京大学 Information processing device, method of controlling same, program, and learned model
JP7364228B2 (en) 2020-03-31 2023-10-18 久美子 石井 Information processing device, its control method, program, and learned model
CN112036157A (en) * 2020-08-04 2020-12-04 林树 Foundation manager tone text analysis method and device
KR20220111406A (en) 2021-02-02 2022-08-09 주식회사 프리시전에스씨엠 Statistical Algorithm for the Short-term Forecasts of Product Prices Based on Natural Language Processing of Domestic and Foreign News

Also Published As

Publication number Publication date
KR102104316B1 (en) 2020-04-27

Similar Documents

Publication Publication Date Title
KR102104316B1 (en) Apparatus for predicting stock price of company by analyzing news and operating method thereof
JP7169369B2 (en) Method, system for generating data for machine learning algorithms
CN110287477B (en) Entity emotion analysis method and related device
CN108491511B (en) Data mining method and device based on graph data and model training method and device
CN108920556B (en) Expert recommending method based on discipline knowledge graph
US9355370B2 (en) System and method for generating legal documents
CN103927615B (en) Entity is associated with classification
US10346752B2 (en) Correcting existing predictive model outputs with social media features over multiple time scales
US10983786B2 (en) Automatically evaluating software project requirements
CN111931055B (en) Object recommendation method, object recommendation device and electronic equipment
CN111199474A (en) Risk prediction method and device based on network diagram data of two parties and electronic equipment
CN111222976A (en) Risk prediction method and device based on network diagram data of two parties and electronic equipment
CN112232944B (en) Method and device for creating scoring card and electronic equipment
WO2023134072A1 (en) Default prediction model generation method and apparatus, device, and storage medium
CN107515904A (en) A kind of position searching method and computing device
US11308128B2 (en) Refining classification results based on glossary relationships
CN111427880B (en) Data processing method, device, computing equipment and medium
CN111582313A (en) Sample data generation method and device and electronic equipment
Obermann et al. Interpretable multiclass models for corporate credit rating capable of expressing doubt
US11222282B2 (en) Sourcing a new machine-learning project by reusing artifacts from reference machine learning projects
US20220374748A1 (en) Automated determination of explanatory variables
US10169418B2 (en) Deriving a multi-pass matching algorithm for data de-duplication
US10509809B1 (en) Constructing ground truth when classifying data
CN113343700B (en) Data processing method, device, equipment and storage medium
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant