JP6586055B2 - 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム - Google Patents
深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6586055B2 JP6586055B2 JP2016138880A JP2016138880A JP6586055B2 JP 6586055 B2 JP6586055 B2 JP 6586055B2 JP 2016138880 A JP2016138880 A JP 2016138880A JP 2016138880 A JP2016138880 A JP 2016138880A JP 6586055 B2 JP6586055 B2 JP 6586055B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- clause
- frequency
- data
- prescriptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明の実施の形態は、係り受け関係にある体言文節と用言文節に対し、該体言文節の体言が該用言文節の用言にとってどの深層格にあたるのかを推定する深層格解析装置、方法、及びプログラムに関する。
本発明の実施の形態に係る深層格解析装置の構成について説明する。図1は、本発明の請求項1記載の深層格解析装置の構成例である。図1に示すように、本発明の実施の形態に係る深層格解析装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この深層格解析装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部30とを備えている。
20 演算部
22 学習部
24 分類モデル記憶部
26 推定部
30 出力部
100 深層格解析装置
220 正解付素性ベクトル集合生成部
222 分類モデル生成部
260 素性ベクトル生成部
262 分類部
Claims (8)
- 係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合を入力とし、各正解付データに対し、該データから素性及び素性値の組の集合である素性ベクトルを生成することにより、正解付素性ベクトル集合を生成する正解付素性ベクトル集合生成部と、
前記正解付素性ベクトル集合から、深層格を分類するための分類モデルを生成する分類モデル生成部と、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとる、
ことを特徴とする深層格学習装置。 - 係り受け関係にある体言文節と用言文節のデータAを入力とし、該データAから素性及び素性値の組の集合である素性ベクトルBを生成する素性ベクトル生成部と、
係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合に含まれる各正解付データに対して生成される素性ベクトルの集合である、正解付素性ベクトル集合から予め生成された、深層格を分類するための分類モデルと、前記素性ベクトルBとから、該データAが各深層格に相当するスコアを算出する分類部と、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとる、
ことを特徴とする深層格推定装置。 - 係り受け関係にある体言文節と用言文節のデータAを入力とし、該データAから素性及び素性値の組の集合である素性ベクトルBを生成する素性ベクトル生成部と、
係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合に含まれる各正解付データに対して生成される素性ベクトルの集合である、正解付素性ベクトル集合から予め生成された、深層格を分類するための分類モデルと、前記素性ベクトルBとから、該データAが各深層格に相当するスコアを算出する分類部と、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとり、
かつ、前記素性及び前記素性値の組の集合として、データ中に存在する、体言文節付属部の表記及び用言文節付属部の表記を用いる、
ことを特徴とする深層格推定装置。 - 係り受け関係にある体言文節と用言文節のデータAを入力とし、該データAから素性及び素性値の組の集合である素性ベクトルBを生成する素性ベクトル生成部と、
係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合に含まれる各正解付データに対して生成される素性ベクトルの集合である、正解付素性ベクトル集合から予め生成された、深層格を分類するための分類モデルと、前記素性ベクトルBとから、該データAが各深層格に相当するスコアを算出する分類部と、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとり、
かつ、前記素性及び前記素性値の組の集合として、データ中に存在する、体言文節付属部の表記及び用言文節付属部の表記を用い、
かつ、前記素性及び前記素性値の組の集合として、前記素性における、データ中の体言を抽出元とする素性については、体言の最後の構成形態素部の情報を用いる、
ことを特徴とする深層格推定装置。 - 正解付素性ベクトル集合生成部、及び分類モデル生成部を含む深層格学習装置における深層格学習方法であって、
前記正解付素性ベクトル集合生成部が、係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合を入力とし、各正解付データに対し、該データから素性及び素性値の組の集合である素性ベクトルを生成することにより、正解付素性ベクトル集合を生成するステップと、
前記分類モデル生成部が、前記正解付素性ベクトル集合から、深層格を分類するための分類モデルを生成するステップと、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとる、
ことを特徴とする深層格学習方法。 - 素性ベクトル生成部、及び分類部を含む深層格推定装置における深層格推定方法であって、
前記素性ベクトル生成部が、係り受け関係にある体言文節と用言文節のデータAを入力とし、該データAから素性及び素性値の組の集合である素性ベクトルBを生成するステップと、
前記分類部が、係り受け関係にある体言文節と用言文節のデータと、該データに対応する正解の深層格との組である正解付データの集合に含まれる各正解付データに対して生成される素性ベクトルの集合である、正解付素性ベクトル集合から予め生成された、深層格を分類するための分類モデルと、前記素性ベクトルBとから、該データAが各深層格に相当するスコアを算出するステップと、
を含み、
前記素性及び前記素性値の組の集合として、
データ中の体言文節及び用言文節に存在する表記文字列を用い、
かつ、
データ中の体言に対し、コーパスにおいて該体言を含む体言文節と係り受け関係にある用言文節からとった、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合をとるか、若しくは、前記体言文節の体言文節付属部と前記用言文節または用言との対と、前記対の頻度との組の集合であって、前記対の頻度を数える際に、前記対の用言文節中の用言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記対の頻度を数えたものをとるか、
データ中の用言に対し、コーパスにおいて該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言を含む用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとるか、又は、
データ中の用言文節に対し、コーパスにおいて該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合をとるか、若しくは、該用言文節と係り受け関係にある体言文節と、前記体言文節の頻度との組の集合であって、前記体言文節の頻度を数える際に、前記体言文節中の体言の意味カテゴリが同一で、かつ、他の表記情報が同一のものは同一視して前記体言文節の頻度を数えたものをとる、
ことを特徴とする深層格推定方法。 - コンピュータを、請求項1記載の深層格学習装置の各部として機能させるためのプログラム。
- コンピュータを、請求項2〜請求項4の何れか1項記載の深層格推定装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016138880A JP6586055B2 (ja) | 2016-07-13 | 2016-07-13 | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016138880A JP6586055B2 (ja) | 2016-07-13 | 2016-07-13 | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019057331A Division JP6694987B2 (ja) | 2019-03-25 | 2019-03-25 | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018010481A JP2018010481A (ja) | 2018-01-18 |
JP6586055B2 true JP6586055B2 (ja) | 2019-10-02 |
Family
ID=60994247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016138880A Active JP6586055B2 (ja) | 2016-07-13 | 2016-07-13 | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6586055B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881310B (zh) * | 2019-12-07 | 2022-05-06 | 杭州华冬人工智能有限公司 | 一种汉字硬笔书写智能指导和评分方法及指导评分*** |
CN111767715A (zh) * | 2020-06-10 | 2020-10-13 | 北京奇艺世纪科技有限公司 | 人物识别的方法、装置、设备及存储介质 |
-
2016
- 2016-07-13 JP JP2016138880A patent/JP6586055B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018010481A (ja) | 2018-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
White et al. | Inference is everything: Recasting semantic resources into a unified evaluation framework | |
Orosz et al. | PurePos 2.0: a hybrid tool for morphological disambiguation | |
US9910886B2 (en) | Visual representation of question quality | |
US10671929B2 (en) | Question correction and evaluation mechanism for a question answering system | |
Zitouni | Natural language processing of semitic languages | |
US9373075B2 (en) | Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation | |
US9471559B2 (en) | Deep analysis of natural language questions for question answering system | |
US8380489B1 (en) | System, methods, and data structure for quantitative assessment of symbolic associations in natural language | |
EP2915068A2 (en) | Natural language processing system and method | |
US20220269939A1 (en) | Graph-based labeling rule augmentation for weakly supervised training of machine-learning-based named entity recognition | |
Roth et al. | Parsing software requirements with an ontology-based semantic role labeler | |
CN113672731A (zh) | 基于领域信息的情感分析方法、装置、设备及存储介质 | |
JP6586055B2 (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
Park et al. | Automatic analysis of thematic structure in written English | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
Behera | An Experiment with the CRF++ Parts of Speech (POS) Tagger for Odia. | |
Quan et al. | Automatic Annotation of Word Emotion in Sentences Based on Ren-CECps. | |
Lee | N-Gram Language Model | |
Sidhu et al. | Role of machine translation and word sense disambiguation in natural language processing | |
JP6694987B2 (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
CN116227497B (zh) | 一种基于深度神经网络的句子构式分析方法及装置 | |
Rakhimova et al. | The Task of Generating Text Based on a Semantic Approach for a Low-Resource Kazakh Language | |
KR102313721B1 (ko) | 자연어 표상 방법 및 이를 수행하기 위해 매체에 저장된 컴퓨터 프로그램 | |
Alrakaf et al. | A supervised approach for word sense disambiguation based on Arabic diacritics | |
Eluri et al. | ARPIT: Ambiguity Resolver for POS Tagging of Telugu, an Indian Language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6586055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |