JP6601470B2 - 自然言語の生成方法、自然言語の生成装置及び電子機器 - Google Patents
自然言語の生成方法、自然言語の生成装置及び電子機器 Download PDFInfo
- Publication number
- JP6601470B2 JP6601470B2 JP2017204160A JP2017204160A JP6601470B2 JP 6601470 B2 JP6601470 B2 JP 6601470B2 JP 2017204160 A JP2017204160 A JP 2017204160A JP 2017204160 A JP2017204160 A JP 2017204160A JP 6601470 B2 JP6601470 B2 JP 6601470B2
- Authority
- JP
- Japan
- Prior art keywords
- meaning
- template
- sentence
- input
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(外1)
は文型テンプレート中の全ての充填位置sに対応するY値に対して加算を行うことを示す。
(外2)
は文型テンプレート中の全ての充填位置sに対応するY値に対して加算を行うことを示す。
<実施例一>
図1に示すように、本発明の実施例一は、自然言語の生成方法を提供し、該方法は人と機械の対話システムまたは画像記述生成システム等の環境に応用することができる。図1を参照に、該方法は以下のステップを含む。
<実施例二>
図2に示すように、本発明の実施例二が提供する自然言語の生成方法は、候補文型テンプレートを後続して選択する効率を向上させるため、文型テンプレートを取得した後、さらに各二つの文型テンプレート間の類似度を計算し、その上で文型テンプレート間の類似度を利用することで、後続する候補文型テンプレートの選択効率を向上させる。図2を参照に、該方法は以下のステップを含む。
(外3)
は文型テンプレート中の全ての充填位置sが対応するY値に対して行う加算を示す。
<実施例三>
本実施例は上記各実施例が述べる自然言語の生成方法を実現するために用いる装置を提供し、図3を参照に、本発明の実施例は自然言語生成装置30を提供し、該装置は以下のモジュールを含む。
(外4)
は文型テンプレート中の全ての充填位置sが対応するY値に対して行う加算を示す。
<実施例四>
図5を参照に、本発明の実施例はさらに人数統計の電子機器を提供し、本発明の実施例の図1または図2に示す実施例のフローを実現できる。前記電子機器はパーソナルコンピュータ(PC)、タブレットコンピュータ及び各種スマートデバイス(スマートグラスまたはスマートフォンを含む)等でもよい。図5に示すように、上記電子機器50はプロセッサー51及びメモリを含んでよい。
Claims (9)
- テンプレート取得モジュールが、コーパスにおける語句から、入力モードで定義された語句の構成成分を充填位置として削除して少なくとも一つの文型テンプレートを生成するステップと、
テンプレート選択モジュールが、前記充填位置を充填可能なサブ語義を含む語義を、前記入力モードに合致する入力語義として取得し、該入力語義と文型テンプレートとの間のマッチング度を計算し、前記マッチング度が所定条件を満たしている少なくとも一つの候補文型テンプレートを選択するステップと、
語句生成モジュールが、前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成するステップと、を含み、
前記少なくとも一つの文型テンプレートを生成するステップの後に、
類似度計算モジュールが各二つの文型テンプレート間の類似度を計算するステップ、をさらに含み、
前記入力語義と文型テンプレートとの間のマッチング度を計算する際に、マッチング度を計算するための現在の文型テンプレートと他の文型テンプレートとの間の類似度に基づき、前記マッチング度を計算するための次の文型テンプレートを決定することを特徴とする自然言語の生成方法。 - 前記入力語義と文型テンプレートとの間のマッチング度を計算するステップは、
前記入力語義における各サブ語義に対し、該サブ語義の文型テンプレートにおける充填位置にそれぞれ基づき、前記コーパスにおける該充填位置に充填できる単語の第一集合を決定するステップと、
該サブ語義と第一集合における各単語との間のコサイン類似度に基づき、該サブ語義と文型テンプレートにおける対応する充填位置とのマッチング因子を計算するステップであって、前記マッチング因子と前記コサイン類似度は正の相関を有する、ステップと、
各サブ語義と文型テンプレートにおける対応する充填位置とのマッチング因子に基づき、前記入力語義と文型テンプレートとの間のマッチング度を計算するステップと、
を含むことを特徴とする請求項1に記載の自然言語の生成方法。 - 前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成するステップは、
前記入力語義及び/又は前記入力語義との語義類似度が高い変換語義のサブ語義を、前記候補文型テンプレートの対応する位置に充填し、候補自然語句を取得するステップと、
前記候補自然語句における各充填位置の前記入力語義及び/又は前記変換語義に含まれるサブ語義により構成された充填語義と、対応する候補文型テンプレートとの間のマッチング度を以下の式(1)
(wはサブ語義に対応する単語を示し、sは候補文型テンプレートp中の一つの充填位置を示し、AM(p,s,w)は単語wと候補文型テンプレートp中の充填位置sのマッチング因子を示し、θwは単語wの予め設定された重み付け係数を示し、T(p,s)はコーパスにおける候補文型テンプレートpの充填位置sを充填可能な単語の集合を示し、nはT(p,s)の単語数を示し、xはT(p,s)の単語を示し、cos(w,x)は単語wとxのコサイン類似度を示す)により計算し、前記マッチング度に基づき、マッチング度が所定しきい値に達した自然語句を選別するステップと、
を含むことを特徴とする請求項1に記載の自然言語の生成方法。 - コーパスにおける語句から、入力モードで定義された語句の構成成分を充填位置として削除して少なくとも一つの文型テンプレートを生成するテンプレート取得モジュールと、
前記充填位置を充填可能なサブ語義を含む語義を、前記入力モードに合致する入力語義として取得し、前記入力語義と文型テンプレートとの間のマッチング度を計算し、前記マッチング度が所定条件を満たしている少なくとも一つの候補文型テンプレートを選択するテンプレート選択モジュールと、
前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成する語句生成モジュールと、を含み、
前記テンプレート取得モジュールにより少なくとも一つの文型テンプレートが生成された後に、各二つの文型テンプレート間の類似度を計算する類似度計算モジュール、をさらに含み、
前記テンプレート選択モジュールは、前記入力語義と文型テンプレートとの間のマッチング度を計算する際に、マッチング度を計算するための現在の文型テンプレートと他の文型テンプレートとの間の類似度に基づき、前記マッチング度を計算するための次の文型テンプレートを決定することを特徴とする自然言語の生成装置。 - 前記テンプレート選択モジュールは、
前記入力語義における各サブ語義に対し、該サブ語義の文型テンプレートにおける充填位置にそれぞれ基づき、前記コーパスにおける該充填位置に充填できる単語の第一集合を決定し、
該サブ語義と第一集合における各単語との間のコサイン類似度に基づき、該サブ語義と文型テンプレートにおける対応する充填位置とのマッチング因子を計算し取得し、前記マッチング因子と前記コサイン類似度は正の相関を有し、
各サブ語義と文型テンプレートにおける対応する充填位置とのマッチング因子に基づき、前記入力語義と文型テンプレートとの間のマッチング度を計算することを特徴とする請求項4に記載の自然言語の生成装置。 - 前記語句生成モジュールは、
前記入力語義及び/又は前記入力語義との語義類似度が高い変換語義のサブ語義を、前記候補文型テンプレートの対応する位置に充填し、候補自然語句を取得し、
前記候補自然語句における各充填位置の前記入力語義及び/又は前記変換語義に含まれるサブ語義により構成された充填語義と、対応する候補文型テンプレートとの間のマッチング度を以下の式(1)
(wはサブ語義に対応する単語を示し、sは候補文型テンプレートp中の一つの充填位置を示し、AM(p,s,w)は単語wと候補文型テンプレートp中の充填位置sのマッチング因子を示し、θwは単語wの予め設定された重み付け係数を示し、T(p,s)はコーパスにおける候補文型テンプレートpの充填位置sを充填可能な単語の集合を示し、nはT(p,s)の単語数を示し、xはT(p,s)の単語を示し、cos(w,x)は単語wとxのコサイン類似度を示す)により計算し、前記マッチング度に基づき、マッチング度が所定のしきい値に達した自然語句を選別することを特徴とする請求項4に記載の自然言語の生成装置。 - プロセッサーと、
コンピュータプログラム命令が記憶されているメモリと、を含む電子機器であって、
前記コンピュータプログラム命令が前記プロセッサーにより実行される時に、
コーパスにおける語句から、入力モードで定義された語句の構成成分を充填位置として削除して少なくとも一つの文型テンプレートを生成するステップと、
前記充填位置を充填可能なサブ語義を含む語義を、前記入力モードに合致する入力語義として取得し、前記入力語義と文型テンプレートとの間のマッチング度を計算し、前記マッチング度が所定条件を満たしている少なくとも一つの候補文型テンプレートを選択するステップと、
前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成するステップと、を前記プロセッサーに実行させ、
前記少なくとも一つの文型テンプレートを生成するステップの後に、
類似度計算モジュールが各二つの文型テンプレート間の類似度を計算するステップ、をさらに含み、
前記入力語義と文型テンプレートとの間のマッチング度を計算する際に、マッチング度を計算するための現在の文型テンプレートと他の文型テンプレートとの間の類似度に基づき、前記マッチング度を計算するための次の文型テンプレートを決定することを特徴とする電子機器。 - コーパスにおける語句から、入力モードで定義された語句の構成成分を充填位置として削除して少なくとも一つの文型テンプレートを生成するステップと、
前記充填位置を充填可能なサブ語義を含む語義を、前記入力モードに合致する入力語義として取得し、前記入力語義と文型テンプレートとの間のマッチング度を計算し、前記マッチング度が所定条件を満たしている少なくとも一つの候補文型テンプレートを選択するステップと、
前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成するステップと、をコンピュータに実行させるための自然言語の生成プログラムであって、
前記少なくとも一つの文型テンプレートを生成するステップの後に、
類似度計算モジュールが各二つの文型テンプレート間の類似度を計算するステップ、をさらに含み、
前記入力語義と文型テンプレートとの間のマッチング度を計算する際に、マッチング度を計算するための現在の文型テンプレートと他の文型テンプレートとの間の類似度に基づき、前記マッチング度を計算するための次の文型テンプレートを決定することを特徴とする自然言語の生成プログラム。 - コーパスにおける語句から、入力モードで定義された語句の構成成分を充填位置として削除して少なくとも一つの文型テンプレートを生成するステップと、
前記充填位置を充填可能なサブ語義を含む語義を、前記入力モードに合致する入力語義を取得し、前記入力語義と文型テンプレートとの間のマッチング度を計算し、前記マッチング度が所定条件を満たしている少なくとも一つの候補文型テンプレートを選択するステップと、
前記入力語義と前記候補文型テンプレートに基づき、自然語句を生成するステップと、をコンピュータに実行させるための自然言語の生成プログラムを記録した記録媒体であって、
前記少なくとも一つの文型テンプレートを生成するステップの後に、
類似度計算モジュールが各二つの文型テンプレート間の類似度を計算するステップ、をさらに含み、
前記入力語義と文型テンプレートとの間のマッチング度を計算する際に、マッチング度を計算するための現在の文型テンプレートと他の文型テンプレートとの間の類似度に基づき、前記マッチング度を計算するための次の文型テンプレートを決定することを特徴とする記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610965589.8 | 2016-11-04 | ||
CN201610965589.8A CN108021547B (zh) | 2016-11-04 | 2016-11-04 | 一种自然语言的生成方法、自然语言生成装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018073411A JP2018073411A (ja) | 2018-05-10 |
JP6601470B2 true JP6601470B2 (ja) | 2019-11-06 |
Family
ID=62084445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017204160A Active JP6601470B2 (ja) | 2016-11-04 | 2017-10-23 | 自然言語の生成方法、自然言語の生成装置及び電子機器 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6601470B2 (ja) |
CN (1) | CN108021547B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086272B (zh) * | 2018-08-01 | 2023-02-17 | 浙江蓝鸽科技有限公司 | 句型识别方法及其*** |
CN108959271B (zh) * | 2018-08-10 | 2020-06-16 | 广州太平洋电脑信息咨询有限公司 | 描述文本生成方法、装置、计算机设备和可读存储介质 |
CN109284502B (zh) * | 2018-09-13 | 2024-02-13 | 广州财盟科技有限公司 | 一种文本相似度计算方法、装置、电子设备及存储介质 |
CN111353293B (zh) * | 2018-12-21 | 2024-06-07 | 深圳市优必选科技有限公司 | 一种语句材料生成方法及终端设备 |
CN109815486A (zh) * | 2018-12-25 | 2019-05-28 | 出门问问信息科技有限公司 | 自然语言生成方法、装置、设备及可读存储介质 |
CN111666384B (zh) * | 2019-03-05 | 2024-06-18 | 京东科技控股股份有限公司 | 面向任务式对话***意图识别的语料库生成方法和装置 |
SG11202111653XA (en) * | 2019-05-02 | 2021-11-29 | The Clinician Pte Ltd | System and method for phrase comparison consolidation and reconciliation |
CN112101037A (zh) * | 2019-05-28 | 2020-12-18 | 云义科技股份有限公司 | 语意相似度计算方法 |
CN110222154A (zh) * | 2019-06-10 | 2019-09-10 | 武汉斗鱼鱼乐网络科技有限公司 | 基于文本及语义的相似度计算方法、服务器及存储介质 |
CN110399499B (zh) * | 2019-07-18 | 2022-02-18 | 珠海格力电器股份有限公司 | 一种语料生成方法、装置、电子设备及可读存储介质 |
CN112397201B (zh) * | 2020-12-10 | 2024-05-28 | 杭州师范大学 | 一种面向智能问诊***的复述句生成优化方法 |
KR102445497B1 (ko) * | 2020-12-15 | 2022-09-21 | 주식회사 엘지유플러스 | 학습 예문 및 어휘 패턴 생성 장치와 이의 동작 방법 |
WO2023206267A1 (zh) * | 2022-04-28 | 2023-11-02 | 西门子股份公司 | 调整自然语言语句的方法、装置及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737042B (zh) * | 2011-04-08 | 2015-03-25 | 北京百度网讯科技有限公司 | 建立问句生成模型的方法和装置以及问句生成方法和装置 |
JP5620349B2 (ja) * | 2011-07-22 | 2014-11-05 | 株式会社東芝 | 対話装置、対話方法および対話プログラム |
CN103377239B (zh) * | 2012-04-26 | 2020-08-07 | 深圳市世纪光速信息技术有限公司 | 计算文本间相似度的方法和装置 |
CN104391969B (zh) * | 2014-12-04 | 2018-01-30 | 百度在线网络技术(北京)有限公司 | 确定用户查询语句句法结构的方法及装置 |
CN105183848A (zh) * | 2015-09-07 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机聊天方法和装置 |
CN105868313B (zh) * | 2016-03-25 | 2019-02-12 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答***及方法 |
-
2016
- 2016-11-04 CN CN201610965589.8A patent/CN108021547B/zh active Active
-
2017
- 2017-10-23 JP JP2017204160A patent/JP6601470B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN108021547A (zh) | 2018-05-11 |
CN108021547B (zh) | 2021-05-04 |
JP2018073411A (ja) | 2018-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6601470B2 (ja) | 自然言語の生成方法、自然言語の生成装置及び電子機器 | |
EP4060565A1 (en) | Method and apparatus for acquiring pre-trained model | |
EP4024232A1 (en) | Text processing model training method, and text processing method and apparatus | |
JP2022177220A (ja) | テキスト認識モデルの訓練方法、テキスト認識方法及び装置 | |
US9766868B2 (en) | Dynamic source code generation | |
KR20210061141A (ko) | 자연어 처리 방법 및 장치 | |
US9619209B1 (en) | Dynamic source code generation | |
JP7430820B2 (ja) | ソートモデルのトレーニング方法及び装置、電子機器、コンピュータ可読記憶媒体、コンピュータプログラム | |
JP2022006173A (ja) | 知識事前訓練モデルの訓練方法、装置及び電子機器 | |
CN109117474A (zh) | 语句相似度的计算方法、装置及存储介质 | |
JP2020053018A (ja) | Vqaシステムの訓練データを生成する訓練データ生成方法、訓練データ生成装置、電子機器およびコンピュータ読み取り可能な媒体 | |
CN106663123B (zh) | 以评论为中心的新闻阅读器 | |
CN113255328A (zh) | 语言模型的训练方法及应用方法 | |
JP2023002690A (ja) | セマンティックス認識方法、装置、電子機器及び記憶媒体 | |
JP2023025126A (ja) | 深層学習モデルのトレーニング方法及び装置、テキストデータ処理方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN115631261A (zh) | 图像生成模型的训练方法、图像生成方法和装置 | |
JP6647475B2 (ja) | 言語処理装置、言語処理システムおよび言語処理方法 | |
CN109145313A (zh) | 语句的翻译方法、装置和存储介质 | |
JP7372402B2 (ja) | 音声合成方法、装置、電子機器及び記憶媒体 | |
CN116821307A (zh) | 内容交互方法、装置、电子设备和存储介质 | |
CN113408702B (zh) | 音乐神经网络模型预训练方法及电子设备和存储介质 | |
CN110428814B (zh) | 一种语音识别的方法及装置 | |
CN109783134B (zh) | 前端页面配置方法、装置及电子设备 | |
CN109614082A (zh) | 一种针对数据查询脚本的翻译方法、装置及设备 | |
US11900918B2 (en) | Method for training a linguistic model and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181203 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190604 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190724 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190923 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6601470 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |