JP2020537228A - 意図認識のための抽象化および移植性 - Google Patents
意図認識のための抽象化および移植性 Download PDFInfo
- Publication number
- JP2020537228A JP2020537228A JP2020518686A JP2020518686A JP2020537228A JP 2020537228 A JP2020537228 A JP 2020537228A JP 2020518686 A JP2020518686 A JP 2020518686A JP 2020518686 A JP2020518686 A JP 2020518686A JP 2020537228 A JP2020537228 A JP 2020537228A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- proxy
- semantic analysis
- tag
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (29)
- 自然言語処理システムのためのモデルを構築するためのコンピュータによって実施される方法であって、
表層形異形のセットを備えるプロキシ・タグを作成すること、
終端トークンと前記プロキシ・タグのうちの少なくとも1つとの組合せを備える訓練例を作成すること、および
前記訓練例を使用して意味解析モデルを構築すること
を含む、コンピュータによって実施される方法。 - 前記表層形異形のセットが、句である表層形異形を備える、請求項1に記載のコンピュータによって実施される方法。
- 前記表層形異形のセットが、一貫性のない構造クラスを有する表層形異形を備える、請求項1に記載のコンピュータによって実施される方法。
- 前記プロキシ・タグが、他のプロキシ・タグを備える、請求項1ないし3のいずれかに記載のコンピュータによって実施される方法。
- 前記プロキシ・タグに対する前記表層形異形のセットが、語彙データベースを使用して自動的に設定される、請求項1ないし4のいずれかに記載のコンピュータによって実施される方法。
- 入力として語彙列を受け取ること、
前記プロキシ・タグの前記表層形異形のセットにおいてリストされている単語列に関して前記語彙列に対してプロキシ解析を実行すること、
前記プロキシ解析に基づいて前記語彙列を変換すること、および
前記意味解析モデルを使用して前記語彙列の意味解析を生成すること
をさらに含む、請求項1ないし5のいずれかに記載のコンピュータによって実施される方法。 - 前記単語列が前記プロキシ・タグのうちの複数の前記表層形異形のセットにおいてリストされている場合に、前記プロキシ解析が、前記語彙列の周囲の単語文脈に基づいて前記プロキシ・タグを決定することを含む、請求項6に記載のコンピュータによって実施される方法。
- 前記プロキシ解析に基づいて前記語彙列を変換することが、前記語彙列における単語を前記プロキシ・タグで置き換えることを含む、請求項6または7に記載のコンピュータによって実施される方法。
- 前記意味解析モデルを使用して前記語彙列の前記意味解析に関する信頼度スコアを決定することをさらに含む請求項6ないし8のいずれかに記載のコンピュータによって実施される方法。
- 前記訓練例の特徴を抽出するために前記訓練例を使用して特徴抽出を実行することをさらに含み、
前記訓練例を使用して前記意味解析モデルを構築することが、入力データとして前記訓練例の前記特徴を使用して前記意味解析モデルを構築することを含む、請求項1ないし9のいずれかに記載のコンピュータによって実施される方法。 - 前記意味解析モデルが、知られていない語彙列の意味解析を生成するために前記訓練例からの出力ラベルを特徴組合せとペアにする、請求項10に記載のコンピュータによって実施される方法。
- 前記意味解析モデルを使用して前記知られていない語彙列の前記意味解析に関する信頼度スコアを決定することをさらに含む、請求項11に記載のコンピュータによって実施される方法。
- 前記プロキシ・タグの前記表層形異形のセットにおいてリストされている単語列に関して、前記知られていない語彙列に対してプロキシ解析を実行することをさらに含む、請求項12に記載のコンピュータによって実施される方法。
- 自然言語処理システムのためのモデルを構築するためのシステムであって、
コンピュータ実行可能命令を記憶するように構成されたメモリと、
プロセッサと
を備え、前記プロセッサが、
表層形異形のセットを備えるプロキシ・タグを作成すること、
終端トークンと前記プロキシ・タグのうちの少なくとも1つとの組合せを備える訓練例を作成すること、および
前記訓練例を使用して意味解析モデルを構築すること
を行うべく前記コンピュータ実行可能命令を実行するように構成されている、システム。 - 前記表層形異形のセットが、句である表層形異形を備える、請求項14に記載のシステム。
- 前記表層形異形のセットが、一貫性のない構造クラスを有する表層形異形を備える、請求項14に記載のシステム。
- 前記プロキシ・タグが、他のプロキシ・タグを備える、請求項14ないし16のいずれかに記載のシステム。
- 前記プロキシ・タグに対する前記表層形異形のセットが、語彙データベースを使用して自動的に設定される、請求項14ないし17のいずれかに記載のシステム。
- 前記プロセッサが、
入力として語彙列を受け取ること、
前記プロキシ・タグの前記表層形異形のセットにおいてリストされている単語列に関して前記語彙列に対してプロキシ解析を実行すること、
前記プロキシ解析に基づいて前記語彙列を変換すること、および
前記意味解析モデルを使用して前記語彙列の意味解析を生成すること
を行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項14ないし18のいずれかに記載のシステム。 - 前記プロセッサが、前記単語列が前記プロキシ・タグのうちの複数の前記表層形異形のセットにおいてリストされている場合、前記語彙列の周囲の単語文脈に基づいて前記プロキシ・タグを決定することによってプロキシ解析を実行することを行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項19に記載のシステム。
- 前記プロセッサが、前記語彙列における単語を前記プロキシ・タグで置き換えて、前記プロキシ解析に基づいて前記語彙列を変換することを行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項19または20に記載のシステム。
- 前記プロセッサが、前記意味解析モデルを使用して前記語彙列の前記意味解析に関する信頼度スコアを決定することを行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項19ないし21のいずれかに記載のシステム。
- 前記プロセッサが、
前記訓練例の特徴を抽出するために前記訓練例を使用して特徴抽出を実行すること、および
入力データとして前記訓練例の前記特徴を使用することによって前記意味解析モデルを構築すること
を行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項14ないし22のいずれかに記載のシステム。 - 前記意味解析モデルが、知られていない語彙列の意味解析を生成するために前記訓練例からの出力ラベルを特徴組合せとペアにする、請求項23に記載のシステム。
- 前記プロセッサが、
前記意味解析モデルを使用して前記知られていない語彙列の前記意味解析に関する信頼度スコアを決定することを行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項24に記載のシステム。 - 前記プロセッサが、
前記プロキシ・タグの前記表層形異形のセットにおいてリストされている単語列に関して、前記知られていない語彙列に対してプロキシ解析を実行することを行うべく前記コンピュータ実行可能命令を実行するようにさらに構成される、請求項25に記載のシステム。 - 自然言語処理システムのためのモデルを構築するためのコンピュータ・プログラム製品であって、
処理回路によって可読であり、かつ請求項1ないし13のいずれかに記載の方法を実行するために前記処理回路によって実行されるように命令を記憶するコンピュータ可読記憶媒体を備えるコンピュータ・プログラム製品。 - コンピュータ可読媒体上に記憶され、かつデジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行されたとき、請求項1ないし13のいずれかに記載の方法を実行するためのソフトウェア・コード部分を備える、コンピュータ・プログラム。
- 自然言語処理システムのためのモデルを構築するためのコンピュータによって実施される方法であって、
表層形異形のセットを備えるプロキシ・タグを作成すること、
前記プロキシ・タグのうちの少なくとも1つを備える訓練例を作成すること、および
前記訓練例を使用して意味解析モデルを構築すること
を含むコンピュータによって実施される方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/728,962 | 2017-10-10 | ||
US15/728,962 US11138506B2 (en) | 2017-10-10 | 2017-10-10 | Abstraction and portability to intent recognition |
PCT/IB2018/057745 WO2019073350A1 (en) | 2017-10-10 | 2018-10-05 | ABSTRACTION AND PORTABILITY FOR THE RECOGNITION OF INTENT |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020537228A true JP2020537228A (ja) | 2020-12-17 |
JP2020537228A5 JP2020537228A5 (ja) | 2021-04-22 |
JP7064274B2 JP7064274B2 (ja) | 2022-05-10 |
Family
ID=65994023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020518686A Active JP7064274B2 (ja) | 2017-10-10 | 2018-10-05 | 意図認識のための抽象化および移植性 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11138506B2 (ja) |
JP (1) | JP7064274B2 (ja) |
CN (1) | CN111194401B (ja) |
DE (1) | DE112018004140T5 (ja) |
GB (1) | GB2581705A (ja) |
WO (1) | WO2019073350A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11848010B1 (en) * | 2018-02-09 | 2023-12-19 | Voicebase, Inc. | Systems and methods for creating dynamic features for correlation engines |
US11188720B2 (en) * | 2019-07-18 | 2021-11-30 | International Business Machines Corporation | Computing system including virtual agent bot providing semantic topic model-based response |
US11593608B2 (en) | 2019-10-28 | 2023-02-28 | Paypal, Inc. | Systems and methods for predicting and providing automated online chat assistance |
CN112651226B (zh) * | 2020-09-21 | 2022-03-29 | 深圳前海黑顿科技有限公司 | 基于依存句法树的知识解析***及方法 |
CN113836304A (zh) * | 2021-09-27 | 2021-12-24 | 山东亿云信息技术有限公司 | 一种基于自然语言处理的智能打标签方法及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013080406A (ja) * | 2011-10-05 | 2013-05-02 | Fujitsu Ltd | コンパイル装置、情報処理システム、コンパイル方法、コンパイルプログラム、記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3004254B2 (ja) | 1998-06-12 | 2000-01-31 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 統計的シーケンスモデル生成装置、統計的言語モデル生成装置及び音声認識装置 |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7031908B1 (en) | 2000-06-01 | 2006-04-18 | Microsoft Corporation | Creating a language model for a language processing system |
US7085723B2 (en) | 2001-01-12 | 2006-08-01 | International Business Machines Corporation | System and method for determining utterance context in a multi-context speech application |
US6941268B2 (en) | 2001-06-21 | 2005-09-06 | Tellme Networks, Inc. | Handling of speech recognition in a declarative markup language |
US7761858B2 (en) | 2004-04-23 | 2010-07-20 | Microsoft Corporation | Semantic programming language |
JPWO2007069512A1 (ja) | 2005-12-15 | 2009-05-21 | シャープ株式会社 | 情報処理装置及びプログラム |
US20070239444A1 (en) | 2006-03-29 | 2007-10-11 | Motorola, Inc. | Voice signal perturbation for speech recognition |
JP5536518B2 (ja) | 2009-04-23 | 2014-07-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | システムの自然言語仕様から当該システム用のシステム・モデル化メタモデル言語モデルを自動的に抽出するための方法、装置及びコンピュータ・ |
JP5317922B2 (ja) | 2009-10-16 | 2013-10-16 | 株式会社野村総合研究所 | 情報抽出ルール作成支援システム |
US20140351228A1 (en) | 2011-11-28 | 2014-11-27 | Kosuke Yamamoto | Dialog system, redundant message removal method and redundant message removal program |
US20140079202A1 (en) | 2012-09-14 | 2014-03-20 | Zultys, Inc. | Method and system for universal internet protocol (ip) phone provisioning |
-
2017
- 2017-10-10 US US15/728,962 patent/US11138506B2/en active Active
-
2018
- 2018-10-05 DE DE112018004140.9T patent/DE112018004140T5/de active Pending
- 2018-10-05 JP JP2020518686A patent/JP7064274B2/ja active Active
- 2018-10-05 WO PCT/IB2018/057745 patent/WO2019073350A1/en active Application Filing
- 2018-10-05 CN CN201880065448.8A patent/CN111194401B/zh active Active
- 2018-10-05 GB GB2006681.7A patent/GB2581705A/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013080406A (ja) * | 2011-10-05 | 2013-05-02 | Fujitsu Ltd | コンパイル装置、情報処理システム、コンパイル方法、コンパイルプログラム、記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
GB202006681D0 (en) | 2020-06-17 |
GB2581705A (en) | 2020-08-26 |
US20190108450A1 (en) | 2019-04-11 |
CN111194401B (zh) | 2021-09-28 |
WO2019073350A1 (en) | 2019-04-18 |
DE112018004140T5 (de) | 2020-04-23 |
CN111194401A (zh) | 2020-05-22 |
JP7064274B2 (ja) | 2022-05-10 |
US11138506B2 (en) | 2021-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7064274B2 (ja) | 意図認識のための抽象化および移植性 | |
US9740685B2 (en) | Generation of natural language processing model for an information domain | |
WO2018192269A1 (zh) | 计算机模拟人脑学***台 | |
US20170286397A1 (en) | Predictive Embeddings | |
US9361293B2 (en) | Using renaming directives to bootstrap industry-specific knowledge and lexical resources | |
US11164562B2 (en) | Entity-level clarification in conversation services | |
Arora et al. | Requirement boilerplates: Transition from manually-enforced to automatically-verifiable natural language patterns | |
US11443209B2 (en) | Method and system for unlabeled data selection using failed case analysis | |
CN111611810A (zh) | 一种多音字读音消歧装置及方法 | |
US10282421B2 (en) | Hybrid approach for short form detection and expansion to long forms | |
US9703773B2 (en) | Pattern identification and correction of document misinterpretations in a natural language processing system | |
US10223349B2 (en) | Inducing and applying a subject-targeted context free grammar | |
Jakupović et al. | Formalisation method for the text expressed knowledge | |
EP3404553A1 (en) | Open information extraction method and system for extracting reified ternary relationship | |
KR102099670B1 (ko) | 질의자 의도를 이해하기 위한 구문 규칙 자동생성 장치 및 방법 | |
CN110633456A (zh) | 语种识别方法、装置、服务器及存储介质 | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
US20230111052A1 (en) | Self-learning annotations to generate rules to be utilized by rule-based system | |
CN113312451B (zh) | 文本标签确定方法和装置 | |
WO2018060777A1 (en) | Method and system for optimizing software testing | |
Mehta et al. | A survey on part-of-speech tagging of Indian languages | |
Labidi | New combined method to improve Arabic POS tagging | |
Khandare et al. | Study of Python libraries for NLP | |
Dwivedi et al. | Overview of Natural Language Processing | |
Eyno | Natural Language Processing and chat-bot implementation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210309 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211118 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20211125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20220413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7064274 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |