JP7337979B2 - モデル訓練方法および装置、テキスト予測方法および装置、電子デバイス、コンピュータ可読記憶媒体、およびコンピュータプログラム - Google Patents
モデル訓練方法および装置、テキスト予測方法および装置、電子デバイス、コンピュータ可読記憶媒体、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7337979B2 JP7337979B2 JP2022021790A JP2022021790A JP7337979B2 JP 7337979 B2 JP7337979 B2 JP 7337979B2 JP 2022021790 A JP2022021790 A JP 2022021790A JP 2022021790 A JP2022021790 A JP 2022021790A JP 7337979 B2 JP7337979 B2 JP 7337979B2
- Authority
- JP
- Japan
- Prior art keywords
- grained
- samples
- coarse
- fine
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Machine Translation (AREA)
Description
Claims (15)
- それぞれが複数の細粒度サンプルを含む少なくとも1つの段落テキストを取得するサンプル取得ステップであって、前記細粒度サンプルは、細粒度自身及び該細粒度の関連情報からなる細粒度のコンテンツを含む、サンプル取得ステップと、
各段落テキストにおける細粒度サンプルを処理して粗粒度サンプルを得る処理ステップであって、前記粗粒度サンプルは、粗粒度自身及び該粗粒度の関連情報からなる粗粒度のコンテンツを含む、処理ステップと、
各段落テキストにおける粗粒度サンプルをアノテートし、1つの粗粒度サンプルを1つの前記細粒度サンプルのマスクでマスキングし、それぞれが細粒度サンプルとアノテートされた粗粒度サンプルのうちの少なくとも1つを含む複数のアノテートテキストを含む訓練サンプルセットを得る訓練サンプルセット取得ステップと、
前記訓練サンプルセットを採用して細粒度モデルを訓練し、段落テキストにおける粗粒度に隣接する直前の細粒度のコンテンツを学習して当該粗粒度のコンテンツを予測するために使用される訓練済みの細粒度モデルを得る訓練ステップと、を含み、
前記訓練サンプルセット取得ステップは、
各段落テキストにおける粗粒度サンプルのコンテンツをアノテートすることであって、前記粗粒度サンプルのコンテンツは、粗粒度自身および当該粗粒度のタイプを含む、ことと、
各段落テキストにおける粗粒度サンプルを前記細粒度モデルに対応する前記細粒度サンプルのマスクでマスキングし、アノテートされた粗粒度サンプルを得ることと、
それぞれの段落テキストにおける各細粒度サンプルおよび各粗粒度サンプルの順序に従って、すべての細粒度サンプルおよびアノテートされた粗粒度サンプルをソートし、訓練サンプルセットを得ることと、を含む、
モデル訓練方法。 - 前記細粒度サンプルは文字サンプルであり、前記粗粒度サンプルは字句サンプルまたはエンティティサンプルを含み、前記処理ステップは、
各段落テキストにおけるすべての文字サンプルの意味を取得することと、
各文字サンプルの意味に基づいて、現在の段落テキストにおける隣接する少なくとも2つの文字サンプルが字句組み合わせルールまたはエンティティ命名ルールに準拠しているか否かを検出することと、
隣接する少なくとも2つの文字サンプルが字句組み合わせルールまたはエンティティ命名ルールに準拠していることが検出されたことに応答して、字句組み合わせルールまたはエンティティ命名ルールに準拠しているすべての文字サンプルを組み合わせ、字句サンプルまたはエンティティサンプルを得ることと、を含む、
請求項1に記載の方法。 - 前記細粒度サンプルは文字サンプルであり、前記粗粒度サンプルはフレーズサンプルをさらに含み、前記処理ステップは、
各文字サンプルの意味および各文字サンプルの構造に基づいて、現在の段落テキストにおけるすべての文字サンプルがフレーズ組み合わせルールに準拠しているか否かを検出することと、
現在の段落テキストにおける文字サンプルがフレーズ組み合わせルールに準拠していることが検出されたことに応答して、フレーズ組み合わせルールに準拠しているすべての文字サンプルを組み合わせ、フレーズサンプルを得ることと、をさらに含む、
請求項2に記載の方法。 - 前記細粒度サンプルは字句サンプルまたはエンティティサンプルを含み、前記粗粒度サンプルはフレーズサンプルを含み、前記処理ステップは、
各段落テキストにおけるすべての字句サンプルまたはエンティティサンプルの意味および構造を取得することと、
各字句サンプルまたはエンティティサンプルの意味および構造に基づいて、現在の段落テキストにおける隣接する少なくとも2つの字句サンプルまたはエンティティサンプルがフレーズ組み合わせルールに準拠しているか否かを検出することと、
現在の段落テキストにおける隣接する少なくとも2つの字句サンプルまたはエンティティサンプルがフレーズ組み合わせルールに準拠していることが検出されたことに応答して、フレーズ組み合わせルールに準拠しているすべての字句サンプルまたはエンティティサンプルを組み合わせ、フレーズサンプルを得ることと、を含む、
請求項1に記載の方法。 - 前記細粒度サンプルは文字サンプルであり、前記粗粒度サンプルはフレーズサンプルを含み、前記処理ステップは、
各段落テキストにおけるすべての文字サンプルの意味および構造を取得することと、
各文字サンプルの意味および各文字サンプルの構造に基づいて、現在の段落テキストにおける隣接するプリセットの文字サンプルがフレーズ組み合わせルールに準拠しているか否かを順次に検出することと、
現在の段落テキストにおける隣接するプリセットの文字サンプルにはフレーズ組み合わせルールに準拠している複数の文字サンプルがあることが検出されたことに応答して、フレーズ組み合わせルールに準拠している複数の文字サンプルを組み合わせ、フレーズサンプルを得ることと、を含む、
請求項1に記載の方法。 - 予測対象テキストを取得することと、
予測対象テキストを請求項1-5のいずれか一項に記載の方法によって生成された細粒度モデルに入力して、前記予測対象テキストにおける粗粒度および前記粗粒度のタイプを得ることと、を含む、
テキスト予測方法。 - それぞれが複数の細粒度サンプルを含む少なくとも1つの段落テキストを取得するように構成されたサンプル取得ユニットであって、前記細粒度サンプルは、細粒度自身及び該細粒度の関連情報からなる細粒度のコンテンツを含む、サンプル取得ユニットと、
各段落テキストにおける細粒度サンプルを処理して粗粒度サンプルを得るように構成された処理ユニットであって、前記粗粒度サンプルは、粗粒度自身及び該粗粒度の関連情報からなる粗粒度のコンテンツを含む、処理ユニットと、
各段落テキストにおける粗粒度サンプルをアノテートし、1つの粗粒度サンプルを1つの前記細粒度サンプルのマスクでマスキングし、それぞれが細粒度サンプルとアノテートされた粗粒度サンプルのうちの少なくとも1つを含む複数のアノテートテキストを含む訓練サンプルセットを得るように構成された訓練サンプルセット取得ユニットと、
前記訓練サンプルセットを採用して細粒度モデルを訓練し、段落テキストにおける粗粒度に隣接する直前の細粒度のコンテンツを学習して、当該粗粒度のコンテンツを予測するために使用される訓練済みの細粒度モデルを得るように構成された訓練ユニットと、を含み、
前記訓練サンプルセット取得ユニットは、
各段落テキストにおける粗粒度サンプルのコンテンツをアノテートするように構成されたアノテートモジュールであって、前記粗粒度サンプルのコンテンツは、粗粒度自身および当該粗粒度のタイプを含む、アノテートモジュールと、
各段落テキストにおける粗粒度サンプルを前記細粒度モデルに対応する前記細粒度サンプルのマスクでマスキングし、アノテートされた粗粒度サンプルを得るように構成されたマスキングモジュールと、
それぞれの段落テキストにおける各細粒度サンプルおよび各粗粒度サンプルの順序に従って、すべての細粒度サンプルおよびアノテートされた粗粒度サンプルをソートし、訓練サンプルセットを得るように構成されたソートモジュールと、を含む、
モデル訓練装置。 - 前記細粒度サンプルは文字サンプルであり、前記粗粒度サンプルは字句サンプルまたはエンティティサンプルを含み、前記処理ユニットは、
各段落テキストにおけるすべての文字サンプルの意味を取得するように構成された文字意味取得モジュールと、
各文字サンプルの意味に基づいて、現在の段落テキストにおける隣接する少なくとも2つの文字サンプルが字句組み合わせルールまたはエンティティ命名ルールに準拠しているか否かを検出するように構成された文字検出モジュールと、
隣接する少なくとも2つの文字サンプルが字句組み合わせルールまたはエンティティ命名ルールに準拠していることが検出されたことに応答して、字句組み合わせルールまたはエンティティ命名ルールに準拠しているすべての文字サンプルを組み合わせ、字句サンプルまたはエンティティサンプルを得るように構成された字句組み合わせモジュールと、を含む、
請求項7に記載の装置。 - 前記処理ユニットは、
各文字サンプルの意味および各文字サンプルの構造に基づいて、現在の段落テキストにおけるすべての文字サンプルがフレーズ組み合わせルールに準拠しているか否かを検出するように構成された第一フレーズ検出モジュールと、
現在の段落テキストにおける文字サンプルがフレーズ組み合わせルールに準拠していることが検出されたことに応答して、フレーズ組み合わせルールに準拠しているすべての文字サンプルを組み合わせ、フレーズサンプルを得るように構成された第一フレーズ組み合わせモジュールと、をさらに含む、
請求項8に記載の装置。 - 前記細粒度サンプルは字句サンプルまたはエンティティサンプルを含み、前記粗粒度サンプルはフレーズサンプルを含み、前記処理ユニットは、
各段落テキストにおけるすべての字句サンプルまたはエンティティサンプルの意味および構造を取得するように構成された字句意味取得モジュールと、
各字句サンプルまたはエンティティサンプルの意味および構造に基づいて、現在の段落テキストにおける隣接する少なくとも2つの字句サンプルまたはエンティティサンプルがフレーズ組み合わせルールに準拠しているか否かを検出するように構成された第二フレーズ検出モジュールと、
現在の段落テキストにおける隣接する少なくとも2つの字句サンプルまたはエンティティサンプルがフレーズ組み合わせルールに準拠していることが検出されたことに応答して、フレーズ組み合わせルールに準拠しているすべての字句サンプルまたはエンティティサンプルを組み合わせ、フレーズサンプルを得るように構成された第二フレーズ組み合わせモジュールと、を含む、
請求項7に記載の装置。 - 前記細粒度サンプルは文字サンプルであり、前記粗粒度サンプルはフレーズサンプルを含み、前記処理ユニットは、
各段落テキストにおけるすべての文字サンプルの意味および構造を取得するように構成された文字構造取得モジュールと、
各文字サンプルの意味および各文字サンプルの構造に基づいて、現在の段落テキストにおける隣接するプリセットの文字サンプルがフレーズ組み合わせルールに準拠しているか否かを順次検出するように構成された第三フレーズ検出モジュールと、
現在の段落テキストにおける隣接するプリセットの文字サンプルにはフレーズ組み合わせルールに準拠している複数の文字サンプルがあることが検出されたことに応答して、フレーズ組み合わせルールに準拠している複数の文字サンプルを組み合わせ、フレーズサンプルを得るように構成された第三フレーズ組み合わせモジュールと、を含む、
請求項7に記載の装置。 - 予測対象テキストを取得するように構成された取得ユニットと、
予測対象テキストを請求項1-5のいずれか一項に記載の方法によって生成された細粒度モデルに入力して、前記予測対象テキストにおける粗粒度および前記粗粒度のタイプを得るように構成された訓練サンプルセット取得ユニットと、を含む、
テキスト予測装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な指令を記憶し、前記指令は、前記少なくとも1つのプロセッサが請求項1-6のいずれか一項に記載の方法を実行できるように前記少なくとも1つのプロセッサによって実行されることを特徴とする、
電子デバイス。 - コンピュータ指令が請求項1-6のいずれか一項に記載の方法をコンピュータに実行させるために使用されることを特徴とする、コンピュータ指令が格納されている非一時的なコンピュータ可読記憶媒体。
- プロセッサによって実行されると、請求項1-6のいずれか一項に記載の方法を実行するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110738146.6 | 2021-06-30 | ||
CN202110738146.6A CN113420822B (zh) | 2021-06-30 | 2021-06-30 | 模型训练方法和装置、文本预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022059021A JP2022059021A (ja) | 2022-04-12 |
JP7337979B2 true JP7337979B2 (ja) | 2023-09-04 |
Family
ID=77717886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022021790A Active JP7337979B2 (ja) | 2021-06-30 | 2022-02-16 | モデル訓練方法および装置、テキスト予測方法および装置、電子デバイス、コンピュータ可読記憶媒体、およびコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220129768A1 (ja) |
JP (1) | JP7337979B2 (ja) |
CN (1) | CN113420822B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330512B (zh) * | 2021-12-13 | 2024-04-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN114792424A (zh) * | 2022-05-30 | 2022-07-26 | 北京百度网讯科技有限公司 | 文档图像的处理方法、装置及电子设备 |
CN117350524B (zh) * | 2023-12-05 | 2024-03-26 | 广东新禾道信息科技有限公司 | 一种新型基础测绘移动采集协同作业方法及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249932A (ja) | 2000-03-06 | 2001-09-14 | Tsubasa System Co Ltd | 車両情報検索装置、車両情報検索方法及び車両情報検索システム |
CN112560501A (zh) | 2020-12-25 | 2021-03-26 | 北京百度网讯科技有限公司 | 语义特征的生成方法、模型训练方法、装置、设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717339B (zh) * | 2019-12-12 | 2020-06-30 | 北京百度网讯科技有限公司 | 语义表示模型的处理方法、装置、电子设备及存储介质 |
CN111126068A (zh) * | 2019-12-25 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 一种中文命名实体识别方法和装置及电子设备 |
CN111539223B (zh) * | 2020-05-29 | 2023-08-18 | 北京百度网讯科技有限公司 | 语言模型的训练方法、装置、电子设备及可读存储介质 |
CN112560484B (zh) * | 2020-11-09 | 2024-03-01 | 武汉数博科技有限责任公司 | 用于命名实体识别的改进bert训练模型及命名实体识别方法 |
-
2021
- 2021-06-30 CN CN202110738146.6A patent/CN113420822B/zh active Active
-
2022
- 2022-01-03 US US17/646,851 patent/US20220129768A1/en active Pending
- 2022-02-16 JP JP2022021790A patent/JP7337979B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249932A (ja) | 2000-03-06 | 2001-09-14 | Tsubasa System Co Ltd | 車両情報検索装置、車両情報検索方法及び車両情報検索システム |
CN112560501A (zh) | 2020-12-25 | 2021-03-26 | 北京百度网讯科技有限公司 | 语义特征的生成方法、模型训练方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220129768A1 (en) | 2022-04-28 |
CN113420822A (zh) | 2021-09-21 |
JP2022059021A (ja) | 2022-04-12 |
CN113420822B (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220350965A1 (en) | Method for generating pre-trained language model, electronic device and storage medium | |
US20230016365A1 (en) | Method and apparatus for training text classification model | |
JP7337979B2 (ja) | モデル訓練方法および装置、テキスト予測方法および装置、電子デバイス、コンピュータ可読記憶媒体、およびコンピュータプログラム | |
JP7108675B2 (ja) | 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
KR20210040851A (ko) | 텍스트 인식 처리 방법, 장치, 전자 기기 및 저장매체 | |
WO2021121198A1 (zh) | 基于语义相似度的实体关系抽取方法、装置、设备及介质 | |
US20220293092A1 (en) | Method and apparatus of training natural language processing model, and method and apparatus of processing natural language | |
EP4116861A2 (en) | Method and apparatus for pre-training semantic representation model and electronic device | |
EP4109324A2 (en) | Method and apparatus for identifying noise samples, electronic device, and storage medium | |
KR20210157342A (ko) | 언어 모델의 훈련 방법, 장치, 전자 기기 및 판독 가능 기록 매체 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
US20220129753A1 (en) | Pre-training method of neural network model, electronic device and medium | |
US20240111956A1 (en) | Nested named entity recognition method based on part-of-speech awareness, device and storage medium therefor | |
CN114861889A (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
US20230114673A1 (en) | Method for recognizing token, electronic device and storage medium | |
JP7291181B2 (ja) | 業界テキスト増分方法、関連装置、およびコンピュータプログラム製品 | |
EP3855341A1 (en) | Language generation method and apparatus, electronic device and storage medium | |
US20230342561A1 (en) | Machine translation method and apparatus, device and storage medium | |
US20230139642A1 (en) | Method and apparatus for extracting skill label | |
US20220139369A1 (en) | Method for recognizing chinese-english mixed speech, electronic device, and storage medium | |
CN113362809B (zh) | 语音识别方法、装置和电子设备 | |
CN115577106A (zh) | 基于人工智能的文本分类方法、装置、设备和介质 | |
CN116244432B (zh) | 语言模型的预训练方法、装置及电子设备 | |
CN114898754B (zh) | 解码图生成、语音识别方法、装置、电子设备及存储介质 | |
US11907668B2 (en) | Method for selecting annotated sample, apparatus, electronic device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7337979 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |