WO2008146583A1 - 辞書登録システム、辞書登録方法および辞書登録プログラム - Google Patents

辞書登録システム、辞書登録方法および辞書登録プログラム Download PDF

Info

Publication number
WO2008146583A1
WO2008146583A1 PCT/JP2008/058539 JP2008058539W WO2008146583A1 WO 2008146583 A1 WO2008146583 A1 WO 2008146583A1 JP 2008058539 W JP2008058539 W JP 2008058539W WO 2008146583 A1 WO2008146583 A1 WO 2008146583A1
Authority
WO
WIPO (PCT)
Prior art keywords
dictionary
registering
natural language
information
user
Prior art date
Application number
PCT/JP2008/058539
Other languages
English (en)
French (fr)
Inventor
Kunihiko Sadamasa
Shinichi Ando
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to US12/601,486 priority Critical patent/US20100174527A1/en
Priority to JP2009516236A priority patent/JPWO2008146583A1/ja
Publication of WO2008146583A1 publication Critical patent/WO2008146583A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

 ユーザ辞書に登録する単語が、自然言語処理に悪影響を及ぼす可能性のある単語である場合でも、その悪影響を最小限に抑えた辞書登録を可能とする辞書登録システムを提供する。  ユーザ辞書を管理・使用して自然言語処理をおこなうデータ処理装置と、自然言語処理に用いるシステム辞書情報及びユーザ辞書情報を保持する記憶装置と、を備えるユーザ辞書を使用して自然言語処理を行う辞書登録システムであって、前記記憶装置が、自然言語処理に用いるシステム辞書情報と、ユーザ辞書と、を備え、前記データ処理装置が、入力された単語に関する情報を前記ユーザ辞書に登録する、単語情報登録手段と、前記システム辞書情報を用いて自然言語処理をおこなった第1の処理結果と、前記システム辞書情報と前記ユーザ辞書情報を用いて自然言語処理をおこなった第2の処理結果との、処理結果の差分を作成する、差分作成手段と、前記差分作成手段で作成された差分にあたる、前記第1の処理結果から前記第2の処理結果への変化が正しいか誤っているかの正誤の判定を受け付ける正誤受付手段と、前記受け付けた単語の登録情報を、前記受け付けた正誤と各正誤を付与する差分を作成する元となった入力文のペアの一部又は全てと共に前記ユーザ辞書に登録する辞書登録手段と、を備える。
PCT/JP2008/058539 2007-05-23 2008-05-08 辞書登録システム、辞書登録方法および辞書登録プログラム WO2008146583A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US12/601,486 US20100174527A1 (en) 2007-05-23 2008-05-08 Dictionary registering system, dictionary registering method, and dictionary registering program
JP2009516236A JPWO2008146583A1 (ja) 2007-05-23 2008-05-08 辞書登録システム、辞書登録方法および辞書登録プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-136660 2007-05-23
JP2007136660 2007-05-23

Publications (1)

Publication Number Publication Date
WO2008146583A1 true WO2008146583A1 (ja) 2008-12-04

Family

ID=40074851

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/058539 WO2008146583A1 (ja) 2007-05-23 2008-05-08 辞書登録システム、辞書登録方法および辞書登録プログラム

Country Status (3)

Country Link
US (1) US20100174527A1 (ja)
JP (1) JPWO2008146583A1 (ja)
WO (1) WO2008146583A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102871A (ja) * 2015-12-04 2017-06-08 富士通株式会社 学習プログラム、学習方法及び学習装置
WO2019194124A1 (ja) * 2018-04-03 2019-10-10 日本電信電話株式会社 タグ付与モデル生成装置、タグ付与装置、これらの方法及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141606B2 (en) * 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
US20170315990A1 (en) * 2015-03-18 2017-11-02 Mitsubishi Electric Corporation Multilingual translation device and multilingual translation method
JP6828741B2 (ja) * 2016-05-16 2021-02-10 ソニー株式会社 情報処理装置
US11379706B2 (en) * 2018-04-13 2022-07-05 International Business Machines Corporation Dispersed batch interaction with a question answering system
CN109033085B (zh) * 2018-08-02 2022-09-30 鼎富智能科技有限公司 中文分词***及中文文本的分词方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127257A (ja) * 1989-10-13 1991-05-30 Fujitsu Ltd 自然言語処理用データ編集支援装置
JPH08287057A (ja) * 1995-04-13 1996-11-01 Fujitsu Ltd 辞書作成支援装置
JPH10312377A (ja) * 1997-05-13 1998-11-24 Sanyo Electric Co Ltd テキスト音声合成装置およびテキスト音声合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004362249A (ja) * 2003-06-04 2004-12-24 Advanced Telecommunication Research Institute International 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体
JP2005267578A (ja) * 2004-03-22 2005-09-29 Nec Corp 辞書強化支援システム、辞書強化支援方法、および辞書強化支援プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5349368A (en) * 1986-10-24 1994-09-20 Kabushiki Kaisha Toshiba Machine translation method and apparatus
JP3960562B2 (ja) * 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127257A (ja) * 1989-10-13 1991-05-30 Fujitsu Ltd 自然言語処理用データ編集支援装置
JPH08287057A (ja) * 1995-04-13 1996-11-01 Fujitsu Ltd 辞書作成支援装置
JPH10312377A (ja) * 1997-05-13 1998-11-24 Sanyo Electric Co Ltd テキスト音声合成装置およびテキスト音声合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004362249A (ja) * 2003-06-04 2004-12-24 Advanced Telecommunication Research Institute International 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体
JP2005267578A (ja) * 2004-03-22 2005-09-29 Nec Corp 辞書強化支援システム、辞書強化支援方法、および辞書強化支援プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102871A (ja) * 2015-12-04 2017-06-08 富士通株式会社 学習プログラム、学習方法及び学習装置
WO2019194124A1 (ja) * 2018-04-03 2019-10-10 日本電信電話株式会社 タグ付与モデル生成装置、タグ付与装置、これらの方法及びプログラム
JP2019185153A (ja) * 2018-04-03 2019-10-24 日本電信電話株式会社 タグ付与モデル生成装置、タグ付与装置、これらの方法及びプログラム
JP7172101B2 (ja) 2018-04-03 2022-11-16 日本電信電話株式会社 タグ付与モデル生成装置、タグ付与装置、これらの方法及びプログラム
US11531806B2 (en) 2018-04-03 2022-12-20 Nippon Telegraph And Telephone Corporation Tag assignment model generation apparatus, tag assignment apparatus, methods and programs therefor using probability of a plurality of consecutive tags in predetermined order

Also Published As

Publication number Publication date
US20100174527A1 (en) 2010-07-08
JPWO2008146583A1 (ja) 2010-08-19

Similar Documents

Publication Publication Date Title
WO2008146583A1 (ja) 辞書登録システム、辞書登録方法および辞書登録プログラム
CN100452025C (zh) 自动检测文件中搭配错误的***和方法
CN103493041B (zh) 使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法
US10762293B2 (en) Using parts-of-speech tagging and named entity recognition for spelling correction
CN109635305B (zh) 语音翻译方法及装置、设备及存储介质
Al-Twairesh et al. Suar: Towards building a corpus for the Saudi dialect
WO2008097490A3 (en) A method and an apparatus to disambiguate requests
WO2007068960A3 (en) A text editing apparatus and method
US9984689B1 (en) Apparatus and method for correcting pronunciation by contextual recognition
WO2009021011A3 (en) Systems and methods for managing statistical expressions
WO2009016631A3 (en) Automatic context sensitive language correction and enhancement using an internet corpus
CN103678288B (zh) 一种专名自动翻译的方法
WO2004066594A3 (en) Word recognition consistency check and error correction system and method
US20150242386A1 (en) Using language models to correct morphological errors in text
KR20120004151A (ko) 문장 번역 장치 및 그 방법
Zhu et al. Semantic parser enhancement for dialogue domain extension with little data
CN101477565B (zh) 确定搜索引擎中输入字符串正确性的方法及装置
Lease et al. Recognizing disfluencies in conversational speech
US20120116749A1 (en) Automatic translation device and method thereof
Wołk et al. Comparison and adaptation of automatic evaluation metrics for quality assessment of re-speaking
CN109614623A (zh) 一种基于句法分析的作文处理方法及***
EP2833269B1 (en) Terminology verification system and method for machine translation services for domain-specific texts
EP1739584A4 (en) DOCUMENT INFORMATIONSVERARBEITUNGSSSYSTEM
WO2008108061A1 (ja) 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
CN116484809A (zh) 基于人工智能的文本处理方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08752430

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2009516236

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 12601486

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08752430

Country of ref document: EP

Kind code of ref document: A1