CN1250189A - 具有习惯用语处理功能的电子词典 - Google Patents

具有习惯用语处理功能的电子词典 Download PDF

Info

Publication number
CN1250189A
CN1250189A CN98119459A CN98119459A CN1250189A CN 1250189 A CN1250189 A CN 1250189A CN 98119459 A CN98119459 A CN 98119459A CN 98119459 A CN98119459 A CN 98119459A CN 1250189 A CN1250189 A CN 1250189A
Authority
CN
China
Prior art keywords
entry
language
idiom
electronic dictionary
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98119459A
Other languages
English (en)
Other versions
CN1102271C (zh
Inventor
杨力平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN98119459A priority Critical patent/CN1102271C/zh
Priority to TW090217855U priority patent/TW477441U/zh
Priority to JP11282996A priority patent/JP2000112941A/ja
Priority to US09/413,962 priority patent/US6453280B1/en
Publication of CN1250189A publication Critical patent/CN1250189A/zh
Priority to HK00103086A priority patent/HK1024068A1/xx
Application granted granted Critical
Publication of CN1102271C publication Critical patent/CN1102271C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

一种具有习惯用语处理功能的电子词典,能够从输入文本中自动识别出当前语句中包含查询词的所有习惯用语,并输出这些习惯用语所对应的译文。该电子词典包括一个习惯用语处理装置,该装置通过文本俘获、断句、局部语法分析以及词库匹配等操作自动识别出当前语句中包含查询词的所有习惯用语。该电子词典提供了习惯用语这一层次上的智能翻译。

Description

具有习惯用语处理功能的电子词典
本发明涉及电子词典,进一步说,涉及具有习惯用语处理功能的电子词典。
多年来,人们一直在研究如何利用计算机使一种文字或口语翻译成另一种文字或口语的机器翻译技术。即在语言学的关于语言形式和结构分析的理论基础上,依靠数学方法建立机器词典、机器语法,利用计算机巨大的存储容量和数据处理能力,在没有人工干预的情况下实现从一种语言到另一种语言(或另外多种语言)的自动翻译。为了实现翻译功能,机器翻译***必须具有词法分析、句法分析、语法分析、词典、习惯用语词典、语义分析以及输出语言的能力。由于机器翻译是一门涉及到语言学、计算机语言学和计算机科学等多门学科的边缘性应用学科,所以目前还没有比较实用的机器翻译***。在这种情况下,人们将兴趣转向一种实用的实现了字词级翻译的电子词典。电子词典是以电子数据的形式存储和使用的一种新型词典。电子词典具有很大的灵活性,可以按超媒体和超文本方式组织信息,检索手段多种多样,可以提供动态翻译特性,并对检索到的词条产生文字、声音和图像解释。
然而,目前大多数电子词典只能实现字词级的翻译。例如,对于“Hetake part in the activity”这样的英文语句,借助一般的英-汉电字词典,只能获得单个词“take”的中文翻译,而无法获得“take part in”这一习惯用语的中文翻译。
虽然目前已有一些具有习惯用语处理功能的电子词典,但是它们具有以下缺点:
·当用户输入诸如“take part in”之类的习惯用语时,这类电子词典可以给出它们的译文,而当用户在输入的习惯用语中加入了其他一些词,如“take an active part in”时,这类电子词典就无法自动识别出习惯用语“take part in”,因而无法给出正确的译文。
·如果用户提供的查询词不是习惯用语的头词,这类电子词典也不能给出正确的译文。例如,对于习惯用语“take part in”,如果用户指出的查询词为“part”,或“in”,则他就不能得到有关“take part in”这一习惯用语的正确译文。
本发明的具有习惯用语处理功能的电子词典克服了以上缺点。
根据本发明的具有习惯用语处理功能的电子词典,包括:用于以电子数据形式存储多个词条的存储装置,每一词条由第一种语言的标题词和第二种语言的译文组成,其中所述标题词包括第一种语言的习惯用语;用于向存储装置登录新的词条的登录装置;以及,根据查询词从存储装置中检索相应的词条的检索装置,所述电子词典的特征在于检索装置包括一个习惯用语处理装置,该装置能够从用第一种语言输入的文本中自动识别出当前语句中包含查询词的所有习惯用语,并且能够从存储装置中检索出习惯用语所对应的用第二种语言表示的译文。
通过以下参照附图的说明可以使本发明的目的、特征和优点更加清楚。
图1为根据本发明的电子词典的方框图;
图2示出了所述电子词典中习惯用语处理装置的工作流程图;
图3示出了词库匹配流程图。
根据本发明的电子词典如图1所示。输入装置100用于输入第一种语言的词串或文本;词条存储装置200用于以电子数据形式存储多个词条;词条登录装置300用于把新的词条登录到词条存储装置200中去,词条检索装置400从词条存储装置200中检索出与查询词匹配的词条;输出装置500输出与查询词匹配的词条。
如图1所示,根据本发明的电子词典的词条检索装置400包括一个习惯用语处理装置600。该习惯用语处理装置600由文本俘获部分601、断句部分602、局部语法分析部分603以及词库匹配部分604组成。
以下参照图2详细描述习惯用语处理装置600各组成部分的工作情况。如图2所示,当习惯用语处理装置600被激活,文本俘获部分601从屏幕显示俘获一段包含查询词的文本,查询词是用户使用光标指示的词。在此之后,断句部分602识别出包含查询词的语句。局部语法分析部分603对语句中所有可能的语法成份进行识别。词库匹配部分604对词库中的词条和语法分析结果进行匹配,每一匹配的词条给出一个语句段的翻译。这些覆盖了查询词的所有匹配词条形成了一个词条集,输出部分根据词条与语句的匹配程度对所述词条集中的词条排队,然后显示在屏幕上。
对于英-汉电子词典,所述局部语法分析部分603所能识别出的语法成份包括:
1.名词短语;
2.动词短语;
3.介词短语;
4.形容词短语;
5.副词短语;
6.单独成份。
名词短语构成如下:
1.1单个名词;
1.2名词+名词;
1.3名词+of+名词;
1.4名词’s名词;
1.5形容词+名词;
1.6冠词+名词;
1.7代词+名词;
1.8数词+名词。
动词短语构成如下:
2.1单个动词;
2.2be+动词;
2.3have+动词;
2.5动词+副词。
介词短语构成如下:
3.1介词+名词短语。
形容词短语构成如下:
4.1单个形容词;
4.2more+形容词;
4.3the most+形容词。
副词短语构成如下:
5.1单个副词;
5.2more+副词;
5.3the most+副词。
以下以语句“He takes an active part in the activity”为例,描述一下局部语法分析的过程。
阶段1
- - - - - - - - - - - - - - - - - - - -
he→名词
take→动词
a→冠词
active→形容词
part→名词
part→形容词
in→介词
in→单独成份
the→冠词
activity→名词
阶段2
- - - - - - - - - - - - - - - - - - - - -
he:名词
take:动词
a:冠词
active:形容词
part:名词
part:形容词
in:介词
in:单独成份
the:冠词
activity:名词
active part:形容词+名词→名词
the activity:冠词+名词→名词
阶段3
- - - - - - - - - - - - - - - - - - - - - -
he:名词
take:动词
a:冠词
active:形容词
part:名词
part:形容词
in:介词
in:单独成份
the:冠词
activity:名词
active part:名词
an active part:冠词+名词→名词
in the activity:介词+名词→介词短语
在识别语句的语法成份时,很有可能一个词属于一个以上的语法成份,它们是语句中完全不同的部分。在上述例子中,“part”既可以是形容词也可以是名词,“in”既可以是介词也可以是单个成份。在这种情况下,局部语法分析的结果将保持所有可能存在的语法成份。
在完成局部语法分析之后,习惯用语处理装置600激活词库匹配部分604对词库中的词条和局部语法分析结果进行匹配。
以下首先介绍一个在本实施例中词库的结构。该词库中每一词条由:标题词、语法、译文组成。
例如:
标题词 语法 译文
take v obj part comp(p in) 参加objprep
take v obj n fin wh comp(pt in) 领会obj
make sure v comp(p about of) 确定objprep
make v obj it comp a comp thatc 使thatc变得adj
place nloc nobj inf inf的地方
表中注释的含义为:
注释 解释
aadjcompfininfnnobjn locobjobjpptthatcvwh 形容词形容词补语及物动词不及物动词名词名词的宾语表明地点的名词以特定词开头的宾语该宾语可以是其之后的语法成份表中的一个介词单独成份以that开头的从句动词以“who”,“where”,“when”,“what”开头的从句
词条的标题词可以包括一个以上的词,例如:
make sure<v comp(p about of)<确定objprep将第一个词作为该词条的头词。
在词条的语法部分中,第一个成份是头词的词类,在词类之后,是一系列语法成分。这部分给出了语法和词义信息。语法成份由其名称和描述组成。它可以包括几个子成份。
例如:obj n fin wh
描述一个宾语语法成份。该宾语是一名词、及物动词短语或由wh开头的从句。
例如:p about of
描述了一个介词短语,该介词短语以about或of开头。
译文部分由语法成份和中文译文组成。
以下参照图3描述一下词库中词条与局部语法分析结果进行匹配的具体过程。以下是词库中具体两词条的例子。
take<v(obj part)(comp(p in))<t(参加objprep)
对于该词条骨架习惯用语(骨架习惯用语是只包括必要组成部分的习惯用语)为“take part in”。在该条目中,“take”为头词。“v”表明这是一个动词短语。“(obj part)”表明动词“take”需要“part”作为其宾语。“comp”指出宾语之后可以用的补语。“(p in)”指出补语应是以“in”开头的介词短语。“t(参加objprep)”表明如何将该习惯用语翻译成中文。“objprep”表示介语in的宾语。
take<v(obj n fin wh)(comp(pt in))<t(领会obj)
该词条的骨架习惯用语为“take in”。在该条目中,“(obj n fin wh)”表明动词“take”需要一个宾语。该宾语可以是名词短语、及物动词短语或以“what”、“when”等开头的从句。“(pt in)”表示补语应是独立成份“in”。
对于以上两词条的匹配结果是:
1.takes vs take<v
2.an active part vs.(obj part)
3.in the activity vs.(comp(p in))
以及
1.take vs take<v
2.an active part vs.(obj n)
3.in vs(comp(pt in))
在上述例子中,如果查询词为“take”或“in”两词条都与局部语法分析结果匹配,如果查询词为“part”则只有词条“take part in”匹配。
最后输出部分根据词条与语法分析结果匹配的程度,对匹配的词条进行排队后输出。例如,对于语句“He takes an active part in theactivity”,查询词为“take”时,有三个匹配的词条:“take part in”、“take in”和“take”。例如根据骨架习惯用语的长度,即骨架习惯用语中词的个数,输出为:
1.take part in参加
2.take in领会
3.take拿、取
从以上可以看出根据本发明的电子词典可以从输入文本中自动识别出包含查询词的所有习惯用语,并输出其相应的译文,从而实现了习惯用语这一级的智能翻译。
对于本领域技术人员来说,在不背离本发明的精神和范畴情况下,本发明可以有各种修改和变型,本发明旨在包括所有这些修改和变型。

Claims (4)

1.一种具有习惯用语处理功能的电子词典,包括:
用于以电子数据形式存储多个词条的存储装置,每一词条由第一种语言的标题词和第二种语言的译文组成,其中所述标题词包括第一种语言的习惯用语;
用于向存储装置登录新的词条的登录装置;以及
根据查询词从存储装置中检索相应词条的检索装置,
所述电子词典的特征在于检索装置包括一个习惯用语处理装置,该装置能够从用第一种语言输入的文本中自动识别出当前语句中包含查询词的所有习惯用语,并且能够从存储装置中检索出习惯用语所对应的用第二种语言表示的译文。
2.根据权利要求1的电子词典,其特征在于所述习惯用语处理装置包括:
文本俘获装置,用于俘获包括查询词的一段文本;
断句装置,从文本俘获装置所俘获的文本中识别出包含查询词的语句;
局部语法分析装置,识别出包含查询词的语句中所有的语法成份;
匹配装置,从词条存储装置中找出所有和语法分析结果匹配的词条;以及
输出装置,输出匹配的词条。
3.根据权利要求2的电子词典,其特征在于输出装置对所要输出的词条按匹配程度进行排列。
4.根据权利要求1的电子词典,其特征在于第一种语言为英语,第二种语言为汉语。
CN98119459A 1998-10-07 1998-10-07 具有习惯用语处理功能的电子词典 Expired - Lifetime CN1102271C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN98119459A CN1102271C (zh) 1998-10-07 1998-10-07 具有习惯用语处理功能的电子词典
TW090217855U TW477441U (en) 1998-10-07 1998-10-28 The English to Chinese online dictionary capable of identifying idioms from english text
JP11282996A JP2000112941A (ja) 1998-10-07 1999-10-04 イディオム処理機能を有する電子辞書
US09/413,962 US6453280B1 (en) 1998-10-07 1999-10-07 Electronic dictionary capable of identifying idioms
HK00103086A HK1024068A1 (en) 1998-10-07 2000-05-24 The electronic dictionary capable of identifying idioms

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN98119459A CN1102271C (zh) 1998-10-07 1998-10-07 具有习惯用语处理功能的电子词典

Publications (2)

Publication Number Publication Date
CN1250189A true CN1250189A (zh) 2000-04-12
CN1102271C CN1102271C (zh) 2003-02-26

Family

ID=5226376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98119459A Expired - Lifetime CN1102271C (zh) 1998-10-07 1998-10-07 具有习惯用语处理功能的电子词典

Country Status (5)

Country Link
US (1) US6453280B1 (zh)
JP (1) JP2000112941A (zh)
CN (1) CN1102271C (zh)
HK (1) HK1024068A1 (zh)
TW (1) TW477441U (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1735883B (zh) * 2002-12-27 2010-05-12 卡西欧计算机株式会社 具有例句的电子词典
CN1932805B (zh) * 2003-06-30 2012-06-20 卡西欧计算机株式会社 电子词典
US9532056B2 (en) 2011-07-18 2016-12-27 Thomson Licensing Method for adaptive entropy coding of tree structures
CN106503076A (zh) * 2016-10-08 2017-03-15 武汉斗鱼网络科技有限公司 一种基于语法格式的分词检索方法及***

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266767B2 (en) * 2000-11-27 2007-09-04 Parker Philip M Method and apparatus for automated authoring and marketing
US8108509B2 (en) * 2001-04-30 2012-01-31 Sony Computer Entertainment America Llc Altering network transmitted content data based upon user specified characteristics
US7080325B2 (en) * 2002-02-22 2006-07-18 Call-Tell Llc Graphical device for comprehensive viewing and input of variable data via a browser-based display
FI114347B (fi) * 2002-03-20 2004-09-30 Master S Innovations Ltd Oy Menetelmä ja laitteisto datan kääntämiseksi
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US7283949B2 (en) * 2003-04-04 2007-10-16 International Business Machines Corporation System, method and program product for bidirectional text translation
US7080103B2 (en) * 2003-05-08 2006-07-18 International Business Machines Corporation Personal information management system and method with audit functionality
US7721271B2 (en) * 2004-04-22 2010-05-18 Microsoft Corporation Language localization and intercepting data using translation tables
TWI269193B (en) * 2004-10-01 2006-12-21 Inventec Corp Keyword sector-index data-searching method and it system
US7349924B2 (en) * 2004-11-29 2008-03-25 International Business Machines Corporation Colloquium prose interpreter for collaborative electronic communication
US7509318B2 (en) * 2005-01-28 2009-03-24 Microsoft Corporation Automatic resource translation
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US7516418B2 (en) * 2006-06-01 2009-04-07 Microsoft Corporation Automatic tracking of user data and reputation checking
US20080189273A1 (en) * 2006-06-07 2008-08-07 Digital Mandate, Llc System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant content data
US20100198802A1 (en) * 2006-06-07 2010-08-05 Renew Data Corp. System and method for optimizing search objects submitted to a data resource
US7657421B2 (en) 2006-06-28 2010-02-02 International Business Machines Corporation System and method for identifying and defining idioms
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
WO2011007627A1 (ja) * 2009-07-17 2011-01-20 日本電気株式会社 音声処理装置および方法ならびに記憶媒体
US8738668B2 (en) 2009-12-16 2014-05-27 Renew Data Corp. System and method for creating a de-duplicated data set
CN102789504A (zh) * 2012-07-19 2012-11-21 姜赢 一种基于xml规则的中文语法校正方法与***
US10936635B2 (en) * 2018-10-08 2021-03-02 International Business Machines Corporation Context-based generation of semantically-similar phrases

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5349368A (en) * 1986-10-24 1994-09-20 Kabushiki Kaisha Toshiba Machine translation method and apparatus
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
JPH02140868A (ja) * 1988-11-22 1990-05-30 Toshiba Corp 機械翻訳システム
JPH05314166A (ja) 1992-05-08 1993-11-26 Sharp Corp 電子化辞書および辞書検索装置
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
IT1261411B (it) * 1993-03-12 1996-05-23 Texas Instruments Italia Spa Metodo e circuiteria per l'uso di memorie aventi locazioni difettose erelativa apparecchiatura di produzione.
JPH0756957A (ja) * 1993-08-03 1995-03-03 Xerox Corp ユーザへの情報提供方法
JPH07282055A (ja) * 1994-04-06 1995-10-27 Fujitsu Ltd 文解析方法および装置
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
JPH08180058A (ja) 1994-12-26 1996-07-12 Matsushita Electric Ind Co Ltd 連語検索装置
JPH08194709A (ja) 1995-01-19 1996-07-30 Matsushita Electric Ind Co Ltd 連語検索装置
JPH08320871A (ja) 1995-05-25 1996-12-03 Toshiba Corp 翻訳処理装置及び翻訳処理方法
JPH10105552A (ja) 1996-09-26 1998-04-24 Oki Electric Ind Co Ltd 機械翻訳システム
JPH10105556A (ja) * 1996-09-27 1998-04-24 Sharp Corp 電子式辞書および情報表示方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1735883B (zh) * 2002-12-27 2010-05-12 卡西欧计算机株式会社 具有例句的电子词典
CN1932805B (zh) * 2003-06-30 2012-06-20 卡西欧计算机株式会社 电子词典
US9532056B2 (en) 2011-07-18 2016-12-27 Thomson Licensing Method for adaptive entropy coding of tree structures
CN106503076A (zh) * 2016-10-08 2017-03-15 武汉斗鱼网络科技有限公司 一种基于语法格式的分词检索方法及***

Also Published As

Publication number Publication date
US6453280B1 (en) 2002-09-17
HK1024068A1 (en) 2000-09-29
CN1102271C (zh) 2003-02-26
TW477441U (en) 2002-02-21
JP2000112941A (ja) 2000-04-21

Similar Documents

Publication Publication Date Title
CN1102271C (zh) 具有习惯用语处理功能的电子词典
KR101130444B1 (ko) 기계번역기법을 이용한 유사문장 식별 시스템
CN1122231C (zh) 为自然语言语句生成逻辑形式图的方法和***
CN1945562A (zh) 训练音译模型、切分统计模型以及自动音译的方法和装置
CN1652106A (zh) 基于语言知识库的机器翻译方法与装置
CN1253820C (zh) 交叉语言信息检索设备和方法
CN1618064A (zh) 翻译方法、已翻译句子的输入方法、记录介质、程序与计算机设备
CN1302030A (zh) 词义消歧的机器翻译方法和***
CN101065746A (zh) 文件自动丰富的方法和***
CN1503161A (zh) 获悉词组之间的转换关系的统计方法和装置
CN1815477A (zh) 用于提供基于标记语言的限定词的方法和***
CN1629833A (zh) 实现问与答功能和计算机辅助写作的方法及装置
CN1492367A (zh) 询问应答***及询问应答方法
CN1687925A (zh) 一种实现双语网页搜索的方法
CN101079268A (zh) 进行手语合成与显示的***和方法
CN1123432A (zh) 机器翻译中的语法自纠正方法
Napoles et al. Paraphrastic sentence compression with a character-based metric: Tightening without deletion
CN1116342A (zh) 一种中文自动校对方法及其***
Kumar et al. FST based morphological analyzer for Hindi language
CN1224954C (zh) 含有固定和可变语法块的语言模型的语音识别装置
Uchimoto et al. Text generation from keywords
Bamman et al. The Latin Dependency Treebank in a cultural heritage digital library
CN1114165C (zh) 中文文本中的字词分割方法
Parameswarappa et al. Kannada word sense disambiguation for machine translation
Papageorgiou et al. Multi-level XML-based Corpus Annotation.

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1053056

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: NEW ANST COMMUNICATION CO.,LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20090911

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090911

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc

Address before: American New York

Patentee before: International Business Machines Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20030226