JP2002215617A - 品詞タグ付けをする方法 - Google Patents

品詞タグ付けをする方法

Info

Publication number
JP2002215617A
JP2002215617A JP2001378036A JP2001378036A JP2002215617A JP 2002215617 A JP2002215617 A JP 2002215617A JP 2001378036 A JP2001378036 A JP 2001378036A JP 2001378036 A JP2001378036 A JP 2001378036A JP 2002215617 A JP2002215617 A JP 2002215617A
Authority
JP
Japan
Prior art keywords
phrase
pos
identifier
tag
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001378036A
Other languages
English (en)
Inventor
Nelly Tarbouriech
タルブリッシュ ネリィ
Herve Poirier
ポワリエ エルヴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2002215617A publication Critical patent/JP2002215617A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 機能を強化した品詞(POS)タグ付け、お
よび句の曖昧性の除去のための方法およびコンピュータ
・システムを提供すること。 【解決手段】 句は、通例、曖昧である可能性のある短
い複数語表現である。本発明は、文法的制約を導入する
ことにより、POSタグ付けならびに文法的な句の曖昧
性除去をサポートする。句は、その句の識別子150に
応じて、人工的なコンテクスト情報210で補われる。
次いで、補った句にPOSタグ付けをするか(ステップ
13)、またはその曖昧性を文法的に取り除く。重要な
応用例は、POSタグ付け、自動式語符号化、主要語検
出、および情報検索である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般には、言語体
系中の句の曖昧性を除くための方法およびコンピュータ
・システムに関し、より詳細には品詞のタグ付けに関す
る。
【0002】
【従来の技術】品詞(POS)タグ付けには、いくつか
の技術が開発されている。品詞タガーの機能は、テキス
ト中の各単語またはそれに対応する下位単位を、タグに
よって表される、抽象的な形態統語論カテゴリと関連付
けることである。品詞タグを付けたテキストは、例えば
パーサまたは統語論アナライザなど、各種のテキスト処
理法に使用されており、テキスト中の意味構造の認識、
抽出および正規化を可能にする。これらの構造は、テキ
スト・マイニング、索引付け、理解、および対話システ
ムに使用することができる。
【0003】以下では、品詞タグを、簡潔にタグまたは
POSタグとも表す。POSタガーの一般的カテゴリを
抽象化することにより、効果的な複数言語パーサを作り
出すことが可能になる。これは、テキスト分析規則は、
各言語に固有の規則を使用するのではなく、限られた数
のカテゴリを使用して記述することができるからであ
る。
【0004】一般に、POSタガーは3つの機能を行
う。 1)トークン化:テクスト文字の流れをトークンに分け
る。 2)語彙的ルックアップ:各トークンに、可能性のある
すべての品詞タグを提供する。 3)曖昧性の除去:各トークンに単一の品詞タグを割り
当てる。
【0005】
【発明が解決しようとする課題】実験的な設定では、P
OSタガーは、95%以上という好率の精度でPOSタ
グの正確な割り当てを達成することができるが、こうし
た試験は通常、完全文からなるテキストで行われてい
る。しかし、現実世界の応用例では、文書はしばしば、
例えば題名、項目リスト、小見出しなど、不完全文から
なるテキストを含んでいる。このような句は、POSタ
ガーで不正確にタグ付けされることが多い。
【0006】技術マニュアルは一般に、「press(押
す)」「open(開く)」あるいは「hold(保持する)」
などの単語を第1のトークンとして含む指示リストを含
んでいる。こうした単語は、語彙中に名詞としても動詞
としても存在するために曖昧性がある。句が例えば「cl
ose the door」のように短く、POSタガーが、動詞で
始まる文法構造として教え込まれていない場合には、P
OSタガーはこの句の曖昧性を取り除くことができな
い。句「Train Schedule」は、「time tables fortrain
s」を意味する句の別の例であるが、この句の場合、一
般的なPOSタガーは2つの単語のどちらかを動詞と識
別する。
【0007】短い句の場合、一般的な曖昧性除去の方法
では、結果が部分的に不正確になるのが普通である。し
たがって、しばしば、ユーザがPOSタガーを模倣する
ことに対応する、手動によるPOSタグ付けを行わなけ
ればならないことがある。
【0008】本発明は、上記の状況を鑑みてなされたも
のであり、その主要な目的はPOSタガーの質を高める
ことである。
【0009】本発明の他の目的は、文法的な制約を導入
することにより、POSタガーによる句の曖昧性除去を
サポートする方法およびコンピュータ・システムを提供
することである。
【0010】本発明のさらに他の目的は、句に人工的な
文法的制約を提供して、句のタグ付け動作を改良する方
法およびコンピュータ・システムを提供することであ
る。
【0011】本発明の別の目的は、コンテクスト情報を
補った句に基づいて、句にPOSタグ付けをする方法お
よびコンピュータ・システムを提供することである。
【0012】本発明のさらに別の目的は、上記の方法に
基づく、自動式語符号化(Automatic Term Encoding)
を提供することである。本発明の別の目的は、上記の方
法に基づき、句から主要語を抽出するプロセスを提供す
ることである。
【0013】
【課題を解決するための手段】これらの目的を達成する
ために、本発明は第1の態様で、句に少なくとも1つの
品詞タグを割り当てる方法を提供する。この方法は、句
の識別子を入手するステップであって、その識別子がコ
ンテクスト情報と関連付けられているステップと、句に
コンテクスト情報を補うステップと、補った句に基づい
て、少なくとも1つのPOSタグを句に割り当てるステ
ップとを含む。
【0014】本発明の第2の態様によると、文法的に句
の曖昧性を除く方法が提供される。この方法は、句を入
手して、その句の識別子を入手するステップであって、
識別子が人工的情報と関連付けられているステップと、
句に人工的情報を補うステップと、補った句に基づいて
文法的に句の曖昧性を除くステップとを含む。
【0015】本発明の第3の態様によると、句に品詞タ
グ付けをするためのコンピュータ・システムが提供され
る。このコンピュータ・システムは、コンテクスト情報
と関連付けられた識別子に教え込む識別子入力手段と、
複数のコンテクスト情報項目を含むコンテクスト・スト
レージと、コンテクスト・ストレージに接続された識別
子ストレージであって、複数のコンテクスト情報項目の
うち少なくとも1つのコンテクスト情報項目にそれぞれ
が関連付けられた複数の識別子を含む識別子ストレージ
とを備える。このコンピュータ・システムはさらに、識
別子入力およびコンテクスト・ストレージに接続され、
入手した識別子に関連付けられたコンテクスト情報で句
を補うコンテクスト・サプルメンタ(supplementer)
と、コンテクスト・サプルメンタに接続され、補った句
に基づいて句の各部分の品詞を識別するPOSタガーと
を備える。
【0016】本発明のこれらの手法を使用することによ
り、句の曖昧性をより正確に取り除くことができる。
【0017】好ましい実施形態では、句の主要な文法カ
テゴリを識別子として使用して、理解および選択を容易
にすることにより、さらに改善を達成することができ
る。
【0018】別の好ましい実施形態では、複数の句中の
句の構造的情報、またはテキスト情報を使用して句の識
別子を定義する。このような方法で定義された識別子
は、定義が容易であるのに加えて、例えば指示リスト、
データベース内容のグループ、または句の類似グループ
など、一度に複数の句に適用できる。
【0019】好ましい実施形態では、本発明の方法を、
主要語抽出の応用例、または自動式語符号化プロセスで
句の形式的構造を引き出すために使用する。
【0020】添付の図面は、本明細書に援用し、かつそ
の一部をなして、本発明のいくつかの実施形態を説明す
る。これらの図面は説明と併せて、本発明の原理を明ら
かにする役目を果たす。図面は、本発明の使用法の好ま
しい実施例および代替実施例の説明のみを目的とするも
ので、本発明を図に説明する実施形態だけに制限するも
のではない。
【0021】さらなる特性および利点は、添付図面に示
す、以下の本発明の各種実施形態のより詳細な説明から
明らかになろう。
【0022】
【発明の実施の形態】次いで本発明の図の実施形態につ
いて、図面を参照して説明する。
【0023】図面、詳細には、POSタグ付けプロセス
で使用する方法の好ましい実施形態を示す図1を参照し
て、本発明の第1の態様について論じる。開始10から
終了14までのこの方法の最初のステップは、識別子を
入手するステップ11であり、次いで句100をその識
別子150に関連付ける。識別子はコンテクスト情報2
10に関連付けられており、ステップ12でこのコンテ
クスト情報を句100に補う。本発明の好ましい実施形
態では、コンテクスト情報は、少なくとも前コンテクス
ト201または後コンテクスト202の情報を含む。ス
テップ13で、補った句120にPOSタガーでタグを
付ける。ステップ110で、元の句100に対応する部
分を取り出す。
【0024】句は、自然言語または人工言語の少なくと
も一部を含むものとして定義することができる。
【0025】任意選択で、このPOSタグ付け法は、点
線の接続ポイントにつなげた点線で表すように継続して
もよい。この任意選択のステップについては、下記で図
3を参照して論じる。
【0026】図1の方法の例示的実施では、識別子は、
句の主要な文法カテゴリである。本発明の別の実施形態
では、句の構造的特性(例えば、見出し、指示リスト)
によって識別子を定義する。
【0027】図1に示すステップは、以下で、句「clos
e the door」を例に詳細に説明する。
【0028】POSタガーがコンテクストを補う際に
は、少なくとも2つの異なる識別子すなわち文法カテゴ
リを定義する。例えば、全体で文法的に名詞または動詞
を表す句には、VerbPhrase(動詞句)またはNounPhrase
(名詞句)を定義する。本発明の方法に従うと、句のP
OSタグ付けまたは曖昧性除去のために、動詞/名詞句
にVerb/NounPhraseコンテクスト情報を補う。この例で
は、POSタガーは、次のVerbPhraseおよびNounPhrase
コンテクスト情報を使用する。 英語。前コンテクスト。NounPhrase:"the" 英語。後コンテクスト。NounPhrase:"who works well" 英語。前コンテクスト。VerbPhrase:"the technician
s" 英語。後コンテクスト。VerbPhrase:"to someone"
【0029】コンテクスト情報は、テキスト情報、PO
Sタグ、またはPOSタガーのために適合された情報を
含むことが可能である。
【0030】図1を参照すると、句「close the door」
の場合、ステップ11でカテゴリVerbPhraseの識別子を
入手する。識別子は、上記のようにコンテクスト情報に
関連付けられている。そして、ステップ12で、それに
対応する前コンテクスト201および後コンテクスト2
02の情報を句100に補う。 "The technicians close the door to someone."
【0031】この補った句120の内容は意味をなさな
いが、POSタガーは、この場合にはこの句の部分の曖
昧性を取り除くことができる。これは、補った句120
が、知られている文法構造を表しているからである。P
OSタガーは、少なくとも1つのPOSタグを句120
に割り当てるステップ13で、動詞には+VERBのタ
グを、単数名詞には+NOUN_SGを、複数名詞には
+NOUN_PLを、冠詞には+ARTを、前置詞には
+PREPを、代名詞には+PRONを、文章末尾のマ
ーカには+SENTを使用する。 "the+ART technician+NOUN_PLclose+VE
RB the+ART door+NOUN_SG to+PREP
someone+PRON.+SENT"
【0032】補ったコンテクスト情報は、POSタグ付
けプロセスを終える際に句から除去する。ステップ11
0の結果は: "close+VERB the+ART door+NOUN_SG" となる。
【0033】識別子を入手するステップ11は、種々の
方式で実施してよい。例えば、句「close the door」が
文書中の指示リストの一部であって、したがって文法カ
テゴリVerbPhraseの識別子と関連付けられることもあ
る。さらに、この句がユーザによる入力であることもあ
り、この場合には、そのユーザとの対話履歴の評価によ
り自動的に識別子が得られるか、あるいはユーザの入力
により手動で識別子が得られることさえある。
【0034】次に本発明の第2の態様を説明する。文法
的に句の曖昧性を取り除くためにコンピュータ・システ
ムで使用する方法は、句を入手するステップと、その句
の識別子を入手するステップであって、識別子が人工的
な情報に関連付けられているステップと、人工的な情報
で句を補い、補った句に基づいて文法的に句の曖昧性を
除くステップとを含む。
【0035】この第2の方法がPOSタガーには限定さ
れず、また本発明の第1の方法のより一般的なバージョ
ンと見なせることは明らかである。したがって、説明で
は本発明の第1の方法のみを参照するが、上記および下
記の本発明の詳細な説明のすべての部分は、第2の方法
にも適用することができる。
【0036】図1に示す方法は、従来技術のPOSタグ
付けプロセスを改良する。本願の導入部ですでに触れ
た、POSタグ付けの基本的ステップの例を図6に示
す。
【0037】図6は、開始60から終了66に、一般的
なPOSタガーのステップを示している。ステップ61
で句100を入手すると、ステップ62で、それをトー
クン1からトークン3(101〜103)にトークン化
する。語彙情報に基づいて、各トークン101〜103
を評価することにより、ステップ63で、可能性のある
タグ、タグ11〜タグ32(111〜132)を提供す
る。可能性のあるタグ111〜132を提供するステッ
プ63は、トークン101〜103の形態的分析を含ん
でもよい。例えば、単語「swim」を、動詞「swim」の単
純過去時制と識別するなどである。ステップ64で、タ
グ111〜132の曖昧性を取り除くことにより、単一
のタグ113、121、132を、各トークン101、
102、103に割り当てる。ステップ65で、曖昧性
を取り除いたタグ113、121および132を、句1
00のトークン101、102、103に組み合わせ、
その結果タグ付きの句190を得る。
【0038】いくつかの従来技術のPOSタガーでは、
POSタグ付けプロセスに、例えば、有限状態変換器
(FST)や隠れマルコフ・モデル(HMM)を使用し
ている。しかし、本発明の方法は、どの従来技術のPO
Sタガーにも応用することが可能である。
【0039】本発明のこの方法のステップは、種々の方
式で従来技術のPOSタグ付けプロセスと組み合わせる
ことが可能である。その一部は、下記で図1および図2
を参照して説明する。
【0040】本発明の一実施形態では、識別子を入手
し、句を補うステップ11および12は、句を入手する
ステップ61とともに実行することができる。この場
合、タグを割り当てるステップ13は、可能性のあるタ
グを提供し、タグの曖昧性を除くステップ63および6
4をまとめて行う。
【0041】本発明の別の実施形態では、例えばステッ
プ63で複数の可能なタグを句の1つのトークンに提供
する場合には、図1に示す方法のステップを、タグの曖
昧性を除くステップ64に挿入してもよい。
【0042】図2は、開始20から終了26に、本発明
の好ましい実施形態の、識別子を入手するステップ11
をより詳細に説明している。ステップ21で、句100
およびそれに関連付けられた識別子150を入手し、ス
テップ22で、その識別子を句の可能な複数カテゴリ1
60にマップする。このマッピングは、実際にはカテゴ
リを事前選択するステップである。本発明の別の実施形
態では、複数のカテゴリ160は句の主要な文法カテゴ
リである。ステップ23で、複数のカテゴリ160を選
択のために提供するが、この選択は外部選択24でもよ
い。最も見込みのあるカテゴリに外部選択24を行わな
い場合は、ステップ25でそれをデフォルトとして選択
する。次いで、句を、コンテクスト情報211に関連付
けられた最も見込みのあるカテゴリ161に関連付け
る。
【0043】本発明の別の実施形態では、コンテクスト
のない句については、句に割り当てられる少なくとも1
つのPOSタグを、可能性のあるPOSタグから選択
し、また可能性のあるPOSタグを評価することによ
り、その句に最も見込みのあるカテゴリを選択する。実
際、このような評価により、POSタグの曖昧性をさら
に除く必要性がなくなる。
【0044】(応用例)図3は、任意選択の応用例のた
めに、図1の方法を使用する方式を表しており、接続ポ
イント15から開始して終了34で終了する。第1の任
意選択ステップ31で、タグ付きの句または句タグを記
憶または出力する。少なくとも1つの割り当てられたP
OSタグを有する句に基づいて、句から主要語を抽出す
る任意選択ステップ32は、本発明の方法を用いるもう
1つの応用例である。本発明の別の実施形態では、別の
任意選択ステップ33で、元の句の変形を包含する句の
形式構造を取り出す。ステップ32および33について
は、下記でより詳細に説明する。
【0045】既存の自然言語処理の応用例(例えば、辞
書生成、用語データベース作成)の多くでは、表現の品
詞の符号化を必要とする。現在、辞書編集者は、何らか
の特定文法に従って手動でこの符号化を行っている。こ
の手動による符号化は、自動式語符号化(Automatic Te
rm Encoding)と呼ばれる自動プロセスによって改良お
よび高速化することができる。形式構造を取り出すステ
ップ33は、自動式語符号化プロセスの最終ステップで
あり、この結果、自然言語の処理ツールで使用できる言
語正規表現が自動的に生成される。
【0046】例えば、句「close the door」は、日常使
用する短い句を含んだ旅行用辞書の一部であって、これ
を異なる言語に翻訳しなければならないこともある。辞
書編集者は、符号化したい語としてこの句を指定し、こ
の句に一般的な文法カテゴリを提供する。文法カテゴリ
は、例えばこの句が指示リストの一部である場合には、
句の構造的特性から得ることも可能である。この例で得
る文法カテゴリもまたVerbPhraseである。タグ付きの句 "close+VERB the+ART door+NOUN_SG" を使用して、その句の変形を捉える正規表現を生成す
る。
【0047】タグ付けプロセスの結果得られる構文カテ
ゴリは、より一般的な文法タグにマップされる。影響を
受ける動詞の曖昧性を除き、その動詞を識別した結果の
POSタグ+VERBは、すべてのタイプの動詞を包含
する、より包括的な修飾子Vにマップされる。POSタ
グ+NOUN_SG(名詞、固有名詞、または略語)
は、すべての名詞タグがマップされた大域修飾子Nに置
き換えられる。これらの包括的なタグは、初期表現を一
般化する。マッピング規則は、追加情報も挿入すること
ができる。例えばある規則では、2つの名詞の間に形容
詞を挿入できること、または動詞の後にいくつかの形容
詞を加えられることを指定することができる。形式構造
を取り出すステップ33で本発明が適用する規則は、言
語およびタガーに依存する。最終的に、句は形式構造 "close V: ADV* the D: door N:" になる。この形式構造は、 "close the door" または"closing firmly the door"のような元の表現の
変形を捉える。
【0048】自動式語符号化は、辞書、用語データベー
スなどの構築プロセスの一部を自動化するため、言語リ
ソース作成者の作業を改善する。これは、符号化プロセ
スの冗長な部分を自動化することにより、確認のために
より多くの時間を割けるようにするため、リソース作成
者の役割を変える。時間の節減以外にも、自動式語符号
化応用例における規則の適用は、符号化(例えば、一般
化タグの選択)が同種であることを保証する。これは、
マッピングを手動で行わないことと、リソース作成者は
単にタガーを誘導するだけで、タガーを模倣するのでは
ないことによる。
【0049】本発明の別の応用例は情報検索に関連する
もので、自動式語符号化の結果を用いることにより上記
の方法を利用する。自動式語符号化の結果得られる形式
構造に基づくと、アプリケーションは複数語表現の異な
る変形をすべて判別し、それにより正規表現に一致する
すべての語を捉えることができる。例えば、句「dense
matrix」の場合には、自動式語符号化プロセスの異なる
ステップから次の結果が得られる。 a)曖昧性除去の結果:”dense+ADJmatrix+NO
UN_SG” b)自動式語符号化による結果:”dense A:ADJ*m
atrix N:”
【0050】自動的に適用される特定の文法規則は、名
詞の前に形容詞(ADJは形容詞)がない、または形容
詞がある可能性を追加する。すると、例えば a)dense square matrix b)real dense square matrix c)large and real dense square matrix
【0051】など、この正規表現と一致する同等の表現
を識別することができる。
【0052】文法規則をさらに追加すると、捉えること
ができる表現の種類が広がる。
【0053】少なくとも1つの割り当てられたPOSタ
グを有する句に基づいて、句から主要語を抽出する図3
のステップ32は、本発明の方法を使用した次の応用例
である。例えば、 "alarm sensor switch" という句は、入手した対応する識別子により、NounPhra
seと識別することができる。続いてこの句を次の文章に
補う。 "the alarm sensor switch who works well." 補った句の曖昧性を取り除くと、 "the alarm +NOUN#SG sensor +NOUN_SG
switch+NOUN_SG who works well." という結果を得る。タグ付きの句に、関連する文法規則
を適用すると、この句の主要語は"switch"であると識別
される。
【0054】主要語検出プロセスの場合の自動式語符号
化の規則と同様に、主要語の抽出に適用すべきこの規則
も正規表現を用いて符号化され、また言語およびタガー
に依存する。ステップ32の主要語検出は、主要語であ
る可能性のある、句中のすべての名詞を見つけるサブ・
ステップと、その句の主要語である可能性が最も高い1
つの名詞を識別するサブ・ステップに分割してもよい。
【0055】(機能単位)図4に、POSタグ付け、主
要語抽出、または形式構造化プロセスに関係する機能単
位を示す。
【0056】第1の実施形態では、コンテクスト・サプ
ルメンタ44は、識別子入力手段43と、POSタガー
45と、識別子ストレージ41に接続されたコンテクス
ト・ストレージ42とに接続される。コンテクスト・サ
プルメンタ44は、識別子入力43を介して句の識別子
を入手する。あるいは、句は、データ・ストレージ49
か、またはコンテクスト・サプルメンタ44に接続され
た句入力48から得てもよい。
【0057】コンテクスト・ストレージ42は、句に補
うための複数のコンテクスト情報項目を含む。識別子ス
トレージ41は複数の識別子を含み、識別子はそれぞ
れ、コンテクスト・ストレージ42の少なくとも1つの
コンテクスト情報項目に関連付けられている。コンテク
スト・サプルメンタ44は、コンテクスト・ストレージ
42から得た識別子に従って、コンテクスト情報項目を
選択する。句は、選択したコンテクスト情報によって補
われ、合わせてPOSタガー45への入力となる。PO
SタガーはPOSタグ付けプロセスを実行し、この結
果、タグ付きの句または句タグが得られる。この結果
は、出力83で表示または出力することができ、または
データ・ストレージ49に記憶しておくこともできる。
【0058】本発明の別の実施形態では、コンピュータ
・システムはさらに、複数のカテゴリを含むカテゴリ・
ストレージ47を備える。識別子はそれぞれ、カテゴリ
・ストレージ47の少なくとも1つのカテゴリに関連付
けられ、各カテゴリは、コンテクスト・ストレージ42
中の少なくとも1つのコンテクスト情報項目に関連付け
られている。カテゴリ入力82を介してカテゴリを入手
すると、句に補わなければならないコンテクスト情報を
直接選択することができる。入手した識別子はカテゴリ
にマップし、続いてコンテクスト情報にマップすること
ができる。
【0059】複数のカテゴリを識別子に関連付ける場
合、カテゴリ・エバリュエータ(evaluator)46は、
その識別子に従って、例えば句の主要な文法カテゴリな
ど見込みのあるカテゴリの事前選択を行い、事前選択し
たカテゴリから最も見込みのあるカテゴリを選択する。
この選択は、選択手段81を介して外部選択によって行
っても、またはデータ・ストレージ49に記憶された選
択規則に従って行ってもよい。
【0060】本発明の別の実施形態では、句の、可能性
のあるPOSタグに基づいて、最も見込みのあるカテゴ
リを選択する。可能性のあるPOSタグは、データ・ス
トレージから句とともに提供される。
【0061】コンテクスト情報は、少なくとも前コンテ
クスト情報か後コンテクスト情報を含むことが可能であ
り、これらの情報はそれぞれ、少なくとも1つのPOS
タグまたはテキスト情報によって表すことができる。
【0062】図3を参照して説明した応用例では、PO
Sタガー45は、タグ付きの句に基づいて主要語抽出プ
ロセスを実行する主要語エキストラクタ(extracteor)
84に接続してよい。または、元の句の変形を包含する
句の形式構造を取り出すフォーマライザ(formalizer)
85に接続してもよい。本発明の別の実施形態では、フ
ォーマライザ85は、形態ジェネレータ86およびデー
タ・ストレージ49に接続することができる。データ・
ストレージ49は、句またはタグ付き句についての入力
データまたは出力データのストレージとして機能するこ
とができ、さらに、POSタグ付け、形式化、または主
要語抽出プロセスの規則を含むことができる。
【0063】(ハードウェア装置)図5は、CPU5
0、キーボード51、ディスプレイ52、ポインティン
グ・デバイス53、有線式/無線式インタフェース5
4、音声入力手段55、音声出力手段56、2次ストレ
ージ57、プリンタ58、および1次ストレージ59を
備えるコンピュータ・システムを表している。
【0064】本発明に照らして、本発明を実施するのに
最良の形態を以下に説明する。1次ストレージ59は、
プロセッサ実行可能命令を含んだコンピュータ・プログ
ラムを含む。この命令は、サプルメンタ44がコンテク
スト情報を句に補うこと、およびPOSタガー45が少
なくとも1つのPOSタグを句に割り当てることを実施
させる。1次ストレージ59はさらに、複数のコンテク
スト情報項目を含むコンテクスト・ストレージ42と、
複数の識別子を含む識別子ストレージ41とを含む。識
別子はそれぞれ、複数のコンテクスト情報項目のうち少
なくとも1つのコンテクスト情報項目と関連付けられ
る。CPU50は、1次ストレージ59に記憶されたプ
ロセッサ実行可能命令を実行し、それにより本発明の実
施される方法を実行する。キーボード51は、句の識別
子を得るための識別子入力43として使用してよい。識
別子は、識別子ストレージ41の複数識別子の1つであ
り、したがって、複数のコンテクスト情報項目のうちの
一コンテクスト情報項目と関連付けられている。句に
は、コンテクスト・サプルメンタ44により、コンテク
スト情報項目を補う。POSタガー45に入力される、
補った句は、少なくとも1つのPOSタグをその句に割
り当てるために評価される。POSタグ付けプロセスで
使用する規則はいずれも、POSタガー45の一部とし
て記憶される。
【0065】キーボード51およびポインティング・デ
バイス53は、識別子入力43、カテゴリ入力82、ま
たは句入力48として使用することができる。ディスプ
レイ52またはプリンタ58は、結果出力83の役目を
果たすことができ、またキーボード51またはポインテ
ィング・デバイス53と併せて、選択手段81として使
用してもよい。
【0066】音声入力手段55は、入力手段または選択
手段81のどちらかとして使用することができ、一方、
音声出力手段56は結果出力83として使用することが
できる。2次ストレージ57は、データ・ストレージ4
9の一部としての役目を果たし、ハード・ディスク、C
D、DVDなどでよい。2次ストレージは交換可能なの
で、通例は言語依存性データの記憶に使用される。
【図面の簡単な説明】
【図1】 本発明の好ましい実施形態による方法を説明
する流れ図である。
【図2】 本発明の好ましい実施形態による、図1の最
初のステップを拡張して説明する流れ図である。
【図3】 図1の方法に基づく任意選択の応用例を説明
する流れ図である。
【図4】 本発明の好ましい実施形態による、句をPO
Sタグ付けするためのコンピュータ・システムの機能単
位の図である。
【図5】 本発明の実施に使用することができるコンピ
ュータ・システムの構成要素の図である。
【図6】 従来技術のPOSタグ付けプロセスを説明す
る流れ図である。
【符号の説明】
41 識別子ストレージ、42 コンテクスト・ストレ
ージ、43 識別子入力、44 コンテクスト・サプル
メンタ、45 POSタガー、46 カテゴリ・エバリ
ュエータ、47 カテゴリ・ストレージ、48 句入
力、49 データ・ストレージ、81 選択手段、82
カテゴリ入力、83 結果出力、84主要語エキスト
ラクタ、85 フォーマライザ、86 形態ジェネレー
タ、51キーボード、52 ディスプレイ、53 ポイ
ンティング・デバイス、54有線式/無線式インタフェ
ース、55 音声入力手段、56 音声出力手段、57
2次ストレージ、58 プリンタ、59 1次ストレ
ージ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つの品詞タグを句に割り当
    てるために、コンピュータ・システムで使用する方法で
    あって、 コンテクスト情報と関連付けられた識別子を、前記句に
    対して入手する識別子入手ステップと、 前記句に前記コンテクスト情報を補うステップと、 補われた前記句に基づいて、少なくとも1つの前記品詞
    タグを当該句に割り当てるステップと、 を含むことを特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法であって、 前記識別子入手ステップは、 前記識別子に従って、前記句に、見込みのある主要な文
    法カテゴリを事前選択するステップと、 事前選択した前記主要な文法カテゴリから、前記句に補
    う前記コンテクスト情報に関連付けられる最も見込みの
    あるカテゴリを選択するステップと、 をさらに含むことを特徴とする方法。
  3. 【請求項3】 請求項2に記載の方法であって、 前記句に割り当てる少なくとも1つの品詞タグは、コン
    テクスト情報を持たない前記句に割り当てることができ
    る、可能性のある品詞タグから選択され、 前記最も見込みのあるカテゴリを選択することは、前記
    可能性のある品詞タグを評価することによってサポート
    されること、 を特徴とする方法。
JP2001378036A 2000-12-19 2001-12-12 品詞タグ付けをする方法 Pending JP2002215617A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/738,987 US6910004B2 (en) 2000-12-19 2000-12-19 Method and computer system for part-of-speech tagging of incomplete sentences
US09/738,987 2000-12-19

Publications (1)

Publication Number Publication Date
JP2002215617A true JP2002215617A (ja) 2002-08-02

Family

ID=24970328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001378036A Pending JP2002215617A (ja) 2000-12-19 2001-12-12 品詞タグ付けをする方法

Country Status (3)

Country Link
US (1) US6910004B2 (ja)
EP (1) EP1217533A3 (ja)
JP (1) JP2002215617A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546315B2 (en) 2005-12-28 2009-06-09 International Business Machines Corporation Device for reporting software problem information
JP2015170151A (ja) * 2014-03-07 2015-09-28 日本放送協会 タグ付与知識学習装置およびそのプログラム、ならびに、タグ付与装置およびそのプログラム

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US6859771B2 (en) * 2001-04-23 2005-02-22 Microsoft Corporation System and method for identifying base noun phrases
GB2390704A (en) * 2002-07-09 2004-01-14 Canon Kk Automatic summary generation and display
GB2399427A (en) 2003-03-12 2004-09-15 Canon Kk Apparatus for and method of summarising text
GB2407657B (en) * 2003-10-30 2006-08-23 Vox Generation Ltd Automated grammar generator (AGG)
US7865354B2 (en) * 2003-12-05 2011-01-04 International Business Machines Corporation Extracting and grouping opinions from text documents
KR100669241B1 (ko) * 2004-12-15 2007-01-15 한국전자통신연구원 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
KR100764174B1 (ko) * 2006-03-03 2007-10-08 삼성전자주식회사 음성 대화 서비스 장치 및 방법
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
WO2008061002A2 (en) * 2006-11-14 2008-05-22 Networked Insights, Inc. Method and system for automatically identifying users to participate in an electronic conversation
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080249762A1 (en) * 2007-04-05 2008-10-09 Microsoft Corporation Categorization of documents using part-of-speech smoothing
US9053089B2 (en) * 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) * 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US7925743B2 (en) * 2008-02-29 2011-04-12 Networked Insights, Llc Method and system for qualifying user engagement with a website
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8521512B2 (en) * 2008-04-30 2013-08-27 Deep Sky Concepts, Inc Systems and methods for natural language communication with a computer
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20100257182A1 (en) * 2009-04-06 2010-10-07 Equiom Labs Llc Automated dynamic style guard for electronic documents
US8275788B2 (en) 2009-11-17 2012-09-25 Glace Holding Llc System and methods for accessing web pages using natural language
US8972445B2 (en) 2009-04-23 2015-03-03 Deep Sky Concepts, Inc. Systems and methods for storage of declarative knowledge accessible by natural language in a computer capable of appropriately responding
US9805020B2 (en) 2009-04-23 2017-10-31 Deep Sky Concepts, Inc. In-context access of stored declarative knowledge using natural language expression
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110161067A1 (en) * 2009-12-29 2011-06-30 Dynavox Systems, Llc System and method of using pos tagging for symbol assignment
US20110161073A1 (en) * 2009-12-29 2011-06-30 Dynavox Systems, Llc System and method of disambiguating and selecting dictionary definitions for one or more target words
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9858338B2 (en) * 2010-04-30 2018-01-02 International Business Machines Corporation Managed document research domains
US20120151386A1 (en) * 2010-12-10 2012-06-14 Microsoft Corporation Identifying actions in documents using options in menus
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US20130311506A1 (en) * 2012-01-09 2013-11-21 Google Inc. Method and apparatus for user query disambiguation
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9280520B2 (en) * 2012-08-02 2016-03-08 American Express Travel Related Services Company, Inc. Systems and methods for semantic information retrieval
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9311058B2 (en) 2013-03-15 2016-04-12 Yahoo! Inc. Jabba language
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9530094B2 (en) * 2013-03-15 2016-12-27 Yahoo! Inc. Jabba-type contextual tagger
US9262555B2 (en) 2013-03-15 2016-02-16 Yahoo! Inc. Machine for recognizing or generating Jabba-type sequences
US9195940B2 (en) 2013-03-15 2015-11-24 Yahoo! Inc. Jabba-type override for correcting or improving output of a model
US9275035B2 (en) * 2013-05-14 2016-03-01 English Helper Inc. Method and system to determine part-of-speech
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的***和方法
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9563192B2 (en) 2014-01-02 2017-02-07 Rockwell Automation Technologies, Inc. Software workstation and method for employing appended metadata in industrial automation software
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10249297B2 (en) 2015-07-13 2019-04-02 Microsoft Technology Licensing, Llc Propagating conversational alternatives using delayed hypothesis binding
US10803207B2 (en) 2015-07-23 2020-10-13 Autodesk, Inc. System-level approach to goal-driven design
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10545854B2 (en) 2016-07-01 2020-01-28 Wipro Limited Method and a system for automatically identifying violations in one or more test cases
US10446137B2 (en) * 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN107315733A (zh) * 2016-11-24 2017-11-03 海南州云藏藏文信息技术有限公司 智能藏文词性自动标注***
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11295089B2 (en) 2020-03-01 2022-04-05 International Business Machines Corporation Dynamically enhancing an instrument using multi-stem definitions
US10878174B1 (en) 2020-06-24 2020-12-29 Starmind Ag Advanced text tagging using key phrase extraction and key phrase generation
US11379763B1 (en) 2021-08-10 2022-07-05 Starmind Ag Ontology-based technology platform for mapping and filtering skills, job titles, and expertise topics

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
US5610812A (en) 1994-06-24 1997-03-11 Mitsubishi Electric Information Technology Center America, Inc. Contextual tagger utilizing deterministic finite state transducer
US5794177A (en) 1995-07-19 1998-08-11 Inso Corporation Method and apparatus for morphological analysis and generation of natural language text
US5822731A (en) 1995-09-15 1998-10-13 Infonautics Corporation Adjusting a hidden Markov model tagger for sentence fragments
GB9713019D0 (en) 1997-06-20 1997-08-27 Xerox Corp Linguistic search system
EP0992008B1 (en) 1997-07-04 2001-11-07 Xerox Corporation Finite State Transducers APPROXIMATING HIDDEN MARKOV MODELS (HMM) AND TEXT TAGGING USING SAME
WO2000030070A2 (en) 1998-11-17 2000-05-25 Lernout & Hauspie Speech Products N.V. Method and apparatus for improved part-of-speech tagging
US6321372B1 (en) 1998-12-23 2001-11-20 Xerox Corporation Executable for requesting a linguistic service

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546315B2 (en) 2005-12-28 2009-06-09 International Business Machines Corporation Device for reporting software problem information
JP2015170151A (ja) * 2014-03-07 2015-09-28 日本放送協会 タグ付与知識学習装置およびそのプログラム、ならびに、タグ付与装置およびそのプログラム

Also Published As

Publication number Publication date
EP1217533A2 (en) 2002-06-26
EP1217533A3 (en) 2005-09-21
US20020077806A1 (en) 2002-06-20
US6910004B2 (en) 2005-06-21

Similar Documents

Publication Publication Date Title
JP2002215617A (ja) 品詞タグ付けをする方法
CN107209759B (zh) 注解辅助装置及记录介质
US10296584B2 (en) Semantic textual analysis
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US5680628A (en) Method and apparatus for automated search and retrieval process
US5930746A (en) Parsing and translating natural language sentences automatically
US5612872A (en) Machine translation system
US20100332217A1 (en) Method for text improvement via linguistic abstractions
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2008152760A (ja) マシンアシスト翻訳ツール
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH07325824A (ja) 文法チェックシステム
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
Iwatsuki et al. Using formulaic expressions in writing assistance systems
US20020129066A1 (en) Computer implemented method for reformatting logically complex clauses in an electronic text-based document
Foufi et al. Multilingual parsing and MWE detection
Sukhahuta et al. Information extraction strategies for Thai documents
Sharma et al. Improving existing punjabi grammar checker
Rosén et al. Syntactic annotation of learner corpora
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
KR20080028655A (ko) 품사 태깅 장치 및 태깅 방법
Ouersighni Robust rule-based approach in Arabic processing
JPH07244669A (ja) 文書検索方式
JP2713354B2 (ja) 話題抽出装置
Bernth et al. Terminology extraction for global content management

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212