JPH03505495A - テキスト表現の語間の意味関係を識別する方法と装置 - Google Patents

テキスト表現の語間の意味関係を識別する方法と装置

Info

Publication number
JPH03505495A
JPH03505495A JP1506030A JP50603089A JPH03505495A JP H03505495 A JPH03505495 A JP H03505495A JP 1506030 A JP1506030 A JP 1506030A JP 50603089 A JP50603089 A JP 50603089A JP H03505495 A JPH03505495 A JP H03505495A
Authority
JP
Japan
Prior art keywords
word
numerical
assigning
value
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1506030A
Other languages
English (en)
Inventor
エイディ,タマン
Original Assignee
マネジメント インフォメーション テクノロジーズ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マネジメント インフォメーション テクノロジーズ,インコーポレイテッド filed Critical マネジメント インフォメーション テクノロジーズ,インコーポレイテッド
Publication of JPH03505495A publication Critical patent/JPH03505495A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 テキスト表現の語間の意味関係を識 別する方法と装置 本特許文献の開示の一部は著作権保護を受ける物を含む。著作権者は特許商標局 の特許ファイル又は記録に現われる限り特許文書又は特許開示による複製には反 対しないが、他の場合(工部ての著作権を留保する。
発明の背景 ■1発明の分野 本発明は2つの自然言語表現間のコンピユータ化連想理解用の方法と装置に関係 する。
■、関連技術の説明 コンピユータ化テキスト検索装置は多数のコンピュータ・コード化文書tユーデ が検索するのを助け、キーワード又はキーワードの特定の組合せを含む1つ以上 の文書を見出す。情報データベースとも呼ばれるテキスト検索装置は1つ以上の 全テキスト文書のライブラリ又は特別にコード化した文書の要旨を含む。これら の要旨は通常題名、概要、キーワード、ノー−トコぎ一部テキスト情報の位置へ のインデックスに限定される。テキスト又は文書の要旨は通常Agoエエ(fF f報交換用アメリカ標準コード)形式で磁気ディスクに記憶される。
標準的には、コンピュータ・ライブラリが全テキスト文書を含んでいる場合、文 書には「インデックス付」されて特別なインデックス語探索ファイルを設けて探 索を高速化する。MS Do日ペースのマイクロコンぎエータ上で走行するイン デックス付全テキスト検索システムの例はイリノイ州シカイのディラブ(Zyl ab )社によるzy工ND]IiXである。カリフォルニア州パロアルトのダ イアログ情報サーぎスにより走行される巨大な商用データベースDIALOGは 題名、概要、キーワード、位置情報から構成される縮訳文書と全テキスト文書の 両方を備えるデータベースを含む。
進歩したテキスト検索システムはプール論理と文字マツチングを用いてユーザが 与える間合せ表現中の文字語を文書中の語とマツチさせる。標準的な間合せ表現 はr (TF:XT W/3 RETRIBV! ) OR(DATA V15  BA8IC)、Jである。この間合せにより、コンピュータはデータベース中 の各文書又は各キーワード・インデックスを探索L、rlJがコンピュータにQ ucTx工mVJで開始する全ての語を受は入れるよう指示しているため「RF iTRIK7月、ruxTuxgvAIJI、  rumTunevxs」等の 3語(「W/3J )以内ノ語przXTJ又61 rTr:xrsJ (r  8 J k1探索ゾaグラムにより仮定される〕への文字マツチを探索する。コ ンピュータは又論理1’−ORJ指令のため「BAS1!J又は「BAsmsJ の5語以内の「DATAIとのマツチも試行する。
探索は文字マツチングから構成される、すなわち「RETRIEVER8Jと共 に語1”TzxTJが文書中で見出さt”Lり場合、マツチが指示される。これ レエ適切な文書であるかもしれないし、ないかもしれない。文書中の節は「金探 索者に関する文」であるかもしれず、一方ユーザは「文書検索」の節を含む文書 を探索している。同様に、関連文書が書類検索を説明している場合、ユーザが間 合せに「TEXT」を指定しているためマツチは見出せない。
いくつかの文書検索システムは重み付は語探索を使用し、ここでは文書中の語の 発生回数が適切度を決定する。キーワードを最大発生する文書が最も適切なもの と仮定され、ユーザに注意をうながす。
正確な語又は既知表現を見出さなければならない場合、文字と語マツチングによ る文字文検索は不可欠であるが、主要な欠点を有する。問合せを構成するユーザ は著者の単語使用や文誉aIt造に親しんでいなければならず、さもないと適切 な文書が除かれる。成功探索を構成するためにはニーrは間合せ言語の使用に熟 達せねばならない、成功探索とは、異なる文脈で同様の単語を使用する誤った文 書を無視しつつ最も適切な文書のみt検索するものである。
重付は単語探索も著者の単語使用や文書構造の知識を必要とし、さもないと不適 切な文書が検索され冨要な文書が失われる。文書に用いられる特定の用語に係ら ず、ユーザがある概念又は情報を含む文書を見出したい場合、ユーザが適切な概 念を説明するため各探索文書で用いられる正確な単語を推測できない場合icは 文字又は単語マツチング探索は困難で失敗しゃすい(すなわち適切な文書を失い 、及び/又は不適切な文書を収集する)。異なる著者は同じ意味を伝えるために しばしば異なる単語を使用する。
それ数本発明の目的は、探索文が間合せ表現語と文字的にマツチしているかどう かに係らずユーザ選択の間合せ表現に対して関係する概念を表わす文書又は文書 の一部を識別するコンピユー化テキスト連想理解システム乞提供することである 。
本発明の目的は又、平明な言語間合せ表現を使用するテキスト及び文書検索シス テムを提供することである。
本発明の目的は又、相対的に言語に独立、すなわち、間合せ表現語をある1つの 言語で書き、連想されるテキストは多数の異なる言語でもよいテキスト及び文書 検索システムを提供することである。
本発明の目的は又、いくつかの言語で無限の語いを有するテキスト及び文書検索 システムを提供することである。
本発明の別の目的と利点は以下の説明で記述され、部分的に説明から明らかとな るか、又は発明の実施例から学習できる。本発明の目的と利点は添附請求の範囲 に特に指摘した装置、方法とその組合せにより実現され得られる。
発明の要旨 以上の目的を達成するため、父本明細書で広範に記述され実施された本発明によ ると、間合せ語のコンピュータ・コード化表現で表わされた概念に関係するコン ピュータ・コード化文書中の概念を表わすテキスト単語を識別するテキスト理解 検索装置において、間合せ語の各々をそれ自身と比較することにより間合せ語の 各々の第1語セマンテック値を計算する段階と、間合せ語の各々をゾロツクの各 々の中のテキスト単語の各々と比較することにより動的所定寸法の複数個のテキ スト・ブロック中のテキスト単語の各々の複数個の第2文字セマンテック値を計 算する段階と、前記第1文字セマンテツク値に最も近密に比較される第2文字セ マンテツク値を有する前記ゾロツクの内の1つのデキスト単語を識別する段階と 、を含むテキスト理解検索装置が提供される。
本仕様書に含1れ、一部を構成する添附図面は本発明の望ましい実施例を図示し 、上記の−v09説明と以下に与える望でしい実施例の詳細な説明と共に、本発 明の詳細な説明する役割を果たす。
図面の簡単な説明 第1図は本発明の教示を含むテキスト検索装置を操作するコンピュータ装置のブ ロック線図である。
第2図は第1図のコンピュータ装置を操作するテキスト検索装置の流れ図である 。
第3図は第1図のテキスト検索装fIt#/c用いられるセマンテック・マトリ クスである。
第4図は単語の関係を決定するため文字セマンテッンテツク・マトリクスを適用 する過程の流れ図である。
第5図は第3図のセマンテック・マトリクスヲ用いて語幹を発生し文字セマンテ ック値を計算するコンピュータ・プログラムの流れ図である。
第6A図(工第5図の流れ図により表わされるコンピュータ・プログラムのソー ス・コードの第1頁である。
第6B図は第5図の流れ図により表わされるコンピュータ・プログラムのソース ・コードの第2頁である。
望ましい実施例の説明 添附図面に図示したような本発明の望ましい実施例を詳細に参照する。
本発明のテキスト検索装置の望ましい実施例に、テキスト検索装置のプログラム 、文書及びデータを記憶し、第2図の流れ図100の段階を実行する第1図のコ ンピュータ装置10により図示される。コンビュ−夕装置10はCPU 14  、データ記憶ディスク18、ランダム°アクセス・メモリ22、表示装置26、 キーボード30を含む。
一般に、ユーザはキーボード30を介してCPt714へ間合せ表現とと間合せ 「関係度量1直」数値を入力する。cpa 14は間合せ表現の6語の文字セマ ンテック解析(以下で詳細に説明)′?:実行し、基線文字セマンテツク関係度 値としてRAM 22に結果を記憶する。次いでCPU14はデータ・ディスク 18上のテキスト・ファイルから単語のブロックを検索し、単語ブロック中の各 語と比較して間合せ表現の6語の文字セマンテツク解析を実行し、結果をRAM  22に記憶する。CPU14は、テキスト・ファイルの全ブロックが完了する 1で単語ブロックの検索と文字セマンテツク解析を実行し続け、解析の結果を記 憶する。次いでcpa 14は間合せ表現基線文字セマンテツク関係区値に対し て各単語のブロックの文字セマンテツク解析の結果を比較し、間合せ表現の単語 に対する各ブロックの単語の文字セマンテツク関係度のレベルを決定する。cp a 14はユーザにより設定された関係度量@に等しい又を工これを越える文字 セマンテツク関係度値を有するブロックを検索する又は検索用にマークする。
文字セマンテツク関係匿値は、テキスト文書の単語により表わされる概念又は意 味がユーザの間合せ表現により表わされる概念又は意味にいかに近接しているか の尺度である。
ここで第2図の流れ図100の詳細解析に戻ると、ユーザは段階120で間合せ 表現の単語を入力する。
第1間合せ語、第2間合せ語等を含む間合せ表現の言語は概念を与えるか、又は 言語の受入れ意味での意味を有する。以下でより詳細に説明するように、コンピ ュータ10は文字セマンテツク解析を用いてテキストファイルの単語を探索し、 テキスト・ファイルが間合せ表現語と文字的に一致するかどうかに係らず同様の 意味を有する単語の群を見出す。
段階120でユーザにより入力された間合せ表現は、例えば4語1’−do a  Cr0p8 st*dyJを含む。マンピユータ装置10は段階124で各間 合せ単語がそれ自体といかに関係°しているかの基線文字セマンテツク関係度値 を設定するため各間合せ語の文字セマンテツク解析を実行する。
文字セマンテツク解析はマイクロ・シンタックス、又は2語の文字間のシンタッ クスを見て、そのセマンテツク構造により2語を関係付け、重み付ける、すなわ ちその意味又はそれが与える人間の言語概念に関してその2語がいかに関係づけ られているかを測定する。
文字セマンテツク解析は、セマンテツク・マトリクスの文字の位置により表現さ れるように、6語の方向と分類意味を基に第1語と第2語の文字へ数値を割当て る段階と、第2語に対する第1語の文字のセマンテツク関係度を識別するためこ れらの数値を解析する段階とt含む。間合せ表現の単語へ基線文字セマンテツク 関係度値を割当てるため、各単語はそ些自体と比較され、それ数文字セマンテツ ク解析の第1語と第2@は同じ間合せ語である。
本発明によると、セマンテツク・マトリクスに示すように各文字の方向意味と分 類意味に従って6語の文字に数値が割当てられる。限定のためではなく一例とし て示すように、第3図の望ましいセマンテツクーマトリクス200は解析語の子 音をセマンテツク主題とも呼ばれるマトリクス分類と方向とに関係付け、その各 々から数値重みを得る。マトリクス200に示す方向(列〕と分類(行)に割当 てた名前は単なる説明用で以下に詳細に説明する。セマンテツク・マトリクス2 00の値と重みt第1及び第2語の文字へ適用し、その文字セマンテーツク関係 度を測定する過程は第4図の流れ図250に示されている。この過程は又第5図 に流れ図形式で示すコンピュータ・プログラム・サブルーチン又はサブプログラ ムと、第6A図及び第6B図のマイクロソフトquick BAS工C第4.0 版の下で走行するよう設計されたRAS工Cソース・コードとしても実行される 。
ステップ254で母音は第1及び第2語の両方fJ′−ら取除かれる。2字又は 3字幹を検出するため形態学的解析を用いて、単語を工その2つ又は3つの最有 意子音に縮少される。ステツf258で「DO」のように単一文字に縮少する単 語は無視される。二重字「THJ。
rGNJ、  rNGJ、  rNcjJ、  rNKJ、  rOKJ、   「CFIJ。
rGll、rcQJ、rpaJ、rsHJは文字セ1ンテツク解析では単一子音 として処理され、これを念頭において段階262で両方の語が3子音以下に縮少 される。
間合せ表現の単語はここで「ORB Jと「STD Jに縮少される。「DO」 とrAJは無視される。単語をその語幹に縮少し、これにより単語の多くの変化 は自動的に解析に含まれる。
文字セマンテツク解析の第1及び第2語の両方として「C!RP Jへ縮少した 第1間合せ語を取ると、ステップ266で方向数と重みが割当てられる。「CJ は文字セマンテツク・マトリクス200の列6であり、それ故「CJは3の方向 数を割当てられる。rRJtXマトリクス200の列1に配置されていて1の方 向数を割当てられる。l’−PJ &エマトリクス200の列2に配置されてい て2の方向数を割当てられる。l/2の方向重みが各文字に割当てられる。
分類数と分類重みをステップ270で第1及び第2語の文字に割当てる。rcJ はマトリクス200の行5に配置されていて5の分類数を割当てられる。rRJ はマトリクス2000行4に配置されていて4の分類数を割当てる。rPJはマ トリクス200の行2に配置されて2の分類数を割当てる。分類重みは各文字を 含む行に対応してrwTJとマークしたマトリクス200の列の数字から選択さ れる。「C」、「R」。
rpJtz各々2.2.2の分類重みを割当てられる。
rPJは分類重みt割当てる際の例外で、行2に関連する重みが1であっても2 の重みを受取る。第1及び第2語の文字とその数字と重みは以下のように示され る。
第1語 CRP 第2語 ORP 方向数 312       !112方向重み   0.5 0.5 0.5          0.5 0.5 0.5分類数 542      542 分類重み   222          222各語の子音の6対の方向数を 比較し、ステップ274で方向数がマツチする場合適切な重みを方向連想数に加 算する。第1語の子音「cR」の第1対の方向数(31)を第2語の最初の2つ の子音r CRJの方向数(31)と比較する。方向数はマツチする、なぜなら 第1語と第2語は同一であるからそうでなければならず、それ故第1語の最初の 子音の方向重みを方向連想数0.5 + 0.5 = 1.0へ710算する。
方向連想数は最初は零である。第1語の次の対の子音r RP Jの子音数(1 2)Y第2語の第2対の子音「RP Jの方向数(12)と比較する。方向数は マツチせねばならず、それ故第1語の子音の第2対の方向重みを方向連想数に加 算する、すなわち1.0 +0.5 +0.5 = 2.0である。
段階278で以下のように各語中の子音の6対の分類数?比較し、適当な重みを 分類連想数に加算する。
第1語の子音の第1対r CRJの分類数(54)を第2語の最初の2つの子音 「CR」の分類数(54)と比較する。第1語と第2語は同一であるためそうで なげればならないように分類数はマツチし、それ故第1語の最初の2つの子音の 分類重みを分類連想数に加算する、すなわち2+2=4である。第1語の子音の 次の対の分類数(,42)Y第2語の2番目の2つの子音r RP Jの分類数 (42)と比較する。分類数はマツチせねばならず、それ故第1語の第2対の子 音の分類重みを分類連想数に加算する、すなわちA+2+2=8である。
第1間合せ語の自身に対する全体連想は分類連想と方向連想の和で、それは2. 0+8=10である。これは第1間合せ語の基線文字セマンテツク連想値を与え る。これに、同様にして計算された第2間合せ語crsTp」)の全体連想数が 加算される。これは2語(母音と単−子音語l除くと)から構成される全体間合 せ表現の基線文字セマンテツク連想[を与える。第1図のコンピュータ10は以 後の使用のためにこの基線[をRAM 22 K記憶する。
第2図の流れ図の段階132に戻ると、コンピュータ10はデータ記憶ディスク 18からテキスト・ファイルを検索し、テキスト・ファイルの単語の文字セマン テツク解析の実行を開始する。テキスト・ファイルはこの解析用に準備する前処 理は必要ない、すなわちキーワード・インデックス又は他の準備をする必要はな い。望ましい実施例では、単語は制御コードなしの標準の大文字及び小文字AB Cエエ文字から構成されるが、他のコーディング体系も容易に使用できる。
本発明によると、テキスト・ファイルの各テキスト語を読取り、有意な単語、す なわち語幹が1子音以上を含む語を文字セマンテツク解析を使用して間合せ表現 の各有意語と比較する。比較E工、寸法(単語数)が間合せ表現の寸法に適合さ ぜうるテキスト・ファイル有意語のブロックで実行される。間合せ表現の語によ り与えられる概念に対してテキスト・ファイルの語により与えられる語の関係度 を測定するため文字セマンテツク解析にとって、各有意間合せ語tテキストの各 ブロック中の各有意テキスト・ファイル語と共に文字セマンテツク解析しなけれ ばならない。従って、各テキスト・ファイル語に対して各間合せ語の1対1対応 マツチを試行する文字テキスト・マツチングと反対に、語群の関係度が解析され る。
望ましい実施例の標準的なブロック寸法は10語であるが、寸法は問題ではなく 、応用例に応じて変更してよい。望ましい実施例ではブロック寸法は有意間合せ 語の数NY基に動的に予決定される。有意語のブロック寸法is N X 5が 望ましいが、5以外の乗数も有用である。コンぎユータ10は第2図の段階14 0で文字セマンテツク解析用にテキスト・ファイルの最初の10有意語から構成 される語のブロックな選択する。
以下でより詳細に説明するように、第1間合せ語とブロックの第1語を文字セマ ンテツク関係度を出すために解析し、次いで第1間合せ語と第1ブロツクの第2 語を解析し、次いで第1間合せ語とブロックの第3語を解析し、等々で、第1間 合せ語に対してブロック中の全語を解析するまで繰返す。次いでこの過程な第2 間合せ語よる解析に対してブロック中の6語に繰返し、次いで第3間合せ語等々 と繰返すが、例は2語の間合せのみt示している。
ブロック中の各テキスト・ファイル語に対する各間合せ語の各解析の全連想数? 累計数値デミツク・スコアとしてRAM 22に記憶する。ブロック記憶は間合 せ表現の語により与えられる概念と対比したブロックの語により表わされる概念 の文字セマンテツク関係度の尺度である。この過程(工流れ図100で段階14 0から164に図示しである。
コンピュータ104次いで段階168,172で10テキスト・ファイル語の第 2ブロツクを選択するが、第2プaツクは約50%だけ第1ブロツクの語と重な り合うよう選択される。これを工語の順序によってのみ決定されないブロックの 可変選択を可能とする。
各ブロックの各テキスト・ファイル語を各間合せ語に対して解析し、各ブロック ・スコアを記憶した債、コンピュータ10は段階176でブロック関係度値を発 生する。ブロック関係度値比は間合せ表現の基線文字セマンテック連想値に対す る各ブロック・スコアの比である。段階180.184で少なくともユーザが選 択した関係度閾値に等しい関係度値比1に:frするブロックを検索表示用に選 択する、これは間合せ表現により表わされる概念に最も関係する概念の表現7含 むテキスト・ファイルの部分だからである。
この文字セフ/チック解析技術は1回の探索セツションでいくつかのファイルに 適用され、最も関係するファイルの最も関係するブロックのみが表示用に選択さ れる。
段階144に戻ると、テキスト・ファイル語と間合せ語の文字セマンテツク解析 が詳細に説明されている。
解析に異なる第1及び第2語χ使用する点を除いて、全体の過程は段階124と 同一であるが、第1及び第2語が同一でないため数と重みは変化する。簡単のた め第2間合ぜ語1’−5TUDY jを文字セマンテツク解析の第1語として使 用し、任意語[CHARM Jを第2語として使用するものと仮定する。慣例に より第1語&工常に間合せ語で、第2語は常にテキスト・ファイル語であるが、 この過程4工反転も可能である。
段階1440文字セマンテツク解析は第4図の流れ図200により詳細に図示さ れる。段階254で第1語及び第2語から母音を除き、rsrD’Jと「OHR M Jを残す。どちらの語も1子音まで縮少していないため、段階258は無視 される。段階262で語幹を6つの有意子音に縮少するが、2重音V THJ、   「()N J。
「NGJ、  rNcJ、  rNKJ、  r6KJ、  rc!HJ、   rGEIJ。
rOQJ、rPHJ、rsHJは文字セマンテツク解析では単一子音として扱わ れる。「CHRM Jは全部で4子音を含み、「CHJは1子音として扱われる 。混乱を避けるため、「CH」はセマンテツク・マトリクス200からの等価子 音「X」と置換える。それ故rOHRMJ )X rXRMJ Kより表わされ る。
「STD Jに縮少した縮少した第1間合せ語を取り、段階266.270でマ トリクス200の子音の位置により方向数と重みと分類数と重みを割当てる。「 S」。
はマトリクス200の列1と行5にいるため、方向数は1、分類数は5、分類重 みは2、方向重みは0.5である。子音のマトリクス位置に係らず方向重みは常 に0.5である。第1語と第2語の周りの子音は同様に数と重みを割当てられ、 以下のように表現可能である。
第1語!3TD  第2語 XRM 方向数 143      411 方向重み 0.5 0.5 0.5        0.5 0.5 0.5分 類数 542      642 分類重み 221         221段階274で俗語の子音の6対の方 向数を比較し、最初零に設定されている方向連想数に適当な重みを7JIII算 する。第1語の子音の第1対r 8T Jの方向数(170を第2語の子音の第 1対r XRJの方向数(41)と比較する。方向数はマツチせず、従って第1 語の最初の2子音の方向重みは方向連想数に加算されず、零にとどまる。第1語 の子音の次の対「TD Jの方向数(45)を第2語の子音の第2対「RM J の方向数(11)と比較する。方向数は又マツチせず、従って方向連想数は零に とどする。
段階278で、俗語の子音の6対の分類数を比較し、最初零に設定されている分 類連想数に適当な重みを加算する。第1語の子音の第1対rsTJの分類数(5 4)を第2語の子音の第1対「XRJの分類数(64)と比較する。分類数はマ ツチせず、従って分類連想数は零にとどまる。第1語の子音の次の対r TD  Jの分類数(42)’に第2語の子音の第2対「RM Jの分類数(42)と比 較する。分類数はマツチし、従って第1語の子音の第2対の分類重みを分類連想 数に加算する、すなわち0+2+1=3である。
例示テキスト語に対する第1間合せ語の全体連想は分類連想と方向連想の合計で 、これは0+3=3である。これは単語「5TUDY」と「(!HARM Jの 全体文字セマンテツク連想値に3を与える。この煩はブロックの他のテキスト語 と比較した時の間合せ語の全体文字セマンテツク連想値に加算されてブロック・ スコアを与える。第1図のコンピュータ10は以後の使用のためにRAM 22 へこのブロック・スコアを記憶する。
問合せからの単語がテキスト中に文字的に現われるか否かに係らず、セマンテツ ク測定は入力表現に意味的に関係するテキストのブロックを自動的に加点すへ同 じ概念を工報告書、抜粋、ノートのどれに見出されても、文具なる言語でも同じ 重みl有する。マトリクス200で同じ方向wk有するもの又は同じ物理的主題 を記述するある語幹から他の語幹への文字組合せの有意比較に乗物を提供するセ マンテツク・マトリクス200によりこれらは自動的かつ動的に関連付けられる 。添字は縮少語幹に3子音以上付卯するため通常捨てられ、それ故率語の全ての 変形と共にマトリクス200で物理的物体の分類を記述する又は同じ方向を共有 する関係概念はセマンテツク的ICIM点される。
例示としてであって開示した特定の実施例に対する限定として与えられたもので はないマトリクス200は、英文字の組合せt実世界の概念とリンクし、これら の概念を数値に変換する構造を与える。従って語の意味と2語間のセマンテツク 関係はマトリクス200内の位置に従って俗語の各文字の方向と分類特性を適用 することにより矛盾なく計算可能である。マトリクス200I工文字が有する2 つの意味、すなわち方向意味と分類意味、後者はセマンテツク主題とも呼ばれる が、の原理に従って文字を構成する。同じ方向意味と分類意味を有する文字はマ トリクス200で同じ位置を共有し、これが文字セマンテック解析の心臓を表わ す。
以後プリミティブと呼ぶ文字又は二重字の列中の位置は、受取った現実に応答し て時流を拡張する分類の方向付意味に関してこれらのプリミティブを関係付ける 。列中の文字の存在は物と事象の内部方向を意味する。全ての物は(少なくとも )面1と面2の2面性を有し、各々が左と右又は正と負のようにある種の符号を 担持する。
プリミティブの行中の位置はセマンテック主題、すなわち実世界での物と事象の クラスに対応する。第1行は存在の最も基本的な要因、生物の行動に対応し、従 ってマトリクス200の列中の方向の表現である。
各行にはセマンテツク主題の静的/動的二重性ン表わす機能名と活動名乞割当て る。原理的には、活動は対応する機能を生じ(例えばでき事(・工媒体を生じる )、機能は活動を実行するのに必要である(集合を工割当てを実行するのに必要 であるん 全ての方向は2つの静的面と2つの動的面に翻訳できる1つの一般的意味を有す る。方向性の面の混合はいつの時点でも正しい。活動を二方向の動的面と関連し ている。機能は方向の静的面と関連している。
全ての物は二重で(2面性を有し]、方向は文字表現の各面に2つの符号の内の 一方(例えば十又は−)を与える。全ての組合せが表示される(++、−十。
十十、−−)。方向1(+−)は方向2(−十)と対称で方向3(十十)は方向 4(−−)と対称で、2つの対称対は互に相補である(超対称〕。
全ての文字は別々の(プリミティブ)意味を有し、各文字が何を意味しているか を正確に説明することは不可能であるが、マトリクス200中の文字の位置はセ マンテック主題(行位置)へ所属するもの及び2重方向性(列位置)’!’有す るものとしてこれを識別する。
従ってマトリクス200中の位置として文字の行と列に関して任意の単語の意味 を定めることが可能である。
それ数文字セマンテック解析はマトリクス2ooと関係づけられる単語の構造に 依存する。方向と分類を識別するラベルは単に説明用でマトリクス200の応用 性’IK更することなく変更可能である。
単語の!生はマ) IJクラス00中のその文字の列座標により与えられる。関 係子(語の一部ン他へリンクする文字〕もその列座標(二重方向性の型式ンχ介 して主に動作する。
各文字は又セマンテツク主題(その行座標)Y:引渡すため、語の構造(工論理 的議論の命題間の論理的関係と比較可能である。
単語のスペクトルはその文字に対応するセマンテツク主題により定義され、これ により文脈と状況のみがスペクトルに自然に対応する物と事象の可能な解釈の富 裕性への制限を設定する。次いでこのスペクトルは言語形態学、隠楡的使用、あ い1いさに関して言語のありうべき相異に責任を持ち、同音異義語、同意語、そ してありうべき矛盾の他の文法的発生に部分的に責任を持つ。
構造とスペクトルは2つ以上の要素(1つ以上の文字に対応)間の関係を含む。
以下の説明は基本セマテツク・インターフェースと呼ばれる2要素関係を検査す る。
3種類の基本的セマテツク・インターフェースがある。
1)方向、これは単一文字の内部インターフェース内面を定める、すなわちマト リクス200のその列の方向である。
2)角度、これを工率語中の2つの隣接方向の結合から生じる。
3)接合、単語中の2つの文字のセマンテツク主題の対化を反映する。
方向はセマンテツク主題として行の割当てと混同してはならない。各文字の「内 側JICはその二重方向性を表わす関係がある。割当て行の文字はこれに加えて 、実世界の関係に制約された意味を有する。これらも語中の関係子として作動す る。多くの場合rRJ又は「LJは関係子である。
割当て文字シエ又、コンパクト集合(正収束下の部分)を表わす「ballJ、   rbaby J、  r bay J、  rbubble JのrbJや 、例えば多重意味の単語「racθ」中のrrJの使用のように主観方向に追従 する部分を表わす「roW」中の「r」のように、その各々の内部型式の方向に 従って互いに縛られた(関係したン実体から構成される集合も表わす。
物理的には、全ての物シエ一定に動いている、すなわち動的で、「5tatic  Jの語幹の「5ta−Jはいくつかの文字セマンテツク意味を有し、全てが主 観流「θ」と2重負関係「t」と関係している。連続的に認識できない程運動が 遅い又は検出できない程運拗が遅い場合、又はある速度で運動を繰返している場 合、物体は静的(5tatic )と呼ばれる。
子音は単語中に最も情報を含む。子音に続く母音【工その子音により表わされる ある種の型式又は方向の側面への焦束化を意味する。
マトリクス200の各列に対する方向の型式とその動的/静的側面による文字の 構造を以下で検査する。
共通方向(+1  +2) 2重正型方向はマトリクス200の方向列3fj!:占有する。検査している言 語の多くの単語では4型式の共通方向がある。用語「正」はマトリクス200の 方向列4を占有する2重負方向から区別するために使用される。
以下の型式の共通方向が列3により表わされる。
イ)正収束、共にあること、同時に発生すること及び/又は互いに同時に接近す ることを表わす。アラビア語のrwa」(=ana)は好例である。rTkaw aa J(=fold )と「1aqiya J (= meet )も又コノ 意味を明白とする。英語の「Con−J中の文字r c J hxこの型式を例 示する。「vlew Jと「obvious J中の文字1’−vJやFaue  J中の「d」の使用も好例である。
a)正発散、次の瞬間に離れる閾値として共にあることを表視する。これは静的 又は動的分離を意味する語中に見出され、例えばrAwJ(=or)や「ql」 (= protect jンである。英語の「wall J中の「w」や「di e J中のl’−dJもこの意味を表わす。この方向をら(tat )の(ti t ))、 r baab J (= dOor )。
「dayn J (= debt )中の「dJにより表わされる。
[C0uple J中のl’−cJと共に対のような語「two J中の「W」 の使用に注意されたい。これは又(イ)と(ロ)の結合である、すなわち「du et J、  r dual J、  「doubleJ中の「d」のように一 般に正の変換や正の関係である。
多重性は二重性の一般化である。アラビア語龜字「W」は名詞と動詞の両方にこ れを表現する。英語文字「Wθ」中のrWJが好例である。他の例は節[a g rossexaggeration J中の文字「g」の使用である。
二)正機能、アラビア語で主格と現在時制の両方を表現する母音「−u Jのよ うに行為(動的)又は自然に(静的)のどちらかにより対応するセマンテック主 題へ属する事実を意味する。「TKayyib J (= good )中のr  TK J、  「quwwah J (= force )中のrq J 。
「qadr J (= power、 cLQatin7. quantit7  )、 「HHaqqJ(= lawfulnesa、 truth )がある 。実例は英文字「do J、  「day J、  「dye J中ordJo 使用がある。
これらの例の各々は発生する機能、すなわちある範囲の時空内での発生又は材料 であることにより単に空間を占有することを表わす。「quantity Jと 「quantum Jの「q」と「get JのrgJは共に正機能を表わす。
非共通方向(−1−2) これらの方向はマトリクス200の列4により表わされ、これは非共通方向(二 重負)の文字を含む。負は異常、特別、不要、不本意、不活発、受動、不在、縮 少、消失又は単に負であることを意味する。
イ)負収束、「tieJ(文字t)Y作るためには、−諸にいるよう強制しつつ 物を離して引く。アラビア語でr ta Jは神への誓い(そして自分を拘束す る)ために用いられる。これは同じ特殊な又は異常な場所又は時間に発生した、 又は異常に又は受動的に互いに近づく、異常で特別で又は不要な方法で共にある ことを表現する負収束を示す。例は「juXtl!LpO1illil Jの「 x」の使用とアラビア語の「1aadha J (=approach for protection  )、   r  1dhn  J  (=  per mission  )、  「 akh J(= brother )である。
英語(7) 「head J中のrhJ。
「fix J中のrXJ、rtOJ中OrtJ Kも注意さ中の「hJと「kh alaa J (= past and gone )中の「kh Jと共に英 語「bate J中のrbJは非常に否定的に別れることt表現し、一方「hi gh J中の「hJ(工従米の用語で単に「負」であり、これは特別な方法で他 から距離を有していることt表わす。英語使用のr except J中の「e x」と共に(” tear J中の[”teJも他の応用例である。
ハ)負2重、アラビア語で「tafaaohala J中の接頭語「tJは負2 重の1つの明らかな応用例としての例である< being sub、Heat  to an ecchange )。英語では、第3者rhJは単に「non e ofthe two (2人以外)」である。例ハ「hθ」、「Bhe」、 「they」。
「them JでのrhJの使用である。「harmonize Jの一般二重 性も多重性へのその一般化と共に共通の応用例である。他の例はアラビア語の[ −aat J(女性複数)やl’−ahJ(不規則複数〕である。
二)負機能、これは特別な方法でのセマンテツク主題への所属又は当該セマンテ ツク主題により表現された機能の不在(否定)を意味する。アラビア語の注意用 接頭語(haa−)や「1ftaJiala J中の挿入語「t」。
「−ah JやV−tJc女性用歯字)、「−dhaa J(= this、t hat )s  r ZHll J (= shadow )中の「ZHJや「 khawaa J (= to be ctmpt7 )が好例である。英語添 字r −ty Jは何らかの特別なものであることを表わし、f−anti−t 7 Jや「facul−f;7 J等がある。
多くの単語の終りで、「θX1tJ、  「atJ、  rite。
[1Qt Jのようにr t J !X何らかの特別なものであること、それ自 体の実体を表わす。「take Jの最初で、「tJは当該主題により表現され た結合(関係)を破り、新たな強制的(望まない)関係を設定することを表現す る。「true J中のrtJは負の機能を表現する。
帰宅方向(+1 −2) 共通及び非共通方向は内部部分に一種類の符号7有している点で「純粋」と呼ば れるが、次の2群の方向は内部部分が反対の符号を有している点で「混合」して いる。帰宅文字はマトリクス200の第1方向列を「a」や、「maa J ( = what )、  rumm J (=mother。
Origin )と「man 」(= mho )中のrmJのように残り?無 視しその第1部分に積極的に焦点を合せる。
英語では、「mθ」の「m J、  「auto−Jの「a」。
「5elf J O「e J、 「1ook Jと「1ike Jの「k、jテ ある(主観投影)。同じ概念が「Go?J中の「8」のように何かを主観的に主 張する又は強調するために用いられる。「ab4Jの「aJと「that’s  right j Jの「r」は別の例である。マトリクス200の列1のAAは アラビア語の「aleph Jのような「a」の使用を表わし、母音としてでは ない。
口)反客観性、アラビア語の「aQl(gala J中)「a」(: remo ve 1ackof clarity from、  r a+ Jは否定接頭 語として、「alif 1zaalah J)のように主観性と密に関係し、か つ第1部分を無視しつつ方向の第2部分(客体)を否定することに焦点を合せる ことン意味する。アラビア語の質問のraJ 、ramJ、  「avtJのよ うに(イ)と(ロ)の組合せはしばしばある。この方向型式の1つの面はr a ssign JのraJの様に何かにある客体(−2)を受けている点である。
「assignj、ng J「八−」と「a−」の他の解釈と共に、機器的かつ 受動的な「m−」もある。アラビア語の「maa J(=aot )中の[mJ や英語のr l1lick Jと「81’l17 Jの「B」のように一般否定 (客観性を無視しつつ)はこの方向型式のひんばんな応用例である。
ハ)再帰、l’−raAaa J (== see、 think a’bou t )。
「QHaada J (= return又はrepeat )、  「aml aa J(= dlctate、 delay ) (D r m J (Dよ うに何か’+2繰返すこと乞意味する第1部分へ戻ることを意味する。これは又 英語の接頭語「re−Jにも見られる。これはC(イ)の動的側面とも見なしう るが、いく分幅広い。l”keepJのrkJが例である。この方向は又「m1 m1c J中の文字「m」や「anθW」中の「a」の使用にも反映される。
二)主観機能、あたかも全てのものであるかのように主観的側面を使用すること t意味する。これは「m−」接頭語やアラビア語の「ka J (= 1ike 、 as )。
「5aara J (= Walk、 generolstream )中の「 6」。
「HHayaah J (= 1ife )の「HH」中で表現される。
英語の例はt;−mass J、  「maffer J、  「time J の「mJt含む。添字r −1um J、  「−un J、  「0m」の使 用にも注意されたい。「all that thare iθ(あるもの全て月 を表わす「all J中の「a」の使用のような例Z介して(イ)との対比が明 らかとなる。用語r 5tuff J中の文字「θ」と共に「king J ( 支配者)の「k」の使用はこの方向暑示している。
外方方向(−1+2) マトリクス200の方向列2に含マれるこの方向型式の群は前述の群と対称であ る。
() $−11! +1 、接続詞「fa J (= then )や「11」 (= to、 tor )、  [yaa J (= calling : o 、、、 ) (D J: 5に方向の客観性に第1のものt無視しつつその第2 部分に積極的に焦点を合せることン意味する。英語では、「you Jの「y」 やr per JのrpJが好例である。
「yea Jの「y」やr just Jの「j」のようになにかを客観的に主 張又は強調するため同じ概念が用いられる。アラビア語では、この意味は異なる 形式の添字「−n」で記すことが可能である( nun a:Ltawkiid 。
tanween等)。
口)−反主観性、アラビア語の「1ad(=no)のr l J、 r Dxa lla J (= go ashtray )の「DKJI「5harrJ ( = evi:L )と「5hiyah J (= fault 1nappea ranOe )の「sh J、 r zaala J (= vanish )  O「zJ、  「wanaaJ (=fail )の「n」のように、客観性 と深く関係し、第2部分を無視しつつ方向の第1部分(主体)ン否定することに 焦点を合せることを意味する。英語では、「1ow」の「1」や「fai’l  Jのf−fJの使用に注意されたい。(イ)と(ロ)の組合せはしばしばあり5 る。この方向型式の1側蘭は、アラビア語の接頭語「1nfaQ、H’la J 、  「naAaaJ (= beQOm8 far )や英単語「enabl θ」の「n」のように何かへある主体(−1)’に受けている点である。(アラ ビア語の)否定の「in」や英語文字「nonθJ、  run−J、 「no  J等の「n」のように一般的否定(主観性ン無視しつつ)はこの方向型式のひ んばんな応用例である。
ハ)   o n−V −s y (PRocvR8xoN)、アラビアiOr  fst、」(= tn )や「man J (= willnot )のよう に第2部分へ向けて進むことを意味する。英語でE工、「−cursion J の「pro−J部分や英単語「pour Jの「p」の使用に注意されたい。他 の例は「native J。
「nation J、  「near J、  「nect Jと共にrinJ の「nJyal−含む。これは(イ)の動的側面と見なしうるがより広いもので ある。再帰の対抗物として、文字「1」が単語「1ess J ヤ75ピア単語 「1aduud J(insiating 8n8m7 ) Y記すように、負 の繰返しを意味する。
二)客観機能、アラビア語の添字「=n」の使用やアラビア語の「−aan J や英語(D r −tion J、  「−nd J。
「nt Jのように何かを定量化又は定量化するためのどこかのように、あたか も全てのものであるかのように客観的側面を使用することを意味する。「ful l Jの文字「f」にも注意されたい。慣用語「nitty−gritt7 J の(−nJやV proof Jと「prayer JのrpJの内部方向によ り説明可能である。文字「fJはマトリクス200の同じ方向列の文字1’−v Jに密に関係している文字「d」のように使用される。一般的数量化ン表現する 「number Jの「n」のような例χ見ることにより(イ)との対比が明ら かとなる。
分類/セマンテツク主題、異なる言語の単語にはセマンテツ久主題の数えきれな い組合せがある。多くの単語が有意であり、従って知るべきかつ実験すべき物と 事象の性質を記している。単語が表わす物とそれが説明する関係は一体的なシス テムの一部である。これらはマトリクス200の行により分類される。
セマンテツク主題の構成に関しては、文字により表わされるような物の知識+1 ’l工3種の基本部品がある、イ)1シマトリスク200の第1行により表現さ マトリクス200の残りの4行は(イ)、(ロ)、?→の組合せで、最初の3つ の短い導入後に説明される。
存在は「そこにあること」のみならず、二重性(2面性χ持つこと)とその多重 性への一般化のため、存在は全体の一部であること、時間と空間内で粒子ン頁す ること又は要素又は点であることt意味する。「1つの」物を指子ような冠詞「 a」のような語や「unitJの「U」、又【工「all Jの「a」や[we Jの「W」がこの性質を表示している。
アラビア語で、文字1’−wJ v名詞や動詞の多重性を表現する添字としての みならず接続詞(= and )としても使用する。母f[u J (d&mm ah ) ’It名詞の主格と動詞の現在に使用し、共に存在することの積極的 機能を表している。アラビア語の「a J (hamza )を英語のraJの ように(主観的に〕主張し割当てるために使用する。
でき事、発生又は形成は時間又は空間でのでき事、現われること、空間又は時間 のある範囲となること、又は空間又は時間を占有する「物質」となることン意味 する。この主題シエ又「媒体」、「作用(又を工)」、「舞台」とも呼ばれる。
上述した異なるアラビア語の接頭語rmJと「fii J (= in ) + !コレに関係すす。
「MaaA J (= water )、  「madcl J (= 5tr etch )。
rdamJ (= bloocl )、  「iaamaJ(=to lagt  )、−rdJxawaaJ(= fade )、  「idh J (= w hen )、  r 1dhaa J (if。
when )も好例である。文字セマンテツク的には、「物」と「時間」の両方 が空間又は時間rmJの主観的に認識された範囲に対し特別の関係rtJを有す る。
「move J、  「malcθJ、「mayJのrmJも見ると、全ては自 動詞的〔受動的〕と他動詞的(能動的)との両方で空間又は時間での「でき事」 を扱ってtする。
[action J kZ文字的には共通の流れ「C」への自己割当て「a」で ある。自然の力による作業シエ定量化へ導く。
量子は力と量の両方である。自然法則はしばしげ力を等しく設定する。力を測足 す、る間伐々&工量を扱っており、これは力と自然法則ン考える主な方法である 。
語幹r qdr JのrQJtエエネルギ、力、強大、能力、量、測定、運命ビ 共に表わす。「waQHy Jのr QHJは意識と良好な知覚を表わす。[w anaa Jの「nJ)工何かン立たせる弱さと失敗を意味する。「Noawa a J(= go ashtray ) kZ r無法」問題に使用され、「N Gayb」は未知である。英語言語はこのセフ/チック主題には2文字のみχ有 し、共通のrqJと客観の「n」で両者共「q−uantum J、  r q −ualit7 」。
r q−uote Jや「n−umbera Jや「n−ature Jの「n Jを表わす語に見出される。反主観定量化(rnJ)は多くのインド・ヨーロッ パ言語で否定の顕著な手段である。
「名前」は主観の客観的量子で、「知識」は客観的量子のマツピングである。こ れは法とエネルギの両方である。これは物を動かし、−緒にし、分離し、その距 離とその寸法を定める。
セマンテツク「割当の主題」は存在と発生、すなわち空間又は時間を取る物と関 係している粒子と実体の組合せである。行4の主題の文字の2つは、最もひんば んな関係子である「r」と「1」である。語幹が3子音1!:有している場合、 その内の1つは再帰(fk方)関係7表わすTi”rJか又は他の2文字間のゾ aカーシデ関係暑意味する「1」であることがありうる。アラビア語の例は「Q HarDK J (: bread、th、 show )と「ka:Llam a J (: talk to、 woula)である。アラビア語の「qar a、AJ (=read月・工rrJ ’に量子rqJへ関係し戻す、すなわち これは生体に知覚の量子を与える。英語の例+s r model J、  r  field J、  rsteer Jy含む。rbJはしばしば「be−J や「bl−Jのように正常な接続か又は「ball Jにあるように粒子の接続 損を表わす。反対のrtJは「t4θ」のように二重否定関係を表わす。
流れ又は構造は力、存在と定量化の組合せにより制御される粒子である。単語「 seeJ、  「zapJ、 「cubeJはこの主題の3文字を例示する。動 的・静的側面のため、流れは又表面と構造も意味し、アラビア語単語のr 0u urah J (= picture、 5hape )と「gcawa、a  J(5ett1e )も好例である。
音と光は力の0別による励起後規則的な波状パターンである特定方向に移動する 粒子から構成される。単語も又流れ状の実体であるものと考えられる。行5によ り表わされる流れは、量子と粒子の結合したものである。量子と流れの両方を用 いて「call J。
[conceive J、  「see J等のような概念な表現し、文字は二 重の波状方向を有するものと考えられる。例えば「cal’l Jは文字セマン テツクによる割当て流れである。
「8」のような主観流れ7用いて物w r see (児月、r say (言 い月、「6θW(縫い)」、「saw (鋸で切る」。
sea (海〕は単に主観流れである。しかし「SOmθ」中では「θ」は定量 化を強調する。アラビア語の「qwl J (tOsay )は量子1−qJの 客観割当て「1」として言うこと暑定め、英語のT−say Jは単に主観流れ の外方転移ryJk表現する。
鳩又(エマラビングは空間又を工時間を取る物を定量化するため印77C1され る力の法則である。これらは法則又は力に対し媒体ビ主観化する操作の結果であ る。用語「マツピング」はこの型式の主観化ン表わすためにしばしば用いられる 。「key Jは粒子にではなく空間と時間の全領域に適用される。r’ ex −Jのl’−xJは時間又は空間のあるものへ力又は定量子として印加される負 の発散又“は負の機能を意味する。アラビア語の例を工「DxawAJ (li ght )とr TKuuIJ (length ) Y含む。
基本的全3主題の組合せは、rgoJ、  rgetJ。
r tzlrl J、  [good J、  「ooa J (全能者]のよ うな!と事象(過程)の一般名である全体主題を生じる。英語言語はこの主題I ′cにこの文字のみt有する。アラビア語の「5hayAJ (: objec t、 thing )、  「zaulm J(=offence、 unfa irness )、  「HHayaah J (= 1ife )はこの主題 の他の3文字を例示する。
文字セマンテツク解析は又単語の文字セマンテツク評価に使用される基本的規則 であるマイクロ・シンタクチック解析の2つの重要な概念に頼っている。
1)特定の概念乞伝えるためには少なくとも2子音が必要である。1子音語はr wayJ、  rgoJ、  rdOJのように一役的すぎる。
2)文字の組合せの意味を決定する際に単語の文字順は決定的である(rtop Jとf” pot Jは同じ文字馨含んでいるが2つの異なる概念を与える)。
文字又はそれが表わす音(・工意味を有しているため、文字セマンテツク・マト リクス200は翻訳の必要なしに全ての英文字言語に適用してもよい。マトリク ス200は英語以外の言語の子音(すなわちrQHJ。
「DH」他)を含んでおり、従って間合せ語とテキスト語は同じ言語である必要 はない。マトリクス200は単語の表意文字表現ン必要としない多くの言語で単 語の文字セマンテック解析を支持可能である。又、単語により与えられる概念は 単語の文字内に含まれているため、文字セマンテック解析は選択した単語に限定 される意味の辞書ン必要としない。非英語の英文字を含む英文字の全ての単語は 解析可能である。他の利点や変更は当業者には容易に考え5る。それ故その広範 な側面の本発明は図示し説明した特定の詳細、代表的装置や図示例には限定され ない。従って、出願人の発明概念全体の要旨又は範囲から逸脱することなく前記 詳細からの背離も実行できる。
θへ 第2図 第4図 7 F CATEGORYI 、コi −00RCATEGOFQ2.31 傘 OGOTOPRINTRIミSミIT ’ 2 C0N5OgJAlfτ1; 第6B、図 10 PRINTRESUI工 手続補正書(自発) 平成3年 2月 6日

Claims (1)

  1. 【特許請求の範囲】 1.間合せ語のコンピユータ・コード化表現で与えられた概念と関係するコンピ ユータ・コード化文書中の概念を与えるテキスト語を識別するテキスト理解検索 方法において、 問合せ語の各々をそれ自身と比較することにより間合せ語の各々の第1文字セマ ンテック値を計算する段階と、 間合せ語の各々を各ブロツク中のテキスト語り各々と比較することにより動的な 所定寸法の複数個のテキスト・ブロツク中のテキスト語の各々の複数個の第2文 字セマンテック値を計算する段階と、前記第1文字セマンテツク値に最も近く比 較される第2文字セマンテック値を有する前記ブロツクの内の1つのテキスト語 を識別する段階と、を含むテキスト理解検索方法。 2.第1項記載の方法において、第1文字セマンテック値を計算する前記段階と 複数個の第2文字セマンテック値を計算する前記段階は、所定の関係マトリクス に従つて第2語の文字に対する第1語の文字の関係に数値を割当てる段階を含む 方法。 3.第2項記載の方法において、数値を割当てる前記段階は、前記第1語を1以 上4子音未満の第1語幹に縮少する段階と、前記第2語を1以上4子音未満の第 2語幹に縮少する段階とを含み、二重字TH,GN,NG,NC,NK,CK, CH,GH,CQ,PH,SHを単一子音として扱う方法。 4.第3項記載の方法において、数値を割当てる前記段階は、以下の文字セマン テック・マトリクスを基に前記第1及び第2語幹の各子音へ方向数を割当てる段 階と、方向重みを割当てる段階と、分類数を割当てる段階と、分類重みとを割当 てる段階とを含み、分類重み方向 1234 11AAJV,WH 21MF,PH,P2D,DH,TH 31QHN,QNQ,CQNG,NK,NC42RLBT 52SZCHC 62K,CKDKTKX.KH,QH,CH73HHSHGZH ここで文字Pの分類重みは2である方法。 5.第4項記載の方法において、方向数を割当てる前記段階は、前記マトリクス の列中に前記語幹の各々の各子音を配置する段階と、前記各子音に前記列の上段 の方向数を割当てる段階とを含み、方向重みを割当てる前記段階は前記各子音へ 0.5の値を割当てる段階を含み、分類数を割当てる前記段階は前記マトリクス の行中に前記各子音を配置する段階と、前記各子音に前記行の分類数を割当てる 段階とを含み、分類重みを割当てる前記段階は前記各子音に前記行の分類重み数 を割当てる段階を含む方法。 6.第5項記載の方法において、数値を割当てる前記段階は、前記第1語幹の隣 接する子音の各対の方向数を前記第2語幹の隣接する子音の各対の方向数と比較 する段階と、各対の前記方向数がマッチした時に前記第1語幹の隣接子音の対の 方向重みの合計だけ方向連想数を増加させる段階と、を含む方法。 7.第5項記載の方法において、数値を割当てる前記段階は、前記第1語幹の隣 接子音の各対の分類数を前記第2語幹の隣接子音の各対の分類数と比較する段階 と、前記第2語幹の隣接子音の各対と同じ分類数を有する前記第1語幹の隣接子 音の対の分類重みの和だけ分類連想数を増加させる段階と、を含む方法。 8.問合せ語のコンピユータ・コード化表現で与えられた概念と関係するコンピ ユータ・コード化文書中の概念を与えるテキスト語を識別するテキスト理解検索 装置において、 間合せ語の各々をそれ自身と比較することにより問合せ語の各々の第1文字セマ ンテック値を計算する装置と、 問合せ語の各々を各ブロツク中のテキスト語の各々と比較することにより動的な 所定寸法の複数個のテキスト・ブロツク中のテキスト語の各々の複数個の第2文 字セマンテツク値を計算する装置と、前記第1文字セマンテツク値に最も近く比 較される第2文字セマンテック値を有する前記ブロツクの内の1つのテキスト語 を識別する段階と、を含むテキスト理解検索装置。 9.第8項記載の装置において、第1文字セマンテツク値を計算する前記装置と 複数個の第2文字セマンテツク値を計算する前記装置は、所定の関係マトリクス に従つて第2語の文字に対する第1語の文字の関係に数値を割当てる装置を含む 装置。 10.第9項記載の装置において、数値を割当てる前記装置は、前記第1語を1 以上4子音未満の第1語幹に縮少する段階と、前記第2語を1以上4子音未満の 第2語幹に縮少する段階とを含み、二重字TH,GN,NG,NC,NK,CK ,CH.GH.CQ,PH,SHを単一子音として扱う装置。 11.第10項記載の装置において、数値を割当てる前記装置は、以下の文字化 マンテック・マトリクスを基に前記第1及び第2語幹の各子音へ方向数を割当て る段階と、方向重みを割当てる段階と、分類数を割当てる段階と、分類重みとを 割当てる段階とを含み、分類重み方向 12あ4 11AAJV,WH 21MF,PH,,P2DDH,TH 31QHN,QNQ,CQNG,NX,NC42RLBT 52SZCHC 62K,CKDKTKX,KH,QH,CH73HHSHQZH ここで文字Pの分類重みは2である装置。 12.第11項記載の装置において、方向数を割当てる前記装置に、前記マトリ クスの列中に前記語幹の各各の各子音を配置する段階と、前記各子音に前記列の 上段の方向数を割当てる段階とを含み、方向重みを割当てる前記装置は前記各子 音へ0.5の値を割当てる装置を含み、分類数を割当てる前記装置は前記マトリ クスの行中に前記各子音を配置し、前記各子音に前記行の分類数を割当てる装置 を含み、分類重みを割当てる前記装置は前記各子音に前記行の分類重み数を割当 てる装置を含む方法。 13.第12項記載の装置において、数値を割当てる前記装置は、前記第1語幹 の隣接子音の各対の方向数を前記第2語幹の隣接子音の各対の方向数と比較する 装置と、各対の前記方向数がマッチした時に前記第1語幹の隣接子音の対の方向 重みの合計だけ方向連想数を増加させる装置と、を含む装置。 14.第12項記載の装置において、数値を割当てる前記装置は、前記第1語幹 の隣接子音の各対の分類数を前記第2語幹の隣接子音の各対の分類数と比較する 装置と、前記第2語幹の隣接子音の各対と同じ分類数を有する前記第1語幹の隣 接子音の対の分類重みの和だけ分類連想数を増加させる装置と、を含む装置。 15.第1語と第2語との間の関係を定める方法において、 選択した英文字を表わす文字のアレイを記憶する段階と、 前記文字の各々に所定の第1及び第2数値位置値と所定の第1及び第2数値重み 値とを別当てる段階と、第1語の選択した文字と第2語の選択しに文字を、前記 選択文字を表わす前記文字の各々に割当てに前記第1及び第2数値位置値と第1 及び第2数値重み値に対応する第1及び第2数値位置値と第1及び第2数値重み 値とに変換する段階と、 第1語の前記選択文字の第1及び第2数値位置値を第2語の前記選択文字の第1 及び第2数値位置値と比較する段階と、 第2語の前記選択文字の第1及び第2数値位置値と対応する第1及び第2数値位 置値を有する第1語の前記選択文字の第1及び第2数値重み値をそれぞれ累計す る段階と、 累計しに第1及び第2数値重み値に従つて第1語と第2語との間の相似性を決定 する段階と、を含む第1語と第2語との間の関係を定める方法。 16.第15項記載の方法において、前記比較する段階は、第1語の選択文字の 対の第1及び第2数値位置値を第2語の文字の対応する対の第1及び第2数値位 置値と比較する段階を含む方法。 17.第15項記載の方法において、前記記憶する段階は、前記文字により表わ される英文字の第1及び第2意味に対応する前記アレイ中の位置へ文字を記憶す る段階を含む方法。 18.第1語と第2語との間の関係を定める蓑置において、 選択した英文字を表わす文字のアレイを記憶する装置と、 前記文字の各々に所定の第1及び第2数値位置値と所定の第1及び第2数値重み 値とを割当てる装置と、第1語の選択した文字と第2語の選択した文字を、前記 選択文字を表わす前記文字の各々に割当てた前記第1及び第2数値位置値と第1 及び第2数値重み値に対応する第1及び第2数値位置値と第1及び第2数値重み 値とに変換する装置と、 第1語の前記選択文字の第1及び第2数値位置値を第2語の前記選択文字の第1 及び第2数値位置値と比較する装置と、 第2語の前記選択文字の第1及び第2数値位置値と対応する第1及び第2数値位 置値を有する第1語の前記選択文字の第1及び第2数値重み値をそれぞれ累計す る装置と、 累計しに第1及び第2数値重み値に従つて第1語と第2語との間の相似性を決定 する装置と、を含む第1語と第2語との間の関係を定める装置。 19.第18項記載の装置において、前記比較する装置は、第1語の選択文字の 対の第1及び第2数値位置値を第2語の文字の対応する対の第1及び第2数値位 置値と比較する装置を含む装置。 20.第18項記載の装置において、前記記憶する装置は、前記文字により表わ される英文字の第1及び第2意味に対応する前記アレイ中の位置へ文字を記憶す る装置を含む装置。 21.単語のセマンテック値を決定する方法において、選択した英文字を表わす 文字のアレイを記憶する段階と、 前記文字の各々に所定の第1及び第2数値位置値と所定の第1及び第2数値重み 値を割当てる段階と、前記選択しに文字を表わす前記文字へ割当てられに前記第 1及び第2数値位置値と第1及び第2数値重み値に対応する第1及び第2数値位 置値と第1及び第2数値重み値に卑語の選択した文字を変換する段階と、を含む 単語のセマンテック値を決定する方法。
JP1506030A 1988-05-18 1989-05-16 テキスト表現の語間の意味関係を識別する方法と装置 Pending JPH03505495A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US195,293 1988-05-18
US07/195,293 US4849898A (en) 1988-05-18 1988-05-18 Method and apparatus to identify the relation of meaning between words in text expressions

Publications (1)

Publication Number Publication Date
JPH03505495A true JPH03505495A (ja) 1991-11-28

Family

ID=22720834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1506030A Pending JPH03505495A (ja) 1988-05-18 1989-05-16 テキスト表現の語間の意味関係を識別する方法と装置

Country Status (4)

Country Link
US (1) US4849898A (ja)
JP (1) JPH03505495A (ja)
AU (1) AU3696489A (ja)
WO (1) WO1989011699A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006226702A (ja) * 2005-02-15 2006-08-31 Nidec-Read Corp 基板検査用治具、基板検査装置及び検査用接触子

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5201042A (en) * 1986-04-30 1993-04-06 Hewlett-Packard Company Software process and tools for development of local language translations of text portions of computer source code
JP2664915B2 (ja) * 1988-01-12 1997-10-22 株式会社日立製作所 情報検索システム
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
US5060146A (en) * 1988-04-08 1991-10-22 International Business Machines Corporation Multilingual indexing system for alphabetical lysorting by comparing character weights and ascii codes
JPH02159674A (ja) * 1988-12-13 1990-06-19 Matsushita Electric Ind Co Ltd 意味解析装置と構文解析装置
NL8900247A (nl) * 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
NL8900587A (nl) * 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.
US5020019A (en) * 1989-05-29 1991-05-28 Ricoh Company, Ltd. Document retrieval system
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
JPH03185561A (ja) * 1989-12-15 1991-08-13 Ricoh Co Ltd 欧文単語入力方法
JPH03188566A (ja) * 1989-12-18 1991-08-16 Fujitsu Ltd 辞書連動テキストベース装置
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
JPH05135036A (ja) * 1990-10-10 1993-06-01 Fuji Xerox Co Ltd 文書処理装置
GB9103080D0 (en) * 1991-02-14 1991-04-03 British And Foreign Bible The Analysing textual documents
EP0510634B1 (en) * 1991-04-25 1999-07-07 Nippon Steel Corporation Data base retrieval system
US5440481A (en) * 1992-10-28 1995-08-08 The United States Of America As Represented By The Secretary Of The Navy System and method for database tomography
CA2102325A1 (en) * 1992-11-04 1994-05-05 Edwin R. Addison Method for resolution of natural-language queries against full-text databases
US5454106A (en) * 1993-05-17 1995-09-26 International Business Machines Corporation Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
US5687364A (en) * 1994-09-16 1997-11-11 Xerox Corporation Method for learning to infer the topical content of documents based upon their lexical content
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US5737734A (en) * 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
US5721902A (en) * 1995-09-15 1998-02-24 Infonautics Corporation Restricted expansion of query terms using part of speech tagging
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US5822731A (en) * 1995-09-15 1998-10-13 Infonautics Corporation Adjusting a hidden Markov model tagger for sentence fragments
US5737227A (en) * 1996-03-19 1998-04-07 Consulex Corporation Software planning program for coatings
JP3916007B2 (ja) * 1996-08-01 2007-05-16 高嗣 北川 意味情報処理方法及びその装置
US6484168B1 (en) * 1996-09-13 2002-11-19 Battelle Memorial Institute System for information discovery
US6119114A (en) * 1996-09-17 2000-09-12 Smadja; Frank Method and apparatus for dynamic relevance ranking
US6173298B1 (en) 1996-09-17 2001-01-09 Asap, Ltd. Method and apparatus for implementing a dynamic collocation dictionary
US6415319B1 (en) 1997-02-07 2002-07-02 Sun Microsystems, Inc. Intelligent network browser using incremental conceptual indexer
US5996011A (en) * 1997-03-25 1999-11-30 Unified Research Laboratories, Inc. System and method for filtering data received by a computer system
US6539430B1 (en) * 1997-03-25 2003-03-25 Symantec Corporation System and method for filtering data received by a computer system
AU1380599A (en) * 1998-11-04 2000-05-22 Sullivan Walter III Database system with restricted keyword list and bi-directional keyword translation
US6434546B1 (en) * 1998-12-22 2002-08-13 Xerox Corporation System and method for transferring attribute values between search queries in an information retrieval system
US6901402B1 (en) * 1999-06-18 2005-05-31 Microsoft Corporation System for improving the performance of information retrieval-type tasks by identifying the relations of constituents
US7219073B1 (en) * 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US6804662B1 (en) 2000-10-27 2004-10-12 Plumtree Software, Inc. Method and apparatus for query and analysis
US6741981B2 (en) 2001-03-02 2004-05-25 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) System, method and apparatus for conducting a phrase search
US6823333B2 (en) 2001-03-02 2004-11-23 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for conducting a keyterm search
US6697793B2 (en) 2001-03-02 2004-02-24 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for generating phrases from a database
US6721728B2 (en) 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US8744835B2 (en) * 2001-03-16 2014-06-03 Meaningful Machines Llc Content conversion method and apparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US7353247B2 (en) * 2001-10-19 2008-04-01 Microsoft Corporation Querying applications using online messenger service
US7403890B2 (en) * 2002-05-13 2008-07-22 Roushar Joseph C Multi-dimensional method and apparatus for automated language interpretation
US20040030540A1 (en) * 2002-08-07 2004-02-12 Joel Ovil Method and apparatus for language processing
US8271495B1 (en) 2003-12-17 2012-09-18 Topix Llc System and method for automating categorization and aggregation of content from network sites
US20060177801A1 (en) * 2005-02-09 2006-08-10 Noureddin Zahmoul Cassidy code
US7930647B2 (en) * 2005-12-11 2011-04-19 Topix Llc System and method for selecting pictures for presentation with text content
JP4923604B2 (ja) * 2006-02-13 2012-04-25 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7739255B2 (en) * 2006-09-01 2010-06-15 Ma Capital Lllp System for and method of visual representation and review of media files
US20080109305A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Using internet advertising as a test bed for radio advertisements
US20080109409A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Brokering keywords in radio broadcasts
US20080109845A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp System and method for generating advertisements for use in broadcast media
US9405732B1 (en) 2006-12-06 2016-08-02 Topix Llc System and method for displaying quotations
US7650317B2 (en) * 2006-12-06 2010-01-19 Microsoft Corporation Active learning framework for automatic field extraction from network traffic
US7814107B1 (en) 2007-05-25 2010-10-12 Amazon Technologies, Inc. Generating similarity scores for matching non-identical data strings
US7908279B1 (en) 2007-05-25 2011-03-15 Amazon Technologies, Inc. Filtering invalid tokens from a document using high IDF token filtering
US8046372B1 (en) * 2007-05-25 2011-10-25 Amazon Technologies, Inc. Duplicate entry detection system and method
US7895225B1 (en) 2007-12-06 2011-02-22 Amazon Technologies, Inc. Identifying potential duplicates of a document in a document corpus
US8965881B2 (en) * 2008-08-15 2015-02-24 Athena A. Smyros Systems and methods for searching an index
US9424339B2 (en) 2008-08-15 2016-08-23 Athena A. Smyros Systems and methods utilizing a search engine
TWI377478B (en) * 2008-10-07 2012-11-21 Mitac Int Corp Self-learning method for keyword based human machine interaction and portable navigation device using the method
US20110301941A1 (en) * 2009-03-20 2011-12-08 Syl Research Limited Natural language processing method and system
US8862458B2 (en) * 2010-11-30 2014-10-14 Sap Ag Natural language interface
US9442928B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
US9442930B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
US9269353B1 (en) * 2011-12-07 2016-02-23 Manu Rehani Methods and systems for measuring semantics in communications
US9064009B2 (en) * 2012-03-28 2015-06-23 Hewlett-Packard Development Company, L.P. Attribute cloud
US9195647B1 (en) * 2012-08-11 2015-11-24 Guangsheng Zhang System, methods, and data structure for machine-learning of contextualized symbolic associations
JP5936698B2 (ja) * 2012-08-27 2016-06-22 株式会社日立製作所 単語意味関係抽出装置
CN103593340B (zh) * 2013-10-28 2017-08-29 余自立 自然表达信息处理方法、处理及回应方法、设备及***
US10275444B2 (en) 2016-07-15 2019-04-30 At&T Intellectual Property I, L.P. Data analytics system and methods for text data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55108075A (en) * 1979-02-09 1980-08-19 Sharp Corp Data retrieval system
JPS57174768A (en) * 1981-04-17 1982-10-27 Sharp Corp Information retrieving device
US4627023A (en) * 1981-09-22 1986-12-02 Sharp Kabushiki Kaisha Word information retrieval system using video storage medium
US4471459A (en) * 1981-09-30 1984-09-11 System Development Corp. Digital data processing method and means for word classification by pattern analysis
BE891911A (fr) * 1982-01-27 1982-05-17 Europ Agence Spatiale Dispositif numerique pour commander la representation graphique de caracteres
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
US4783758A (en) * 1985-02-05 1988-11-08 Houghton Mifflin Company Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words
US4747053A (en) * 1985-05-20 1988-05-24 Brother Kogyo Kabushiki Kaisha Electronic dictionary
US4758955A (en) * 1985-07-19 1988-07-19 Carson Chen Hand-held spelling checker and method for reducing redundant information in the storage of textural material

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006226702A (ja) * 2005-02-15 2006-08-31 Nidec-Read Corp 基板検査用治具、基板検査装置及び検査用接触子

Also Published As

Publication number Publication date
US4849898A (en) 1989-07-18
WO1989011699A1 (en) 1989-11-30
AU3696489A (en) 1989-12-12

Similar Documents

Publication Publication Date Title
JPH03505495A (ja) テキスト表現の語間の意味関係を識別する方法と装置
French A simple recurrent network model of bilingual memory
Enfield Areal linguistics and mainland Southeast Asia
Kostoff Co-word analysis
Budi et al. Association rules mining for name entity recognition
Kostoff Database tomography: Origins and duplications
Alliheibi et al. Opinion mining of Saudi responses to COVID-19 vaccines on Twitter
Kassahun et al. Design and develop a part of speech tagging for ge’ez language using deep learning approach
Todorović et al. Serbian ner&beyond: The archaic and the modern intertwinned
Das et al. Role of artificial intelligence in preservation of culture and heritage
Barlow Papuan-Austronesian contact and the spread of numeral systems in Melanesia
Clementeena et al. A literature survey on question answering system in natural language processing
Assunção et al. A lexicometric analysis of the poems from O Guardador de Rebanhos
Aguiar et al. Towards technological approaches for concept maps mining from text
Nwohiri et al. AI-Powered Plagiarism Detection: Leveraging Forensic Linguistics And Natural Language Processing
Azmina The analysis of grammatical and textual equivalence used in the translation of Paolini‘s novel of “inheritance” into Indonesian
Abushaala et al. A comparative study on various deep learning techniques for Arabic NLP syntactic tasks on noisy data
Malyshev et al. The sociolinguistic situation of the Dargwa in Dagestan
Nabiilah et al. Personality Classification Based on Textual Data using Indonesian Pre-Trained Language Model and Ensemble Majority Voting.
Raben Computer–Assisted Research in the Humanities: A Directory of Scholars Active
Sheremetyeva et al. A multilingual onomasticon as a multipurpose NLP resource.
Karlgren et al. Vector-based Semantic Analysis using Random Indexing and Morphological Analysis for Cross-Lingual Information Retrieval.
Li et al. Automatic construction of cross-lingual networks of concepts from the Hong Kong SAR Police Department
Fauzy et al. The Relationship of News Title Writing and Multiple Intelligences of Journalistic Students
Modhaffer PATTERNS OF COMPOUNDS IN ARABIC: A COMPUTATIONAL MORPHO-SYNTACTIC APPROACH