JP2009525514A - データおよび情報を獲得、分析、マイニングするシステムならびに方法 - Google Patents

データおよび情報を獲得、分析、マイニングするシステムならびに方法 Download PDF

Info

Publication number
JP2009525514A
JP2009525514A JP2008551540A JP2008551540A JP2009525514A JP 2009525514 A JP2009525514 A JP 2009525514A JP 2008551540 A JP2008551540 A JP 2008551540A JP 2008551540 A JP2008551540 A JP 2008551540A JP 2009525514 A JP2009525514 A JP 2009525514A
Authority
JP
Japan
Prior art keywords
data
tool
mining
database
thesaurus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008551540A
Other languages
English (en)
Inventor
ハートウィグ・チャールズ・ディー
マルチェロ・ロバート
キッペルマン・スチュアート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Janssen Diagnostics LLC
Original Assignee
Janssen Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Janssen Diagnostics LLC filed Critical Janssen Diagnostics LLC
Publication of JP2009525514A publication Critical patent/JP2009525514A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を提供する。
【解決手段】目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法は、目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、生のデータの集合にデータマイニングツールを適用して、マイニングされたデータを得る過程と、マイニングされたデータにユーザーインターフェースを適用して、目的の情報を視覚化することを達成する過程と、による。
【選択図】図1

Description

開示の内容
〔発明の分野〕
本発明は、目的のデータおよび/または情報を獲得、分析、および、マイニングする方法に関する。
〔発明の背景〕
データの獲得、処理、および、マイニングは、人による大量の入力を伴う主として手作業の手順のままである。さまざまな側面が、自動化されてきたが、全体のプロセスは、いまだに一体化されておらず、検索者がデータおよび情報に関して、獲得、分析、マイニングし、かつ、結論に達する、ために、一つの一体化されたシステムを用いることができるようにはなっていない。グーグル(Google)、ダイアログ(Dialog)、パブメッド(PubMed)、のような、検索エンジン付きのデータベースが、利用可能である。各データベースは、検索に関する異なる規則と、異なる「ワイルドカード」の使用法と、シソーラスのような異なる資源と、を有している。すべてのデータベースは、生のデータの集合を獲得し、その生のデータの集合は、直接的な人との対話を介して、または、オムニビズ(OmniViz)のようなツールを介して、分析されなければならない。米国特許第6,070,133号、同第6,484,168号、同第6,665,661号、同第6,718,336号、同第6,772,170号、同第6,898530号、および、同第6,940,509号、が参照される。しかし、これらのツールは、複雑で、通常の検索者には入手できない数学およびコンピュータプログラミングの理解度を要する。さらに、各ツールは、なお高度な数学およびコンピュータ技術の知識を別様に必要とするデータを分析する。さらに、各ツールは、専有のインターフェース(proprietary interface)を介して、シソーラスまたは検索基準のような一般的な概念を用いる。さまざまなツールからの検索結果を比較および対照することができる値を仮定すると、同一の検索用語、同一のシソーラス、などを用いて検索が行われることが、特に重要である。専有のインターフェースは、現在のところ、異なるツールが、共通のインターフェース、データ、および、類義語、を用いることを妨げている。手動による手段を用いて、たとえこれらのツールが組み合わされて用いられたとしても、その結果生じるデータの分類は、回答より多くの質問を必要とする場合がある。マイニングされたデータの分析の生成、そのデータに関する報告および意見の提示、は、なお、集中的な人の努力を必要とする。データベースのような供給源からのデータの取得、何が目的のもの(of interest)であるかを判定するためのデータの分類、マイニングされたデータの分析、のプロセスの複雑さは、時間の浪費を導く。さらに、ツール間の検索の一貫性を確実にするために必要とされる手作業による過程は、得られた結果の完璧さに関する不安と、市場の企業での非能率性とを導く。
〔発明の概要〕
本発明は、目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を包含し、その方法は、目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、生のデータの集合にデータマイニングツールを適用して、マイニングされたデータを得る過程と、マイニングされたデータにユーザーインターフェースを適用して、目的の情報の視覚化を達成する過程と、によるものである。
本発明は、その方法を実行するためにプログラムされたコンピュータを用いて装置もしくは装置の組み合わせでの、または装置もしくは装置の組み合わせへの、その方法の使用、その方法を実行するための説明書を含む物品、その方法を実行し、それによる結果を提供することによって事業を行う方法、その方法を実行するシステム、ならびに、それらの使用、物品、方法、および、システムから生み出された報告、をもさらに包含する。
〔発明の詳細な説明〕
本発明は、目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を包含し、その方法は、目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、生のデータの集合にデータマイニングツールを適用して、マイニングされたデータを得る過程と、マイニングされたデータにユーザーインターフェースを適用して、目的の情報の視覚化を達成する過程と、によるものである。
本発明は、その方法を実行するためにプログラムされたコンピュータを用いて装置もしくは装置の組み合わせでの、または装置もしくは装置の組み合わせへの、その方法の使用、その方法を実行するための説明書を含む物品、その方法を実行し、それによる結果を提供することによって事業を行う方法、その方法を実行するためのシステム、および、それらの使用、物品、方法、および、システムによって生み出された報告(図13〜図14)、をさらに含む。
本発明の方法は、オプションとして、少なくとも一つのデータ同期化マイニングツールを、マイニングされたデータに適用する過程を、さらに含むことができる。好ましくは、データ同期化マイニングツールは、マイニングされたデータを主題別配列(topicality)に基づいてクラスター化し(図9〜図12)、以下に限定されないが、K平均法、デカルト分析、改変分子モデル(modified molecular model)、または、ばねモデル、を含む当該分野で知られた任意のモデルを用い、そして、主要な検索用語の潜在導関数(latent derivatives)を生み出す。潜在導関数は、例えば、主要な検索用語が、アスピリンおよび痛みの場合には、頭痛に関するデータが生成された結果である。データ同期化マイニングツールは、ペン・アスペクト(Penn Aspect)(ホフマン、ティー、確率的潜在意味解析:Hofmann, T. Probabilistic latent Semantic Analysis、人工知能での不確実性についての第15回会議の会報(ユー・エイ・アイ’99):Proceedings of the Fifteenth Conference on Uncertainty in Artificial Intelligence (UAI'99), http;//www.cs.brown.edu/~th/papers/Hofmann-UAI99.pdf, 米国特許出願公開第2002/0107853号(US20020107853);および米国特許出願公開第2006/0242118号(US20060242118))のような当該分野で知られた任意の確率的潜在意味解析であってよい。
目的の情報は、以下に限定されないが、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、を含む、当該分野で知られた任意のデータ供給源において見出されうる。データベースは、公共利用可能なデータベース、または、内部データベース、であってよい。データベースの例には、以下に限定されないが、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(Micropatent)(商標)、欧州特許庁データベース、ダイアログ(Dialog)(商標)、メドライン(Medline)(商標)、パブメド(PubMed)(商標)、グーグル(Google)(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ(Crisp)、レクシス/ネクシス(Lexis/Nexis)(商標)、および、ウエストロー(Westlaw)(商標)、が含まれる。
データマイニングツールは、以下に限定されないが、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列、を含む、当該分野で知られた任意のツールであってよい。自然言語プロセッサは、例えば、オムニビズ(OmniViz)またはMITツールセット、であってよい。ユーザーインターフェースは、以下に限定されないが、サブルーチンを含むコンピュータコード、を含む、当該分野で知られた任意のインターフェースでありうる。そのプロセスが図1〜図6に示されていて、視覚化が図7および図8に示されている。
本発明の方法のサブルーチンは、複数のデータマイニングツールを一つのコンピュータ画面上に統合して、各検索に対してどのツールを用いるかを利用者に選択させること、複数のデータ供給源を一つのコンピュータ画面に統合して、各検索に対してどのデータ供給源を用いるかを利用者に選択させること、すべてのシソーラスを同じ画面上に統合して、各検索に対してどのシソーラスを用いるかを利用者に選択させること、実行されたすべての検索およびマイニングセッションの電子履歴(electronic history)を維持し、利用者が利用者自身の履歴検索を再吟味できるようにすること、他の利用者の検索を再吟味できるようにすること、ならびに、活動のログを維持することであって、共通の活動領域を決定するためにその活動のログ自体がマイニングされうる、活動のログを維持すること、のうちの少なくとも一つを提供する。共通のシソーラスは、各用語カテゴリーに対して維持されることができ、共通のシソーラスを各用語カテゴリーに対して維持するなどして、各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする。カテゴリーは、以下に限定されないが、社名、病状、および、ヒト遺伝子、を含む、当該分野で知られた任意のカテゴリーであってよい。この翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしに、すべてのツールにわたって用いられることを可能にする。
本発明は、人およびコンピュータのインターフェースによって、データを獲得し、マイニングし、分析する方法およびシステムを提供し、その人およびコンピュータのインターフェースは、現在のシステムでは利用することができない利益を提供する、効率がよく対費用効果の高い方法において人の専門的知識を強化する。コンピュータは、いかに洗練されているといえども、現在のところ、人の心を読んで人が何を考えているかを言い当てることはできない。それとは逆に、極わずかな人は、自分の考えをコンピュータが必要とするピンポイントの正確さと完全さで検索用の単語/句/発想に効率良く翻訳できる。本発明は、これら2つの専門的知識分野の間の結びつきを提供する。
本発明は、以下の利益を提供する。
・利用者に、市販されている、かつ/または、内部で開発された、データ分析ツールの選択権を与える。
・利用者に、特許、専有の実験装置からの出力、OCD器具からのデータ、など、のような、マイニングのためのデータ供給源の選択権を与える。
・すべてのデータマイニングツールは用語・類義語の使用に大きく依存しているので、本発明は、利用者間の用語シソーラスを保持するための簡単なインターフェースを提供する。本発明は、共通のシソーラスを、そのシソーラスがワイルドカードシステムのアプリケーション/ツールのいずれでも働くように、変更する。したがって、各シソーラスは、任意のマイニングツールと共に用いられるように強化され、すなわち、各シソーラスは同期化される。この結果、改良されたマイニング結果が得られる。
・利用者が、これらのツールのうちいずれか、またはすべてを、任意の組み合わせで、シソーラスの任意の組み合わせと共に、これらのデータのいずれかに対して、用いることができるようにする。これによって、利用者は、異なるツールによる結果の迅速な比較/対照を行う能力を提供され、傾向および相違を特定する能力を提供される。検索結果は、共通の、同期化された検索/シソーラスの組み合わせを用いたツールに由来しているので、検索結果は、検索者がこれらの組み合わせの結果に対して持つ信頼を大きく改善する。
・利用者が、先の検索、他の利用者によって(他の話題によって)実行された先の検索に対する検索、など、を保持する能力を与えられる。
・検索結果の変化を追跡し、利用者が検索用語に対して「ウオッチプロセス(watch processes)」を始動できるようにする。たとえば、利用者が単語「狼瘡」に対する検索を始動すると、利用者は、この単語を含む文献がわれわれのデータベース中に現れたときはいつでも通報される(電子メールまたは他の電子的手段を介して)。その場合、そのデータは、再処理され、再評価される場合がある。
・ビジネスインテリジェンスを実行する能力を提供する。
〔参照文献〕
Figure 2009525514
〔実施の態様〕
この発明の具体的な実施態様は以下の通りである。
(1)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法において、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、方法。
(2)実施態様(1)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(3)実施態様(1)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(4)実施態様(1)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(5)実施態様(4)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(6)実施態様(1)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(7)実施態様(4)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(8)実施態様(2)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(9)実施態様(8)に記載の方法において、
前記データ同期化マイニングツールは、
K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(10)実施態様(8)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(11)実施態様(8)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(12)実施態様(1)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(13)実施態様(12)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(14)実施態様(13)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(15)実施態様(14)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって類義語を評価することができるようにする、方法。
(16)実施態様(15)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(17)実施態様(16)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(18)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するようにプログラムされたコンピュータを含む装置において、
前記方法は、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、装置。
(19)実施態様(18)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(20)実施態様(18)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(21)実施態様(18)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(22)実施態様(21)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(23)実施態様(18)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(24)実施態様(23)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(25)実施態様(19)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(26)実施態様(25)に記載の方法において、
前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(27)実施態様(25)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(28)実施態様(25)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(29)実施態様(18)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(30)実施態様(29)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(31)実施態様(30)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(32)実施態様(31)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
(33)実施態様(32)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(34)実施態様(33)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(35)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するようにプログラムされた少なくとも一つのコンピュータを含む装置の組み合わせにおいて、
前記方法は、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、装置の組み合わせ。
(36)実施態様(35)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(37)実施態様(35)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(38)実施態様(35)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(39)実施態様(38)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(40)実施態様(35)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(41)実施態様(40)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(42)実施態様(36)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(43)実施態様(36)に記載の方法において、
前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(44)実施態様(43)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(45)実施態様(43)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(46)実施態様(36)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(47)実施態様(46)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(48)実施態様(46)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(49)実施態様(48)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
(50)実施態様(49)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(51)実施態様(50)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(52)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するための説明書を含む物品において、
前記方法は、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、物品。
(53)実施態様(52)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(54)実施態様(52)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(55)実施態様(52)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(56)実施態様(55)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(57)実施態様(52)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(58)実施態様(55)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(59)実施態様(53)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(60)実施態様(59)に記載の方法において、
前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(61)実施態様(59)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(62)実施態様(59)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(63)実施態様(52)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(64)実施態様(63)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(65)実施態様(64)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(66)実施態様(65)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
(67)実施態様(66)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(68)実施態様(67)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(69)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行することを含む事業を実施する方法において、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、方法。
(70)実施態様(69)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(71)実施態様(69)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(72)実施態様(69)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(73)実施態様(72)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(74)実施態様(69)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(75)実施態様(74)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(76)実施態様(70)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(77)実施態様(76)に記載の方法において、
前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(78)実施態様(76)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(79)実施態様(76)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(80)実施態様(69)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(81)実施態様(80)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(82)実施態様(81)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(83)実施態様(82)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
(84)実施態様(83)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(85)実施態様(84)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(86)目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するシステムにおいて、
前記方法は、
a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
を具備する、システム。
(87)実施態様(86)に記載の方法において、
前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
をさらに具備する、方法。
(88)実施態様(86)に記載の方法において、
前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
(89)実施態様(86)に記載の方法において、
前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
(90)実施態様(89)に記載の方法において、
前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
(91)実施態様(86)に記載の方法において、
前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
(92)実施態様(91)に記載の方法において、
前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
(93)実施態様(87)に記載の方法において、
前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
(94)実施態様(93)に記載の方法において、
前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
(95)実施態様(93)に記載の方法において、
前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
(96)実施態様(93)に記載の方法において、
前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
(97)実施態様(86)に記載の方法において、
前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
(98)実施態様(97)に記載の方法において、
前記サブルーチンは、
a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
e)他の利用者の検索を再吟味できるようにすること、ならびに、
f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
のうちの少なくとも一つを提供する、方法。
(99)実施態様(98)に記載の方法において、
前記c)は、
各用語カテゴリーに対して共通のシソーラスを保持することと、
各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
をさらに含む、方法。
(100)実施態様(99)に記載の方法において、
前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
(101)実施態様(100)に記載の方法において、
前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
(102)実施態様(100)に記載の方法において、
前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
(103)実施態様(1)〜実施態様(102)のいずれかに記載の発明によって生み出される、報告。
データマイニング段階を示す図である。 データベースからユーザーインターフェースへの情報の流れを示す図である。 典型的なデータ取り込み結果を示す図である。 データマイニングの結果を示す図である。 ワイルドカード高等検索の画面を示す図である。 ワイルドカード基本検索の画面を示す図である。 ワイルドカード基本分類/マイニングを示す図である。 マイニング分析ツールのワイルドカード選択の画面を示す図である。 話題が強調されたワイルドカードマイニングステップ1の画面を示す図である。 ワイルドカードマイニングステップ1の画面を示す図である。 主題別配列のないワイルドカードマイニングステップ2の画面を示す図である。 主題別配列のあるワイルドカードマイニングステップ2の画面を示す図である。 選択されたデータの集合中の文書を示すワイルドカードマイニングステップ3の画面を示す図である。 データの集合の次の検索用語を示すワイルドカードマイニングステップ3の画面を示す図である。

Claims (103)

  1. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法において、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、方法。
  2. 請求項1に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  3. 請求項1に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  4. 請求項1に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  5. 請求項4に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  6. 請求項1に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  7. 請求項4に記載の方法において、
    前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  8. 請求項2に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  9. 請求項8に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  10. 請求項8に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  11. 請求項8に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  12. 請求項1に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  13. 請求項12に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  14. 請求項13に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  15. 請求項14に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって類義語を評価することができるようにする、方法。
  16. 請求項15に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  17. 請求項16に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  18. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するようにプログラムされたコンピュータを含む装置において、
    前記方法は、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、装置。
  19. 請求項18に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  20. 請求項18に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  21. 請求項18に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  22. 請求項21に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  23. 請求項18に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  24. 請求項23に記載の方法において、
    前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  25. 請求項19に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  26. 請求項25に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  27. 請求項25に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  28. 請求項25に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  29. 請求項18に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  30. 請求項29に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  31. 請求項30に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  32. 請求項31に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
  33. 請求項32に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  34. 請求項33に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  35. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するようにプログラムされた少なくとも一つのコンピュータを含む装置の組み合わせにおいて、
    前記方法は、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、装置の組み合わせ。
  36. 請求項35に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  37. 請求項35に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  38. 請求項35に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  39. 請求項38に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  40. 請求項35に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  41. 請求項40に記載の方法において、
    前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  42. 請求項36に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  43. 請求項36に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  44. 請求項43に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  45. 請求項43に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  46. 請求項36に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  47. 請求項46に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  48. 請求項46に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  49. 請求項48に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
  50. 請求項49に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  51. 請求項50に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  52. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するための説明書を含む物品において、
    前記方法は、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、物品。
  53. 請求項52に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  54. 請求項52に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  55. 請求項52に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  56. 請求項55に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  57. 請求項52に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  58. 請求項55に記載の方法において、
    前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  59. 請求項53に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  60. 請求項59に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  61. 請求項59に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  62. 請求項59に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  63. 請求項52に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  64. 請求項63に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  65. 請求項64に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  66. 請求項65に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
  67. 請求項66に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  68. 請求項67に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  69. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行することを含む事業を実施する方法において、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、方法。
  70. 請求項69に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  71. 請求項69に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  72. 請求項69に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  73. 請求項72に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  74. 請求項69に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  75. 請求項74に記載の方法において、
    前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  76. 請求項70に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  77. 請求項76に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  78. 請求項76に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  79. 請求項76に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  80. 請求項69に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  81. 請求項80に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  82. 請求項81に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  83. 請求項82に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
  84. 請求項83に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  85. 請求項84に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  86. 目的のデータおよび/または情報を獲得、分析、ならびに、マイニングする方法を実行するシステムにおいて、
    前記方法は、
    a)目的の情報を含むデータおよび/または情報を得るために、少なくとも一つの主要な検索用語を用いて、少なくとも一つのデータベースを検索して、生のデータの集合を得る過程と、
    b)前記生のデータの集合に、データマイニングツールを適用して、マイニングされたデータを得る過程と、
    c)前記マイニングされたデータに、ユーザーインターフェースを適用して、前記目的の情報の視覚化を達成する過程と、
    を具備する、システム。
  87. 請求項86に記載の方法において、
    前記過程b)で得られた前記マイニングされたデータに、少なくとも一つのデータ同期化マイニングツールを、オプションとして適用する過程、
    をさらに具備する、方法。
  88. 請求項86に記載の方法において、
    前記目的の情報は、知的財産、文献、マイクロアレイパイプライン、患者データ、専有の実験装置からの出力、計測手段からのデータ、市場データ、人口調査データ、のうちの少なくとも一つを含む、方法。
  89. 請求項86に記載の方法において、
    前記データベースは、公共利用可能なデータベース、または内部データベースである、方法。
  90. 請求項89に記載の方法において、
    前記データベースは、米国特許商標庁データベース、世界知的所有権機関データベース、マイクロパテント(商標)、欧州特許庁データベース、ダイアログ(商標)、メドライン(商標)、パブメド(商標)、グーグル(商標)、内部システム、EDGAR、FDAオレンジブック、クリスプ、レクシス/ネクシス(商標)、および、ウエストロー(商標)のうちの少なくとも一つから選択される、方法。
  91. 請求項86に記載の方法において、
    前記データマイニングツールは、自然言語プロセッサ、および、SQLの取り込み、単純検索、または、同時生起行列を含む集合から選択される、方法。
  92. 請求項91に記載の方法において、前記自然言語プロセッサは、オムニビズ、またはMITツールセット、を含む、方法。
  93. 請求項87に記載の方法において、
    前記データ同期化マイニングツールは、主題別配列に基づいて、前記マイニングされたデータをクラスター化する、方法。
  94. 請求項93に記載の方法において、
    前記データ同期化マイニングツールは、K平均法、デカルト分析、改変分子モデル、または、ばねモデル、のうちの少なくとも一つを用いる、方法。
  95. 請求項93に記載の方法において、
    前記データ同期化マイニングツールは、主要な検索用語の潜在導関数をさらに生み出す、方法。
  96. 請求項93に記載の方法において、
    前記データ同期化マイニングツールは、確率的潜在意味解析である、方法。
  97. 請求項86に記載の方法において、
    前記ユーザーインターフェースは、サブルーチンを含むコンピュータコードである、方法。
  98. 請求項97に記載の方法において、
    前記サブルーチンは、
    a)複数のデータマイニングツールを一つのコンピュータ画面上に統合し、各検索に対してどのツールを使うかを利用者に選択させること、
    b)複数のデータ供給源を一つのコンピュータ画面に統合し、各検索に対してどのデータ供給源を使うかを前記利用者に選択させること、
    c)すべてのシソーラスを同じ画面上に統合し、各検索に対してどのシソーラスを使うかを前記利用者に選択させること、
    d)実行されたすべての検索およびマイニングセッションの電子履歴を維持し、利用者が自分自身の履歴検索を再吟味できるようにすること、
    e)他の利用者の検索を再吟味できるようにすること、ならびに、
    f)活動のログを維持することであって、共通の活動領域を決定するために前記活動のログ自体がマイニングされうる、活動のログを維持すること、
    のうちの少なくとも一つを提供する、方法。
  99. 請求項98に記載の方法において、
    前記c)は、
    各用語カテゴリーに対して共通のシソーラスを保持することと、
    各シソーラスを各ツールに適した形式に変換するために必要なすべての電子翻訳を実行することと、
    をさらに含む、方法。
  100. 請求項99に記載の方法において、
    前記各用語カテゴリーに対して共通のシソーラスを保持することは、任意のツールと共に用いられることができるカテゴリーによって、類義語を評価することができるようにする、方法。
  101. 請求項100に記載の方法において、
    前記カテゴリーは、社名、病状、および、ヒト遺伝子、から選択される、方法。
  102. 請求項100に記載の方法において、
    前記翻訳の機能は、一つの共通のシソーラス(カテゴリー毎に)が、前記ツールおよびシソーラスの組み合わせを選択すること以外は利用者からの入力なしにすべてのツールにわたって用いられることを可能にする、方法。
  103. 報告において、
    請求項1〜請求項102のいずれか1項に記載の発明によって生み出される、報告。
JP2008551540A 2006-01-19 2007-01-19 データおよび情報を獲得、分析、マイニングするシステムならびに方法 Pending JP2009525514A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US76013806P 2006-01-19 2006-01-19
PCT/US2007/060750 WO2007084974A2 (en) 2006-01-19 2007-01-19 Systems and methods for acquiring analyzing mining data and information

Publications (1)

Publication Number Publication Date
JP2009525514A true JP2009525514A (ja) 2009-07-09

Family

ID=38288400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008551540A Pending JP2009525514A (ja) 2006-01-19 2007-01-19 データおよび情報を獲得、分析、マイニングするシステムならびに方法

Country Status (8)

Country Link
US (1) US20070168338A1 (ja)
EP (1) EP1999648A2 (ja)
JP (1) JP2009525514A (ja)
CN (1) CN101529418A (ja)
BR (1) BRPI0706683A2 (ja)
CA (1) CA2637745A1 (ja)
MX (1) MX2008009411A (ja)
WO (1) WO2007084974A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600966B2 (en) * 2007-09-20 2013-12-03 Hal Kravcik Internet data mining method and system
CN102419975B (zh) * 2010-09-27 2015-11-25 深圳市腾讯计算机***有限公司 一种基于语音识别的数据挖掘方法和***
CN102750282B (zh) * 2011-04-19 2014-10-22 北京百度网讯科技有限公司 同义词模板的挖掘方法和装置以及同义词挖掘方法和装置
CN102254003A (zh) * 2011-07-15 2011-11-23 江苏大学 一种图书推荐方法
JP2015505082A (ja) * 2011-12-12 2015-02-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報ドメインに対する自然言語処理モデルの生成
US9323736B2 (en) * 2012-10-05 2016-04-26 Successfactors, Inc. Natural language metric condition alerts generation
CN103473369A (zh) * 2013-09-27 2013-12-25 清华大学 基于语义的信息采集方法及***
CN103544255B (zh) * 2013-10-15 2017-01-11 常州大学 基于文本语义相关的网络舆情信息分析方法
CN106228000A (zh) * 2016-07-18 2016-12-14 北京千安哲信息技术有限公司 过度医疗检测***及方法
CN106126758B (zh) * 2016-08-30 2021-01-05 西安航空学院 用于信息处理和信息评估的云***

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6484168B1 (en) * 1996-09-13 2002-11-19 Battelle Memorial Institute System for information discovery
US6070133A (en) * 1997-07-21 2000-05-30 Battelle Memorial Institute Information retrieval system utilizing wavelet transform
US6006223A (en) * 1997-08-12 1999-12-21 International Business Machines Corporation Mapping words, phrases using sequential-pattern to find user specific trends in a text database
US6115708A (en) * 1998-03-04 2000-09-05 Microsoft Corporation Method for refining the initial conditions for clustering with applications to small and large database clustering
US6898530B1 (en) * 1999-09-30 2005-05-24 Battelle Memorial Institute Method and apparatus for extracting attributes from sequence strings and biopolymer material
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6940509B1 (en) * 2000-09-29 2005-09-06 Battelle Memorial Institute Systems and methods for improving concept landscape visualizations as a data analysis tool
US6665661B1 (en) * 2000-09-29 2003-12-16 Battelle Memorial Institute System and method for use in text analysis of documents and records
US6718336B1 (en) * 2000-09-29 2004-04-06 Battelle Memorial Institute Data import system for data analysis system
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6865573B1 (en) * 2001-07-27 2005-03-08 Oracle International Corporation Data mining application programming interface
US7451137B2 (en) * 2004-07-09 2008-11-11 Microsoft Corporation Using a rowset as a query parameter
US7574433B2 (en) * 2004-10-08 2009-08-11 Paterra, Inc. Classification-expanded indexing and retrieval of classified documents

Also Published As

Publication number Publication date
BRPI0706683A2 (pt) 2011-04-05
US20070168338A1 (en) 2007-07-19
CA2637745A1 (en) 2007-07-26
CN101529418A (zh) 2009-09-09
WO2007084974A3 (en) 2009-04-09
WO2007084974A2 (en) 2007-07-26
EP1999648A2 (en) 2008-12-10
MX2008009411A (es) 2008-10-01

Similar Documents

Publication Publication Date Title
JP2009525514A (ja) データおよび情報を獲得、分析、マイニングするシステムならびに方法
Marcos-Pablos et al. Decision support tools for SLR search string construction
Kumar et al. Text mining: concepts, process and applications
Yang et al. Text mining and visualization tools–impressions of emerging capabilities
Díaz-Galiano et al. Query expansion with a medical ontology to improve a multimodal information retrieval system
Leetaru Data mining methods for the content analyst: An introduction to the computational analysis of content
WO2005060684A2 (en) Method and system for obtaining solutions to contradictional problems from a semantically indexed database
Khoo et al. Augmenting Dublin core digital library metadata with Dewey decimal classification
Uys et al. Leveraging unstructured information using topic modelling
KR102150560B1 (ko) 토픽을 이용한 타겟 분석 장치 및 방법
Cole et al. Google Scholar's coverage of the engineering literature 10 years later
Costa et al. NewsMeSH: A new classifier designed to annotate health news with MeSH headings
Yildirim et al. Prediction of similarities among rheumatic diseases
Martinez et al. Facilitating biomedical systematic reviews using ranked text retrieval and classification
Widad et al. Bert for question answering applied on covid-19
Yang et al. Leveraging text analytics in patent analysis to empower business decisions–A competitive differentiation of kinase assay technology platforms by I2E text mining software
Nicholson Approaching librarianship from the data: using bibliomining for evidence‐based librarianship
Negi A Brief Survey On Text Mining, Its Techniques, And Applications
Asyrofi et al. Systematic Literature Review Langchain Proposed
Shi et al. Developing a healthcare dataset information resource (DIR) based on Semantic Web
Ibrahim et al. Analysis of Text Mining from Full-Text Articles and Abstracts by Postgraduates Students in Selected Nigeria Universities.
Sin et al. Analysing the effects of individual characteristics and self-efficacy on users' preferences for system features in relevance judgment
Dridi et al. The medical project management (MPM) system
Imambi et al. A novel feature selection method for classification of medical documents from pubmed
Musunuru litreviewer: A Python Package for Review of Literature (RoL)