BRPI0706683A2 - sistemas e métodos para adquirir, analisar e explorar dados e informação - Google Patents

sistemas e métodos para adquirir, analisar e explorar dados e informação Download PDF

Info

Publication number
BRPI0706683A2
BRPI0706683A2 BRPI0706683-0A BRPI0706683A BRPI0706683A2 BR PI0706683 A2 BRPI0706683 A2 BR PI0706683A2 BR PI0706683 A BRPI0706683 A BR PI0706683A BR PI0706683 A2 BRPI0706683 A2 BR PI0706683A2
Authority
BR
Brazil
Prior art keywords
data
tool
database
encyclopedia
search
Prior art date
Application number
BRPI0706683-0A
Other languages
English (en)
Inventor
Charles D Hartwig
Robert Marciello
Stuart Kippelman
Original Assignee
Veridex Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Veridex Llc filed Critical Veridex Llc
Publication of BRPI0706683A2 publication Critical patent/BRPI0706683A2/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

SISTEMAS E MéTODOS PARA ADQUIRIR, ANALISAR E EXPLORAR DADOS E INFORMAçãO. A presente invenção refere-se a um método de adquirir, analisar e explorar dados e/ou informação de interesse através da busca de pelo menos uma base de dados usando pelo menos um termo de busca primária para obter dados e informação que contenham a informação de interesse para obter conjunto de dados brutos; aplicar uma ferramenta de explorar dados ao conjunto de dados brutos para obter dados explorados; e aplicar uma interface de usuário aos dados explorados para obter uma visualização da informação de interesse.

Description

Relatório Descritivo da Patente de Invenção para "SISTEMAS EMÉTODOS PARA ADQUIRIR, ANALISAR E EXPLORAR DADOS EINFORMAÇÃO".
Campo da Invenção
A presente invenção refere-se a métodos de adquirir, analisar eexplorar dados e/ou informação de interesse.
Antecedentes da Invenção
Adquirir, processar e explorar dados permanece amplamente emprocedimentos manuais com entrada extensiva do ser humano. Vários as-pectos foram automatizados, mas todo o processo ainda não foi integradopara permitir que um pesquisador utilize um sistema integrado para adquirir,analisar, explorar e alcançar conclusões sobre dados e informação. As ba-ses de dados com mecanismos de busca são disponíveis tais como Google,Dialog e PubMed. Cada base de dados tem diferentes regras sobre buscar,diferente uso de """wildcard......e diferentes recursos tais como enciclopédias.
Todas as bases de dados produzem conjunto de dados brutos que devemser utilizadas via orientação humana direta ou de uma ferramenta tal comoOmniViz. As Patentes US 6070133, 6484168, 6665661, 6718336, 6772170,6898530 e 6940509. No entanto, essas ferramentas são complexas e adqui-rem um grau de entendimento de matemática e programação de computadornão disponível à pesquisa típica. Além disso, cada ferramenta analisa osdados que diferentemente requerem até mesmo maior conhecimento de ma-temática e habilidades com computador. Além do mais, cada ferramenta uti-liza conceitos comuns, tais como enciclopédia ou critério de busca, via umainterface de proprietário. Dado o valor sendo capaz de comparar e contrastarresultados de busca de várias ferramentas, é crítico que as buscas sejamfeitas usando termos de busca idênticos, enciclopédias idênticas, etc. Asinterfaces de proprietários correntemente impedem diferentes ferramentasde utilizar simultaneamente uma interface comum, dados e sinônimos. Atémesmo se essas ferramentas forem usadas em combinação, via dispositivosmanuais, a classificação resultante de dados pode necessitar de mais per-guntas do que respostas. A geração de análises dos dados explorados, aprodução de relatórios e opiniões relacionados aos dados ainda requer umesforço humano intenso. A complexidade do processo de captar dados deuma fonte tal como uma base de dados, classificar os dados para determinaro que é de interesse e analisar os dados explorados resulta em tempo perdi-do. Além disso, as etapas manuais requeridas para assegurar consistênciade busca entre as ferramentas levam à insegurança com a eficácia dos re-sultados obtidos e ineficiência em aventuras comerciais.
Sumário da Invenção
A presente invenção envolve um método de adquirir, analisar eexplorar dados e/ou informação de interesse pela busca de pelo menos umabase de dados usando pelo menos um termo de busca primária para obterdados e/ou informação que contenham a informação de interesse para obterum conjunto de dados brutos; aplicar uma ferramenta de exploração de da-dos para o conjunto de dados brutos para obter dados explorados; e aplicaruma interface de usuário aos dados explorados para obter uma visualizaçãoda informação de interesse.
A presente invenção adicionalmente envolve o uso do métodoem ou a uma máquina ou combinação de máquinas com um computadorprogramado para executar o método; um artigo com instruções para execu-tar o método; um método de fazer negócios através de conduzir o método efornecer resultados dele; um sistema para conduzir o método; e relatóriosgerados dessa maneira.
Breve Descrição dos Desenhos
A Figura 1 descreve as fases de exploração de dados.
A Figura 2 descreve o fluxo de informação de uma base de da-dos para uma interface de usuário.
A Figura 3 descreve um resultado de coleta de dados típica.
A Figura 4 descreve o resultado de exploração de dados.
A Figura 5 é uma descarga de busca avançada com ""wildcard"".
A Figura 6 é uma descarga de busca básica com "wildcard".
A Figura 7 é uma descarga de classificação/exploração básicacom "wildcard".A Figura 8 é uma descarga de ferramentas de análise de esco-lha de exploração com "wildcard".
A Figura 9 é uma descarga da etapa 1 de exploração com "wild-card" com realces tópicos.
A Figura 10 é uma descarga da etapa 1 explorando com "wild-card".
A Figura 11 é uma descarga da etapa 2 de exploração com"wildcard" com nenhuma topicalização.
A Figura 12 é uma descarga da etapa 2 de exploração com"wildcard" com topicalização.
A Figura 13 é uma descarga da etapa 3 de exploração com""wildcard"" descrevendo os documentos dentro do conjunto de dados esco-lhido.
A Figura 14 é uma descarga da etapa 3 dé exploração com""wildcard"" descrevendo um termo de busca subseqüente de um conjuntode dados.
Descrição Detalhada da Invenção
A presente invenção envolve um método de adquirir, analisar eexplorar dados e/oü informação de interesse pela busca de pelo menos umabase de dados usando pelo menos um termo de busca primária para obterdados e/ou informação que contenham a informação de interesse para obterconjunto de dados brutos; aplicar uma ferramenta de exploração de dadosao conjunto de dados brutos para obter dados de exploração; e aplicar umainterface de usuário aos dados de explorados para obter uma visualizaçãoda informação de interesse.
A presente invenção adicionalmente envolve o uso do métodoem ou a uma máquina ou combinação de máquinas com um computadorprogramado para executar o método; um artigo com instruções para execu-tar o método; um método de fazer negócios através de conduzir o método efornecer resultados dele; um sistema para conduzir o método; e relatóriosgerados dessa maneira (Figuras 13-14).
O método pode opcionalmente conter a etapa adicional de apli-car pelo menos uma ferramenta de exploração sincronizada por dados aosdados explorados. Preferivelmente, a ferramenta de exploração sincronizadapor dados agrupa os dados explorados baseada em topicalização (Figuras9-12); utiliza em qualquer modelo conhecido na técnica incluindo, sem Iimi-tação, os dispositivos K, análises Cartesianas, um modelo molecular modifi-cado, ou um modelo de mola e produz derivativos latentes de termos de pro-cura primária. Um derivativo latente é, por exemplo, o resultado de produzirdados com respeito a dores de cabeça quando os termos de busca primáriaeram aspirina e dor. A ferramenta de exploração sincronizada por dados po-de ser qualquer análise semântica latente probabilística conhecida na técni-ca tal como Penn Aspect (Hofmann, T. Probabilistic Latent Semantic Analy-sis. Proceedings of the Fifteenth Conference on Uncertainty in Artificial Intel-Iigence (UAI'99) http://www.es.brown.edu/~th/papers/Hofmann-UAI99.pdf.US20020107853; e US20060242118).
A informação de interesse pode ser encontrada em qualquer fon-te de dados conhecida na técnica, incluindo, sem limitação, propriedade inte-lectual, literatura, encadeamentos de microfileira, dados do paciente, produ-ção de experimentos do proprietário, dados de instrumentação, dados demercado, dados de censo. A base de dados pode ser uma base de dadospublicamente disponível ou uma base de dados interna. Exemplos de bases• de dados incluindo, sem limitação, uma base de dados do Escritório de Pa-tente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
A ferramenta de exploração de dados pode ser qualquer umaconhecida na técnica, incluindo, sem limitação, um processador de lingua-gem natural e uma matriz de coleta SQL, de busca simples ou de co-ocorrência. O processador de linguagem natural pode ser, por exemplo, umConjunto OmniViz ou um Conjunto de Ferramenta MIT. A interface de usuá-rio pode ser qualquer uma conhecida na técnica, incluindo, sem limitação,um código de computador compreendendo sub-rotinas. O processo é descri-to nas Figuras 1-6 e a visualização é descrita nas Figuras 7 e 8.
As sub-rotinas do método fornecem pelo menos consolidar umadas ferramentas de exploração de múltiplos dados sobre uma tela de com-putador única, deixando um usuário selecionar que ferramenta(s) usar paracada busca; consolidar fontes de múltiplos dados em uma tela de computa-dor única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca; consolidar todas as enciclopédias sobre a mesma tela, deixan-do o usuário selecionar que enciclopédia usar para cada busca; manter umahistória eletrônica de cada busca e explorando a seção executada, permitin-do que os usuários revejam suas próprias buscas históricas; permitir a revi-são de outras buscas do usuário; e manter um Iog de atividades que pode,ele próprio, ser explorado através de determinar áreas comuns de atividade.As enciclopédias comuns podem ser mantidas para cada categoria de termo;executando todas as traduções eletrônicas necessárias para converter cadaenciclopédia em uma forma adequada para cada ferramenta tal como pelamanutenção de uma enciclopédia comum para categoria de termo permite ahabilidade para avaliar os sinônimos pela categoria que pode ser usada comqualquer ferramenta. A categoria pode ser qualquer uma conhecida na téc-nica, incluindo, sem limitação, nome de companhia, estados de doença egenes humanos. A função de translação permite que uma enciclopédia co-mum (por categoria) seja usada através de todas as ferramentas com ne-nhuma entrada do usuário além de selecionar a(s) combinação(ões) de fer-ramenta e enciclopédia.
A presente invenção fornece métodos e sistemas para adquirir,explorar e analisar dados via um ser humano - interface de computador quealavanca a perícia humana em um método eficiente, de custo útil que forne-ce vantagens não disponíveis em sistemas correntes. Um computador, nãoimporta quão sofisticado, não pode atualmente ler sua mente e te dizer oque você está pensando. 5~lnversamente, muitos poucos humanos podemefetivamente traduzir seus pensamentos em palavras/frases/conceitos debusca com a exatidão e integralidade que um computador requer. A presen-te invenção fornece o nexo entre essas duas áreas de perícia.A presente invenção fornece as seguintes vantagens:
• Presenteia o usuário com uma escolha de ferramentas deanálise de dados comercialmente disponível e/ou internamente desenvolvi-das.
Presenteia o usuário com uma escolha de fontes de dadospara explorar, tal como Patentes, Produção de Experimentos de Proprietário,Dados de Instrumentos de OCD1 etc.
• Uma vez que todas as ferramentas de exploração de dadosse baseiam fortemente no uso de sinônimos de termo, a presente invençãooferece uma interface simples para manter enciclopédias de termo entre osusuários. A presente invenção modifica a enciclopédia comum de modo queela trabalhe com qualquer das aplicações/ferramentas no sistema ""wild-card"". Por conseguinte, cada enciclopédia é alavancada para uso comqualquer ferramenta de exploração - elas são sincronizadas.
· Permite que o usuário use qualquer ou todas essas ferra-mentas, em qualquer combinação, com qualquer combinação de enciclopé-dias, em quaisquer desses dados. Isso oferece ao usuário a habilidade pararapidamente comparar/contrastar resultados de diferentes ferramentas, eidentificar tendências e diferenças. Porque os resultados de busca vêm deferramentas que estão usando uma combinação de busca/enciclopédia co-mum, sincronizada, ela aperfeiçoa extremamente a confiança que o pesqui-sador tem nesses resultados combinados.
• Oferece ao usuário a habilidade para reter buscas anteriores,procura por buscas anteriores executadas por outros usuários (pelo tópico),etc.
• Rastreia mudanças em resultados de busca, permitindo aousuário ajustar "observar processos" em termos de busca. Por exemplo, se ousuário ajusta uma busca para a palavra "lúpus", o usuário será informado(via eMail ou outro dispositivo eletrônico) sempre que um documento comessa palavra aparece em nossa base de dados. Os dados podem então serreprocessados e reavaliados.
• A habilidade para executar negócios inteligentes.<table>table see original document page 8</column></row><table>

Claims (102)

1. Método de adquirir, analisar e explorar dados e/ou informaçãode interesse compreendendo as etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter dados e/ou informação que contenhaa informação de interesse para obter conjunto de dados brutos;b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados explorados; ec. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
2. Método de acordo com a reivindicação 1, compreendendo op-cionalmente aplicar pelo menos uma ferramenta de exploração sincronizadapor dados aos dados explorados obtidos na etapa b.
3. Método de acordo com a reivindicação 1, em que a informa-ção de interesse compreende pelo menos uma de propriedade intelectual,encadeamentos de microfileira, dados do paciente, produção de experimen-tos do proprietário, dados de instrumentação, dados de mercado, dados decenso.
4. Método de acordo com a reivindicação 1, em que a base dedados é uma base de dados disponível publicamente ou uma base de dadosinterna.
5. Método de acordo com a reivindicação 4, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
6. Método de acordo com a reivindicação 1, em que a ferramen-ta de exploração de dados é selecionada de um conjunto compreendendoum processador de linguagem natural e uma matriz de coleta SQL, de buscasimples ou de co-ocorrência.
7. Método de acordo com a reivindicação 4, em que o processa-dor de linguagem natural compreende um Conjunto OmniViz ou um Conjuntode Ferramenta MIT.
8. Método de acordo com a reivindicação 2, em que a ferramen-ta de exploração sincronizada por dados agrupa a base de dados exploradana topicalidade.
9. Método de acordo com a reivindicação 8, em que a ferramen-ta de exploração sincronizada por dados utiliza pelo menos um dos dispositi-vos K1 análises Cartesianas, um modelo molecular modificado, ou um mode-lo de mola.
10. Método de acordo com a reivindicação 8, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-dos latentes de termos de busca primária.
11. Método de acordo com a reivindicação 8, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica Iaten-te probabilística.
12. Método de acordo com a reivindicação 1, em que a interfacede usuário é um código dé computador compreendendo sub-rotinas.
13. Método de acordo com a reivindicação 12, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de dados múltiplos so-bre uma tela de computador única, deixando um usuário selecionar que fer-ramenta) usar para cada busca;b. consolidar buscas de dados múltiplos em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser expio-rado para determinar áreas comuns de atividade.
14. Método de acordo com a reivindicação 13, em c. compreen-de adicionalmente manter uma enciclopédia para cada categoria de termo;executar todas as traduções eletrônicas necessárias para converter cadaenciclopédia em uma forma adequada para cada ferramenta.
15. Método de acordo com a reivindicação 14, em que a manu-tenção de uma enciclopédia comum para cada categoria de termo permite ahabilidade de avaliar sinônimos por categoria que pode ser usada com qual-quer ferramenta.
16. Método de acordo com a reivindicação 15, em que a catego-ria é selecionada de nome de companhia, estados de doença e genes hu-manos.
17. Método de acordo com a reivindicação 16, em que a funçãode translação permite que uma enciclopédia comum (por categoria) seja u-sada por todas as ferramentas com nenhuma entrada do usuário além deselecionar a(s) combinação(ões) de ferramenta e enciclopédia.
18. Máquina compreendendo um computador programado paraexecutar um método para adquirir, analisar e explorar dados e/ou informaçãode interesse em que o método compreende as etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter dados e/ou informação que conte-nham a informação de interesse para obter um conjunto de dados brutos;b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados explorados; ec. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
19. Método como definido na reivindicação 18, compreendendoopcionalmente aplicar opcionalmente pelo menos uma ferramenta de explo-ração sincronizada por dados aos dados explorados obtidos na etapa b.
20. Método como definido na reivindicação 18, em que a infor-mação de interesse compreende pelo menos uma de propriedade intelectu-al, literatura, encadeamentos de microfileira, dados do paciente, produção deexperimentos do proprietário, dados de instrumentação, dados de mercado,dados de censo.
21. Método como definido na reivindicação 18, em que a basede dados está em uma base de dados disponível publicamente ou uma basede dados interna.
22. Método de acordo com a reivindicação 21, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
23. Método como definido na reivindicação 18, em que a ferra-menta de exploração de dados é selecionada de um conjunto compreenden-do um processador de linguagem natural e uma matriz de coleta SQL, debusca simples ou de co-ocorrência.
24. Método de acordo com a reivindicação 23, em que o proces-sador de linguagem natural compreende um Conjunto OmniViz ou um Con-junto de Ferramenta MIT.
25. Método de acordo com a reivindicação 19, em que a ferra-menta de exploração sincronizada por dados agrupa os dados exploradoscom base em topicalidade.
26. Método como definido na reivindicação 25, em que a ferra-menta de exploração sincronizada por dados utiliza pelo menos um dos dis-positivos K, análises Cartesianas, um modelo molecular modificado, ou ummodelo de mola.
27. Método de acordo com a reivindicação 25, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-dos latentes de termos de busca primária.
28. Método de acordo com a reivindicação 25, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica laten-te probabilística.
29. Método como definido na reivindicação 18, em que a interfa-ce de usuário é um código de computador compreendendo sub-rotinas.
30. Método de acordo com a reivindicação 29, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de múltiplos dados, dei-xando um usuário selecionar que ferramenta(s) usar para cada busca;b. consolidar fontes de múltiplos dados em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser explo-rado para determinar áreas comuns de atividade.
31. Método de acordo com a reivindicação 30, em que c. adicio-nalmente compreende manter uma enciclopédia comum para cada categoriade termo; executar todas as traduções eletrônicas necessárias para conver-ter cada enciclopédia em uma forma adequada para cada ferramenta.
32. Método de acordo com a reivindicação 31, em que manteruma enciclopédia comum para cada categoria de termos permite avaliar si-nônimos por categoria que podem ser usados com qualquer ferramenta.
33. Método de acordo com a reivindicação 32, em que a catego-ria é selecionada de nome de companhia, estados de doença e genes hu-manos.
34. Método de acordo com a reivindicação 33, em que a funçãode translação permite que uma enciclopédia comum (por categoria) seja u-sada através de todas as ferramentas com nenhuma entrada do usuário a-lém de selecionar a(s) combinação(ões) de enciclopédia.
35. Combinação de máquinas compreendendo pelo menos umcomputador programado para executar um método para adquirir, analisar eexplorar dados e/ou informação de interesse em que o método compreendeas etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter conjunto de dados brutos.b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados explorados; ec. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
36.Método de acordo com a reivindicação 35, compreendendoopcionalmente aplicar pelo menos uma ferramenta de exploração sincroni-zada por dados aos dados explorados obtidos na etapa b.
37. Método de acordo com a reivindicação 35, em que a infor-mação de interesse compreende pelo menos uma de propriedade intelectu-al, literatura, encadeamentos de microfileira, dados do paciente, produção deexperimentos do proprietário, dados de instrumentação, dados de mercado,dados de censo.
38. Método de acordo com a reivindicação 35, em que a base dedados está em uma base de dados disponível publicamente ou em uma ba-se de dados interna.
39. Método de acordo com a reivindicação 38, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
40. Método de acordo com a reivindicação 35, em que a ferra-menta de exploração de dados é selecionada de um conjunto que compre-ende um processador de linguagem natural e uma matriz de coleta SQL, debusca simples ou de co-ocorrência.
41. Método de acordo com a reivindicação 40, em que o proces-sador de linguagem natural compreende um Conjunto OmniViz ou um Con-junto de Ferramenta MIT.
42. Método de acordo com a reivindicação 36, em que a ferra-menta de exploração sincronizada por dados agrupa os dados exploradoscom base em topicalidade.
43. Método de acordo com a reivindicação 36, em que a ferra-menta de exploração sincronizada por dados utiliza pelo menos um dos dis-positivos K, análises Cartesianas, um modelo molecular modificado, ou ummodelo de mola.
44. Método de acordo com a reivindicação 43, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-dos latentes de termos de busca primária.
45. Método de acordo com a reivindicação 43, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica laten-te probabilística.
46. Método de acordo com a reivindicação 36, em que a interfa-ce de usuário é um código de computador compreendendo sub-rotinas.
47. Método de acordo com a reivindicação 46, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de múltiplos dados so-bre uma tela de computador única, deixando um usuário selecionar que fer-ramenta(s) usar para cada busca;b. consolidar fontes de múltiplos dados em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser explo-rado para determinar áreas comuns de atividade.Método de acordo com a reivindicação 46, em que c. adicio-nalmente compreende manter uma enciclopédia comum para cada categoriade termo; executar todas as traduções eletrônicas necessárias para conver-ter cada enciclopédia em uma forma adequada para cada ferramenta.
48. Método de acordo com a reivindicação 47, em que manteruma enciclopédia comum para cada categoria de termo permite a habilidadepara avaliar sinônimos por categoria que pode ser usada com qualquer fer-ramenta.
49. Método de acordo com a reivindicação 48, em que a catego-ria é selecionada de nome de companhia, estados de doença e genes hu-manos.
50. Método de acordo com a reivindicação 49, em que a funçãode translação permite que uma enciclopédia (por categoria) seja usada atra-vés de todas as ferramentas com nenhuma entrada do usuário além de se-lecionar a(s) combinação(ões) de ferramenta e enciclopédia.
51. Artigo compreendendo instruções para conduzir um métodode adquirir, analisar e explorar dados e/ou informação de interesse em que ométodo compreende as etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter dados e/ou informação que contenhaa informação de interesse para obter um conjunto de dados brutos;b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados explorados; ec. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
52. Método como definido na reivindicação 51, compreendendoopcionalmente aplicar pelo menos uma ferramenta de exploração sincroni-zada por dados aos dados explorados obtidos na etapa b.
53. Método como definido na reivindicação 51, em que a infor-mação de interesse compreende pelo menos uma de propriedade intelectu-al, literatura, encadeamentos de microfileira, dados do paciente, produção deexperimentos do proprietário, dados de instrumentação, dados de mercado,dados de censo.
54. Método como definido na reivindicação 51, em que a basede dados está em uma base de dados disponível publicamente.
55. Método de acordo com a reivindicação 54, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
56. Método como definido na reivindicação 51, em que a ferra-menta de exploração de dados é selecionada de um conjunto compreenden-do um processador de linguagem natural e uma matriz de coleta SQL, debusca simples ou de co-ocorrência.
57. Método de acordo com a reivindicação 54, em que o proces-sador de linguagem natural compreende um Conjunto OmniViz ou um Con-junto de Ferramenta MIT.
58. Método de acordo com a reivindicação 52, em que a ferra-menta de exploração sincronizada por dados agrupa os dados exploradoscom base em topicalidade.
59. Método de acordo com a reivindicação 58, em que a ferra-menta de exploração sincronizada por dados utiliza pelo menos um dos dis-positivos K, análises Cartesianas, um modelo molecular modificado, ou ummodelo de mola.
60. Método de acordo com a reivindicação 58, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-tivos latentes de termos de busca primária.
61. Método de acordo com a reivindicação 58, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica laten-te probabilística.
62. Método como definido na reivindicação 51, em que a interfa-ce de usuário é um código de computador compreendendo sub-rotinas.
63. Método de acordo com a reivindicação 62, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de dados múltiplos so-bre uma tela de computador única, deixando um usuário selecionar que fer-ramenta(s) usar para cada busca;b. consolidar buscas de dados múltiplos em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser explo-rado para determinar áreas comuns de atividade.
64. Método de acordo com a reivindicação 63, em que c. adicio-nalmente compreende manter uma enciclopédia comum para cada categoriade termo; executar todas as traduções eletrônicas necessárias para conver-ter cada enciclopédia em uma forma adequada para cada ferramenta.
65. Método de acordo com a reivindicação 64, em que manteruma enciclopédia comum para cada categoria de termo permite a habilidadepara avaliar os sinônimos pela categoria que pode ser usada com qualquerferramenta.
66. Método de acordo com a reivindicação 65, em que a catego-ria é selecionada de nome de companhia, estados de doença e genes hu-manos.
67. Método de acordo com a reivindicação 66, em que a funçãode transação permite que uma enciclopédia comum (por categoria) seja u-sada através de todas as ferramentas com nenhuma entrada do usuário a-lém de selecionar a(s) combinação(ões) de ferramenta e enciclopédia.
68. Método de fazer negócios compreendendo conduzir um métodode adquirir, analisar e explorar dados e/ou informação de interesse em que ométodo de adquirir, analisar e explorar dados e/ou informação de interessecompreende as etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter dados e/ou informação que contenhaa informação de interesse para obter conjunto de dados brutos; b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados exploradosc. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
69. Método de acordo com a reivindicação 68, compreendendoopcionalmente aplicar pelo menos uma ferramenta de exploração sincroni-zada por dados aos dados explorados obtidos na etapa b.
70. Método de acordo com a reivindicação 68, em que a infor-mação de interesse compreende pelo menos uma de propriedade intelectu-al, encadeamentos de microfileira, dados do paciente, produção de experi-mentos do proprietário, dados de instrumentação, dados de mercado, dadosde censo.
71. Método de acordo com a reivindicação 68, em que a base dedados é uma base de dados disponível publicamente ou uma base de dadosinterna.
72. Método de acordo com a reivindicação 71, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
73. Método de acordo com a reivindicação 68, em que a ferra-menta de exploração de dados é selecionada de um conjunto compreenden-do um processador de linguagem natural e uma matriz de coleta SQL, debusca simples ou de co-ocorrência.
74. Método de acordo com a reivindicação 73, em que o proces-sador de linguagem natural compreende um Conjunto OmniViz ou um Con-junto de Ferramenta MIT.
75. Método de acordo com a reivindicação 69, em que a ferra-menta de exploração sincronizada por dados agrupa a base de dados explo-rada na topicalidade.
76. Método de acordo com a reivindicação 75, em que a ferra-menta de exploração sincronizada por dados utiliza pelo menos um dos dis-positivos K, análises Cartesianas, um modelo molecular modificado, ou ummodelo de mola.
77. Método de acordo com a reivindicação 75, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-dos latentes de termos de busca primária.
78. Método de acordo com a reivindicação 75, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica laten-te probabilística.
79. Método de acordo com a reivindicação 68, em que a interfa-ce de usuário é um código de computador compreendendo sub-rotinas.
80. Método de acordo com a reivindicação 79, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de dados múltiplos so-bre uma tela de computador única, deixando um usuário selecionar que fer-ramenta(s) usar para cada busca;b. consolidar buscas de dados múltiplos em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser explo-rado para determinar áreas comuns de atividade.
81. Método de acordo com a reivindicação 80, em que c. com-preende adicionalmente manter uma enciclopédia para cada categoria determo; executar todas as traduções eletrônicas necessárias para convertercada enciclopédia em uma forma adequada para cada ferramenta.
82. Método de acordo com a reivindicação 81, em que a manu-tenção de uma enciclopédia comum para cada categoria de termo permite ahabilidade de avaliar sinônimos por categoria que pode ser usada com qual-quer ferramenta.
83. Método de acordo com a reivindicação 82, em que a catego-ria é selecionada de nome de companhia, estados de doença e genes hu-manos.
84. Método de acordo com a reivindicação 83, em que a funçãode translação permite que uma enciclopédia comum (por categoria) seja u-sada por todas as ferramentas com nenhuma entrada do usuário além deselecionar a(s) combinação(ões) de ferramenta e enciclopédia.
85. Sistema para executar um método para adquirir, analisar eexplorar dados e/ou informação de interesse em que o método compreendeas etapas de:a. buscar pelo menos uma base de dados usando pelo menosum termo de busca primária para obter dados e/ou informação que conte-nham a informação de interesse para obter um conjunto de dados brutos;b. aplicar uma ferramenta de exploração de dados ao conjuntode dados brutos para obter dados explorados; ec. aplicar uma interface de usuário aos dados explorados paraobter uma visualização da informação de interesse.
86. Método como definido na reivindicação 85, compreendendoopcionalmente aplicar opcionalmente pelo menos uma ferramenta de explo-ração sincronizada por dados aos dados explorados obtidos na etapa b.
87. Método como definido na reivindicação 85, em que a infor-mação de interesse compreende pelo menos uma de propriedade intelectu-al, literatura, encadeamentos de microfileira, dados do paciente, produção deexperimentos do proprietário, dados de instrumentação, dados de mercado,dados de censo.
88. Método como definido na reivindicação 85, em que a basede dados está em uma base de dados disponível publicamente ou uma basede dados interna.
89. Método de acordo com a reivindicação 88, em que a base dedados é selecionada de pelo menos uma base de dados do Escritório dePatente de Marcas Norte Americano, uma base de dados da OrganizaçãoMundial de Propriedade Intelectual, Micropatent™, uma base de dados doEscritório de Patente Europeu™, Medline™, PubMed™, Google™, sistemasinternos, EDGAR, livro de FDA Orange, Crisp, Lexis/Nexis™ e Westlaw™.
90. Método como definido na reivindicação 85, em que a ferra-menta de exploração de dados é selecionada de um conjunto compreenden-do um processador de linguagem natural e uma matriz de coleta SQL, debusca simples ou de co-ocorrência.
91. Método de acordo com a reivindicação 90, em que o proces-sador de linguagem natural compreende um Conjunto OmniViz ou um Con-junto de Ferramenta MIT.
92. Método de acordo com a reivindicação 86, em que a ferra-menta de exploração sincronizada por dados agrupa os dados exploradoscom base em topicalidade.
93. Método de acordo com a reivindicação 92, em que a ferra-menta de exploração sincronizada por dados utiliza pelo menos um dos dis-positivos K, análises Cartesianas, um modelo molecular modificado, ou ummodelo de mola.
94. Método de acordo com a reivindicação 92, em que a ferra-menta de exploração sincronizada por dados adicionalmente produz deriva-dos latentes de termos de busca primária.
95. Método de acordo com a reivindicação 92, em que a ferra-menta de exploração sincronizada por dados é uma análise semântica laten-te probabilística.
96. Método como definido na reivindicação 85, em que a interfa-ce de usuário é um código de computador compreendendo sub-rotinas.
97. Método de acordo com a reivindicação 96, em que as sub-rotinas fornecem pelo menos um de:a. consolidar ferramentas de exploração de múltiplos dados, dei-xando um usuário selecionar que ferramenta(s) usar para cada busca;b. consolidar fontes de múltiplos dados em uma tela de compu-tador única, deixando o usuário selecionar que fonte(s) de dados usar paracada busca;c. consolidar todas as enciclopédias sobre a mesma tela, dei-xando o usuário selecionar que enciclopédia usar para cada busca;d. manter uma história eletrônica de cada busca e seção de ex-ploração executada, permitindo que os usuários revejam suas próprias bus-cas históricas;e. permitir a revisão de outras buscas do usuário; ef. manter um Iog de atividades que pode, ele próprio, ser explo-rado para determinar áreas comuns de atividade.
98. Método de acordo com a reivindicação 97, em que c. adicio-nalmente compreende manter uma enciclopédia comum para cada categoriade termo; executar todas as traduções eletrônicas necessárias para conver-ter cada enciclopédia em uma forma adequada para cada ferramenta.
99. Método de acordo com a reivindicação 98, em que manteruma enciclopédia comum para cada categoria de termos permite avaliar si-nônimos por categoria que podem ser usados com qualquer ferramenta.
100. Método de acordo com a reivindicação 99, em que a cate-goria é selecionada de nome de companhia, estados de doença e geneshumanos.
101. Método de acordo com a reivindicação 99, em que a funçãode translação permite que uma enciclopédia comum (por categoria) seja u-sada através de todas as ferramentas com nenhuma entrada do usuário a-lém de selecionar a(s) combinação(ões) de enciclopédia.
102. Relatório gerado por qualquer uma das reivindicações de 1-101.
BRPI0706683-0A 2006-01-19 2007-01-19 sistemas e métodos para adquirir, analisar e explorar dados e informação BRPI0706683A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US76013806P 2006-01-19 2006-01-19
US60/760,138 2006-01-19
PCT/US2007/060750 WO2007084974A2 (en) 2006-01-19 2007-01-19 Systems and methods for acquiring analyzing mining data and information

Publications (1)

Publication Number Publication Date
BRPI0706683A2 true BRPI0706683A2 (pt) 2011-04-05

Family

ID=38288400

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0706683-0A BRPI0706683A2 (pt) 2006-01-19 2007-01-19 sistemas e métodos para adquirir, analisar e explorar dados e informação

Country Status (8)

Country Link
US (1) US20070168338A1 (pt)
EP (1) EP1999648A2 (pt)
JP (1) JP2009525514A (pt)
CN (1) CN101529418A (pt)
BR (1) BRPI0706683A2 (pt)
CA (1) CA2637745A1 (pt)
MX (1) MX2008009411A (pt)
WO (1) WO2007084974A2 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600966B2 (en) 2007-09-20 2013-12-03 Hal Kravcik Internet data mining method and system
CN102419975B (zh) * 2010-09-27 2015-11-25 深圳市腾讯计算机***有限公司 一种基于语音识别的数据挖掘方法和***
CN102750282B (zh) * 2011-04-19 2014-10-22 北京百度网讯科技有限公司 同义词模板的挖掘方法和装置以及同义词挖掘方法和装置
CN102254003A (zh) * 2011-07-15 2011-11-23 江苏大学 一种图书推荐方法
CN103999081A (zh) 2011-12-12 2014-08-20 国际商业机器公司 生成用于信息领域的自然语言处理模型
US9323736B2 (en) * 2012-10-05 2016-04-26 Successfactors, Inc. Natural language metric condition alerts generation
CN103473369A (zh) * 2013-09-27 2013-12-25 清华大学 基于语义的信息采集方法及***
CN103544255B (zh) * 2013-10-15 2017-01-11 常州大学 基于文本语义相关的网络舆情信息分析方法
CN106228000A (zh) * 2016-07-18 2016-12-14 北京千安哲信息技术有限公司 过度医疗检测***及方法
CN106126758B (zh) * 2016-08-30 2021-01-05 西安航空学院 用于信息处理和信息评估的云***

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6484168B1 (en) * 1996-09-13 2002-11-19 Battelle Memorial Institute System for information discovery
US6070133A (en) * 1997-07-21 2000-05-30 Battelle Memorial Institute Information retrieval system utilizing wavelet transform
US6006223A (en) * 1997-08-12 1999-12-21 International Business Machines Corporation Mapping words, phrases using sequential-pattern to find user specific trends in a text database
US6115708A (en) * 1998-03-04 2000-09-05 Microsoft Corporation Method for refining the initial conditions for clustering with applications to small and large database clustering
US6898530B1 (en) * 1999-09-30 2005-05-24 Battelle Memorial Institute Method and apparatus for extracting attributes from sequence strings and biopolymer material
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6718336B1 (en) * 2000-09-29 2004-04-06 Battelle Memorial Institute Data import system for data analysis system
US6665661B1 (en) * 2000-09-29 2003-12-16 Battelle Memorial Institute System and method for use in text analysis of documents and records
US6940509B1 (en) * 2000-09-29 2005-09-06 Battelle Memorial Institute Systems and methods for improving concept landscape visualizations as a data analysis tool
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6865573B1 (en) * 2001-07-27 2005-03-08 Oracle International Corporation Data mining application programming interface
US7451137B2 (en) * 2004-07-09 2008-11-11 Microsoft Corporation Using a rowset as a query parameter
US7574433B2 (en) * 2004-10-08 2009-08-11 Paterra, Inc. Classification-expanded indexing and retrieval of classified documents

Also Published As

Publication number Publication date
CN101529418A (zh) 2009-09-09
MX2008009411A (es) 2008-10-01
EP1999648A2 (en) 2008-12-10
WO2007084974A3 (en) 2009-04-09
CA2637745A1 (en) 2007-07-26
US20070168338A1 (en) 2007-07-19
JP2009525514A (ja) 2009-07-09
WO2007084974A2 (en) 2007-07-26

Similar Documents

Publication Publication Date Title
Esteva et al. COVID-19 information retrieval with deep-learning based semantic search, question answering, and abstractive summarization
BRPI0706683A2 (pt) sistemas e métodos para adquirir, analisar e explorar dados e informação
Zamir et al. Grouper: a dynamic clustering interface to Web search results
Demner-Fushman et al. Answer extraction, semantic clustering, and extractive summarization for clinical question answering
Haig et al. BEME Guide No 3: Systematic searching for evidence in medical education--Part 1: Sources of information
Díaz-Galiano et al. Query expansion with a medical ontology to improve a multimodal information retrieval system
Hienert et al. Digital library research in action–supporting information retrieval in sowiport
US7536368B2 (en) Method for problem formulation and for obtaining solutions from a database
WO2005060684A2 (en) Method and system for obtaining solutions to contradictional problems from a semantically indexed database
Khoo et al. Augmenting Dublin core digital library metadata with Dewey decimal classification
Segev et al. Maintaining materialized views in distributed databases
Wang et al. Automated MeSH term suggestion for effective query formulation in systematic reviews literature search
Angrosh et al. Contextual information retrieval in research articles: Semantic publishing tools for the research community
Gargiulo et al. A big data architecture for knowledge discovery in PubMed articles
Yu et al. Phrase based topic modeling for semantic information processing in biomedicine
Neuhaus et al. Google Scholar goes to school: The presence of Google Scholar on college and university web sites
Billman et al. Medical sensemaking with entity workspace
Ding et al. Incorporating the results of co-word analyses to increase search variety for information retrieval
Choi A complete assessment of tagging quality: A consolidated methodology
Kafando et al. ITEXT-BIO: Intelligent term EXTraction for BIOmedical analysis
Lin et al. Semantic clustering of answers to clinical questions
Palotti et al. User intent behind medical queries: An evaluation of entity mapping approaches with metamap and freebase
Chen et al. Testing a cancer meta spider
Li et al. Automatically building templates for entity summary construction
Kumar et al. Medical query expansion using UMLS

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal acc. article 33 of ipl - extension of time limit for request of examination expired