RU2013156494A - Разрешение семантической неоднозначности при помощи статистического анализа - Google Patents

Разрешение семантической неоднозначности при помощи статистического анализа Download PDF

Info

Publication number
RU2013156494A
RU2013156494A RU2013156494/08A RU2013156494A RU2013156494A RU 2013156494 A RU2013156494 A RU 2013156494A RU 2013156494/08 A RU2013156494/08 A RU 2013156494/08A RU 2013156494 A RU2013156494 A RU 2013156494A RU 2013156494 A RU2013156494 A RU 2013156494A
Authority
RU
Russia
Prior art keywords
word
concept
registry
values
semantic
Prior art date
Application number
RU2013156494/08A
Other languages
English (en)
Other versions
RU2592395C2 (ru
Inventor
Константин Алексеевич Зуев
Дарья Николаевна Богданова
Original Assignee
Общество с ограниченной ответственностью "Аби ИнфоПоиск"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби ИнфоПоиск" filed Critical Общество с ограниченной ответственностью "Аби ИнфоПоиск"
Priority to RU2013156494/08A priority Critical patent/RU2592395C2/ru
Priority to US14/509,355 priority patent/US9740682B2/en
Publication of RU2013156494A publication Critical patent/RU2013156494A/ru
Application granted granted Critical
Publication of RU2592395C2 publication Critical patent/RU2592395C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

1. Способ, содержащий:получение, с помощью вычислительного устройства, текста, включающего слово;сравнение, с помощью процессора вычислительного устройства, слова в тексте со словами из реестра значений, при этом реестр значений содержит, по меньшей мере, одно слово реестра и по меньшей мере одно понятие, соответствующее по меньшей мере одному слову из реестра;при совпадении слова со словом из реестра значений выявление понятия для слова путем сравнения каждого понятия, связанного со словом из реестра, с этим словом;при выявлении правильного понятия для слова назначение этого понятия для слова; ипри невыявлении правильного понятия для слова, добавление нового понятия в реестр значений для слова из реестра.2. Способ по п.1, дополнительно содержащий выполнение статистического анализа для выявления понятия для слова.3. Способ по п.1, дополнительно содержащий при отсутствии для слова совпадения со словом в реестре значений добавление нового слова и соответствующего нового понятия в реестр значений на основе этого слова.4. Способ по п.1, в котором реестр значений дополнительно содержит семантическую иерархию с отношениями «родительский объект-дочерний объект» между семантическими классами, и причем каждый семантический класс содержит глубинную модель, определяющую семантическое отношение между родительским семантическим классом и дочерним семантическим классом.5. Способ по п.4, в котором дочерний семантический класс наследует и уточняет глубинную модель своего непосредственного родительского семантического класса.6. Способ по п.1, в котором добавление в реестр значений нового понятия, соответствующего слову в

Claims (21)

1. Способ, содержащий:
получение, с помощью вычислительного устройства, текста, включающего слово;
сравнение, с помощью процессора вычислительного устройства, слова в тексте со словами из реестра значений, при этом реестр значений содержит, по меньшей мере, одно слово реестра и по меньшей мере одно понятие, соответствующее по меньшей мере одному слову из реестра;
при совпадении слова со словом из реестра значений выявление понятия для слова путем сравнения каждого понятия, связанного со словом из реестра, с этим словом;
при выявлении правильного понятия для слова назначение этого понятия для слова; и
при невыявлении правильного понятия для слова, добавление нового понятия в реестр значений для слова из реестра.
2. Способ по п.1, дополнительно содержащий выполнение статистического анализа для выявления понятия для слова.
3. Способ по п.1, дополнительно содержащий при отсутствии для слова совпадения со словом в реестре значений добавление нового слова и соответствующего нового понятия в реестр значений на основе этого слова.
4. Способ по п.1, в котором реестр значений дополнительно содержит семантическую иерархию с отношениями «родительский объект-дочерний объект» между семантическими классами, и причем каждый семантический класс содержит глубинную модель, определяющую семантическое отношение между родительским семантическим классом и дочерним семантическим классом.
5. Способ по п.4, в котором дочерний семантический класс наследует и уточняет глубинную модель своего непосредственного родительского семантического класса.
6. Способ по п.1, в котором добавление в реестр значений нового понятия, соответствующего слову в реестре значений, включает статистический анализ каждого уровня семантической иерархии, связанного с реестром значений, начиная от корня иерархии, для определения вероятности наличия понятия для этого слова, и причем новое понятие содержит наиболее вероятное понятие.
7. Способ по п.6, в котором вероятность наличия понятия для слова основана на корпусах, соответсвуших тексту.
8. Система, содержащая:
один или более процессоров данных; и
одно или более устройств хранения, хранящих инструкции, которые, будучи исполненными одним или более процессорами данных, воздействуют на один или более процессоров данных для выполнения операций, содержащих:
получение, с помощью вычислительного устройства, текста, включающего слово;
сравнение, с помощью процессора вычислительного устройства, слова в тексте со словами из реестра значений, при этом реестр значений содержит по меньшей мере одно слово реестра и по меньшей мере одно понятие, соответствующее по меньшей мере одному слову из реестра;
при совпадении слова со словом из реестра значений выявление понятия для слова путем сравнения каждого понятия, связанного со словом из реестра, с этим словом;
при выявлении правильного понятия для слова назначение этого понятия для слова; и
при невыявлении правильного понятия для слова добавление нового понятия в реестр значений для слова из реестра.
9. Система по п.8, в которой операции дополнительно содержат выполнение статистического анализа для выявления понятия для слова.
10. Система по п.8, в которой операции дополнительно содержат при отсутствии для слова совпадения со словом в реестре значений добавление нового слова и соответствующего нового понятия в систему значений на основе этого слова.
11. Система по п.8, в которой реестр значений дополнительно содержит семантическую иерархию с отношениями «родительский объект-дочерний объект» между семантическими классами, и причем каждый семантический класс содержит глубинную модель, определяющую семантическое отношение между родительским семантическим классом и дочерним семантическим классом.
12. Система по п.11, в которой дочерний семантический класс наследует и уточняет глубинную модель своего непосредственного родительского семантического класса.
13. Система по п.8, в которой добавление в реестр значений нового понятия, соответствующего слову в реестре значений, включает статистический анализ каждого уровня семантической иерархии, связанного с реестром значений, начиная от корня иерархии, для определения вероятности наличия понятия для этого слова, и причем новое понятие содержит наиболее вероятное понятие.
14. Система по п.13, в которой вероятность наличия понятия для слова основана на корпусах, соответсвущих тексту.
15. Машиночитаемый носитель данных, имеющий хранящиеся на нем машинные инструкции, причем процессор исполняет инструкции для выполнения операций, содержащих:
получение, с помощью вычислительного устройства, текста, включающего слово;
сравнение, с помощью процессора вычислительного устройства, слова в тексте со словами из реестра значений, при этом реестр значений содержит по меньшей мере одно слово реестра и по меньшей мере одно понятие, соответствующее по меньшей мере одному слову из реестра;
при совпадении слова со словом из реестра значений выявление понятия для слова путем сравнения каждого понятия, связанного со словом из реестра, с этим словом;
при выявлении правильного понятия для слова назначение этого понятия для слова; и
при невыявлении правильного понятия для слова добавление нового понятия в реестр значений для слова из реестра.
16. Машиночитаемый носитель данных по п.15, дополнительно содержащий выполнение статистического анализа для выявления понятия для слова.
17. Машиночитаемый носитель данных по п.15, дополнительно содержащий при отсутствии для слова совпадения со словом в реестре значений добавление нового слова и соответствующего нового понятия в реестр значений на основе этого слова.
18. Машиночитаемый носитель данных по п.15, в котором реестр значений дополнительно содержит семантическую иерархию с отношениями «родительский объект-дочерний объект» между семантическими классами, и причем каждый семантический класс содержит глубинную модель, определяющую семантическое отношение между родительским семантическим классом и дочерним семантическим классом.
19. Машиночитаемый носитель данных по п.18, в котором дочерний семантический класс наследует и уточняет глубинную модель своего непосредственного родительского семантического класса.
20. Машиночитаемый носитель данных по п.15, в котором добавление в реестр значений нового понятия, соответствующего слову в реестре значений, включает статистический анализ каждого уровня семантической иерархии, связанного с реестром значений, начиная от корня иерархии, для определения вероятности наличия понятия для этого слова, и причем новое понятие содержит наиболее вероятное понятие.
21. Машиночитаемый носитель данных по п.20, в котором вероятность наличия понятия для слова основана на корпусах, соответсвуших тексту.
RU2013156494/08A 2013-12-19 2013-12-19 Разрешение семантической неоднозначности при помощи статистического анализа RU2592395C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2013156494/08A RU2592395C2 (ru) 2013-12-19 2013-12-19 Разрешение семантической неоднозначности при помощи статистического анализа
US14/509,355 US9740682B2 (en) 2013-12-19 2014-10-08 Semantic disambiguation using a statistical analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013156494/08A RU2592395C2 (ru) 2013-12-19 2013-12-19 Разрешение семантической неоднозначности при помощи статистического анализа

Publications (2)

Publication Number Publication Date
RU2013156494A true RU2013156494A (ru) 2015-06-27
RU2592395C2 RU2592395C2 (ru) 2016-07-20

Family

ID=53400219

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013156494/08A RU2592395C2 (ru) 2013-12-19 2013-12-19 Разрешение семантической неоднозначности при помощи статистического анализа

Country Status (2)

Country Link
US (1) US9740682B2 (ru)
RU (1) RU2592395C2 (ru)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9824084B2 (en) * 2015-03-19 2017-11-21 Yandex Europe Ag Method for word sense disambiguation for homonym words based on part of speech (POS) tag of a non-homonym word
RU2619193C1 (ru) * 2016-06-17 2017-05-12 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Многоэтапное распознавание именованных сущностей в текстах на естественном языке на основе морфологических и семантических признаков
JP6705318B2 (ja) * 2016-07-14 2020-06-03 富士通株式会社 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム
US10331659B2 (en) 2016-09-06 2019-06-25 International Business Machines Corporation Automatic detection and cleansing of erroneous concepts in an aggregated knowledge base
RU2621869C1 (ru) * 2016-11-17 2017-06-07 Федеральное казенное учреждение здравоохранения "Российский научно-исследовательский противочумный институт "Микроб" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека ("РосНИПЧИ "Микроб") Способ подвидовой дифференциации штаммов возбудителя чумы методом полимеразной цепной реакции с гибридизационно-флуоресцентным учетом результатов в режиме реального времени
CN110168544A (zh) * 2016-12-27 2019-08-23 夏普株式会社 应答装置、应答装置的控制方法、及控制程序
CN109271621B (zh) * 2017-07-18 2023-04-18 腾讯科技(北京)有限公司 语义消歧处理方法、装置及其设备
CN108320808A (zh) * 2018-01-24 2018-07-24 龙马智芯(珠海横琴)科技有限公司 病历分析方法和装置、设备、计算机可读存储介质
US10956677B2 (en) 2018-02-05 2021-03-23 International Business Machines Corporation Statistical preparation of data using semantic clustering
US20220164678A1 (en) * 2018-09-26 2022-05-26 Entigenlogic Llc Curing a deficiency of a knowledge database
US11481554B2 (en) 2019-11-08 2022-10-25 Oracle International Corporation Systems and methods for training and evaluating machine learning models using generalized vocabulary tokens for document processing
US11494559B2 (en) * 2019-11-27 2022-11-08 Oracle International Corporation Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
US11507747B2 (en) * 2019-11-27 2022-11-22 Oracle International Corporation Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质
CN112528670B (zh) * 2020-12-01 2022-08-30 清华大学 字词词义处理方法、装置、电子设备及存储介质
AU2022277097A1 (en) 2021-05-17 2023-12-07 Verantos, Inc. System and method for term disambiguation

Family Cites Families (204)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
US4864503A (en) 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
US5146405A (en) 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
EP0361570B1 (en) 1988-09-15 1997-08-06 Océ-Nederland B.V. A system for grammatically processing a sentence composed in natural language
SE466029B (sv) 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
NL8900587A (nl) 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.
JP3114181B2 (ja) 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
US5301109A (en) 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
US5418717A (en) 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
US5497319A (en) 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5175684A (en) 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5475587A (en) 1991-06-28 1995-12-12 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5559693A (en) 1991-06-28 1996-09-24 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5477451A (en) 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
GB9209346D0 (en) 1992-04-30 1992-06-17 Sharp Kk Machine translation system
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
JPH08501166A (ja) 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム
US5678051A (en) 1992-12-24 1997-10-14 Matsushita Electric Industrial C., Ltd. Translating apparatus with special display mode for supplemented words
ES2101613B1 (es) 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
NL9300310A (nl) 1993-02-19 1994-09-16 Oce Nederland Bv Inrichting en werkwijze voor syntactische signaal-analyse.
GB2279164A (en) 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
US5873056A (en) 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5510981A (en) 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
JP2618832B2 (ja) 1994-06-16 1997-06-11 日本アイ・ビー・エム株式会社 文書の論理構造の解析方法及びシステム
US5752051A (en) 1994-07-19 1998-05-12 The United States Of America As Represented By The Secretary Of Nsa Language-independent method of generating index terms
JPH08101837A (ja) 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
US5715468A (en) 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
JP3960562B2 (ja) 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法
GB2295470A (en) 1994-11-28 1996-05-29 Sharp Kk Machine translation system
US6139201A (en) 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
JP3066274B2 (ja) 1995-01-12 2000-07-17 シャープ株式会社 機械翻訳装置
US5729741A (en) 1995-04-10 1998-03-17 Golden Enterprises, Inc. System for storage and retrieval of diverse types of information obtained from different media sources which includes video, audio, and text transcriptions
US5737617A (en) 1995-06-06 1998-04-07 International Business Machines Corporation Method and system for English text analysis
EP0834139A4 (en) 1995-06-07 1998-08-05 Int Language Engineering Corp COMPUTER-ASSISTED TRANSLATION TOOLS
US5721938A (en) 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US5794177A (en) 1995-07-19 1998-08-11 Inso Corporation Method and apparatus for morphological analysis and generation of natural language text
AU6849196A (en) 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5787410A (en) 1996-02-20 1998-07-28 Oracle Corporation Method and apparatus for storing and retrieving data in multiple languages simultaneously using a fully-populated sub-table
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US6161083A (en) 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US6233544B1 (en) 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US5884247A (en) 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
JP3466857B2 (ja) 1997-03-06 2003-11-17 株式会社東芝 辞書更新方法および辞書更新システム
US6076051A (en) 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US6233546B1 (en) 1998-11-19 2001-05-15 William E. Datig Method and system for machine translation using epistemic moments and stored dictionary entries
JP3001460B2 (ja) 1997-05-21 2000-01-24 株式会社エヌイーシー情報システムズ 文書分類装置
US5933822A (en) 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6055528A (en) 1997-07-25 2000-04-25 Claritech Corporation Method for cross-linguistic document retrieval
US6356864B1 (en) 1997-07-25 2002-03-12 University Technology Corporation Methods for analysis and evaluation of the semantic content of a writing based on vector length
US6463404B1 (en) 1997-08-08 2002-10-08 British Telecommunications Public Limited Company Translation
US6081774A (en) 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
US6182028B1 (en) 1997-11-07 2001-01-30 Motorola, Inc. Method, device and system for part-of-speech disambiguation
US6260008B1 (en) 1998-01-08 2001-07-10 Sharp Kabushiki Kaisha Method of and system for disambiguating syntactic word multiples
ITUD980032A1 (it) 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
US7020601B1 (en) 1998-05-04 2006-03-28 Trados Incorporated Method and apparatus for processing source information based on source placeable elements
EP0962873A1 (en) 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6243670B1 (en) 1998-09-02 2001-06-05 Nippon Telegraph And Telephone Corporation Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US6285978B1 (en) 1998-09-24 2001-09-04 International Business Machines Corporation System and method for estimating accuracy of an automatic natural language translation
US6349276B1 (en) 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US6275789B1 (en) 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US6381598B1 (en) 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
US6243689B1 (en) 1998-12-29 2001-06-05 Robert G. Norton System and method for authorizing electronic funds transfer at a point of sale
US6266642B1 (en) 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6223150B1 (en) 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6356865B1 (en) 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
WO2000046701A1 (en) 1999-02-08 2000-08-10 Huntsman Ici Chemicals Llc Method for retrieving semantically distant analogies
US6901402B1 (en) 1999-06-18 2005-05-31 Microsoft Corporation System for improving the performance of information retrieval-type tasks by identifying the relations of constituents
US6601026B2 (en) 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US8914361B2 (en) * 1999-09-22 2014-12-16 Google Inc. Methods and systems for determining a meaning of a document to match the document to content
US6393389B1 (en) 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US6778949B2 (en) 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US6721697B1 (en) 1999-10-18 2004-04-13 Sony Corporation Method and system for reducing lexical ambiguity
US6928448B1 (en) 1999-10-18 2005-08-09 Sony Corporation System and method to match linguistic structures using thesaurus information
US6330530B1 (en) 1999-10-18 2001-12-11 Sony Corporation Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures
US6529865B1 (en) 1999-10-18 2003-03-04 Sony Corporation System and method to compile instructions to manipulate linguistic structures into separate functions
CN1302030B (zh) 1999-12-24 2010-04-21 纽昂斯通讯公司 词义消歧的机器翻译方法和***
AU2001249777A1 (en) 2000-03-31 2001-10-15 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
US20010029442A1 (en) 2000-04-07 2001-10-11 Makoto Shiotsu Translation system, translation processing method and computer readable recording medium
US6604101B1 (en) 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
AU2001261506A1 (en) 2000-05-11 2001-11-20 University Of Southern California Discourse parsing and summarization
US7062483B2 (en) 2000-05-18 2006-06-13 Endeca Technologies, Inc. Hierarchical data-driven search and navigation system and method for information retrieval
US6965857B1 (en) 2000-06-02 2005-11-15 Cogilex Recherches & Developpement Inc. Method and apparatus for deriving information from written text
US6622123B1 (en) 2000-06-23 2003-09-16 Xerox Corporation Interactive translation system and method
WO2002001401A1 (en) 2000-06-26 2002-01-03 Onerealm Inc. Method and apparatus for normalizing and converting structured content
US7085708B2 (en) 2000-09-23 2006-08-01 Ravenflow, Inc. Computer system with natural language to machine language translator
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7263488B2 (en) 2000-12-04 2007-08-28 Microsoft Corporation Method and apparatus for identifying prosodic word boundaries
KR20020045343A (ko) 2000-12-08 2002-06-19 오길록 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
US6983240B2 (en) 2000-12-18 2006-01-03 Xerox Corporation Method and apparatus for generating normalized representations of strings
US7860706B2 (en) 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US7132445B2 (en) 2001-04-16 2006-11-07 Schering Corporation 3,4-Di-substituted cyclobutene-1,2-diones as CXC-chemokine receptor ligands
US7050964B2 (en) 2001-06-01 2006-05-23 Microsoft Corporation Scaleable machine translation system
US7191115B2 (en) 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
EP1306775A1 (en) 2001-10-29 2003-05-02 BRITISH TELECOMMUNICATIONS public limited company Machine translation
CN1578954B (zh) 2001-10-29 2010-04-14 英国电讯有限公司 计算机语言翻译扩展***
JP3906356B2 (ja) 2001-12-27 2007-04-18 独立行政法人情報通信研究機構 構文解析方法及び装置
US7177799B2 (en) 2002-01-14 2007-02-13 Microsoft Corporation Semantic analysis system for interpreting linguistic structures output by a natural language linguistic analysis system
JP2003223437A (ja) 2002-01-29 2003-08-08 Internatl Business Mach Corp <Ibm> 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
AT6920U1 (de) 2002-02-14 2004-05-25 Sail Labs Technology Ag Verfahren zur erzeugung natürlicher sprache in computer-dialogsystemen
JP2003242136A (ja) 2002-02-20 2003-08-29 Fuji Xerox Co Ltd 構文情報タグ付与支援システムおよび方法
JP3726263B2 (ja) 2002-03-01 2005-12-14 ヒューレット・パッカード・カンパニー 文書分類方法及び装置
WO2003077152A2 (en) 2002-03-04 2003-09-18 University Of Southern California Sentence generator
US7526424B2 (en) 2002-03-20 2009-04-28 Microsoft Corporation Sentence realization model for a natural language generation system
EP1351158A1 (en) 2002-03-28 2003-10-08 BRITISH TELECOMMUNICATIONS public limited company Machine translation
EP1349079A1 (en) 2002-03-28 2003-10-01 BRITISH TELECOMMUNICATIONS public limited company Machine translation
US6928407B2 (en) 2002-03-29 2005-08-09 International Business Machines Corporation System and method for the automatic discovery of salient segments in speech transcripts
US7490034B2 (en) 2002-04-30 2009-02-10 Microsoft Corporation Lexicon with sectionalized data and method of using the same
RU2273879C2 (ru) * 2002-05-28 2006-04-10 Владимир Владимирович Насыпный Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем
WO2004001667A2 (en) 2002-06-21 2003-12-31 The Trustees Of Columbia University In The City Of New York Systems and methods for de-blurring motion blurred images
US7353165B2 (en) 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US7409404B2 (en) 2002-07-25 2008-08-05 International Business Machines Corporation Creating taxonomies and training data for document categorization
US7466334B1 (en) 2002-09-17 2008-12-16 Commfore Corporation Method and system for recording and indexing audio and video conference calls allowing topic-based notification and navigation of recordings
US6886010B2 (en) 2002-09-30 2005-04-26 The United States Of America As Represented By The Secretary Of The Navy Method for data and text mining and literature-based discovery
US7249012B2 (en) 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7356457B2 (en) 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
US8055669B1 (en) 2003-03-03 2011-11-08 Google Inc. Search queries improved based on query semantic information
US7346493B2 (en) 2003-03-25 2008-03-18 Microsoft Corporation Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system
KR100515641B1 (ko) 2003-04-24 2005-09-22 우순조 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
JP4410486B2 (ja) 2003-05-12 2010-02-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳装置及びプログラム
US7475390B2 (en) 2004-01-12 2009-01-06 International Business Machines Corporation System and method for automatic natural language translation during information transfer
US20040261016A1 (en) 2003-06-20 2004-12-23 Miavia, Inc. System and method for associating structured and manually selected annotations with electronic document contents
WO2005020093A1 (en) 2003-08-21 2005-03-03 Idilia Inc. Internet searching using semantic disambiguation and expansion
US7475015B2 (en) 2003-09-05 2009-01-06 International Business Machines Corporation Semantic language modeling and confidence measurement
US7739102B2 (en) 2003-10-08 2010-06-15 Bender Howard J Relationship analysis system and method for semantic disambiguation of natural language
CN1879148A (zh) * 2003-11-12 2006-12-13 皇家飞利浦电子股份有限公司 用于语法产生的语义标记到短语的分配
US7657420B2 (en) 2003-12-19 2010-02-02 Palo Alto Research Center Incorporated Systems and methods for the generation of alternate phrases from packed meaning
US7478033B2 (en) 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters
US7478038B2 (en) * 2004-03-31 2009-01-13 Microsoft Corporation Language model adaptation using semantic supervision
JP2007532995A (ja) * 2004-04-06 2007-11-15 デパートメント・オブ・インフォメーション・テクノロジー 疑似インターリングア及び交雑アプローチを用いた英語からヒンディ語及びその他のインド諸語への複数言語機械翻訳システム
US7949590B2 (en) 2004-04-16 2011-05-24 Goldman Sachs & Co. Apparatus, method and system for designing and trading macroeconomic investment views
US9189568B2 (en) 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
US7596485B2 (en) 2004-06-30 2009-09-29 Microsoft Corporation Module for creating a language neutral syntax representation using a language particular syntax tree
JP2006099296A (ja) 2004-09-29 2006-04-13 Nec Corp 翻訳システム、翻訳通信システム、機械翻訳方法、および、プログラム
US7970600B2 (en) 2004-11-03 2011-06-28 Microsoft Corporation Using a first natural language parser to train a second parser
US7200550B2 (en) 2004-11-04 2007-04-03 Microsoft Corporation Projecting dependencies to generate target language dependency structure
US7461056B2 (en) 2005-02-09 2008-12-02 Microsoft Corporation Text mining apparatus and associated methods
US7672830B2 (en) 2005-02-22 2010-03-02 Xerox Corporation Apparatus and methods for aligning words in bilingual sentences
JP2006268375A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳メモリシステム
JP4263181B2 (ja) 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4050755B2 (ja) 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US20130091113A1 (en) 2005-05-06 2013-04-11 Seaton Gras Hierarchical information retreival and boolean search strings
US20110055188A1 (en) 2009-08-31 2011-03-03 Seaton Gras Construction of boolean search strings for semantic search
US7840589B1 (en) 2005-05-09 2010-11-23 Surfwax, Inc. Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation
US7451124B2 (en) 2005-05-12 2008-11-11 Xerox Corporation Method of analyzing documents
JP4064413B2 (ja) 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
GB2428508B (en) 2005-07-15 2009-10-21 Toshiba Res Europ Ltd Parsing method
US7937265B1 (en) 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US7672831B2 (en) 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
JP4047885B2 (ja) 2005-10-27 2008-02-13 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
NZ569107A (en) 2005-11-16 2011-09-30 Evri Inc Extending keyword searching to syntactically and semantically annotated data
JP5011751B2 (ja) 2006-02-27 2012-08-29 富士通株式会社 訳語情報出力処理プログラム,処理方法および処理装置
US8626486B2 (en) 2006-09-05 2014-01-07 Google Inc. Automatic spelling correction for machine translation
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US8214199B2 (en) 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9047275B2 (en) * 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8078450B2 (en) * 2006-10-10 2011-12-13 Abbyy Software Ltd. Method and system for analyzing various languages and constructing language-independent semantic structures
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9471562B2 (en) * 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US8122026B1 (en) 2006-10-20 2012-02-21 Google Inc. Finding and disambiguating references to entities on web pages
US7895030B2 (en) 2007-03-16 2011-02-22 International Business Machines Corporation Visualization method for machine translation
US8122016B1 (en) * 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US7987176B2 (en) 2007-06-25 2011-07-26 Sap Ag Mixed initiative semantic search
US8229730B2 (en) 2007-08-31 2012-07-24 Microsoft Corporation Indexing role hierarchies for words in a search index
US8639708B2 (en) 2007-08-31 2014-01-28 Microsoft Corporation Fact-based indexing for natural language search
US8527260B2 (en) 2007-09-06 2013-09-03 International Business Machines Corporation User-configurable translations for electronic documents
US8117223B2 (en) 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
US8260049B2 (en) 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems
US8301633B2 (en) 2007-10-01 2012-10-30 Palo Alto Research Center Incorporated System and method for semantic search
US8010539B2 (en) 2008-01-25 2011-08-30 Google Inc. Phrase based snippet generation
US9361365B2 (en) 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
CA2639438A1 (en) 2008-09-08 2010-03-08 Semanti Inc. Semantically associated computer search index, and uses therefore
US20100082324A1 (en) 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US20110301941A1 (en) 2009-03-20 2011-12-08 Syl Research Limited Natural language processing method and system
US8112436B2 (en) 2009-09-21 2012-02-07 Yahoo ! Inc. Semantic and text matching techniques for network search
US8676565B2 (en) * 2010-03-26 2014-03-18 Virtuoz Sa Semantic clustering and conversational agents
US8688690B2 (en) 2010-04-15 2014-04-01 Palo Alto Research Center Incorporated Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction
US8300949B2 (en) 2010-05-18 2012-10-30 Sharp Laboratories Of America, Inc. Edge detection technique having improved feature visibility
EP2400400A1 (en) 2010-06-22 2011-12-28 Inbenta Professional Services, S.L. Semantic search engine using lexical functions and meaning-text criteria
US8554558B2 (en) 2010-07-12 2013-10-08 Nuance Communications, Inc. Visualizing automatic speech recognition and machine translation output
US8285728B1 (en) 2010-08-24 2012-10-09 The United States Of America As Represented By The Secretary Of The Navy Knowledge discovery and dissemination of text by mining with words
KR101192439B1 (ko) 2010-11-22 2012-10-17 고려대학교 산학협력단 디지털 콘텐츠 검색 장치 및 방법
US20120131060A1 (en) 2010-11-24 2012-05-24 Robert Heidasch Systems and methods performing semantic analysis to facilitate audio information searches
US20120197628A1 (en) 2011-01-28 2012-08-02 International Business Machines Corporation Cross-language spell checker
WO2012116287A1 (en) 2011-02-24 2012-08-30 Lexisnexis, A Division Of Reed Elsevier Inc. Methods for electronic document searching and graphically representing electronic document searches
EP2684117A4 (en) 2011-03-10 2015-01-07 Textwise Llc METHOD AND SYSTEM FOR UNIFORM INFORMATION REPRESENTATION AND ITS APPLICATION
US9824138B2 (en) 2011-03-25 2017-11-21 Orbis Technologies, Inc. Systems and methods for three-term semantic search
US9678992B2 (en) 2011-05-18 2017-06-13 Microsoft Technology Licensing, Llc Text to image translation
US8892488B2 (en) 2011-06-01 2014-11-18 Nec Laboratories America, Inc. Document classification with weighted supervised n-gram embedding
US9176949B2 (en) 2011-07-06 2015-11-03 Altamira Technologies Corporation Systems and methods for sentence comparison and sentence-based search
CN102306144B (zh) * 2011-07-18 2013-05-08 南京邮电大学 一种基于语义词典的词语消歧方法
US8533188B2 (en) 2011-09-16 2013-09-10 Microsoft Corporation Indexing semantic user profiles for targeted advertising
RU2487403C1 (ru) 2011-11-30 2013-07-10 Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук Способ построения семантической модели документа
US9323746B2 (en) 2011-12-06 2016-04-26 At&T Intellectual Property I, L.P. System and method for collaborative language translation
US8909648B2 (en) 2012-01-18 2014-12-09 Technion Research & Development Foundation Limited Methods and systems of supervised learning of semantic relatedness
US8886639B2 (en) 2012-04-19 2014-11-11 Sap Ag Semantically enriched search of services
US20130318095A1 (en) 2012-05-14 2013-11-28 WaLa! Inc. Distributed computing environment for data capture, search and analytics
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
CN103365974A (zh) * 2013-06-28 2013-10-23 百度在线网络技术(北京)有限公司 一种基于相关词主题的语义消歧方法和***

Also Published As

Publication number Publication date
US20150178268A1 (en) 2015-06-25
US9740682B2 (en) 2017-08-22
RU2592395C2 (ru) 2016-07-20

Similar Documents

Publication Publication Date Title
RU2013156494A (ru) Разрешение семантической неоднозначности при помощи статистического анализа
JP2015525928A5 (ru)
JP2016509711A5 (ru)
RU2016149498A (ru) Моделирование контекста сеанса для систем понимания разговорной речи
JP2014533407A5 (ru)
JP2017536601A5 (ru)
JP2017004555A5 (ru)
MX2019004407A (es) Agentes conversacionales multi-propósito basados en tecnicas de aprendizaje profundo para el procesamiento de consultas de lenguaje natural.
RU2016133850A (ru) Определение задач в сообщениях
SG11201902848QA (en) Intention acquisition method, electronic device and computer-readable storage medium
JP2017068861A5 (ru)
RU2016150428A (ru) Заполнение записей контактов пользователя
MX2019001576A (es) Sistemas y metodos para la recuperacion contextual de registros electronicos.
US20140129492A1 (en) Concept noise reduction in deep question answering systems
JP2020501255A5 (ru)
RU2013156493A (ru) Разрешение семантической неоднозначности при помощи не зависящей от языка семантической структуры
US10067983B2 (en) Analyzing tickets using discourse cues in communication logs
IL284340A (en) Editing instructions are machine based
RU2014150944A (ru) Система и способ использования данных предыдущего кадра для оптического распознавания символов кадров видеоматериалов
BR112015022922A2 (pt) sistema e método para gerenciar um suprimento de leite materno
US9779728B2 (en) Systems and methods for adding punctuations by detecting silences in a voice using plurality of aggregate weights which obey a linear relationship
BR112015015904A2 (pt) renderização de linguagem natural de consultas de busca estruturadas
US20170154052A1 (en) Method and apparatus for identifying semantically related records
JP2010538375A5 (ru)
RU2013156495A (ru) Разрешение семантической неоднозначности при помощи семантического классификатора

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20170630

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311