DE10337934A1 - Verfahren und Vorrichtung zur Strukturierung von Texten - Google Patents

Verfahren und Vorrichtung zur Strukturierung von Texten Download PDF

Info

Publication number
DE10337934A1
DE10337934A1 DE10337934A DE10337934A DE10337934A1 DE 10337934 A1 DE10337934 A1 DE 10337934A1 DE 10337934 A DE10337934 A DE 10337934A DE 10337934 A DE10337934 A DE 10337934A DE 10337934 A1 DE10337934 A1 DE 10337934A1
Authority
DE
Germany
Prior art keywords
text
text information
structuring
unstructured
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10337934A
Other languages
English (en)
Inventor
Frank Krickhahn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10337934A priority Critical patent/DE10337934A1/de
Publication of DE10337934A1 publication Critical patent/DE10337934A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur regelbasierten Überführung unstrukturierter Textinformationen in ein strukturiertes Format mit folgenden Schritten: DOLLAR A a) Eingabe von Strukturierungsregeln (10) zur Strukturierung der unstrukturierten Textinformationen (9), DOLLAR A b) Erfassen unstrukturierter Textinformationen (9), DOLLAR A c) Parsen der unstrukturierten Textinformationen (9) zur Erzeugung kleiner Textfragmente, DOLLAR A d) Durchsuchen von Texteinheiten der unstrukturierten Textinformationen (9) nach in den Strukturierungsregeln (10) definierten Textfragmenten, DOLLAR A e) Strukturierung der Textfragmente der unstrukturierten Textinformationen (9) gemäß in den Strukturierungsregeln (10) festgelegten Bedingungen, DOLLAR A sowie eine Vorrichtung zur regelbasierten Überführung unstrukturierter Textinformationen in ein strukturiertes Format mit einer Eingabevorrichtung (1, 2) für unstrukturierte Textinformationen (9), mit einer Eingabevorrichtung (1) und Speichervorrichtung (4) für Strukturierungsregeln (10), mit einer Extraktionsvorrichtung (6) von kleinen Texteinheiten aus den unstrukturierten Textinformationen, mit einer Strukturierungsvorrichtung (7) zur Erzegung strukturierter Textinformationen (11) aufgrund der Strukturierungsregeln (10) und mit einer Auswertevorrichtung (8) für die Texteinheiten in den strukturierten Textinformationen (11).

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Überführung unstrukturierter Textinformationen in ein strukturiertes Format.
  • Insbesondere in der Medizintechnik werden heutzutage viele Freitext-Reporte erstellt, die beispielsweise durch Einsatz von Diktaphonen und/oder Spracherkennungs-Technologien im Computer erfasst werden. Das Problem beim Umgang mit diesen Reporten besteht darin, dass ein automatischer Zugriff auf kleine Informationsteile, sogenannte atomare Informationen, nahezu unmöglich ist, da der Inhalt keine bzw. nur eine sehr grobe Struktur enthält. Somit sind Freitext-Reporte für die strukturierte Darstellung und Auswertung der Informationen sehr ungeeignet.
  • Bei derartigen Freitext-Reporten werden lediglich ganzheitliche Informationen verarbeitet. Sie können nicht zu automatischen Auswertungen herangezogen werden, so dass die in ihnen enthaltenen Informationen somit für diesen Zweck verloren sind. Dieses Problem wächst in dem Maße, wie das Bedürfnis nach Zugriff auf die atomare Information beispielsweise zum Zwecke eines Kodierens steigt.
  • In Aho, Alfred V. et al, "Compilers – Principles, Techniques and Tools", Addison Wesley, Reading, Massachusetts, 1986, Seiten 4 bis 11, ist das Prinzip des Parsens beschrieben.
  • Aus Wormek A.K. et al., "SAM: Speech-Aware Applications in Medicine to Support Structured Data Entry" ist ein Verfahren zur strukturierten Eingabe von Daten via Sprache bekannt.
  • Bei diesen Dokumenten erfolgt eine Überführung unstrukturierter Textinformationen in eine Struktur auf Basis der Ablei tung einer Struktur aus einer anderen. Auch diese daraus erhaltenen Strukturen lassen sich nicht zu automatischen Auswertungen verwenden.
  • Die Erfindung geht von der Aufgabe aus, ein Verfahren und eine Vorrichtung der eingangs genannten Art zu schaffen, die eine einfache, automatisierte Überführung unstrukturierter Textinformationen von Freitext-Reporten in ein strukturiertes, auswertbares Format ermöglicht.
  • Die Aufgabe wird erfindungsgemäß durch ein Verfahren mit folgenden Schritten gelöst:
    • a) Eingabe von Strukturierungsregeln zur Strukturierung der unstrukturierten Textinformationen,
    • b) Erfassen unstrukturierter Textinformationen,
    • c) Parsen der unstrukturierten Textinformationen zur Erzeugung kleiner Textfragmenten,
    • d) Durchsuchen von Texteinheiten der unstrukturierten Textinformationen nach in den Strukturierungsregeln definierten Textfragmenten,
    • e) Strukturierung der Textfragmente der unstrukturierten Textinformationen gemäß in den Strukturierungsregeln festgelegten Bedingungen.
  • Durch die zu definierenden Strukturierungsregeln wird der Freitext-Report geparst, d.h. in kleinere Einheiten zerlegt, und in eine Struktur überführt, damit ein Programm diese Informationen auswerten kann. Eine solche Regel enthält Informationen zu den Textfragmenten, nach denen der Freitext-Report zu durchsuchen ist, welches Struktur-Element hierdurch repräsentiert wird, sowie zusätzliche Informationen darüber, wie die Struktur aufzubauen ist.
  • Erfindungsgemäß kann im Schritt b) die Erfassung von unstrukturierter Textinformationen durch ein Mikrophon erfolgen, wobei mittels eines Spracherkennungsprogramms eine Umsetzung in unstrukturierte Textinformationen durchgeführt wird.
  • In vorteilhafter Weise können die Strukturierungsregeln Informationen zu den Textfragmenten enthalten, nach denen der Freitext-Report zu durchsuchen ist, welches Struktur-Element hierdurch repräsentiert wird und wie die Struktur aufzubauen ist.
  • Die Aufgabe wird bezüglich der Vorrichtung erfindungsgemäß durch eine Eingabevorrichtung für unstrukturierte Textinformationen, eine Eingabevorrichtung und Speichervorrichtung für Strukturierungsregeln, eine Extraktionsvorrichtung von kleinen Texteinheiten aus den unstrukturierten Textinformationen, eine Strukturierungsvorrichtung zur Erzeugung strukturierter Textinformationen aufgrund der Strukturierungsregeln und eine Auswertevorrichtung für die Texteinheiten in den strukturierten Textinformationen gelöst.
  • Eine Eingabe von auswertbaren unstrukturierten Textinformationen kann direkt erfolgen, wenn der Eingabevorrichtung für unstrukturierte Textinformationen eine Vorrichtung zur Spracherkennung zugeordnet ist.
  • Es hat sich als vorteilhaft erwiesen, wenn für die strukturierten Textinformationen als strukturiertes Format DICOM-SR oder XML Verwendung findet.
  • Die Erfindung ist nachfolgend anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert. Es zeigen:
  • 1 eine erfindungsgemäße Vorrichtung zur Strukturierung von Texten und
  • 2 ein erfindungsgemäßes Verfahren zur Strukturierung von Texten.
  • In der 1 ist eine erfindungsgemäße Vorrichtung zur Strukturierung von Texten dargestellt, die beispielsweise in einem Personal Computer (PC) realisiert sein kann. Eine Tastatur 1 dient zur Eingabe von Strukturierungsregeln und ggf. von Freitext-Reporten. Weiterhin kann die Vorrichtung eine Sprach-Eingabevorrichtung 2 aufweisen, beispielsweise ein Mikrophon oder ein Kassetten-Abspielgerät aufweisen, durch die die Freitext-Reporte in den PC eingegeben werden können. An die Sprach-Eingabevorrichtung 2 ist eine Vorrichtung 3 zur Spracherkennung, beispielsweise mit einem Spracherkennungsprogramm, angeschlossen, mittels derer die gesprochenen Freitext-Reporte in Textinformationen umgesetzt werden können.
  • Die Tastatur 1 ist mit einer Speichervorrichtung 4 für Strukturierungsregeln und einer Speichervorrichtung 5 für Textinformationen verbunden, an die auch die Vorrichtung 3 zur Spracherkennung angeschlossen ist. Mit der Speichervorrichtung 5 für Textinformationen ist eine Extraktionsvorrichtung 6 verbunden, die aus den unstrukturierten Textinformationen kleine Texteinheiten erkennt und kennzeichnet. An der Extraktionsvorrichtung 6 und der Speichervorrichtung 4 für die Strukturierungsregeln ist eine Strukturierungsvorrichtung 7 zur Erzeugung strukturierter Textinformationen angeschlossen, die aufgrund der festgelegten und gespeicherten Strukturierungsregeln die extrahierten Texteinheiten in ein strukturiertes Format überführt. Mit der Strukturierungsvorrichtung 7 ist eine Auswertevorrichtung 8 verbunden, die eine Abfrage nach kleinen, strukturierten Texteinheiten zur weiteren Auswertung ermöglicht.
  • In einer medizinischen Einrichtung werden Freitext-Reporte beispielsweise mit Hilfe eines Diktiergerätes (Dictaphones) aufgezeichnet und später von einer Sekretärin mittels eines Schreibprogramms über die Tastatur 1 in den Computer übertragen. Eine Umwandlung eines Freitext-Reports in einen geschriebenen Text kann auch durch die Vorrichtung 3 zur Spracherkennung mit einem entsprechenden Spracherkennungspro gramm erfolgen, wobei der Freitext-Report direkt in einen Personal Computer mittels Diktat oder nachträglich mit einem Abspielgerät für Diktierkassetten eingegeben werden kann.
  • Um spätere Auswertungen der so entstandenen Datenbestände zu ermöglichen, werden die Freitext-Reporte neben ihrem Originalformat in ein strukturiertes Format, beispielsweise DICOM-SR oder XML, überführt. Hierzu werden Regeln definiert, die die Systematik der Überführung festlegen.
  • Ausgangspunkt sind in der 2 dargestellte unstrukturierte Textinformationen 9, welche mittels Diktat bzw. Freitexteingabe entstanden ist. Diese Textinformationen 9 dient als Input für eine Vorrichtung, die diese unstrukturierten Textinformationen 9 in eine strukturierte Form übersetzen soll.
  • In der 2 ist Folgendes als Beispiel für unstrukturierte Textinformationen 9 angegeben:
    Indikation: Diaphorese. Ausschluss von Abnormalitäten regionaler Wandbewegungen. Überprüfen hypertonischer Kardiomyopathie. Ausschluss myokardialen Infarkt. Beurteilen des linken des Auswurfanteils des linken Ventrikels. Ausschluss eines Aneurysma des linken Ventrikels.
    Historie: Andere sachbezogene Historien beinhalten: neuerlicher Kokainmissbrauch. Vorhergehende CV-
    Prozeduren:
    Studieninfo. Die Studie wurde unter generaler Anästhesie durchgeführt.
  • Zur Übersetzung dieser unstrukturierten Textinformationen 9 in eine strukturierte Form werden in diese Vorrichtung Strukturierungsregeln 10 über die Tastatur 1 eingegeben und in der Speichervorrichtung 4 gespeichert, welche die Grundlage der Übersetzung bilden.
  • Diese Strukturierungsregeln 10 definieren, nach welchen Textfragmenten im Text zu suchen ist und welches Ergebnis das Auffinden eines solchen Textfragmentes in der Übersetzung hat. Im nachfolgend beschriebenen Beispiel bedeutet beispielsweise das Auffinden des Textfragmentes "Indikation" oder "Indications", dass eine neues Element, welches eine Indikation beschreibt, in die Struktur eingefügt wird.
  • Im Folgenden sind Beispiele von derartigen Strukturierungsregeln 10 angegeben, die in der 2 dargestellt sind. Die allgemeine Grundlage ist, dass Strukturierungsregeln 10 definiert werden, welche auf der Basis des Auffindens von Textfragmenten festlegen, wie unstrukturierte Textinformationen 9 in eine strukturierte Form übertragen werden.
  • Steht im Text das Wort "Indikation", so ist es unter Element "Indikation" mit offenen Aktionen zu behandeln. Gleiches gilt für das Wort "Historie" als Element "Historie" und "Studieninfo" als Element "Studieninfo".
  • Steht im Text das Wort "Diaphorese", so ist es unter Element "Indikation" als Aktion einzufügen. Das Wort "Kokainmissbrauch" im Text ist unter Element "Historie-Eintrag" einzufügen. Der Begriff "generale Anästhesie" ist unter Element "Studieninfo" einzufügen.
  • Mit diesen und weiteren einmal eingegebenen, jedoch jederzeit änderbaren Strukturierungsregeln 10 werden unstrukturierte Textinformationen 9 des Freitext-Reports in eine strukturierte Form gebracht, so dass man in den nun erhaltenen, nachfolgend beschriebenen strukturierten Textinformationen 11 nach bestimmten Begriffen suchen kann.
    <Report>
    <Indikationen>
    <Indikation> Diaphorese</ Indikation >. Ausschluss von Abnormalitäten regionaler Wandbewegungen. Überprüfen hypertonischer Kardiomyopathie. Ausschluss myokardialen Infarkt. Beurteilen des linken des Auswurfanteils des linken Ventrikels. Ausschluss eines Aneurysma des linken Ventrikels.
    </Indikationen>
    <Historie>
  • Andere sachbezogene Historien beinhalten: neuerlicher <Historie-Eintrag> Kokainmissbrauch <Historie-Eintrag>.
    Vorhergehende CV-Prozedur(en):
    </Historie>
    <Studieninfos>
  • Die Studie wurde unter <Studieninfo> generaler Anästhesie <Studieninfo> durchgeführt.
    </Studieninfos>
    </Report>
  • Dabei erfolgt erfindungsgemäß eine Überführung unstrukturierter Textinformationen in eine Struktur auf Basis der regelbasierten Interpretation von Inhalten.
  • So können beispielsweise in zwei Dokumenten folgende Textpassagen enthalten sein:
    • a) "Der Patient wurde einer umfangreichen Untersuchung unterzogen. Diagnostiziert wurde ein Darmtumor."
    • b) "Aufgrund einer CT-basierten Untersuchung wurde als Diagnose ein Tumor im Darmtrakt festgestellt".
  • Um eine Strukturierung der Diagnose durchzuführen, können folgende Regeln angewandt werden:
    • 1. Enthält ein Satz die Worte "diagnostiziert", "Diagnoseergebnis" oder "Diagnose", so enthält er Informationen zur Diagnose.
    • 1.1. Enthält der gleiche Satz das Wort "Tumor" oder "bösartige Geschwulst", wurde ein Tumor festgestellt.
    • 1.1.1 Enthält der gleiche Satz das Wort "Darm" oder Darmtrakt", so wurde ein Darmkrebs diagnostiziert.
    • 1.2 Enthält der Satz die Worte "Darmtumor" oder "Darmkrebs", so wurde Darmkrebs diagnostiziert.
  • Das gleiche Textfragment wird auf diese Weise unter unterschiedlichsten Aspekten analysiert. Die aus diesen Analysen gewonnenen Erkenntnisse werden dann in entsprechende Strukturen umgesetzt:
    <Diagnose>
    <Code> DF-0044A </CODE>
    <Meaning> Darmkrebs </Meaning>
    </Diagnose>
  • Es ist also ein automatischer Zugriff auf atomare Informationen möglich, da der Inhalt durch die erfindungsgemäße Vorrichtung eine fein strukturierte Form erhält. Somit lassen sich auch Freitext-Reporte für eine strukturierte Darstellung und automatische Auswertung der Informationen einsetzen.

Claims (9)

  1. Verfahren zur regelbasierten Überführung unstrukturierter Textinformationen in ein strukturiertes Format mit folgenden Schritten: a) Eingabe von Strukturierungsregeln (10) zur Strukturierung der unstrukturierten Textinformationen (9), b) Erfassen unstrukturierter Textinformationen (9), c) Parsen der unstrukturierten Textinformationen (9) zur Erzeugung kleiner Textfragmenten, d) Durchsuchen von Texteinheiten der unstrukturierten Textinformationen (9) nach in den Strukturierungsregeln (10) definierten Textfragmenten, e) Strukturierung der Textfragmente der unstrukturierten Textinformationen (9) gemäß in den Strukturierungsregeln (10) festgelegten Bedingungen.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Schritt b) die Erfassung von unstrukturierter Textinformationen (9) durch ein Mikrophon erfolgt, wobei mittels eines Spracherkennungsprogramms eine Umsetzung in unstrukturierte Textinformationen durchgeführt wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Strukturierungsregeln (10) Informationen zu den Textfragmenten enthalten, nach denen der Freitext-Report zu durchsuchen ist.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Strukturierungsregeln (10) Informationen zu den Textfragmenten enthalten, welches Struktur-Element hierdurch repräsentiert wird.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Strukturierungsregeln (10) Informationen enthalten, wie die Struktur aufzubauen ist.
  6. Vorrichtung zur regelbasierten Überführung unstrukturierter Textinformationen in ein strukturiertes Format mit einer Eingabevorrichtung (1, 2) für unstrukturierte Textinformationen (9), mit einer Eingabevorrichtung (1) und Speichervorrichtung (4) für Strukturierungsregeln (10), mit einer Extraktionsvorrichtung (6) von kleinen Texteinheiten aus den unstrukturierten Textinformationen, mit einer Strukturierungsvorrichtung (7) zur Erzeugung strukturierter Textinformationen (11) aufgrund der Strukturierungsregeln (10) und mit einer Auswertevorrichtung (8) für die Texteinheiten in den strukturierten Textinformationen (11).
  7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, dass der Eingabevorrichtung (2) für unstrukturierte Textinformationen (9) eine Vorrichtung (3) zur Spracherkennung zugeordnet ist.
  8. Vorrichtung nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass für die strukturierten Textinformationen (9) als strukturiertes Format DICOM-SR Verwendung findet.
  9. Vorrichtung nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass für die strukturierten Textinformationen (9) als strukturiertes Format XML Verwendung findet.
DE10337934A 2002-09-30 2003-08-18 Verfahren und Vorrichtung zur Strukturierung von Texten Withdrawn DE10337934A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10337934A DE10337934A1 (de) 2002-09-30 2003-08-18 Verfahren und Vorrichtung zur Strukturierung von Texten

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10245876.6 2002-09-30
DE10245876 2002-09-30
DE10337934A DE10337934A1 (de) 2002-09-30 2003-08-18 Verfahren und Vorrichtung zur Strukturierung von Texten

Publications (1)

Publication Number Publication Date
DE10337934A1 true DE10337934A1 (de) 2004-04-08

Family

ID=31984336

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10337934A Withdrawn DE10337934A1 (de) 2002-09-30 2003-08-18 Verfahren und Vorrichtung zur Strukturierung von Texten

Country Status (3)

Country Link
US (1) US20040117734A1 (de)
CN (1) CN100541483C (de)
DE (1) DE10337934A1 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7849049B2 (en) 2005-07-05 2010-12-07 Clarabridge, Inc. Schema and ETL tools for structured and unstructured data
US7849048B2 (en) 2005-07-05 2010-12-07 Clarabridge, Inc. System and method of making unstructured data available to structured data analysis tools
US7976539B2 (en) 2004-03-05 2011-07-12 Hansen Medical, Inc. System and method for denaturing and fixing collagenous tissue
US9477749B2 (en) 2012-03-02 2016-10-25 Clarabridge, Inc. Apparatus for identifying root cause using unstructured data

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606840B2 (en) * 2004-06-15 2009-10-20 At&T Intellectual Property I, L.P. Version control in a distributed computing environment
US7475341B2 (en) * 2004-06-15 2009-01-06 At&T Intellectual Property I, L.P. Converting the format of a portion of an electronic document
US8559764B2 (en) * 2004-06-15 2013-10-15 At&T Intellectual Property I, L.P. Editing an image representation of a text
US7689557B2 (en) * 2005-06-07 2010-03-30 Madan Pandit System and method of textual information analytics
CN100382022C (zh) * 2005-09-09 2008-04-16 华为技术有限公司 一种接口数据文法分析处理***及其分析处理方法
US7949538B2 (en) 2006-03-14 2011-05-24 A-Life Medical, Inc. Automated interpretation of clinical encounters with cultural cues
US8731954B2 (en) 2006-03-27 2014-05-20 A-Life Medical, Llc Auditing the coding and abstracting of documents
US8095575B1 (en) * 2007-01-31 2012-01-10 Google Inc. Word processor data organization
US7908552B2 (en) 2007-04-13 2011-03-15 A-Life Medical Inc. Mere-parsing with boundary and semantic driven scoping
US8682823B2 (en) * 2007-04-13 2014-03-25 A-Life Medical, Llc Multi-magnitudinal vectors with resolution based on source vector features
US9946846B2 (en) * 2007-08-03 2018-04-17 A-Life Medical, Llc Visualizing the documentation and coding of surgical procedures
CN102262676A (zh) * 2011-08-15 2011-11-30 何琦 可扩展标记语言文件转换器及其转换方法
CN103793437A (zh) * 2012-11-01 2014-05-14 无锡华润上华科技有限公司 晶圆测试数据处理方法及其***
US10541053B2 (en) 2013-09-05 2020-01-21 Optum360, LLCq Automated clinical indicator recognition with natural language processing
US10133727B2 (en) 2013-10-01 2018-11-20 A-Life Medical, Llc Ontologically driven procedure coding
US10402473B2 (en) * 2016-10-16 2019-09-03 Richard Salisbury Comparing, and generating revision markings with respect to, an arbitrary number of text segments
CN111680089B (zh) * 2017-09-19 2023-03-21 广州市妇女儿童医疗中心 文本结构化方法、装置、***和非易失性存储介质
CN107729526B (zh) * 2017-10-30 2020-04-07 清华大学 一种文本结构化的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7213027B1 (en) * 2000-03-21 2007-05-01 Aol Llc System and method for the transformation and canonicalization of semantically structured data
AU2001261506A1 (en) * 2000-05-11 2001-11-20 University Of Southern California Discourse parsing and summarization
US6725231B2 (en) * 2001-03-27 2004-04-20 Koninklijke Philips Electronics N.V. DICOM XML DTD/schema generator

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7976539B2 (en) 2004-03-05 2011-07-12 Hansen Medical, Inc. System and method for denaturing and fixing collagenous tissue
US7849049B2 (en) 2005-07-05 2010-12-07 Clarabridge, Inc. Schema and ETL tools for structured and unstructured data
US7849048B2 (en) 2005-07-05 2010-12-07 Clarabridge, Inc. System and method of making unstructured data available to structured data analysis tools
US9477749B2 (en) 2012-03-02 2016-10-25 Clarabridge, Inc. Apparatus for identifying root cause using unstructured data
US10372741B2 (en) 2012-03-02 2019-08-06 Clarabridge, Inc. Apparatus for automatic theme detection from unstructured data

Also Published As

Publication number Publication date
CN1497473A (zh) 2004-05-19
CN100541483C (zh) 2009-09-16
US20040117734A1 (en) 2004-06-17

Similar Documents

Publication Publication Date Title
DE10337934A1 (de) Verfahren und Vorrichtung zur Strukturierung von Texten
DE69424350T2 (de) Kontextsensitive Methode zum Auffinden von Informationen über ein Wort in einem elektronischen Wörterbuch
DE3788488T2 (de) Sprachenübersetzungssystem.
DE69330633T2 (de) Verfahren und Apparat zum Vergleichen von semantischen Mustern für das Wiederauffinden von Texten
DE60124842T2 (de) Rauschrobuste Mustererkennung
DE69129163T2 (de) Verfahren und Vorrichtung zur Texteingabe
DE68928231T2 (de) Verfahren und Vorrichtung zur Maschinenübersetzung
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
DE69423838T2 (de) Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen
DE19825205C2 (de) Verfahren, Vorrichtung und Erzeugnis zum Generieren von postlexikalischen Aussprachen aus lexikalischen Aussprachen mit einem neuronalen Netz
DE3910467A1 (de) Verfahren und vorrichtung zur erzeugung von berichten
DE102013202365A1 (de) Herausziehen von informationen aus krankenakten
CN1172992A (zh) 在自然语言解析器中识别和解析常混词的方法和***
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
Schweikhard et al. Handling word formation in comparative linguistics
EP1273003B1 (de) Verfahren und vorrichtung zum bestimmen prosodischer markierungen
Hild Effects of linguistic complexity on expert processing during simultaneous interpreting
DE69025091T2 (de) Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort
Riedl Unsupervised methods for learning and using semantics of natural language
Pincemin et al. Textometry on audiovisual corpora
EP0814457B1 (de) Verfahren zur automatischen Erkennung eines gesprochenen Textes
Schmidt et al. Generative Large Language Models for Detection of Speech Recognition Errors in Radiology Reports
CN115588486A (zh) 一种基于Transformer的中医诊断生成装置及其应用
Wagner et al. Show me what you've learned: applying cooperative machine learning for the semi-automated annotation of social signals
DE102016114265A1 (de) Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache

Legal Events

Date Code Title Description
8141 Disposal/no request for examination