JP2022508350A - 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム - Google Patents
汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム Download PDFInfo
- Publication number
- JP2022508350A JP2022508350A JP2021533326A JP2021533326A JP2022508350A JP 2022508350 A JP2022508350 A JP 2022508350A JP 2021533326 A JP2021533326 A JP 2021533326A JP 2021533326 A JP2021533326 A JP 2021533326A JP 2022508350 A JP2022508350 A JP 2022508350A
- Authority
- JP
- Japan
- Prior art keywords
- term
- medical
- mapping
- module
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
前記ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタの業務データを記憶し、
前記データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理し、用語マッピングツールによるソースデータベースへのアクセス及び修正にサポートし、
前記予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
前記用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
前記自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コード間のマッピング関係に基づき、多方向マッピングを実現し、
前記曖昧マッチングモジュールは、従来の医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
前記カスタム用語モジュールは、従来の医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
前記マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの汎用医療用語ライブラリが一致するように保ち、
前記増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
前記異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、エラーログに基づき、医療用語マッピングの全過程の遡りを行うことができる。
まず、ソースデータベース内の、各テーブル内のフィールド名、数値タイプ、全ての値の最大長さ、テーブル内の総行数、及びヌル値の占める割合を含む全てのテーブルの要約性を統計し、
次に、具体的なある1つのテーブルの内部の具体的な用語の詳細情報及び出現頻度を統計し、且つ出現頻度の高低に応じて大きい順に配列することで、後続の用語マッピングは、出現頻度の高い用語を優先的に選択して処理し、システムは、出現頻度の低い用語が後続の用語マッピングに参与する必要があるかどうかのアドバイスを与え、未定義の場合、デフォルトで全ての用語がマッピングに参与することとし、また、ユーザが具体的な状況に応じて調整することも可能であるとすることで、後続の用語マッピングに参与しない最小の出現頻度の閾値を決定する。
(1)用語の単語分割であって、汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、それぞれの単語分割に対して出現頻度を統計し、基礎語彙の頻度として、曖昧マッチングが必要なソース医療用語Mに対してマッチングする前に単語分割を行い、
(2)曖昧マッチングであって、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
(2.1)汎用医療用語ライブラリから単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットAに組み合わせ、
(2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4 … Pnは、各単語分割の基礎語彙における対応する確率であり、
(2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、その数式(2)は、
図1示すように、本発明は、汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムを提供し、当該システムは、ソースデータベースと、データベース接続管理モジュールと、予備分析モジュールと、用語マッピングユニットと、増分更新モジュールと、異常処理モジュールと、マルチセンタ・インタラクションモジュールとを含み、さらに、データクリーニングモジュールを含むことが可能であり、
ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタのHIS、LIS、PACS及びEMRなどの医療情報システムの業務データを記憶し、前記業務データは、患者の基本情報、治療情報、費用情報、診断情報、投薬情報、手術情報、検証情報、検査情報、テキストカルテ情報及び看護バイタルサイン情報を含み、
データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理(ロード、修正及び記憶を含む)し、用語マッピングツールによる異なるタイプのソースデータベースへのアクセス及び修正にサポートし、
予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コードの間のマッピング関係に基づき、多方向マッピングを実現し、そのマッピング結果を品質制御すればよく、
曖昧マッチングモジュールは、従来の医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
カスタム用語モジュールは、従来の医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後(技術担当者と医師との共同決定により)、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの汎用医療用語ライブラリが一致するように保ち、
増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、その以降、エラーログに基づき医療用語マッピング全過程の遡りを行うことができるように保証する。
一.データベース接続管理モジュール
ソースデータベースへの必要な情報を管理(ロード、修正及び記憶を含む)し、ソースデータベースと目標データベースは、物理レベルで同一のデータベースシステムにすることができる。実現方法は、主に従来の例えばjavaプログラミング言語で記述されたクラス及びインタフェースがJDBCモジュールを構成し、複数種のデータベースに統一されたアクセスインタフェースを提供し、優れたクロスプラットフォームパフォーマンスを有し、主にデータベース又は他のデータソースとの接続を確立し、データベースにSQL命令を送信し、データベースの返信結果を処理する機能を実現し、その概略図は、図3に示す通りである。
データベース接続管理モジュールが、ソースデータベースとの接続を実現した後、当該モジュールによりソースデータベースにおける全てのデータ構造情報及びその具体的なフィールドの統計情報を自動走査し、統計テーブルAを生成し、このテーブルは、2つの部分を含む。
ソースデータベース内に国際汎用医療用語ライブラリの標準コードが存在する用語について、そのコードの属する標準を特定した後、そのマッピングされる目標用語セットを選択し、ソースデータベース内の用語の属する標準用語セットコードと目標用語セットコードとの間に参照可能なマッピング関係があれば、この部分の用語は、マッピングSQL文を自動的に生成し、ソースデータベース内の用語に対する自動マッピング、及び相応的なデータロードを完了させる。
当該部分の医療用語を汎用医療用語ライブラリにおける標準用語と1つずつ曖昧マッチングし、マッピングが推奨される標準用語及びその所在する標準用語セットコードを提供する。曖昧マッチングは、通常、複数の標準用語をマッチング対象として推奨し、医学知識の背景を有する専門家が手動で唯一のマッチング対象を決定する必要がある。マッピング関係が決定された後、自動マッピングモジュールを呼び出して当該部分の医療用語のマッピング及びそれにカバーされるデータのロードを完了させる。曖昧マッチングの具体的な方法は、以下の通りである。
医療用語は、多くの語彙が規則敵に組み合わせてなり、ここで特定の規律に応じて医療用語を複数の語彙に再び細分化する。
(1.1)このような方法に従って、汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、各単語分割に対して出現頻度を統計し、基礎語彙の頻度とする。
(1.2)曖昧マッチングを必要とするソース医療用語を、マッチングする前に、単語分割も行う。例えば、用語Mは、単語分割された後、[単語分割1、単語分割2、…単語分割n]が得られる。
(2)曖昧マッチング
本発明は、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
(2.1)汎用医療用語ライブラリから、単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットA{a,b,c,d,e,…}に組み合わせ、
(2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4 … Pnは、各単語分割の基礎語彙における対応する確率であり、
(2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、その数式(2)は、
a)汎用医療用語ライブラリ用語に対して単語分割を行い、各単語分割の確率を取得し、
b)用語「阿膠長寿内服液」に対して単語分割を行った後、「阿膠\長寿\内服液」を取得した。基礎語彙の頻度にその対応する確率を検索し、それぞれ「阿膠」頻度p1、「長寿」p2、「内服液」p3を取得し、その各単語分割の平均確率d(M)を求め、
c)汎用医療用語ライブラリに「阿膠」、「長寿」、「内服液」を含む全ての用語を検索し、それらに対して単語分割を行い、用語セットA{[「阿膠」、「カルシウム」、「内服液」]、[「阿膠」、「顆粒」]、[「阿膠」、「補血」、「内服液」]…}を取得し、d(a)、d(b)、d(c)…を取得し、
d)マッチング度を求めてソートする。
複雑な場合、特に国内医療データセンタにデータが冗長であり、漢方薬及び伝統的な治療手段に関連する医療用語が多く存在する実際の状況では、国際汎用医療用語ライブラリとマッチングできないことがある。カスタム用語モジュールカスタム用語と既知の標準用語との相互衝突を回避するように、事前に制約を定義し、例えば、コード上に、カスタム用語に限られたコード範囲を使用するように強制される。
各医療データセンタの医療情報システムの間にデータ標準化とデータ共有を実現しようとすると、全ての医療データセンタが統一された汎用医療用語ライブラリ及び統一された医療用語セットコードを用いることが要求される。本発明は、審査後に統一的に追加する方式を採用し、各医療データセンタが標準用語をカスタムする時に生じる用語記述の差異を防止する。提出、審査、承認のプロセスでは、複数の医療データセンタのインタラクションの問題が存在する。マルチセンタ・インタラクションモジュールは、各医療データセンタの汎用医療用語ライブラリ及びその用語コードの協調及び統一を担当し、マルチセンタ・インタラクションモジュールの最高権限者は、カスタム標準用語の使用問題を審査協調する。マルチセンタのカスタム用語のインタラクションネットワークは、図5に示す通りである。
医療用語マッピングが行われた医療データセンタの後続の医療用語の標準化プロセスは、主に用語マッピングユニットが生成した従来の用語標準化されたマッピング記録に基づき増分データの更新を実現し、標準化マッピングがまだ完了できていない医療用語について、カスタム用語モジュールを繰り返して実行する。
異常処理モジュールは、システムの稼働時の全てのログを保存し、各モジュールが正常に稼働するかどうかを記録し、システムの動作時に発生したエラーと、各モジュールの呼び出し時に発生したエラーと、各モジュールの動作時に個別の用語に対してマッピングを行うときに発生したエラーとを含むエラーログを分類して保管し、自動分析モジュールで無視された用語及びカスタムモジュールで無視された用語を含むマッピングが成功しなかった用語を分類して保管し、失敗した用語のドキュメントを生成する。異常処理モジュールは、データベースにタイムスタンプを設定することで、データベースの遡り機能をサポートし、ユーザがマッチングされたデータベースを、指定された日付のデータ遡ることをサポートする。
医療用語の標準化マッピングの後、医療データのクリーニングは、医療データの品質を向上させ、後続のデータマイニング及び分析のために必要であり、ここで、よく用いられるデータクリーニングポリシーが提供され、主に構造レベル及び実例レベルの「ダーティデータ」をクリーニングし、それぞれデータモード及び完全性制約要件に違反するデータを含み、例えば、データ値の超過範囲、属性依頼関係の破壊、一意の関係の破壊、参照の完全性の破壊など及び値が間違った属性に対応すること、属性間の依頼関係が破壊されたデータ、例えば欠落値、重複記録、矛盾する記録、参照エラーなどが挙げられ、最大程度にデータの完全性、一意性、権威性、正当性、整合性を満たし、データの冗長を減少し、データの品質を向上させる。
Claims (10)
- 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムであって、当該システムは、ソースデータベースと、データベース接続管理モジュールと、予備分析モジュールと、用語マッピングユニットと、増分更新モジュールと、異常処理モジュールと、マルチセンタ・インタラクションモジュールとを含み、
前記ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタの業務データを記憶し、
前記データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理し、用語マッピングツールによるソースデータベースへのアクセス及び修正をサポートし、
前記予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
前記用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
前記自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コードの間のマッピング関係に基づき、多方向マッピングを実現し、
前記曖昧マッチングモジュールは、従来の医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
前記カスタム用語モジュールは、従来の医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
前記マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの汎用医療用語ライブラリが一致するように保ち、
前記増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
前記異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、エラーログに基づき、医療用語マッピングの全過程の遡りを行うことができる
ことを特徴とする汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 当該システムは、データクリーニングモジュールをさらに含み、前記データクリーニングモジュールは、クリーニング・ルールを作成し、各データ要素に重みを与え、欠損が深刻なデータをスクリーニングしており、構造レベル及び実例レベルのダーティデータをクリーニングすることを含む
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記データベース接続管理モジュールは、具体的に、プログラミング言語によって記述されたクラス及びインタフェースがJDBCモジュールを構成することにより、複数種のデータベースへ統一されたアクセスインタフェースを提供し、データベース又は他のデータソースとの接続を確立し、データベースにSQL命令を送信し、データベースの返信結果を処理する機能を実現する
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記予備分析モジュールは、データベース接続管理モジュールがソースデータベースとの接続を実現した後、当該モジュールにより、ソースデータベースにおける全てのデータ構造情報及びその具体的なフィールドの統計情報を自動走査し、統計テーブルを生成し、以下の2つの部分を含み、
まず、ソースデータベース内の、各テーブル内のフィールド名、数値タイプ、全ての値の最大長さ、テーブル内の総行数、及びヌル値の占める割合を含む全てのテーブルの要約性を統計し、
次に、具体的なある1つのテーブルの内部の具体的な用語の詳細情報及び出現頻度を統計し、且つ出現頻度の高低に応じて大きい順に配列することで、後続の用語マッピングは、出現頻度の高い用語を優先的に選択して処理し、システムは、出現頻度の低い用語が後続の用語マッピングに参与する必要があるかどうかのアドバイスを与え、未定義の場合、デフォルトで全ての用語がマッピングに参与することとし、また、ユーザが具体的な状況に応じて調整することも可能であるとすることで、後続の用語マッピングに参与しない最小の出現頻度の閾値を決定する
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記自動マッピングモジュールは、ソースデータベース内に国際汎用医療用語ライブラリの標準コードが存在する用語について、そのコードの属する標準を特定した後、マッピングされる目標用語セットを選択し、ソースデータベース内の用語の属する標準用語セットのコードと目標用語セットのコードとの間に参照可能なマッピング関係があれば、この部分の用語は、マッピングSQL文を自動的に生成でき、ソースデータベース内の用語に対する自動マッピング、及び対応するデータのロードを完了させる
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記曖昧マッチングモジュールでは、曖昧マッチングの具体的な方法は、以下の通りであり、
(1)用語の単語分割であって、汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、それぞれの単語分割に対して出現頻度を統計し、基礎語彙の頻度として、曖昧マッチングが必要なソース医療用語Mに対してマッチングする前に単語分割を行い、
(2)曖昧マッチングであって、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
(2.1)汎用医療用語ライブラリから単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットAに組み合わせ、
(2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4…Pnは、各単語分割の基礎語彙における対応する確率であり、
(2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、その数式(2)は、
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム、 - 前記カスタム用語モジュールは、カスタム用語と既知の標準用語との相互衝突を回避するように、事前に制約を定義し、カスタム用語を追加する際、各医療データセンタの間に追加されたカスタム標準用語の整合性を保つ必要があり、重複追加を防止するとともに、マルチセンタ医療データが用語マッピング標準化された後、データ共有が実現可能であることを保証し、カスタム用語を追加する前に、マルチセンタ・インタラクションモジュールに、カスタム用語を追加する申請を提出する必要があり、申請内容は、追加するカスタム用語、カスタム用語の具体的な説明及びカスタム用語のコードを含み、マルチセンタ・インタラクションモジュールの関連する操作者による審査に合格した場合、類似して重複する医療用語のカスタムコードがないと判断し、1つのカスタム標準用語コードを生成し、そして、自動マッピングモジュールを呼び出し、用語マッピング及び関連するデータのロードを完了させ、審査に合格しなかった場合、当該医療データセンタが、後続のマッピングを完了させるために、既存のカスタム用語コードを返送し、或いは、カスタム用語の生成に失敗した原因を返送し、エラードキュメントを生成してユーザに提示する
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記マルチセンタ・インタラクションモジュールは、各医療データセンタの汎用医療用語ライブラリ及びその用語コードの協調と統一を担当し、マルチセンタ・インタラクションモジュールの最高権限者は、カスタム標準用語の使用問題を審査協調する
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記増分更新モジュールは、医療用語マッピングが行われた医療データセンタの後続の医療用語標準化プロセスに用いられ、主に用語マッピングユニットの生成した従来の用語標準化されたマッピング記録に基づき増分データの更新を実現し、標準化マッピングがまだ完了していない医療用語について、カスタム用語モジュールを繰り返して実行する
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。 - 前記異常処理モジュールは、システムの動作時の全てのログを保管し、各モジュールが正常に動作するかどうかを記録し、システムの動作時に発生したエラーと、各モジュールの呼び出し時に発生したエラーと、各モジュールの動作時に個別の用語に対してマッピングを行う際に発生したエラーとを含むエラーログを分類して保管し、自動分析モジュールで無視された用語及びカスタムモジュールで無視された用語を含むマッピングが成功しなかった用語を分類して保管し、失敗した用語のドキュメントを生成し、異常処理モジュールは、データベースにタイムスタンプを設定することで、データベースの遡り機能をサポートし、ユーザがマッチングされたデータベースを、指定された日付のデータに遡ることをサポートする
ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910629244.9A CN110349639B (zh) | 2019-07-12 | 2019-07-12 | 一种基于通用医疗术语库的多中心医疗术语标准化*** |
CN201910629244.9 | 2019-07-12 | ||
PCT/CN2020/083586 WO2020233256A1 (zh) | 2019-07-12 | 2020-04-07 | 一种基于通用医疗术语库的多中心医疗术语标准化*** |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022508350A true JP2022508350A (ja) | 2022-01-19 |
JP7093593B2 JP7093593B2 (ja) | 2022-06-30 |
Family
ID=68176052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021533326A Active JP7093593B2 (ja) | 2019-07-12 | 2020-04-07 | 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7093593B2 (ja) |
CN (1) | CN110349639B (ja) |
WO (1) | WO2020233256A1 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110349639B (zh) * | 2019-07-12 | 2022-01-04 | 之江实验室 | 一种基于通用医疗术语库的多中心医疗术语标准化*** |
CN111126018B (zh) * | 2019-11-25 | 2023-08-08 | 泰康保险集团股份有限公司 | 表单生成方法及装置、存储介质、电子设备 |
CN110990591A (zh) * | 2019-12-26 | 2020-04-10 | 北京亚信数据有限公司 | 医疗数据转码质量稽核方法及*** |
CN111291225B (zh) * | 2020-05-08 | 2020-08-11 | 成都金盘电子科大多媒体技术有限公司 | 一种医疗健康信息数据标准快速校验的方法及*** |
CN112035451A (zh) * | 2020-08-25 | 2020-12-04 | 上海灵长软件科技有限公司 | 数据校验优化的处理方法、装置、电子设备与存储介质 |
CN112069774A (zh) * | 2020-09-03 | 2020-12-11 | 微医云(杭州)控股有限公司 | 一种数据映射方法、装置、电子终端及存储介质 |
CN112347266A (zh) * | 2020-09-11 | 2021-02-09 | 湖南中医药大学 | 儿童康复专科术语标准化*** |
CN112052667B (zh) * | 2020-09-27 | 2024-05-03 | 沈阳东软智能医疗科技研究院有限公司 | 一种实现医学编码映射的方法、装置及设备 |
CN112365939B (zh) * | 2020-10-14 | 2023-04-07 | 山东大学 | 一种基于医疗健康大数据的数据治理方法及*** |
CN112633005B (zh) * | 2020-11-11 | 2024-06-21 | 上海数创医疗科技有限公司 | 一种心电术语语义匹配方法 |
CN112395854B (zh) * | 2020-12-02 | 2022-11-22 | 中国标准化研究院 | 一种标准要素的一致性检验方法 |
CN112883157B (zh) * | 2021-02-07 | 2023-04-07 | 武汉大学 | 一种多源异构医疗数据的标准化方法及装置 |
CN112951355B (zh) * | 2021-02-25 | 2023-05-02 | 武汉大学 | 一种海量医疗数据入库的质检功能方法及装置 |
CN112817945A (zh) * | 2021-03-03 | 2021-05-18 | 江苏汇鑫融智软件科技有限公司 | 一种基于esb的医疗的异构***数据仓库建设方法 |
CN112988966A (zh) * | 2021-03-04 | 2021-06-18 | 中建海峡建设发展有限公司 | 一种语音交互的施工日志管理***及实现方法 |
CN113284630B (zh) * | 2021-04-13 | 2024-05-14 | 常州市第二人民医院 | 一种基于医学本体的医学术语知识库的构建***及方法 |
CN113239115B (zh) * | 2021-05-19 | 2023-06-02 | 中国医学科学院医学生物学研究所 | 一种疫苗不良反应批量数据快速、准确的同步方法 |
CN113377897B (zh) * | 2021-05-27 | 2022-04-22 | 杭州莱迈医疗信息科技有限公司 | 基于深度对抗学习的多语言医疗术语规范标准化***及方法 |
CN113342793B (zh) * | 2021-06-18 | 2023-04-07 | 立信(重庆)数据科技股份有限公司 | 一种调研数据标准化方法及*** |
CN113704555B (zh) * | 2021-07-16 | 2023-11-07 | 杭州医康慧联科技股份有限公司 | 基于医疗方向联邦学习的特征管理方法 |
CN113764086A (zh) * | 2021-08-17 | 2021-12-07 | 卫宁健康科技集团股份有限公司 | 基于jhnebp模型的护理信息处理***、方法 |
CN113836126B (zh) * | 2021-09-22 | 2024-01-30 | 上海妙一生物科技有限公司 | 一种数据清洗方法、装置、设备及存储介质 |
CN113656604B (zh) * | 2021-10-19 | 2022-02-22 | 之江实验室 | 基于异构图神经网络的医疗术语规范化***及方法 |
CN114003791B (zh) * | 2021-12-30 | 2022-04-08 | 之江实验室 | 基于深度图匹配的医疗数据元自动化分类方法及*** |
CN114461714B (zh) * | 2022-01-13 | 2024-03-29 | 湖北国际物流机场有限公司 | Bim编码转换*** |
CN114595668A (zh) * | 2022-01-28 | 2022-06-07 | 北京医鸣技术有限公司 | 一种医疗诊断术语标准化的方法、平台、介质及设备 |
CN115080751B (zh) * | 2022-08-16 | 2022-11-11 | 之江实验室 | 一种基于通用模型的医学标准术语管理***及方法 |
CN115712839B (zh) * | 2022-11-14 | 2023-10-24 | 国网山东省电力公司日照供电公司 | 一种继电保护装置通讯模型自动匹配***及方法 |
CN115952770B (zh) * | 2023-03-15 | 2023-07-25 | 广州汇通国信科技有限公司 | 一种数据标准化的处理方法、装置、电子设备及存储介质 |
CN116110560A (zh) * | 2023-04-13 | 2023-05-12 | 杭州璞睿生命科技有限公司 | 临床诊疗数据对接至edc***的方法、装置、设备及介质 |
CN116167354B (zh) * | 2023-04-19 | 2023-07-07 | 北京亚信数据有限公司 | 医疗专业名词特征提取模型训练、标准化方法及装置 |
CN116386799B (zh) * | 2023-06-05 | 2023-08-18 | 数据空间研究院 | 一种医疗数据采集与标准转换方法及*** |
CN116737697B (zh) * | 2023-08-10 | 2023-10-20 | 云筑信息科技(成都)有限公司 | 建筑行业物料主数据管理方法、装置及电子设备 |
CN117995332B (zh) * | 2024-04-07 | 2024-07-05 | 北方健康医疗大数据科技有限公司 | 一种值域代码标准化转换***及方法 |
CN118035504A (zh) * | 2024-04-15 | 2024-05-14 | 上海森亿医疗科技有限公司 | 医学核心词知识库构建方法、装置、介质及终端 |
CN118173211B (zh) * | 2024-05-15 | 2024-07-23 | 万链指数(青岛)信息科技有限公司 | 一种用于医疗大数据的数据标准化治理方法及*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005519411A (ja) * | 2002-03-05 | 2005-06-30 | シーメンス メディカル ソルーションズ ヘルス サーヴィシズ コーポレイション | 動的辞書及び用語蓄積システム |
JP2006079189A (ja) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | レセプトファイル生成システム、カルテファイル生成システムおよびファイル生成システム |
JP2007025834A (ja) * | 2005-07-13 | 2007-02-01 | Hitachi Ltd | 読影レポート入力支援方法及び読影レポート入力支援システム |
JP2007531080A (ja) * | 2003-07-14 | 2007-11-01 | イージーケアテック カンパニー リミテッド | 医療情報の電算標準化方法 |
US7610192B1 (en) * | 2006-03-22 | 2009-10-27 | Patrick William Jamieson | Process and system for high precision coding of free text documents against a standard lexicon |
JP2016146165A (ja) * | 2014-11-10 | 2016-08-12 | アクセンチュア グローバル サービスィズ リミテッド | インテリジェントなコーディング、報告および分析に焦点を合わせたツールを用いた、医療コーディング管理システム |
JP2016200978A (ja) * | 2015-04-10 | 2016-12-01 | 株式会社日立製作所 | 教師データの生成装置 |
WO2018084682A1 (ko) * | 2016-11-07 | 2018-05-11 | 경희대학교 산학협력단 | 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램 |
WO2019016054A1 (en) * | 2017-07-18 | 2019-01-24 | Koninklijke Philips N.V. | CODED MEDICAL VOCABULARY MATCHING |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101452503A (zh) * | 2008-11-28 | 2009-06-10 | 上海生物信息技术研究中心 | 一种异构临床医疗信息共享***和方法 |
US20160342746A1 (en) * | 2015-05-21 | 2016-11-24 | Naveen Sarabu | Cloud-Based Medical-Terminology Manager and Translator |
CN106383853A (zh) * | 2016-08-30 | 2017-02-08 | 刘勇 | 一种电子病历后结构化以及辅助诊断的实现方法及其*** |
CN107978341A (zh) * | 2017-12-22 | 2018-05-01 | 南京昂特医信数据技术有限公司 | 一种基于语境的医学语义框架下的异构数据适配方法及其*** |
CN109033080B (zh) * | 2018-07-12 | 2023-03-24 | 上海金仕达卫宁软件科技有限公司 | 基于概率转移矩阵的医疗术语标准化方法及*** |
CN109408820A (zh) * | 2018-10-17 | 2019-03-01 | 长沙瀚云信息科技有限公司 | 一种医学术语映射***和方法、设备及存储介质 |
CN109446340A (zh) * | 2018-10-17 | 2019-03-08 | 长沙瀚云信息科技有限公司 | 一种医学标准术语本体管理***及方法、设备和存储介质 |
CN110349639B (zh) * | 2019-07-12 | 2022-01-04 | 之江实验室 | 一种基于通用医疗术语库的多中心医疗术语标准化*** |
-
2019
- 2019-07-12 CN CN201910629244.9A patent/CN110349639B/zh active Active
-
2020
- 2020-04-07 WO PCT/CN2020/083586 patent/WO2020233256A1/zh active Application Filing
- 2020-04-07 JP JP2021533326A patent/JP7093593B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005519411A (ja) * | 2002-03-05 | 2005-06-30 | シーメンス メディカル ソルーションズ ヘルス サーヴィシズ コーポレイション | 動的辞書及び用語蓄積システム |
JP2007531080A (ja) * | 2003-07-14 | 2007-11-01 | イージーケアテック カンパニー リミテッド | 医療情報の電算標準化方法 |
JP2006079189A (ja) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | レセプトファイル生成システム、カルテファイル生成システムおよびファイル生成システム |
JP2007025834A (ja) * | 2005-07-13 | 2007-02-01 | Hitachi Ltd | 読影レポート入力支援方法及び読影レポート入力支援システム |
US7610192B1 (en) * | 2006-03-22 | 2009-10-27 | Patrick William Jamieson | Process and system for high precision coding of free text documents against a standard lexicon |
JP2016146165A (ja) * | 2014-11-10 | 2016-08-12 | アクセンチュア グローバル サービスィズ リミテッド | インテリジェントなコーディング、報告および分析に焦点を合わせたツールを用いた、医療コーディング管理システム |
JP2016200978A (ja) * | 2015-04-10 | 2016-12-01 | 株式会社日立製作所 | 教師データの生成装置 |
WO2018084682A1 (ko) * | 2016-11-07 | 2018-05-11 | 경희대학교 산학협력단 | 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램 |
WO2019016054A1 (en) * | 2017-07-18 | 2019-01-24 | Koninklijke Philips N.V. | CODED MEDICAL VOCABULARY MATCHING |
Also Published As
Publication number | Publication date |
---|---|
JP7093593B2 (ja) | 2022-06-30 |
CN110349639A (zh) | 2019-10-18 |
CN110349639B (zh) | 2022-01-04 |
WO2020233256A1 (zh) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7093593B2 (ja) | 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム | |
CN110415831B (zh) | 一种医疗大数据云服务分析平台 | |
CN110347662B (zh) | 一种基于通用数据模型的多中心医疗数据结构标准化*** | |
Barateiro et al. | A survey of data quality tools. | |
CN111916161B (zh) | 用于临床试验过程中多数据源采集转换的方法及装置 | |
US20130046529A1 (en) | Method and System for Classification of Clinical Information | |
CN110136837B (zh) | 一种医疗数据处理平台 | |
CN112151170A (zh) | 用于计算用作医疗决策支持的医疗建议的分数的方法 | |
CN110119395B (zh) | 大数据治理中基于元数据实现数据标准与数据质量关联处理的方法 | |
CN111341455A (zh) | 临床试验一体化云平台管理***、方法及存储介质 | |
Takecian et al. | Methodological guidelines for reducing the complexity of data warehouse development for transactional blood bank systems | |
Liu et al. | Controlled vocabularies in OODBs: Modeling issues and implementation | |
WO2022141925A1 (zh) | 一种智能医学服务***、方法及存储介质 | |
Ott et al. | Expressing patient selection criteria based on HL7 V3 templates within the open-source tool ART-DECOR | |
Iglesias et al. | Empowering the SDM-RDFizer tool for scaling up to complex knowledge graph creation pipelines 1 | |
CN112735571A (zh) | 一种医疗健康数据上传管理平台 | |
CN114049925A (zh) | 临床试验开发计划生成方法、***和设备 | |
CN114741459A (zh) | 基于人工智能的数据查询方法、装置、电子设备及介质 | |
Milward | Model Driven Data Management in Healthcare. | |
KR102616442B1 (ko) | 치료영역 별 임상시험 데이터의 표준화 처리 시스템 | |
Diesch et al. | In search for methods to support electronic patient recruitment in a multi-ICU clinical trial | |
Arias | The benefits of graph databases for the computation of clinical quality measures | |
Małysiak-Mrozek et al. | Incorporating fuzzy logic in object-relational mapping layer for flexible medical screenings | |
CN117540343B (zh) | 一种数据融合方法与*** | |
Romanchikova et al. | A framework for user-configurable data quality assurance of electronic patient records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210610 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220608 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7093593 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |