JP7074307B2 - 汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム - Google Patents

汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム Download PDF

Info

Publication number
JP7074307B2
JP7074307B2 JP2021533317A JP2021533317A JP7074307B2 JP 7074307 B2 JP7074307 B2 JP 7074307B2 JP 2021533317 A JP2021533317 A JP 2021533317A JP 2021533317 A JP2021533317 A JP 2021533317A JP 7074307 B2 JP7074307 B2 JP 7074307B2
Authority
JP
Japan
Prior art keywords
mapping
data
data structure
database
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021533317A
Other languages
English (en)
Other versions
JP2022508348A (ja
Inventor
▲勁▼松 李
雨 田
前呈 叶
▲執▼▲暁▼ 王
▲偉▼国 ▲陳▼
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2022508348A publication Critical patent/JP2022508348A/ja
Application granted granted Critical
Publication of JP7074307B2 publication Critical patent/JP7074307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データ構造の標準化領域に関し、特に汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムに関する。
国内の情報化レベルの向上に伴い、益々多くの病院は、自分の病院情報システム(HIS)及び電子カルテシステム(EMR)、映像収集及び伝送システム(PACS)、実験室検査情報システム(LIS)を含む各種の臨床業務情報システムが構築された。多くの情報化程度の高い病院は、さらに、臨床データセンタ(CDR)を設立し、病院全体の業務データの集中化を実現し、病院管理、患者サービス及び臨床科学研究に利便性を提供する。しかし、異なる病院の間に採用された医療情報システムに大きな差異があるため、病院内のデータ構造の異質性が大きく、各病院間のデータ共有を実現することができず、マルチセンタに基づく臨床科学研究は展開しにくい。そのため、データ構造の標準化方法を必要とし、異なる病院の医療データを同一の汎用データモデルにマッピングする。
従来の技術案『CN201410605173-異種システムのデータのマッピング・テンプレートに基づく医療データ収集システム及び方法』は、技術者が医療データソースにアクセスし、データソースにおけるデータ構造を記録し、標準データ構造を参照し、データ構造のマッピングテンプレートを作成又は多重化し、データ構造のマッピングタスクを実行する。テンプレートの作成プロセスは、目標テーブルの構造を、業務関連関係を有する複数のフィールドに分割し、各フィールドごとにデータ収集SQLスクリプトを生成し、収集合併SQLスクリプトを作成して、各フィールドを組み合わせれば、目標データ構造を得る。当該方法のポイントは、データ収集テンプレートの制約を利用してデータの正規化収集を実現することである。従来技術の欠点をまとめると、以下の通りである。
1.データ構造のマッピング処理は、データベースに対して頻繁に多くの検索を行う必要があり、従来の技術案は、直接ソースデータベースを操作するため、ソースサーバの動作負荷を大きくし、正常な業務活動に影響を与える。
2.医療データは、それ自体の固有の専門性及び複雑性を有する。情報技術者だけでは、単独でマッピング関係の設計作業を完了させることができず、医療背景を備える非技術者の協力が必要である。従来のマッピング関係の設計手段は、直観的ではなく、非技術者に不便であり、技術者と非技術者との双方の良好なコミュニケーションと協力に役立たない。
3.医療データの蓄積量が大きく、データ構造のマッピング性能に対する要求が高く、標的的にデータ構造のマッピングスクリプトを最適化する必要がある。従来の手段は、技術者が手動でソースデータベースを照会し、データ分布状況を把握しなければならず、操作が煩雑である。
4.従来の技術案は、増分更新方案を提供しておらず、或いは、増分更新機能を提供するが、更新時に全てのデータに対してデータ構造のマッピング処理を行う必要があり、効率が低下する。
本発明は、従来技術の欠陥に鑑みて、汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムを提供することを目的とする。
本発明の目的は、以下の技術案により達成される。汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムであって、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットとを含み、
前記ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、前記キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
前記キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、
前記目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
前記データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
前記データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報レポートを返信し、
前記マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、前記マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
前記マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、前記データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、前記マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースから抽出し、データ構造のマッピングを行って目標データベースに導入し、
前記品質制御ユニットは、異常処理モジュールを含み、前記異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
前記増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、前記増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、前記増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する。
さらに、前記データ接続管理モジュールが、データベースへのアクセスをサポートすることは、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報基づき、データベースに接続する。
さらに、前記データ構造走査モジュールにおいて、前記データ構造情報は、テーブル名と、フィールド名と、フィールドタイプとを含み、前記フィールド統計情報は、フィールドの行数と、フィールドの最大長さと、フィールドの値の範囲と、フィールドの各値の頻度及び割合とを含み、データ構造情報は、構造マッピング関係の確立をサポートし、フィールド統計情報は、マッピング性能の最適化をサポートし、当該モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにする。
さらに、前記マッピング関係生成及び設計モジュールは、走査されたソースデータベース及び目標データベースのデータ構造を取得した後、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、前記マッピング関係生成及び設計モジュールは、テキストコメント及び設計文書の導出をサポートする。
さらに、前記マッピングコード生成及び修正モジュールは、ユーザの確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存するとともに、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する。
さらに、前記データキャッシュモジュールが確立したキャッシュ層は、ソースデータ構造に変更時間フィールドを追加することで、それぞれのデータの最新の変更時間を記録し、前記マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される。
さらに、前記異常処理モジュールは、データ構造のマッピング関係に基づきデータを抽出した際に、「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、これらのデータの構造マッピングを拒否し、これらのエラーをログに記録し、ユーザが確認して削除又はクリーニング処理するために、エラーデータを一時的なテーブルに記録する。
さらに、前記増分キャッシュモジュールは、CDC技術によってソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更時間を記録する。
さらに、前記増分マッピングモジュールは、ログにおける最新のマッピング操作時間とキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う。
さらに、前記品質制御ユニットは、品質評価モジュールをさらに含み、前記品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了した後、今回のデータ構造のマッピング処理に対する品質評価報告を生成する。
本発明の有益な効果は、以下の通りであり、本発明は、医療データ構造のマッピング関係設計フローを改良し、情報技術者と医療従事者との協同作業に有利であり、作業効率を向上させる。詳細は、以下の通りである。
1.データ構造のマッピングに必要なデータは、ソースデータベースからキャッシュデータベースに移行してキャッシュ層が確立されることで、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、キャッシュ層においてデータ構造のマッピング変換操作を行い、結果を目標データベースに保存する。
2.複数種類のデータベースに対する自動走査をサポートし、データベース内におけるデータ構造情報及びフィールド統計情報レポートを返信し、データ構造のマッピング設計及び性能の最適化に根拠を提供するだけでなく、後続のマッピングさぎょの効率及び正確性を大きく向上させることができる。
3.可視化されたデータ構造のマッピング関係設計ツールを提供し、データ構造のマッピング関係を直観的に表現することができ、情報技術者と医療従事者とのコミュニケーション及び協同作業が便利になり、最終的なデータ構造のマッピング関係を修正して確定し、システムによって記録することができる。
4.確定されたデータ構造のマッピング関係について、上述した可視化データ構造のマッピング関係の設計に基づき自動化データ構造のマッピングスクリプトを生成することができ、ユーザは、スクリプトを修正してスクリプトの正確性を確保することができる。対応するソース構造及び目標構造が続いて増分更新されるとき、上記データ構造のマッピングスクリプトに対する多重化を実現することができる。ソース構造又は目標構造が変わると、旧データ構造のマッピング関係に基づきデータ構造のマッピング関係の記録を修正して更新する。
5.完全に具体的に実行可能なデータ構造のマッピングフロー及びメカニズムを確立することで、データ構造のマッピングの前後の科学性と完全性を保証する。データ構造のマッピングのログ記録を作成し、異常処理メカニズムを改善する。
システムのブロック図である。 データの流れの経路である。 マッピング関係の可視化の例示である。 増分更新フローとデータの流れの経路である。
以下、図面及び具体的な実施例を参照しながら本発明をさらに詳しく説明する。
図1に示すように、本発明は、汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムを提供し、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットを含み、
ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、HIS、LIS、PACS、EMRシステムのデータベースを含み、キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、当該医療データセンタの正常な業務に影響を及ぼすことを回避し、
目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理(ロード、変更、記憶)し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報レポートを返信し、
マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースを抽出し、データ構造のマッピングを行って目標データベースに導入し、
品質制御ユニットは、異常処理モジュールを含み、異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する。
データ流れの経路は、図2に示すように、初回のデータ構造のマッピング時に、まず、データ接続管理モジュールにより、ソースデータベースをキャッシュデータベースにバックアップし、データ構造走査モジュールにより、ソースデータベース及び目標データベースのデータ構造を走査し、そして、マッピング関係生成及び設計モジュールにより、初期マッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、マッピングスクリプトを生成し、ユーザがマッピング処理を確認した後、マッピング処理モジュールは、データをキャッシュデータベースから抽出し、構造マッピングを行って目標データベースに導入し、同時に処理過程での異常は、異常処理モジュールのログに記録され、マッピング処理が完了後、今回のデータ構造のマッピング操作に対する品質評価報告が生成される。
それぞれのモジュールの具体的な実現形態は、以下の通りである。
一.データ接続管理モジュール
キャッシュデータベースと目標データベースは、物理的に同一のデータベースシステムであってもよい。実現方式は、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報に基づきデータベースに接続することを含むが、これに限定されない。
二.データ構造走査モジュール
データ構造走査モジュールにおいて、データ構造情報は、テーブル名、フィールド名及びフィールドタイプを含み、フィールド統計情報は、フィールドの行数、フィールドの最大長さ、フィールドの値の範囲、フィールド各値の頻度及び割合を含むが、これらに限定されない。データ構造情報は、構造マッピング関係を確立することをサポートし、フィールド統計情報は、マッピング性能の最適化をサポートする。当該モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにし、表1、表2に示す通りである。データ構造走査モジュールは、操作者がデータ構造及びデータ分布を理解することに役立ち、作業効率を向上させる。
データ走査のレポートの例示
Figure 0007074307000001
フィールド統計表の例示
Figure 0007074307000002
三.マッピング関係生成及び設計モジュール
走査後のソースデータベース及び目標データベースのデータ構造を得ると、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、前記可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、図3に示す通りである。前記マッピング関係生成及び設計モジュールは、追跡のために、テキストコメント及び設計文書の導出をサポートする。マッピング関係生成及び設計モジュールは、技術者と非技術者とのコミュニケーションのために、データ構造のマッピング関係を直観的に表現する。複数バージョンのデータ構造のマッピングのドキュメントの導出をサポートし、データ構造のマッピング関係の履歴を追跡することができる。
四.マッピングコード生成及び修正モジュール
ユーザが確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存し、作業量を減少させ、コードをより正規化し、また、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する。マッピングコード生成及び修正モジュールは、データ構造のマッピング処理を半自動化し、作業効率を向上させる。
五.データキャッシュモジュール
データキャッシュモジュールの確立したキャッシュ層は、ソースデータ構造に、変更時間フィールドを追加することで、各データの最新の変更時間を記録する。
六.マッピング処理モジュール
マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される。
七.異常処理モジュール
データ構造のマッピング関係に基づき、データを抽出した際に「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、表3に示すように、ユーザが確認して削除又はクリーニング処理を行うために、これらのデータの構造マッピングを拒否し、これらのエラーをログに記録し、エラーデータを一時的なテーブルに記録する。
エラーデータの記録表の例示
Figure 0007074307000003
八.品質評価モジュール
品質制御ユニットは、さらに、品質評価モジュールを含み、品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了後に、今回のデータ構造のマッピング処理に対しる品質評価報告を生成し、品質評価報告の内容は、表4に示す通りである。
構造マッピングの品質評価報告の例示
Figure 0007074307000004
九.増分キャッシュモジュール
増分キャッシュモジュールは、CDC(CDC:change data capture 変更データキャプチャ、データベースのログからデータ操作及び時間の情報を取得できる)によって、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更(挿入又は更新)時間を記録する。
十.増分マッピングモジュール
増分マッピングモジュールは、ログにおける最新のマッピング操作時間及びキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う。
なお、増分更新は、さらに、以下の案を採用することができる。
a.キャッシュ層における各テーブルにトリガを設け、且つ対応する更新テーブルを作成し、データが変更されるとき、更新テーブルに当該データの唯一の標識及び変更時間(***、更新、削除)を記録する。マッピングの増分更新を実行するとき、更新表から更新の記録を取得し、データ表から、対応するデータを抽出する。
b.マテリアライズドビューを利用して増分更新を実現する。マテリアライズドビューは、ビューに似ているが、物理的記憶を作成する。一部のデータベースは、マテリアライズドビューのソーステーブルに対してマテリアライズドビューログを作成し、データの変化を記録し、それに基づき、増分更新を行う。
以上は本発明の実施例に過ぎず、本発明の保護範囲を限定するものではない。本発明の精神と原則内に、創造的な労働を付しないあらゆる修正、均等置換、改善などは、いずれも本発明の保護範囲に含まれる。

Claims (10)

  1. 汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムであって、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットとを含み、
    前記ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、前記キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
    前記キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、
    前記目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
    各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
    前記データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
    前記データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報をまとめて得られたレポートを返信し、
    前記マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、前記マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
    前記マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、前記データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離することで、正常な業務に影響を及ぼすことを回避し、前記マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースから抽出し、データ構造のマッピングを行って目標データベースに導入し、
    前記品質制御ユニットは、異常処理モジュールを含み、前記異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
    前記増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、前記増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、前記増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する
    ことを特徴とする汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  2. 前記データ接続管理モジュールがデータベースへのアクセスをサポートすることは、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報基づき、データベースに接続することを含む
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  3. 前記データ構造走査モジュールにおいて、前記データ構造情報は、テーブル名と、フィールド名と、フィールドタイプとを含み、前記フィールド統計情報は、フィールドの行数と、フィールドの最大長さと、フィールドの値の範囲と、フィールドの各値の頻度及び割合とを含み、データ構造情報は、構造マッピング関係の確立をサポートし、フィールド統計情報は、マッピング性能の最適化をサポートし、当該データ構造走査モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにする
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  4. 前記マッピング関係生成及び設計モジュールは、走査されたソースデータベース及び目標データベースのデータ構造を取得した後、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、前記マッピング関係生成及び設計モジュールは、テキストコメント及び設計文書の導出をサポートする
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  5. 前記マッピングコード生成及び修正モジュールは、ユーザの確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存するとともに、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  6. 前記データキャッシュモジュールが確立したキャッシュ層は、ソースデータ構造に変更時間フィールドを追加することで、それぞれのデータの最新の変更時間を記録し、前記マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  7. 前記異常処理モジュールは、データ構造のマッピング関係に基づきデータを抽出した際に、「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、これらのエラーを有するデータ構造のマッピングを拒否し、これらのエラーをログに記録し、ユーザが確認して削除又はクリーニング処理するために、エラーデータを一時的なテーブルに記録する
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  8. 前記増分キャッシュモジュールは、CDC技術によってソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更時間を記録する
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  9. 前記増分マッピングモジュールは、ログにおける最新のマッピング操作時間とキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
  10. 前記品質制御ユニットは、品質評価モジュールをさらに含み、前記品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了した後、今回のデータ構造のマッピング処理に対する品質評価報告を生成する
    ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
JP2021533317A 2019-07-12 2020-04-07 汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム Active JP7074307B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910629812.5A CN110347662B (zh) 2019-07-12 2019-07-12 一种基于通用数据模型的多中心医疗数据结构标准化***
CN201910629812.5 2019-07-12
PCT/CN2020/083585 WO2020233255A1 (zh) 2019-07-12 2020-04-07 一种基于通用数据模型的多中心医疗数据结构标准化***

Publications (2)

Publication Number Publication Date
JP2022508348A JP2022508348A (ja) 2022-01-19
JP7074307B2 true JP7074307B2 (ja) 2022-05-24

Family

ID=68175149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021533317A Active JP7074307B2 (ja) 2019-07-12 2020-04-07 汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム

Country Status (3)

Country Link
JP (1) JP7074307B2 (ja)
CN (1) CN110347662B (ja)
WO (1) WO2020233255A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347662B (zh) * 2019-07-12 2021-08-03 之江实验室 一种基于通用数据模型的多中心医疗数据结构标准化***
CN111008028B (zh) * 2019-11-22 2022-07-01 杭州数式网络科技有限公司 一种软件升级方法、设备和存储介质
CN111008189B (zh) * 2019-11-26 2023-08-25 浙江电子口岸有限公司 一种动态数据模型构建方法
CN111340636B (zh) * 2020-02-27 2022-11-04 平安医疗健康管理股份有限公司 数据有效性检测方法、装置、计算机设备和存储介质
CN111367987A (zh) * 2020-03-31 2020-07-03 西安震有信通科技有限公司 适应多种数据库类型的数据导入方法、***及装置
CN112102910A (zh) * 2020-09-22 2020-12-18 零氪科技(北京)有限公司 一种用于私有化数据对接数据自动校验的方法和装置
CN112162992A (zh) * 2020-10-12 2021-01-01 浪潮软件集团有限公司 一种高效的数据库更新***及方法
CN112328574A (zh) * 2020-11-03 2021-02-05 上海许继电气有限公司 一种继电保护故障信息主站数据迁移方法及装置
CN112328576A (zh) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 一种基于多数据源的通用数据模型的表示方法
CN112559491A (zh) * 2020-12-17 2021-03-26 山东健康医疗大数据有限公司 基于医疗行业内数据模型适配管理实现方法及***
CN112835911B (zh) * 2021-03-10 2022-12-02 四川大学华西医院 一种适用于医疗信息平台的主数据管理***
CN113176876B (zh) * 2021-04-23 2023-08-11 网易(杭州)网络有限公司 数据读写的方法、装置和电子设备
CN113539505A (zh) * 2021-07-03 2021-10-22 深圳市裕辰医疗科技有限公司 血液透析质量控制结果的计算***及其计算方法
CN114385727B (zh) * 2021-12-13 2024-04-30 中煤科工集团信息技术有限公司 一种关于不定期新增表的多表数据汇总方法及计算机设备
CN114218195A (zh) * 2021-12-17 2022-03-22 东软汉枫医疗科技有限公司 一种医疗物联网元宇宙底层数据模型结构
CN114265875B (zh) * 2022-03-03 2022-07-22 深圳钛铂数据有限公司 一种基于流数据的实时建宽表的方法
CN115050479B (zh) * 2022-04-12 2023-08-04 江南大学附属医院 多中心研究的数据质量评价方法、***及设备
CN115905455B (zh) * 2022-12-31 2023-09-29 北京和兴创联健康科技有限公司 一种基于自动探测技术规范化医院数据库的方法
CN116244374B (zh) * 2023-01-09 2024-04-19 北京百度网讯科技有限公司 一种数据处理方法、装置、设备及存储介质
CN116386799B (zh) * 2023-06-05 2023-08-18 数据空间研究院 一种医疗数据采集与标准转换方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010573A (zh) 2017-11-24 2018-05-08 苏州市环亚数据技术有限公司 一种医院数据融合***、方法、电子设备及存储介质
CN109920522A (zh) 2018-11-30 2019-06-21 广州百家医道健康管理股份有限公司 一种居民健康管理医疗大数据平台

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2693391A1 (en) * 2012-08-02 2014-02-05 Amadeus s.a.s. Dynamic and hierarchical generic data mapping for traveler profile publication
CN106997421B (zh) * 2016-01-25 2020-07-03 清华大学 个性化医疗信息采集和健康监测的智能***和方法
US10397331B2 (en) * 2016-01-29 2019-08-27 General Electric Company Development platform for industrial internet applications
CN105956409A (zh) * 2016-05-27 2016-09-21 上海道拓医药科技股份有限公司 智能医疗设备实时数据管理方法及***
US20190095518A1 (en) * 2017-09-27 2019-03-28 Johnson Controls Technology Company Web services for smart entity creation and maintenance using time series data
CN107368588B (zh) * 2017-07-24 2020-09-01 人教数字出版有限公司 一种异构资源同构化方法及装置
US10255199B1 (en) * 2017-09-22 2019-04-09 Intel Corporation Evicting clean secure pages without encryption
CN108256026A (zh) * 2018-01-10 2018-07-06 圣泓工业设计创意有限公司 一种管理传统建筑特征元素的数据库***
CN109034544A (zh) * 2018-06-29 2018-12-18 广东新禾道信息科技有限公司 国土资源数据管理平台
CN109378053B (zh) * 2018-11-30 2021-07-06 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109979606B (zh) * 2019-01-07 2020-06-23 北京云度互联科技有限公司 一种基于容器化构建微服务化医疗影像云及云胶片的方法
CN109994217B (zh) * 2019-03-08 2021-08-06 视联动力信息技术股份有限公司 一种查看病理文件的方法和装置
CN110347662B (zh) * 2019-07-12 2021-08-03 之江实验室 一种基于通用数据模型的多中心医疗数据结构标准化***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010573A (zh) 2017-11-24 2018-05-08 苏州市环亚数据技术有限公司 一种医院数据融合***、方法、电子设备及存储介质
CN109920522A (zh) 2018-11-30 2019-06-21 广州百家医道健康管理股份有限公司 一种居民健康管理医疗大数据平台

Also Published As

Publication number Publication date
WO2020233255A1 (zh) 2020-11-26
CN110347662A (zh) 2019-10-18
CN110347662B (zh) 2021-08-03
JP2022508348A (ja) 2022-01-19

Similar Documents

Publication Publication Date Title
JP7074307B2 (ja) 汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム
US11341155B2 (en) Mapping instances of a dataset within a data management system
US7690000B2 (en) Metadata journal for information technology systems
CN105046328B (zh) 一种三维可视化桥梁病害信息采集管理***及方法
EP2909748B1 (en) Data lineage system
CN111611458B (zh) 大数据治理中基于元数据和数据分析技术实现***数据架构梳理的方法
CN101739390B (zh) 基于技术设计文档的数据转换
CN102081661A (zh) 基于xml的异构关系型数据库的数据集成方法和***
US20060288014A1 (en) Method and software for mobile data collection having managed workflow
EP1898328A2 (en) An interface between clinical and research information systems
JP2014048673A (ja) ワークフロー生成サーバ、及び方法
CN102457475A (zh) 网络安全数据集成与转换***
JP6328768B2 (ja) メタデータ自動化システム
CN113010208B (zh) 一种版本信息的生成方法、装置、设备及存储介质
CN110889013A (zh) 一种基于xml的数据关联方法、装置、服务器及存储介质
US7844601B2 (en) Quality of service feedback for technology-neutral data reporting
CN111125045B (zh) 一种轻量级etl处理平台
CN112735571A (zh) 一种医疗健康数据上传管理平台
US11256600B2 (en) Log analysis application
CN113438248B (zh) 一种便于主站网络ip地址自查管理***
CN112019364B (zh) 信息管理方法及装置
CN113672626B (zh) 一种数据结构变更方法、装置及电子设备
CN111143406A (zh) 数据库数据比对方法和比对***
CN113674115B (zh) 一种基于数据治理技术的高校数据管理辅助***及方法
CN117951120B (zh) 一种CloudBeaver数据库管理***集成到云平台的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210610

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220429

R150 Certificate of patent or registration of utility model

Ref document number: 7074307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150