JP7074307B2 - Multi-center medical data structure standardization system based on generic data model - Google Patents

Multi-center medical data structure standardization system based on generic data model Download PDF

Info

Publication number
JP7074307B2
JP7074307B2 JP2021533317A JP2021533317A JP7074307B2 JP 7074307 B2 JP7074307 B2 JP 7074307B2 JP 2021533317 A JP2021533317 A JP 2021533317A JP 2021533317 A JP2021533317 A JP 2021533317A JP 7074307 B2 JP7074307 B2 JP 7074307B2
Authority
JP
Japan
Prior art keywords
mapping
data
data structure
database
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021533317A
Other languages
Japanese (ja)
Other versions
JP2022508348A (en
Inventor
▲勁▼松 李
雨 田
前呈 叶
▲執▼▲暁▼ 王
▲偉▼国 ▲陳▼
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2022508348A publication Critical patent/JP2022508348A/en
Application granted granted Critical
Publication of JP7074307B2 publication Critical patent/JP7074307B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データ構造の標準化領域に関し、特に汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムに関する。 The present invention relates to a data structure standardization domain, and particularly to a multicenter medical data structure standardization system based on a general-purpose data model.

国内の情報化レベルの向上に伴い、益々多くの病院は、自分の病院情報システム(HIS)及び電子カルテシステム(EMR)、映像収集及び伝送システム(PACS)、実験室検査情報システム(LIS)を含む各種の臨床業務情報システムが構築された。多くの情報化程度の高い病院は、さらに、臨床データセンタ(CDR)を設立し、病院全体の業務データの集中化を実現し、病院管理、患者サービス及び臨床科学研究に利便性を提供する。しかし、異なる病院の間に採用された医療情報システムに大きな差異があるため、病院内のデータ構造の異質性が大きく、各病院間のデータ共有を実現することができず、マルチセンタに基づく臨床科学研究は展開しにくい。そのため、データ構造の標準化方法を必要とし、異なる病院の医療データを同一の汎用データモデルにマッピングする。 With the increasing level of computerization in Japan, more and more hospitals are using their own hospital information system (HIS) and electronic medical record system (EMR), video collection and transmission system (PACS), and laboratory laboratory information system (LIS). Various clinical business information systems including are constructed. Many highly informative hospitals will also establish clinical data centers (CDRs) to centralize operational data across hospitals and provide convenience for hospital management, patient services and clinical scientific research. However, due to the large differences in the medical information systems adopted between different hospitals, the data structure within the hospitals is highly heterogeneous, and data sharing between hospitals cannot be realized. Scientific research is difficult to develop. Therefore, a standardization method of data structure is required, and medical data of different hospitals is mapped to the same general-purpose data model.

従来の技術案『CN201410605173-異種システムのデータのマッピング・テンプレートに基づく医療データ収集システム及び方法』は、技術者が医療データソースにアクセスし、データソースにおけるデータ構造を記録し、標準データ構造を参照し、データ構造のマッピングテンプレートを作成又は多重化し、データ構造のマッピングタスクを実行する。テンプレートの作成プロセスは、目標テーブルの構造を、業務関連関係を有する複数のフィールドに分割し、各フィールドごとにデータ収集SQLスクリプトを生成し、収集合併SQLスクリプトを作成して、各フィールドを組み合わせれば、目標データ構造を得る。当該方法のポイントは、データ収集テンプレートの制約を利用してデータの正規化収集を実現することである。従来技術の欠点をまとめると、以下の通りである。 In the conventional technical proposal "CN201410605173-Medical data collection system and method based on data mapping template of heterogeneous system", a technician accesses a medical data source, records the data structure in the data source, and refers to the standard data structure. Then create or multiplex the data structure mapping template and perform the data structure mapping task. The template creation process divides the structure of the target table into multiple fields with business-related relationships, generates a data collection SQL script for each field, creates a collection merged SQL script, and combines each field. If you get the target data structure. The point of this method is to realize normalized collection of data by utilizing the constraints of the data collection template. The drawbacks of the prior art are summarized below.

1.データ構造のマッピング処理は、データベースに対して頻繁に多くの検索を行う必要があり、従来の技術案は、直接ソースデータベースを操作するため、ソースサーバの動作負荷を大きくし、正常な業務活動に影響を与える。 1. 1. The data structure mapping process requires frequent and many searches to the database, and the conventional technical proposal directly operates the source database, which increases the operational load of the source server and enables normal business activities. Affect.

2.医療データは、それ自体の固有の専門性及び複雑性を有する。情報技術者だけでは、単独でマッピング関係の設計作業を完了させることができず、医療背景を備える非技術者の協力が必要である。従来のマッピング関係の設計手段は、直観的ではなく、非技術者に不便であり、技術者と非技術者との双方の良好なコミュニケーションと協力に役立たない。 2. Medical data has its own unique expertise and complexity. Information engineers alone cannot complete mapping-related design work on their own, and the cooperation of non-engineers with a medical background is required. Traditional mapping-related design tools are not intuitive, inconvenient for non-engineers, and do not help good communication and cooperation between engineers and non-engineers.

3.医療データの蓄積量が大きく、データ構造のマッピング性能に対する要求が高く、標的的にデータ構造のマッピングスクリプトを最適化する必要がある。従来の手段は、技術者が手動でソースデータベースを照会し、データ分布状況を把握しなければならず、操作が煩雑である。 3. The amount of medical data accumulated is large, and the demand for data structure mapping performance is high, so it is necessary to optimize the data structure mapping script in a targeted manner. In the conventional means, the technician must manually inquire the source database to grasp the data distribution status, which is complicated to operate.

4.従来の技術案は、増分更新方案を提供しておらず、或いは、増分更新機能を提供するが、更新時に全てのデータに対してデータ構造のマッピング処理を行う必要があり、効率が低下する。 4. The conventional technique does not provide an incremental update plan or provides an incremental update function, but it is necessary to perform data structure mapping processing for all data at the time of update, which reduces efficiency. do.

本発明は、従来技術の欠陥に鑑みて、汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムを提供することを目的とする。 It is an object of the present invention to provide a standardization system for a multi-center medical data structure based on a general-purpose data model in view of defects in the prior art.

本発明の目的は、以下の技術案により達成される。汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムであって、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットとを含み、
前記ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、前記キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
前記キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、
前記目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
前記データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
前記データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報レポートを返信し、
前記マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、前記マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
前記マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、前記データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、前記マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースから抽出し、データ構造のマッピングを行って目標データベースに導入し、
前記品質制御ユニットは、異常処理モジュールを含み、前記異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
前記増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、前記増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、前記増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する。
The object of the present invention is achieved by the following technical proposals. It is a standardization system of multi-center medical data structure based on a general-purpose data model, and the system includes a source database, a cache database, a target database, a data connection management module, a data structure scanning module, and a mapping construction unit. Includes a mapping execution unit, an incremental update unit, and a quality control unit.
The source database is a database in which each medical data center executes a medical business flow, and the cache database and the target database are both located on a dedicated front server of each medical data center.
The cache database stores the original data of the source database of the medical data center, and the cache layer isolates the data structure mapping process from the source database.
The target database stores medical data that matches the general-purpose data model data structure obtained by mapping the data structure by the data structure mapping relationship and the cache data to which the medical data center belongs.
Each medical data center goal database is connected to a cloud server to enable collaborative analysis between multi-center medical data.
The data connection management module manages the information required to access the database, supports access to the source database, cache database and target database, and supports access to the source database, cache database, and target database.
The data structure scanning module scans the data structures of the source database and the target database, returns the data structure information and the field statistical information report, and returns.
The mapping construction unit includes a mapping relation generation and design module and a mapping code generation and modification module. The mapping relation generation and design module generates a mapping relation of an initial data structure, and a user can generate a mapping relation of a data structure. The visualization screen is displayed so that the confirmation can be confirmed, and after the confirmation is completed, the mapping code generation and modification module generates the mapping script of the data structure.
The mapping execution unit includes a data cache module and a mapping processing module, and the data cache module migrates data necessary for mapping a data structure from a source database to a cache database to establish a cache layer and establish a data structure. The mapping process of is isolated from the source database to avoid affecting normal business, and the mapping process module caches the data after the user confirms the mapping script of the data structure generated by the mapping construction unit. Extracted from, mapped the data structure and introduced into the target database,
The quality control unit includes an error handling module, and the error handling module records abnormality information in the processing process of the mapping processing module.
The incremental update unit includes an incremental cache module and an incremental mapping module, the incremental cache module captures changes in data in the source database, updates the incremental data in the cache layer, and the incremental mapping module updates incrementally. Data structure standardization mapping is performed for the data, the data is extracted from the cache database, the data structure mapping is executed, and the data is introduced into the target database.

さらに、前記データ接続管理モジュールが、データベースへのアクセスをサポートすることは、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報基づき、データベースに接続する。 In addition, the data connection management module supports access to the database by reading the connection information profile, loading the corresponding database connection driver according to the database type configuration information, and based on the ip, account and password information. , Connect to the database.

さらに、前記データ構造走査モジュールにおいて、前記データ構造情報は、テーブル名と、フィールド名と、フィールドタイプとを含み、前記フィールド統計情報は、フィールドの行数と、フィールドの最大長さと、フィールドの値の範囲と、フィールドの各値の頻度及び割合とを含み、データ構造情報は、構造マッピング関係の確立をサポートし、フィールド統計情報は、マッピング性能の最適化をサポートし、当該モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにする。 Further, in the data structure scanning module, the data structure information includes a table name, a field name, and a field type, and the field statistical information includes the number of rows of the field, the maximum length of the field, and the value of the field. The data structure information supports the establishment of structural mapping relationships, the field statistics support the optimization of mapping performance, and the module is structured. Query the tables one by one using the query language and collect the query results into a report.

さらに、前記マッピング関係生成及び設計モジュールは、走査されたソースデータベース及び目標データベースのデータ構造を取得した後、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、前記マッピング関係生成及び設計モジュールは、テキストコメント及び設計文書の導出をサポートする。 Further, the mapping relation generation and design module acquires the data structures of the scanned source database and the target database, and then performs ambiguous matching with the field names based on the preset synonym dictionary to obtain the initial data structure. A visualization screen is displayed so that the user can see the mapping relationship of the data structure by generating the mapping relationship, and the visualization is specifically performed between the tables using directional graphics. Reflecting field-to-field one-to-one relationships, one-to-many relationships, and many-to-one relationships, the mapping relationship generation and design modules support text comments and derivation of design documents.

さらに、前記マッピングコード生成及び修正モジュールは、ユーザの確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存するとともに、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する。 Further, the mapping code generation / modification module generates and saves a data structure mapping script according to a code frame based on the data structure mapping relationship confirmed by the user, and has the authority to change the data structure mapping script to the user. I will provide a.

さらに、前記データキャッシュモジュールが確立したキャッシュ層は、ソースデータ構造に変更時間フィールドを追加することで、それぞれのデータの最新の変更時間を記録し、前記マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される。 Further, the cache layer established by the data cache module records the latest change time of each data by adding a change time field to the source data structure, and the mapping processing module puts the mapping script in the cache layer. Apply, perform standardized mapping of the data structure, and the mapping result of the data structure is saved in the target database and the latest mapping operation time is recorded in the log.

さらに、前記異常処理モジュールは、データ構造のマッピング関係に基づきデータを抽出した際に、「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、これらのデータの構造マッピングを拒否し、これらのエラーをログに記録し、ユーザが確認して削除又はクリーニング処理するために、エラーデータを一時的なテーブルに記録する。 Further, when the anomaly processing module extracts data based on the mapping relationship of the data structure, an error including "a null value exists in the not null field" and "the length of the data is out of range" occurs. If so, it rejects the structural mapping of these data, logs these errors, and logs the error data in a temporary table for the user to review and delete or clean.

さらに、前記増分キャッシュモジュールは、CDC技術によってソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更時間を記録する。 Further, the incremental cache module captures changes in data in the source database by CDC technology, updates the incremental data in the cache layer, and records the change time in the change time field.

さらに、前記増分マッピングモジュールは、ログにおける最新のマッピング操作時間とキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う。 Further, the incremental mapping module compares the latest mapping operation time in the log with the data change time in the cache layer, maps to the data whose change time is later than the latest mapping operation time, and first, the cache database. If it is the same as the mapping relationship of the existing data structure existing in the cache database, the data structure mapping process and quality control are performed, and the mapping relationship of the existing data structure is matched. If not, after updating the mapping relationship of the data structure, the mapping process of the data structure and the quality control are performed.

さらに、前記品質制御ユニットは、品質評価モジュールをさらに含み、前記品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了した後、今回のデータ構造のマッピング処理に対する品質評価報告を生成する。 Further, the quality control unit further includes a quality evaluation module, and the quality evaluation module generates a quality evaluation report for the mapping process of the current data structure after the mapping process of the mapping process module is completed.

本発明の有益な効果は、以下の通りであり、本発明は、医療データ構造のマッピング関係設計フローを改良し、情報技術者と医療従事者との協同作業に有利であり、作業効率を向上させる。詳細は、以下の通りである。 The beneficial effects of the present invention are as follows, and the present invention improves the mapping-related design flow of the medical data structure, is advantageous for the collaborative work between the information engineer and the medical worker, and improves the work efficiency. Let me. The details are as follows.

1.データ構造のマッピングに必要なデータは、ソースデータベースからキャッシュデータベースに移行してキャッシュ層が確立されることで、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、キャッシュ層においてデータ構造のマッピング変換操作を行い、結果を目標データベースに保存する。 1. The data required for data structure mapping is migrated from the source database to the cache database and the cache layer is established, so that the data structure mapping process is isolated from the source database and affects normal operations. Is avoided, the mapping conversion operation of the data structure is performed in the cache layer, and the result is saved in the target database.

2.複数種類のデータベースに対する自動走査をサポートし、データベース内におけるデータ構造情報及びフィールド統計情報レポートを返信し、データ構造のマッピング設計及び性能の最適化に根拠を提供するだけでなく、後続のマッピングさぎょの効率及び正確性を大きく向上させることができる。 2. Supports automatic scanning for multiple types of databases, returns data structure information and field statistics reports in the database, provides a basis for data structure mapping design and performance optimization, as well as subsequent mapping. The efficiency and accuracy of the database can be greatly improved.

3.可視化されたデータ構造のマッピング関係設計ツールを提供し、データ構造のマッピング関係を直観的に表現することができ、情報技術者と医療従事者とのコミュニケーション及び協同作業が便利になり、最終的なデータ構造のマッピング関係を修正して確定し、システムによって記録することができる。 3. It provides a visualization relationship design tool for data structure mapping, and can intuitively express the mapping relationship of data structure, which makes communication and collaborative work between information engineers and medical workers convenient, and finally. Data structure mapping relationships can be modified and finalized and recorded by the system.

4.確定されたデータ構造のマッピング関係について、上述した可視化データ構造のマッピング関係の設計に基づき自動化データ構造のマッピングスクリプトを生成することができ、ユーザは、スクリプトを修正してスクリプトの正確性を確保することができる。対応するソース構造及び目標構造が続いて増分更新されるとき、上記データ構造のマッピングスクリプトに対する多重化を実現することができる。ソース構造又は目標構造が変わると、旧データ構造のマッピング関係に基づきデータ構造のマッピング関係の記録を修正して更新する。 4. For the defined data structure mapping relationship, an automated data structure mapping script can be generated based on the visualization data structure mapping relationship design described above, and the user can modify the script to improve the accuracy of the script. Can be secured. Multiplexing of the data structure to the mapping script can be achieved as the corresponding source and target structures are subsequently updated incrementally. When the source structure or target structure changes, the data structure mapping relationship record is revised and updated based on the old data structure mapping relationship.

5.完全に具体的に実行可能なデータ構造のマッピングフロー及びメカニズムを確立することで、データ構造のマッピングの前後の科学性と完全性を保証する。データ構造のマッピングのログ記録を作成し、異常処理メカニズムを改善する。 5. Ensuring the scientific and completeness of data structure mapping before and after data structure mapping by establishing a completely concretely feasible data structure mapping flow and mechanism. Create logging of data structure mappings to improve the exception handling mechanism.

システムのブロック図である。It is a block diagram of a system. データの流れの経路である。It is a data flow path. マッピング関係の可視化の例示である。This is an example of visualization of mapping relations. 増分更新フローとデータの流れの経路である。It is the path of the incremental update flow and the data flow.

以下、図面及び具体的な実施例を参照しながら本発明をさらに詳しく説明する。 Hereinafter, the present invention will be described in more detail with reference to the drawings and specific examples.

図1に示すように、本発明は、汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムを提供し、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットを含み、
ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、HIS、LIS、PACS、EMRシステムのデータベースを含み、キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、当該医療データセンタの正常な業務に影響を及ぼすことを回避し、
目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理(ロード、変更、記憶)し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報レポートを返信し、
マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離し、正常な業務に影響を及ぼすことを回避し、マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースを抽出し、データ構造のマッピングを行って目標データベースに導入し、
品質制御ユニットは、異常処理モジュールを含み、異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する。
As shown in FIG. 1, the present invention provides a standardization system for a multi-center medical data structure based on a generic data model, which includes a source database, a cache database, a target database, a data connection management module, and the like. Includes data structure scanning module, mapping construction unit, mapping execution unit, incremental update unit, quality control unit,
The source database is the database in which each medical data center executes the medical business flow, including the databases of HIS, LIS, PACS, and EMR systems, and the cache database and the target database are all on the dedicated front server of each medical data center. Placed,
The cache database stores the original data of the source database of the medical data center, and the cache layer isolates the data structure mapping process from the source database to avoid affecting the normal operation of the medical data center. death,
The target database stores medical data that matches the general-purpose data model data structure obtained by mapping the data structure using the data structure mapping relationship and cache data of the medical data center to which it belongs.
Each medical data center goal database is connected to a cloud server to enable collaborative analysis between multi-center medical data.
The data connection management module manages (loads, modifies, stores) the information needed to access the database, supports access to the source, cache, and target databases.
The data structure scan module scans the data structures of the source and target databases and returns data structure information and field statistics reports.
The mapping construction unit includes a mapping relation generation and design module and a mapping code generation and modification module, and the mapping relation generation and design module generates the mapping relation of the initial data structure, and the user confirms the mapping relation of the data structure. After the visualization screen is displayed so that it can be confirmed and the confirmation is completed, the mapping code generation and modification module generates the mapping script of the data structure.
The mapping execution unit includes a data cache module and a mapping processing module, and the data cache module migrates the data required for data structure mapping from the source database to the cache database to establish a cache layer and map the data structure. By isolating the process from the source database and avoiding affecting normal business, the mapping process module extracts the data from the cache database after the user checks the mapping script of the data structure generated by the mapping construction unit. , Map the data structure and introduce it to the target database,
The quality control unit includes the error handling module, and the error handling module records the error information in the processing process of the mapping processing module.
The incremental update unit includes an incremental cache module and an incremental mapping module, the incremental cache module captures changes in the data in the source database and updates the incremental data in the cache tier, and the incremental mapping module is the incrementally updated data. The data structure is standardized and mapped, the data is extracted from the cache database, the data structure is mapped, and the data is introduced into the target database.

データ流れの経路は、図2に示すように、初回のデータ構造のマッピング時に、まず、データ接続管理モジュールにより、ソースデータベースをキャッシュデータベースにバックアップし、データ構造走査モジュールにより、ソースデータベース及び目標データベースのデータ構造を走査し、そして、マッピング関係生成及び設計モジュールにより、初期マッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、マッピングスクリプトを生成し、ユーザがマッピング処理を確認した後、マッピング処理モジュールは、データをキャッシュデータベースから抽出し、構造マッピングを行って目標データベースに導入し、同時に処理過程での異常は、異常処理モジュールのログに記録され、マッピング処理が完了後、今回のデータ構造のマッピング操作に対する品質評価報告が生成される。 As shown in FIG. 2, the data flow path is as follows. At the time of initial data structure mapping, the data connection management module first backs up the source database to the cache database, and the data structure scanning module uses the data structure scanning module to connect the source database and target database. Scan the data structure and generate the initial mapping relationship with the mapping relationship generation and design module, display the visualization screen so that the user can check the mapping relationship of the data structure, and after the confirmation is completed, generate the mapping code. And the correction module generates a mapping script, and after the user confirms the mapping process, the mapping process module extracts the data from the cache database, performs structural mapping and introduces it to the target database, and at the same time, an abnormality in the process. Is recorded in the log of the error processing module, and after the mapping processing is completed, a quality evaluation report for the mapping operation of this data structure is generated.

それぞれのモジュールの具体的な実現形態は、以下の通りである。 The specific implementation form of each module is as follows.

一.データ接続管理モジュール
キャッシュデータベースと目標データベースは、物理的に同一のデータベースシステムであってもよい。実現方式は、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報に基づきデータベースに接続することを含むが、これに限定されない。
one. Data connection management module The cache database and the target database may be physically the same database system. Implementation methods include, but are not limited to, reading the connection information profile, loading the corresponding database connection driver according to the database type configuration information, and connecting to the database based on ip, account, and password information.

二.データ構造走査モジュール
データ構造走査モジュールにおいて、データ構造情報は、テーブル名、フィールド名及びフィールドタイプを含み、フィールド統計情報は、フィールドの行数、フィールドの最大長さ、フィールドの値の範囲、フィールド各値の頻度及び割合を含むが、これらに限定されない。データ構造情報は、構造マッピング関係を確立することをサポートし、フィールド統計情報は、マッピング性能の最適化をサポートする。当該モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにし、表1、表2に示す通りである。データ構造走査モジュールは、操作者がデータ構造及びデータ分布を理解することに役立ち、作業効率を向上させる。
two. Data Structure Scan Module In the data structure scan module, data structure information includes table names, field names and field types, and field statistics include the number of rows in the field, the maximum length of the field, the range of values in the field, and each field. Including, but not limited to, frequency and proportion of values. Data structure information supports establishing structural mapping relationships, and field statistics support optimization of mapping performance. The module queries tables one by one using a structured query language, summarizes the query results into a report, as shown in Tables 1 and 2. The data structure scanning module helps the operator understand the data structure and data distribution and improves work efficiency.

データ走査のレポートの例示

Figure 0007074307000001
Example of data scan report
Figure 0007074307000001

フィールド統計表の例示

Figure 0007074307000002
Example of field statistics table
Figure 0007074307000002

三.マッピング関係生成及び設計モジュール
走査後のソースデータベース及び目標データベースのデータ構造を得ると、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、前記可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、図3に示す通りである。前記マッピング関係生成及び設計モジュールは、追跡のために、テキストコメント及び設計文書の導出をサポートする。マッピング関係生成及び設計モジュールは、技術者と非技術者とのコミュニケーションのために、データ構造のマッピング関係を直観的に表現する。複数バージョンのデータ構造のマッピングのドキュメントの導出をサポートし、データ構造のマッピング関係の履歴を追跡することができる。
three. Mapping relationship generation and design module When the data structures of the source database and target database after scanning are obtained, ambiguous matching is performed for the field names based on the preset synonym dictionary, and the mapping relationship of the initial data structure is generated. A visualization screen is displayed so that the user can check the mapping relationship of the data structure, and the visualization specifically utilizes a directional graphic to be used between the tables and between the fields. It reflects the one-to-one relationship, the one-to-many relationship, and the many-to-one relationship between them, as shown in FIG. The mapping relationship generation and design module supports text comments and derivation of design documents for tracking. The mapping relationship generation and design module intuitively represents the mapping relationship of data structures for communication between engineers and non-engineers. Supports the derivation of documents for multiple versions of data structure mappings and can track the history of data structure mapping relationships.

四.マッピングコード生成及び修正モジュール
ユーザが確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存し、作業量を減少させ、コードをより正規化し、また、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する。マッピングコード生成及び修正モジュールは、データ構造のマッピング処理を半自動化し、作業効率を向上させる。
four. Mapping code generation and modification module Based on the data structure mapping relationship confirmed by the user, the data structure mapping script is generated and saved according to the code frame, the amount of work is reduced, the code is more normalized, and the data is sent to the user. Provides permission to modify the structure mapping script. The mapping code generation and modification module semi-automates the data structure mapping process and improves work efficiency.

五.データキャッシュモジュール
データキャッシュモジュールの確立したキャッシュ層は、ソースデータ構造に、変更時間フィールドを追加することで、各データの最新の変更時間を記録する。
5. Data cache module The established cache layer of the data cache module records the latest modification time of each data by adding a modification time field to the source data structure.

六.マッピング処理モジュール
マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される。
6. Mapping processing module The mapping processing module applies the mapping script to the cache layer, performs standardized mapping of the data structure, the mapping result of the data structure is saved in the target database, and the latest mapping operation time is recorded in the log.

七.異常処理モジュール
データ構造のマッピング関係に基づき、データを抽出した際に「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、表3に示すように、ユーザが確認して削除又はクリーニング処理を行うために、これらのデータの構造マッピングを拒否し、これらのエラーをログに記録し、エラーデータを一時的なテーブルに記録する。
7. Abnormal processing module If an error including "a null value exists in the knot null field" or "the data length is out of range" occurs when extracting data based on the mapping relationship of the data structure, Table 3 As shown in, the user rejects the structural mapping of these data, logs these errors, and logs the error data in a temporary table for confirmation and deletion or cleaning processing.

エラーデータの記録表の例示

Figure 0007074307000003
Example of error data recording table
Figure 0007074307000003

八.品質評価モジュール
品質制御ユニットは、さらに、品質評価モジュールを含み、品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了後に、今回のデータ構造のマッピング処理に対しる品質評価報告を生成し、品質評価報告の内容は、表4に示す通りである。
Eight. Quality evaluation module The quality control unit further includes a quality evaluation module, and the quality evaluation module generates a quality evaluation report for the mapping process of the data structure this time after the mapping process of the mapping process module is completed, and the quality evaluation. The contents of the report are as shown in Table 4.

構造マッピングの品質評価報告の例示

Figure 0007074307000004
Example of quality evaluation report of structural mapping
Figure 0007074307000004

九.増分キャッシュモジュール
増分キャッシュモジュールは、CDC(CDC:change data capture 変更データキャプチャ、データベースのログからデータ操作及び時間の情報を取得できる)によって、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更(挿入又は更新)時間を記録する。
Nine. Incremental cache module The incremental cache module captures changes in data in the source database and captures incremental data in the cache layer by CDC (CDC: change data capture change data capture, data manipulation and time information can be obtained from database logs). Update and record the change (insert or update) time in the change time field.

十.増分マッピングモジュール
増分マッピングモジュールは、ログにおける最新のマッピング操作時間及びキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う。
なお、増分更新は、さらに、以下の案を採用することができる。
a.キャッシュ層における各テーブルにトリガを設け、且つ対応する更新テーブルを作成し、データが変更されるとき、更新テーブルに当該データの唯一の標識及び変更時間(***、更新、削除)を記録する。マッピングの増分更新を実行するとき、更新表から更新の記録を取得し、データ表から、対応するデータを抽出する。
b.マテリアライズドビューを利用して増分更新を実現する。マテリアライズドビューは、ビューに似ているが、物理的記憶を作成する。一部のデータベースは、マテリアライズドビューのソーステーブルに対してマテリアライズドビューログを作成し、データの変化を記録し、それに基づき、増分更新を行う。
10. Incremental mapping module The incremental mapping module compares the latest mapping operation time in the log with the data change time in the cache tier, maps to the data whose change time is slower than the latest mapping operation time, and first the cache database. If it is the same as the mapping relationship of the existing data structure existing in the cache database, the data structure mapping process and quality control are performed, and the mapping relationship of the existing data structure is matched. If not, after updating the mapping relationship of the data structure, the mapping process of the data structure and the quality control are performed.
In addition, the following proposals can be further adopted for the incremental update.
a. A trigger is provided for each table in the cache layer, and a corresponding update table is created, and when data is changed, the only indicator and change time (insertion, update, deletion) of the data are recorded in the update table. When performing an incremental update of the mapping, get a record of the update from the update table and extract the corresponding data from the data table.
b. Achieve incremental updates using materialized views. Materialized views are similar to views, but create physical memory. Some databases create materialized view logs for materialized view source tables, record data changes, and make incremental updates based on them.

以上は本発明の実施例に過ぎず、本発明の保護範囲を限定するものではない。本発明の精神と原則内に、創造的な労働を付しないあらゆる修正、均等置換、改善などは、いずれも本発明の保護範囲に含まれる。
The above is only an embodiment of the present invention and does not limit the scope of protection of the present invention. Any modifications, equal replacements, improvements, etc. that do not involve creative labor within the spirit and principles of the invention are all within the scope of the invention.

Claims (10)

汎用データモデルに基づくマルチセンタ医療データ構造の標準化システムであって、当該システムは、ソースデータベースと、キャッシュデータベースと、目標データベースと、データ接続管理モジュールと、データ構造走査モジュールと、マッピング構築ユニットと、マッピング実行ユニットと、増分更新ユニットと、品質制御ユニットとを含み、
前記ソースデータベースは、各医療データセンタが医療業務フローを実行するデータベースであり、前記キャッシュデータベースと目標データベースは、いずれも各医療データセンタの専用フロントサーバに配置され、
前記キャッシュデータベースは、当該医療データセンタのソースデータベースの元データを記憶し、キャッシュ層としては、データ構造のマッピング処理をソースデータベースと隔離し、
前記目標データベースは、所属する医療データセンタがデータ構造のマッピング関係及びキャッシュデータによってデータ構造のマッピングを行って得られた汎用データモデルデータ構造に合致する医療データを記憶し、
各医療データセンタの目標データベースは、いずれもクラウドサーバに接続され、マルチセンタ医療データの間の協同分析を実現し、
前記データ接続管理モジュールは、データベースへのアクセスに必要な情報を管理し、ソースデータベース、キャッシュデータベース及び目標データベースへのアクセスをサポートし、
前記データ構造走査モジュールは、ソースデータベース及び目標データベースのデータ構造を走査し、データ構造情報及びフィールド統計情報をまとめて得られたレポートを返信し、
前記マッピング構築ユニットは、マッピング関係生成及び設計モジュールと、マッピングコード生成及び修正モジュールとを含み、前記マッピング関係生成及び設計モジュールは、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように可視化画面を表示し、確認が完了した後、マッピングコード生成及び修正モジュールは、データ構造のマッピングスクリプトを生成し、
前記マッピング実行ユニットは、データキャッシュモジュールと、マッピング処理モジュールとを含み、前記データキャッシュモジュールは、データ構造のマッピングに必要なデータをソースデータベースからキャッシュデータベースに移行してキャッシュ層を確立し、データ構造のマッピング処理をソースデータベースと隔離することで、正常な業務に影響を及ぼすことを回避し、前記マッピング処理モジュールは、ユーザがマッピング構築ユニットの生成したデータ構造のマッピングスクリプトを確認した後、データをキャッシュデータベースから抽出し、データ構造のマッピングを行って目標データベースに導入し、
前記品質制御ユニットは、異常処理モジュールを含み、前記異常処理モジュールは、マッピング処理モジュールの処理過程での異常情報を記録し、
前記増分更新ユニットは、増分キャッシュモジュールと、増分マッピングモジュールとを含み、前記増分キャッシュモジュールは、ソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、前記増分マッピングモジュールは、増分更新されたデータに対して、データ構造の標準化マッピングを行い、データをキャッシュデータベースから抽出し、データ構造のマッピングを実行して目標データベースに導入する
ことを特徴とする汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
It is a standardization system of multi-center medical data structure based on a general-purpose data model, and the system includes a source database, a cache database, a target database, a data connection management module, a data structure scanning module, and a mapping construction unit. Includes a mapping execution unit, an incremental update unit, and a quality control unit.
The source database is a database in which each medical data center executes a medical business flow, and the cache database and the target database are both located on a dedicated front server of each medical data center.
The cache database stores the original data of the source database of the medical data center, and the cache layer isolates the data structure mapping process from the source database.
The target database stores medical data that matches the general-purpose data model data structure obtained by mapping the data structure by the data structure mapping relationship and the cache data to which the medical data center belongs.
Each medical data center goal database is connected to a cloud server to enable collaborative analysis between multi-center medical data.
The data connection management module manages the information required to access the database, supports access to the source database, cache database and target database, and supports access to the source database, cache database, and target database.
The data structure scanning module scans the data structures of the source database and the target database, and returns a report obtained by summarizing the data structure information and the field statistical information.
The mapping construction unit includes a mapping relation generation and design module and a mapping code generation and modification module. The mapping relation generation and design module generates a mapping relation of an initial data structure, and a user can generate a mapping relation of a data structure. The visualization screen is displayed so that the confirmation can be confirmed, and after the confirmation is completed, the mapping code generation and modification module generates the mapping script of the data structure.
The mapping execution unit includes a data cache module and a mapping processing module, and the data cache module migrates data necessary for mapping a data structure from a source database to a cache database to establish a cache layer and establish a data structure. By isolating the mapping process of the above from the source database, it is possible to avoid affecting the normal business, and the mapping process module displays the data after the user confirms the mapping script of the data structure generated by the mapping construction unit. Extract from the cache database, map the data structure and introduce it into the target database,
The quality control unit includes an error handling module, and the error handling module records abnormality information in the processing process of the mapping processing module.
The incremental update unit includes an incremental cache module and an incremental mapping module, the incremental cache module captures changes in data in a source database, updates the incremental data in the cache layer, and the incremental mapping module updates incrementally. Multi-center medical data based on a generic data model characterized by standardizing the data structure, extracting the data from the cache database, performing the data structure mapping, and introducing it into the target database. Structural standardization system.
前記データ接続管理モジュールがデータベースへのアクセスをサポートすることは、接続情報プロファイルを読み取り、データベースタイプの設定情報に応じて、対応するデータベース接続ドライバをロードし、ip、アカウント、パスワード情報基づき、データベースに接続することを含む
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The data connection management module supports access to the database by reading the connection information profile, loading the corresponding database connection driver according to the database type configuration information, and based on the ip, account, and password information. A standardization system for a multi-center medical data structure based on the generic data model according to claim 1, wherein the system comprises connecting to.
前記データ構造走査モジュールにおいて、前記データ構造情報は、テーブル名と、フィールド名と、フィールドタイプとを含み、前記フィールド統計情報は、フィールドの行数と、フィールドの最大長さと、フィールドの値の範囲と、フィールドの各値の頻度及び割合とを含み、データ構造情報は、構造マッピング関係の確立をサポートし、フィールド統計情報は、マッピング性能の最適化をサポートし、当該データ構造走査モジュールは、構造化照会言語を用いてテーブルに対して1つずつ照会を行い、照会結果をまとめてレポートにする
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
In the data structure scanning module, the data structure information includes a table name, a field name, and a field type, and the field statistical information includes the number of rows of the field, the maximum length of the field, and the range of values of the field. The data structure information supports the establishment of structural mapping relationships, the field statistics support the optimization of mapping performance, and the data structure scanning module is structured. The standardization system for a multi-center medical data structure based on the general-purpose data model according to claim 1, wherein the table is queried one by one using a categorized inquiry language, and the queried results are collectively reported.
前記マッピング関係生成及び設計モジュールは、走査されたソースデータベース及び目標データベースのデータ構造を取得した後、予め設定された類語辞書に基づき、フィールド名に対して曖昧マッチングを行い、初期データ構造のマッピング関係を生成し、ユーザがデータ構造のマッピング関係を確認できるように、可視化画面を表示し、可視化は、具体的に、指向性が付いたグラフィックを利用して、テーブルとテーブルとの間、フィールドとフィールドとの間の1対1の関係、1対多の関係及び多対1の関係を反映し、前記マッピング関係生成及び設計モジュールは、テキストコメント及び設計文書の導出をサポートする
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
After acquiring the data structures of the scanned source database and target database, the mapping relationship generation and design module performs ambiguous matching with the field names based on the preset synonym dictionary, and the mapping relationship of the initial data structure. Displays a visualization screen so that the user can see the mapping relationships of the data structure, specifically using directional graphics, between tables, fields and Reflecting one-to-one relationships, one-to-many relationships, and many-to-one relationships with fields, the mapping relationship generation and design module is characterized by supporting text comments and derivation of design documents. A standardization system for a multi-center medical data structure based on the general-purpose data model according to claim 1.
前記マッピングコード生成及び修正モジュールは、ユーザの確認したデータ構造のマッピング関係に基づき、コードフレームに従ってデータ構造のマッピングスクリプトを生成して保存するとともに、ユーザにデータ構造のマッピングスクリプトを変更する権限を提供する
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The mapping code generation and modification module generates and saves a data structure mapping script according to a code frame based on the data structure mapping relationship confirmed by the user, and provides the user with the authority to change the data structure mapping script. A standardization system for a multi-center medical data structure based on the general-purpose data model according to claim 1.
前記データキャッシュモジュールが確立したキャッシュ層は、ソースデータ構造に変更時間フィールドを追加することで、それぞれのデータの最新の変更時間を記録し、前記マッピング処理モジュールは、マッピングスクリプトをキャッシュ層に適用し、データ構造の標準化マッピングを行い、データ構造のマッピング結果は、目標データベースに保存され、ログに最新のマッピング操作時間が記録される
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The cache layer established by the data cache module records the latest change time of each data by adding a change time field to the source data structure, and the mapping processing module applies the mapping script to the cache layer. , Multi-based on the generic data model according to claim 1, characterized in that standardized mapping of the data structure is performed, the mapping result of the data structure is stored in the target database, and the latest mapping operation time is recorded in the log. Center medical data structure standardization system.
前記異常処理モジュールは、データ構造のマッピング関係に基づきデータを抽出した際に、「ノットヌルフィールドにヌル値が存在する」、「データの長さが範囲外である」を含むエラーが発生した場合、これらのエラーを有するデータ構造のマッピングを拒否し、これらのエラーをログに記録し、ユーザが確認して削除又はクリーニング処理するために、エラーデータを一時的なテーブルに記録する
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
When the anomaly processing module extracts data based on the mapping relationship of the data structure, an error including "a null value exists in the not null field" and "the length of the data is out of range" occurs. , Rejecting the mapping of data structures with these errors, logging these errors, and recording the error data in a temporary table for the user to review and delete or clean. A standardization system for a multi-center medical data structure based on the general-purpose data model according to claim 1.
前記増分キャッシュモジュールは、CDC技術によってソースデータベースにおけるデータの変化を捉え、キャッシュ層において増分データを更新し、変更時間フィールドに変更時間を記録する
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The general-purpose data model according to claim 1, wherein the incremental cache module captures changes in data in a source database using CDC technology, updates the incremental data in the cache layer, and records the change time in a change time field. Multi-center medical data structure standardization system based on.
前記増分マッピングモジュールは、ログにおける最新のマッピング操作時間とキャッシュ層におけるデータの変更時間を比較し、変更時間が最新のマッピング操作時間よりも遅いデータに対してマッピングを行い、まず、キャッシュデータベースにおける増分データ構造及び目標データベース構造を走査し、キャッシュデータベースに存在する既存のデータ構造のマッピング関係と同じであれば、データ構造のマッピング処理及び品質制御を行い、既存のデータ構造のマッピング関係に合致しなければ、データ構造のマッピング関係を更新した後、データ構造のマッピング処理及び品質制御を行う
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The incremental mapping module compares the latest mapping operation time in the log with the data change time in the cache tier, maps to the data whose change time is slower than the latest mapping operation time, and first increments in the cache database. If the data structure and target database structure are scanned and the mapping relationship of the existing data structure existing in the cache database is the same, the data structure mapping process and quality control must be performed to match the mapping relationship of the existing data structure. For example, the standardization system for a multi-center medical data structure based on the general-purpose data model according to claim 1, wherein the data structure mapping process and quality control are performed after updating the data structure mapping relationship.
前記品質制御ユニットは、品質評価モジュールをさらに含み、前記品質評価モジュールは、マッピング処理モジュールのマッピング処理が完了した後、今回のデータ構造のマッピング処理に対する品質評価報告を生成する
ことを特徴とする請求項1に記載の汎用データモデルに基づくマルチセンタ医療データ構造の標準化システム。
The quality control unit further includes a quality evaluation module, and the quality evaluation module generates a quality evaluation report for the mapping process of the current data structure after the mapping process of the mapping process module is completed. A standardization system for a multi-center medical data structure based on the general-purpose data model described in Item 1.
JP2021533317A 2019-07-12 2020-04-07 Multi-center medical data structure standardization system based on generic data model Active JP7074307B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910629812.5A CN110347662B (en) 2019-07-12 2019-07-12 Multi-center medical data structure standardization system based on universal data model
CN201910629812.5 2019-07-12
PCT/CN2020/083585 WO2020233255A1 (en) 2019-07-12 2020-04-07 Universal data model-based system for standardizing structure of medical data from multiple centers

Publications (2)

Publication Number Publication Date
JP2022508348A JP2022508348A (en) 2022-01-19
JP7074307B2 true JP7074307B2 (en) 2022-05-24

Family

ID=68175149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021533317A Active JP7074307B2 (en) 2019-07-12 2020-04-07 Multi-center medical data structure standardization system based on generic data model

Country Status (3)

Country Link
JP (1) JP7074307B2 (en)
CN (1) CN110347662B (en)
WO (1) WO2020233255A1 (en)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347662B (en) * 2019-07-12 2021-08-03 之江实验室 Multi-center medical data structure standardization system based on universal data model
CN111008028B (en) * 2019-11-22 2022-07-01 杭州数式网络科技有限公司 Software upgrading method, device and storage medium
CN111008189B (en) * 2019-11-26 2023-08-25 浙江电子口岸有限公司 Dynamic data model construction method
CN111340636B (en) * 2020-02-27 2022-11-04 平安医疗健康管理股份有限公司 Data validity detection method and device, computer equipment and storage medium
CN111367987A (en) * 2020-03-31 2020-07-03 西安震有信通科技有限公司 Data import method, system and device suitable for multiple database types
CN112102910A (en) * 2020-09-22 2020-12-18 零氪科技(北京)有限公司 Method and device for automatically checking proprietary data docking data
CN112162992A (en) * 2020-10-12 2021-01-01 浪潮软件集团有限公司 Efficient database updating system and method
CN112328574A (en) * 2020-11-03 2021-02-05 上海许继电气有限公司 Relay protection fault information master station data migration method and device
CN112328576A (en) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 Representation method of universal data model based on multiple data sources
CN112559491A (en) * 2020-12-17 2021-03-26 山东健康医疗大数据有限公司 Method and system for realizing adaptive management based on data model in medical industry
CN112835911B (en) * 2021-03-10 2022-12-02 四川大学华西医院 Master data management system suitable for medical information platform
CN113176876B (en) * 2021-04-23 2023-08-11 网易(杭州)网络有限公司 Data reading and writing method and device and electronic equipment
CN113539505A (en) * 2021-07-03 2021-10-22 深圳市裕辰医疗科技有限公司 Calculation system and calculation method for hemodialysis quality control result
CN114385727B (en) * 2021-12-13 2024-04-30 中煤科工集团信息技术有限公司 Multi-table data summarizing method and computer equipment for aperiodic newly-added table
CN114218195A (en) * 2021-12-17 2022-03-22 东软汉枫医疗科技有限公司 Medical internet of things network element universe bottom layer data model structure
CN114265875B (en) * 2022-03-03 2022-07-22 深圳钛铂数据有限公司 Method for establishing wide table in real time based on stream data
CN115050479B (en) * 2022-04-12 2023-08-04 江南大学附属医院 Data quality evaluation method, system and equipment for multi-center research
CN115905455B (en) * 2022-12-31 2023-09-29 北京和兴创联健康科技有限公司 Method for normalizing hospital database based on automatic detection technology
CN116244374B (en) * 2023-01-09 2024-04-19 北京百度网讯科技有限公司 Data processing method, device, equipment and storage medium
CN116386799B (en) * 2023-06-05 2023-08-18 数据空间研究院 Medical data acquisition and standard conversion method and system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010573A (en) 2017-11-24 2018-05-08 苏州市环亚数据技术有限公司 A kind of hospital data emerging system, method, electronic equipment and storage medium
CN109920522A (en) 2018-11-30 2019-06-21 广州百家医道健康管理股份有限公司 A kind of residents ' health managed care big data platform

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2693391A1 (en) * 2012-08-02 2014-02-05 Amadeus s.a.s. Dynamic and hierarchical generic data mapping for traveler profile publication
CN106997421B (en) * 2016-01-25 2020-07-03 清华大学 Intelligent system and method for personalized medical information acquisition and health monitoring
US10397331B2 (en) * 2016-01-29 2019-08-27 General Electric Company Development platform for industrial internet applications
CN105956409A (en) * 2016-05-27 2016-09-21 上海道拓医药科技股份有限公司 Real-time data management method and system of intelligent medical equipment
CN107368588B (en) * 2017-07-24 2020-09-01 人教数字出版有限公司 Heterogeneous resource isomorphism method and device
US10255199B1 (en) * 2017-09-22 2019-04-09 Intel Corporation Evicting clean secure pages without encryption
US11120012B2 (en) * 2017-09-27 2021-09-14 Johnson Controls Tyco IP Holdings LLP Web services platform with integration and interface of smart entities with enterprise applications
CN108256026A (en) * 2018-01-10 2018-07-06 圣泓工业设计创意有限公司 A kind of Database Systems of management legacy construction characteristic element
CN109034544A (en) * 2018-06-29 2018-12-18 广东新禾道信息科技有限公司 Land and resources datas manages platform
CN109378053B (en) * 2018-11-30 2021-07-06 安徽影联云享医疗科技有限公司 Knowledge graph construction method for medical image
CN109979606B (en) * 2019-01-07 2020-06-23 北京云度互联科技有限公司 Method for constructing micro-service medical image cloud and cloud film based on containerization
CN109994217B (en) * 2019-03-08 2021-08-06 视联动力信息技术股份有限公司 Method and device for checking pathological file
CN110347662B (en) * 2019-07-12 2021-08-03 之江实验室 Multi-center medical data structure standardization system based on universal data model

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010573A (en) 2017-11-24 2018-05-08 苏州市环亚数据技术有限公司 A kind of hospital data emerging system, method, electronic equipment and storage medium
CN109920522A (en) 2018-11-30 2019-06-21 广州百家医道健康管理股份有限公司 A kind of residents ' health managed care big data platform

Also Published As

Publication number Publication date
CN110347662B (en) 2021-08-03
WO2020233255A1 (en) 2020-11-26
JP2022508348A (en) 2022-01-19
CN110347662A (en) 2019-10-18

Similar Documents

Publication Publication Date Title
JP7074307B2 (en) Multi-center medical data structure standardization system based on generic data model
US11341155B2 (en) Mapping instances of a dataset within a data management system
US7690000B2 (en) Metadata journal for information technology systems
CN105046328B (en) A kind of three-dimensional visualization bridge defect information acquisition management system and method
EP2909748B1 (en) Data lineage system
CN111611458B (en) Method for realizing system data architecture carding based on metadata and data analysis technology in big data processing
CN101739390B (en) Data transformation based on a technical design document
CN102081661A (en) Data integration method and system of heterogeneous relational database based on XML (Extensive Makeup Language)
EP1898328A2 (en) An interface between clinical and research information systems
CN103942234A (en) Method for operating multiple heterogeneous databases, middleware device and system
JP2014048673A (en) Workflow generation server and method
CN102457475A (en) Integration and conversion system for network security data
JP2016530646A (en) Metadata automation system
CN113010208B (en) Version information generation method, device, equipment and storage medium
CN110889013A (en) Data association method, device, server and storage medium based on XML
US7844601B2 (en) Quality of service feedback for technology-neutral data reporting
CN111125045B (en) Lightweight ETL processing platform
CN112735571A (en) Medical health data uploading management platform
US11256600B2 (en) Log analysis application
CN113438248B (en) Network IP address self-checking management system convenient for master station
CN112019364B (en) Information management method and device
JP4444326B2 (en) Database management system, database management method, and database management program
CN113672626B (en) Data structure changing method and device and electronic equipment
CN111143406A (en) Database data comparison method and database data comparison system
CN103810242A (en) System and method for automatically recognizing innovative literature graticules and literature positions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210610

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220429

R150 Certificate of patent or registration of utility model

Ref document number: 7074307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150