TWI596564B - Method and device for extracting harmful cases of medicine - Google Patents

Method and device for extracting harmful cases of medicine Download PDF

Info

Publication number
TWI596564B
TWI596564B TW104108866A TW104108866A TWI596564B TW I596564 B TWI596564 B TW I596564B TW 104108866 A TW104108866 A TW 104108866A TW 104108866 A TW104108866 A TW 104108866A TW I596564 B TWI596564 B TW I596564B
Authority
TW
Taiwan
Prior art keywords
combination
medical
harmful
positive
patient
Prior art date
Application number
TW104108866A
Other languages
English (en)
Other versions
TW201610905A (zh
Inventor
Yuki Kosaka
Kazuyo Narita
Satoshi Morinaga
Ayumi Endo
Kaori Yamada
Aiko Kumano
Maki Komamine
Original Assignee
Nec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corp filed Critical Nec Corp
Publication of TW201610905A publication Critical patent/TW201610905A/zh
Application granted granted Critical
Publication of TWI596564B publication Critical patent/TWI596564B/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

醫藥品有害事例抽出方法及裝置
本發明係關於利用資訊處理抽出醫藥品引起之有害事例的方法及裝置,特別是關於能廣泛地抽出醫藥品所致之未知有害事例之醫藥品有害事例抽出方法及裝置。
醫藥品係於取得政府許可後方上市,但若上市而對於多數患者開立處方,有時會未預期發生醫藥品有害事例而帶來重大的健康受害。原因是:為了取得政府許可而實施的臨床試驗係為了驗證醫藥品的有效性,對於有限數目患者於短期間實施,所以,難以用臨床試驗查明醫藥品全部的醫藥品有害事例。所以,實施醫藥品之上市後調査,提早查明出還未發現的醫藥品有害事例並實施為了防止此醫藥品有害事例發生之安全對策是醫藥品主管當局的重要任務。
近年的上市後調査主要是分析自主報告而實施醫藥品有害事例之查明。自主報告係由醫師、患者、製藥企業自主提供之關於有可能是醫藥品有害事例的事例的報告。但是自主報告不一定會報告在臨床現場實際發生的全部醫藥品有害事例,所以即使從自主報告查明醫藥品有害事例,仍會有難以查明到全部的醫藥品有害事例的缺點。
為了彌補此缺點,在近年已有人探討分析患者接受之醫療相關的資訊醫療資訊資料而抽出和未知之醫藥品有害事例相關之資訊的作法。和自主報告不同,醫療資訊資料中,長期詳細記載著巨大數目的患者在臨床現場實際發生的診療履歷。所以,期待是否能利用分析醫療資訊資料而查明在自主報告未報告的醫藥品有害事例。醫療資訊資料為從醫療報酬明細及調劑報酬明細獲得的資料、從診療記錄獲得之資料等。醫療報酬明細及調劑報酬明細也稱為Rezept等,診療記錄也稱為Karte、醫療記錄(medical record)。
尤其當患者以政府提供或民間企業提供之醫療保險制度、健康保險制度在醫療機関受診時,醫療報酬明細、調査報酬明細會收集在醫療保險、健康保險的經營者處。因此,藉由解析在醫療保險、健康保險之經營者或接受其委託者處收集到的巨大數量的醫療報酬明細、調査報酬明細,可以期待能查明未知之醫藥品有害事例。
作為本發明之關連技術之非專利文獻1揭示:對於各患者取得顯示對此患者開立了何種醫藥品以及此患者發生了何種傷病的時間序列資料,並依據取得的時間序列資料利用機械學習抽出醫藥品有害事例的方法。非專利文獻1之方法,將就代表醫藥品有害事例之組合而言已知的「醫藥品與傷病」之組合作為正例,將就非醫藥品有害事例之組合已知的「醫藥品與傷病」之組合作為負例。例如:某醫藥品為解熱劑且已知當服用此解熱劑時會發生為有害事例之出疹,則「該醫藥品與出疹」之組合成為正例。當觀察到患者發熱並處方解熱劑時,解熱劑本身是對症於發熱而解熱的藥劑,故「解熱劑與發熱」之組合分類在負例。
非專利文獻1之方法中,係學習以下的模型:將正例、負例、非正例亦非負例之「醫藥品與傷病」之組合、及上述醫藥品之處方及傷病發生之時間序列資料作為輸入,就每一「醫藥品與傷病」之組合產生在醫藥品之處方期間何時發生、發生幾次傷病的屬性資料,並基於對應於正例之屬性資料與對應於負例之屬性資料,從屬性資料計算代表「醫藥品與傷病」之組合為有害事例的可疑度的分數。以下稱此模型為「判別模型」。並且,在已學習之判別模型中,輸入非正例亦非負例之「醫藥品與傷病」之組合所對應的屬性資料,就每一「醫藥品與傷病」之組合計算上述分數。此分數係代表非正例亦非負例之輸入之「醫藥品與傷病」之組合為醫藥品有害事例之可能性之程度,故依據算出之分數抽出懷疑是醫藥品有害事例的「醫藥品與傷病」之組合。
非專利文獻1記載之技術,基本上係只重視輸入之醫藥品與傷病之時間序列資料當中之醫藥品之處方期間的傷病的發生,而從針對醫藥品之處方之時間序列資訊與觀察到的傷病之時間序列資訊抽出代表有害事例之「醫藥品與傷病」之組合之技術。 ﹝先前技術文獻﹞ ﹝非專利文獻﹞
[非專利文獻1] "OMOP Cup Grand Prize 'Best Submission' Report"、Foundation for the National Institute of Health、[2014年1月18日檢索]、網際網路〈URL:http://omop.fnih.org/sites/default/files/Vogel_Progress_prize_methods_GP_0.pdf〉 [非專利文獻2] R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang, and C.-J. Lin, "LIBLINEAR: A library for large linear classification," Journal of Machine Learning Research, 9(2008), 1871-1874. [非專利文獻3] J. Zhou, J. Chen and J. Ye, "MALSAR: Multi-tAsk Learning via Structural Regularization," Arizona State University, 2012、[2014年2月26日檢索]、網際網路〈URL:http://www.public.asu.edu/~jye02/Software/MALSAR〉 [非專利文獻4] Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P., "Smote: Synthetic minority over-sampling technique," Journal of Artificial Intelligence Research, 16:321-357 (2002). [非專利文獻5] Xu-Ying Liu and Jianxin Wu and Zhi-Hua Zhou, "Exploratory Under-Sampling for Class-Imbalance Learning," Data Mining, 2006. ICDM '06. Sixth International Conference on. [非專利文獻6] Sugiyama, M., Suzuki, T., Nakajima, S., Kashima, H., von Buenau, P., and Kawanabe, M, "Direct importance estimation for covariate shift adaptation," Annals of the Institute of Statistical Mathematics, vol. 60, no. 4, pp. 699-746, 2008.
﹝發明欲解決之課題﹞
實際在醫藥品安全對策中,要求從醫療資訊資料以高精準度抽出醫藥品有害事例。在此,高精準度係指少錯誤地抽出廣泛種類的有害事例。原因是:為了防止有害事例導致之健康受害,正確地掌握廣泛種類之有害事例係為重要。
如非專利文獻1記載之技術,為了導出用以判別正例與負例的規則,關於判別模型之學習使用之屬性資料,須在正例與負例之間存在某些差異。若無差異存在,則無法分給正例高分、負例低分以分類正例與負例並算出區別正例與負例的分數。
非專利文獻1記載之技術中,係針對正例與負例分別產生顯示在醫藥品之處方期間之傷病之發生時期與發生次數之屬性資料,並輸入此屬性資料。但是,非專利文獻1使用之屬性資料中,有時代表有害事例之組合(正例之組合)與非有害事例之組合(負例之組合)之間,此等屬性資料之內容之差異小。在如此的情形,只從醫藥品與傷病之時間序列資訊產生之屬性資料難以判別代表有害事例之組合與非有害事例之組合。因此非專利文獻1記載之技術會有無法以少錯誤廣泛地只抽出代表有害事例之組合的問題。
以下說明顯示有害事例之組合與非有害事例之組合之間的屬性資料之差異小的情形之一例。
非有害事例之組合係代表不易認定是因為醫藥品之處方引起之傷病者,就其一例而言,可列舉某傷病和為了此傷病之治療而處方之醫藥品的「醫藥品與傷病」之組合。此組合因為是傷病發生後為了此傷病之治療而開立醫藥品之處方,所以,在醫藥品與傷病之時間序列資訊方面,醫藥品之處方與傷病之發生在同日發生的次數多。另一方面,有害事例之中,也有醫藥品處方後立即出現症狀的過敏反應等有害事例。顯示如此的有害事例之傷病,亦為在醫藥品與傷病的時間序列資訊方面,和醫藥品之處方在同日發生之次數多。所以,有時會有代表有害事例之組合與非有害事例之組合之間,顯示從醫藥品處方後何時發生、發生幾次傷病之屬性資料的內容之差異小的情形。在此情形,即使使用判別模型仍無法區別代表有害事例之組合與非有害事例之組合。
本發明之目的在於解決如此的關連技術的課題,提供能以良好精準度將醫藥品與和此醫藥品關連之有害事例之組合抽出之醫藥品有害事例抽出方法及裝置。 ﹝解決課題之方式﹞
本發明之醫藥品有害事例抽出方法係將為醫藥品與傷病之組合且該當於醫藥品有害事例之組合予以抽出, 係將已知作為代表醫藥品有害事例之組合的組合作為正例之組合,已知並非醫藥品有害事例之組合的組合作為負例之組合,將非賦予正例之組合也非負例之組合的組合作為正例負例以外之組合, 具有以下步驟: 使用各患者之包括醫療事件的時間序列資訊之醫療資訊資料,針對各前述正例之組合、各前述負例之組合、及各前述正例負例以外之組合,依據前述醫療事件的時間序列資訊生成屬性資料;並 依前述正例之組合所對應之屬性資料及前述負例之組合所對應之屬性資料學習判別模型; 將前述正例負例以外之組合所對應之屬性資料輸入到前述判別模型並算出分數; 對於就各前述正例負例以外之組合分別算出之前述分數套用抽出條件,抽出懷疑是醫藥品有害事例之前述正例負例以外之組合; 前述各患者之醫療事件包括對於該患者之醫藥品之處方及在該患者觀察到的傷病, 前述各患者之醫療事件更包括對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而代表該醫療行為已實施之事件中之至少一者。
本發明之醫藥品有害事例抽出裝置係將為醫藥品與傷病之組合且該當於醫藥品有害事例之組合予以抽出之裝置, 係將已知作為代表醫藥品有害事例之組合的組合作為正例之組合,已知並非醫藥品有害事例之組合的組合作為負例之組合,將非賦予正例之組合也非負例之組合的組合作為正例負例以外之組合, 包含以下機構: 屬性產生機構,使用存放於記憶裝置之包括各患者之醫療事件的時間序列資訊之醫療資訊資料,對於存放於前述記憶裝置之各前述正例之組合、存放於前述記憶裝置之各前述負例之組合、及存放於前述記憶裝置之各前述正例負例以外之組合,依據前述醫療事件的時間序列資訊生成屬性資料而存放於前述記憶裝置; 學習機構,利用前述正例之組合所對應之屬性資料及前述負例之組合所對應之屬性資料學習判別模型; 算出機構,將存放於前述記憶裝置之前述正例負例以外之組合所對應之屬性資料輸入到前述判別模型並算出分數; 抽出機構,對於就各前述正例負例以外之組合分別算出之前述分數套用抽出條件,抽出懷疑是醫藥品有害事例之前述正例負例以外之組合; 前述各患者之醫療事件包括對於該患者之醫藥品之處方及在該患者觀察到的傷病, 前述各患者之醫療事件更包括對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而代表該醫療行為已實施之事件中之至少一者。
依照本發明,能以良好地精準度抽出醫藥品及和此醫藥品有關連的有害事例的之組合。
以下針對本發明之實施形態,參照圖式説明。
首先,針對醫療事件的時間序列資訊進行説明。
診療報酬明細、調劑報酬明細書以及診療紀錄資訊等的醫療資訊資料,由於包含關於針對患者的醫療行為的附日期記錄,故可視為每一位患者的醫療事件的時間序列資訊。在此,所謂醫療事件,係指某一位患者在某一時點,該患者被觀察到傷病、被開立特定的醫藥品處方、接受特定的診療行為,或是接受特定的傷病診斷等的,特定的患者在特定的時點所發生的醫療關係的事例(事件)。在此,更進一步來說,一般而言,醫療資訊資料所包含之特定患者在特定時點的特定項目的相關記載事項、醫療費、診療科、住院等的廣義醫療相關資訊也被記述為醫療事件。因此在本明細中,係將醫療事件定義為,包含患者所發生之傷病,同時包含對患者所實行之醫療行為,以及,隨附於對患者所實行之醫療行為並表示該醫療行為已被實行過的事件者。不言自明,所謂「住院」此等醫療事件,係表示特定的患者在特定的時點住院,所謂「醫療費」此等醫療事件,係表示特定的患者在特定的時點被請求特定金額的醫療費,所謂「診療科」此等醫療事件,係表示特定的患者在特定的時點所接受診療的診療科。例如,特定的診療科的治療行為、醫藥品的處方、住院等的處置等為醫療行為所包含,隨附於醫療行為並表示該醫療行為已被實行過的事件,例如醫療費的請求等。
另外,所謂醫療事件的時間序列資訊,例如,如以下所示的,係指以適當的時間單位(例如1個月)區隔表現出針對某一患者X是否開出特定的醫藥品A的處方的資訊。
患者X、醫藥品A:0,0,0,1,1,0,0 在此,該事件有發生時以「1」表示,並未發生時以「0」表示。在本例中,表示患者X的醫藥品A的處方,於最初的3個月期間(亦即從第1個月到第3個月)並未開立,於接下來的2個月期間(第4個月以及第5個月)開立2個月期間(第6個月以及第7個月)並未開立。
在上述的例子中,醫藥品處方的有無以「0」以及「1」的二進制資料表示,惟不限於二進制資料,亦可用適當的單位表示處方量,例如像下列等的方式,表現出詳細資訊: 患者X、醫藥品A:0,0,0,2.3,6.18,0,0
另外,在上述的例子中,係表示代表醫藥品處方的醫療事件,惟亦可賦予開出各醫藥品處方的診療科的資訊,例如像下列等的方式,詳細地表現出醫療事件: 患者X、醫藥品A、內科:0,0,0,1,1,0,0 患者X、醫藥品A、外科:0,0,0,1,0,0,0
另外,醫療資訊資料所包含之醫療事件種類,尚有醫療費。該事件,係表示特定的患者在特定的時點被請求特定金額的醫療費。醫療費的醫療事件的時間序列資訊的例子,係指如以下,將對某一位患者X已請求多少的醫療費以適當的單位(例如診療報酬的點數)代表請求額。
患者X,醫療費:300, 550, 90, 140, 2500, 600, 0 醫療資訊資料中包含關於巨大數量的患者的多種醫療事件的時間序列資訊。例如:下例代表2名患者的多種的醫療事件的時間序列資訊。
患者X、醫藥品A   :0, 0, 0, 1, 1, 0, 0 患者X、醫藥品B   :0, 0, 0, 0, 0, 1, 0 患者X、診療行為C  :0, 0, 1, 1, 1, 0, 0 患者X、診斷病名D  :0, 0, 0, 0, 1, 1, 0 患者X、住院    :0, 0, 0, 0, 1, 0, 0 患者X、內科(診療科)  :0, 0, 1, 1, 1, 1, 0 患者Y、醫藥品A   :0, 0, 1, 1, 1, 1, 1 患者Y、醫藥品C   :0, 0, 0, 1, 1, 1, 0 上述例係代表表示對患者X開立醫藥品A、B的處方、對患者X實施診療行為C、患者X被診斷出病名D、患者X住院、患者X接受內科診療這些事件是否分別已於某時發生。又,代表對於患者Y之醫藥品A、C之處方是否已於某時發生。
以下為求簡便,將「診斷病名」此醫療事件記載為「傷病」。上述例中,「診斷病名」記載為「傷病」的話,成為如下所示。
患者X、醫藥品A   :0, 0, 0, 1, 1, 0, 0 患者X、醫藥品B   :0, 0, 0, 0, 0, 1, 0 患者X、診療行為C  :0, 0, 1, 1, 1, 0, 0 患者X、傷病D   :0, 0, 0, 0, 1, 1, 0 患者X、住院    :0, 0, 0, 0, 1, 0, 0 患者X、內科(診療科)  :0, 0, 1, 1, 1, 1, 0 患者Y、醫藥品A   :0, 0, 1, 1, 1, 1, 1 患者Y、醫藥品C   :0, 0, 0, 1, 1, 1, 0 圖1顯示本發明之一實施形態之醫藥品有害事例抽出裝置之構成。此醫藥品有害事例抽出裝置具有依據醫療資訊資料包含之多數患者之醫療事件的時間序列資訊,從「醫藥品與傷病」之組合之中抽出代表有害事例之組合之機能。尤其此裝置依據針對各組合算出之分數,亦即依據代表為有害事例之可疑性之數値抽出代表有害事例之組合。以下的説明中,在上下文為明顯的情形,將「醫藥品與傷病」之組合簡稱為「組合」。
圖1所示醫藥品有害事例抽出裝置具備: 執行資料處理之處理裝置11; 記憶裝置12,和處理裝置11連接並記憶成為醫藥品有害事例之抽出對象之醫療資訊資料、判別模型、分數、抽出結果等對於在處理裝置11之資料處理為必要且產生資料處理之結果的資料;通訊界面(I/F部)13;操作輸入部14;及畫面顯示部15。通訊界面部13、操作輸入部14及畫面顯示部15均和處理裝置11連接。
通訊界面部13由專用的資料通訊電路構成,具有和經由通訊線路而連接的未圖示的各種裝置與處理裝置11之間進行資料通訊的機能。操作輸入部14由鍵盤、滑鼠等操作輸入裝置構成,具有查明操作者之操作並輸入到處理裝置11的機能。畫面顯示部15由LCD(液晶顯示裝置)、PDP(電漿顯示面板)等畫面顯示裝置構成,具有因應來自處理裝置11的指示,將操作選單、選定結果等各種資訊顯示在畫面的機能。
記憶裝置12由硬碟、半導體記憶裝置等構成。圖1所示之醫藥品有害事例抽出裝置中,記憶裝置12所記憶的主要資訊為:醫療資訊資料51、正例之組合52、負例之組合53、正例負例以外之組合54、正例負例旗標55、屬性資料56、判別模型57、有害事例分數58、抽出條件59、抽出結果60及控制參數69。記憶裝置12中除了記憶在此所述者以外,也可以存放醫藥品有害事例抽出裝置之動作使用的資訊。以下針對該等資訊説明。
醫療資訊資料51係如上述由診療報酬明細、調劑報酬明細、診療記錄等獲得之資訊,其係就每名患者之醫療事件的時間序列資訊表示。本實施形態中,醫療資訊資料51係由某患者在某時點的以下的特定患者在特定時點發生之醫療事件構成:(a)被開立特定之醫藥品處方、(b)觀察到特定傷病、(c)接受特定診療行為、(d)被請求特定金額的醫療費、(e)關連於特定診療科、及(f)住院。醫療事件之詳情將於後述,但為在此列舉以外之項目但以廣意和醫療相關連之項目也可作為本發明之醫療事件使用。又,本發明中,取決於是如何的方式找出成為醫藥品有害事例之「醫藥品與傷病」之組合,也可不使用在此記述之(c)~(f)當中之一部分的醫療事件。如非專利文獻1的相關説明,無法從醫藥品之處方及傷病發生之時間序列資料以良好的精準度抽出醫藥品有害事例,所以本實施形態中,不只著眼在醫藥品之處方期間中的傷病,還著眼於傷病發生以外之醫療事件。本實施形態中,醫療資訊資料宜為從診療報酬明細及調劑報酬明細的任一者獲得之資訊較佳。
本發明係為了判別是否因為醫藥品之處方而造成有害事例的結果發生,所以考慮成為原因之事例(先行之事例,亦即醫藥品之處方)與可成為結果之事例(後續事例,亦即觀察到的傷病)作為組合事例,就各組合考慮是否為和醫藥品相關連的有害事例。本實施形態中,均考慮係「醫藥品與傷病」之組合之正例之組合52、負例之組合53及正例負例以外之組合54。正例的組合52,係已知為表示醫藥品有害事例的組合的「醫藥品與傷病」的組合。反例的組合53,係已知為並非醫藥品有害事例的組合的「醫藥品與傷病」的組合。相對於此,正例負例以外之組合54係指「醫藥品與傷病」之組合並非正例之組合也非負例之組合。因此正例負例以外之組合54是不知道是代表醫藥品有害事例之組合還是非醫藥品有害事例之組合的組合。
正例負例旗標55係代表正例與負例之組合是正例之組合還是負例之組合的組合別的旗標値。就旗標値而言,例如:對於正例之組合設定代表正例之値,對於負例之組合設定代表負例之値。
屬性資料56,係針對正例、負例、正例負例以外之組合,就各表達醫療資訊資料上之特徵之資料。本實施形態之屬性資料之詳情將於後述。
判別模型57,係表達組合所對應之屬性資料與組合是否對應於有害事例之關係之模型。判別模型57之形式,可考慮例如:邏輯迴歸模型、線性支持向量機(SVM:SupportVectorMachine)模型等。
有害事例分數58,係利用判別模型57對於正例負例以外之組合54分別算出的代表為有害事例之可疑性的値。値愈大,則欲強烈懷疑是有害事例。
抽出條件59,係顯示從正例負例以外之組合54之中抽出代表有害事例之組合時應符合之條件。抽出條件,例如抽出之組合之有害事例分數之閾値、抽出之組合之最大數等。
抽出結果60,係從正例負例以外之組合54之中就代表有害事例之組合抽出的組合的表。
控制參數69,係決定處理裝置11之醫藥品有害事例之抽出處理之執行條件等之各種參數。
以下說明處理裝置11。
本實施形態之醫藥品有害事例抽出裝置係用正例之組合52與負例之組合53來學習判別模型57,之後將正例負例以外之組合54套用於判別模型57,並獲得針對此正例負例以外之組合54之有害事例分數58。為了執行如此的處理,處理裝置11設置有:輸入部21、屬性資料產生部22、判別模型學習部23、有害事例分數算出部24及抽出部25。屬性資料產生部22相當於屬性產生機構,判別模型學習部23相當於學習機構,有害事例分數算出部24相當於算出機構,抽出部25相當於抽出機構。
輸入部21從通訊界面部13或操作輸入部14將醫療資訊資料、正例之組合、負例之組合、正例負例以外之組合、抽出條件等對於在此醫藥品有害事例抽出裝置之處理為必要之資訊輸入,並將此等資訊存放在記憶裝置12。在此,對於輸入部12提供的醫療資訊資料係從診療報酬明細、調劑報酬明細抽取的各患者之醫療事件的時間序列資訊。近年來,診療報酬明細、調劑報酬明細係利用預先規定的資料格式以電子資料的形式產生,此資料格式本身已經表達醫療事件的時間序列資訊,所以從診療報酬明細、調劑報酬明細抽取各患者之醫療事件的時間序列資訊極容易進行。
屬性資料產生部22從記憶裝置12讀取正例之組合52、負例之組合53、正例負例以外之組合54及醫療資訊資料51,並對於讀取的醫療資訊資料51進行前處理後,使用已讀取的資訊產生屬性資料,將此屬性資料存放在記憶裝置12。取決於醫療資訊資料等的資料形式,前處理並非必要。
判別模型學習部23具有以下機能:從記憶裝置12讀取正例之組合52及負例之組合53、及屬性資料56之中之正例與負例所對應之屬性資料、正例負例旗標55,並學習判別模型57,將學習後之判別模型57保存在記憶裝置12。
有害事例分數算出部24具有以下機能:從記憶裝置12讀取正例負例以外之組合54、及此正例負例以外之組合所對應之屬性資料,將已讀取的屬性資料輸入到判別模型,針對正例負例以外之組合分別算出有害事例分數,並將算出的有害事例分數保存在記憶裝置12。
抽出部25具有以下機能:從記憶裝置12讀取有害事例分數58及抽出條件59,以符合抽出條件的方式從正例負例以外之組合之中抽出懷疑是有害事例的組合,並將此抽出結果保存在記憶裝置12。又,抽出部25具有以下機能:將上述抽出結果輸出到畫面顯示部15,或通過通訊界面部13而輸出到外部。
以下參照圖2說明圖1所示之醫藥品有害事例抽出裝置之動作。此醫藥品有害事例抽出裝置之動作大致分成屬性產生階段S1、學習階段S2、有害事例分數算出階段及抽出階段S4的4個階段,該等階段依此順序執行。
於屬性產生階段S1,於步驟S11中,輸入部21從通訊界面部13或操作輸入部14接收醫療資訊資料、及正例、負例、及正例負例以外之各組合,並存放在記憶裝置12。然後,屬性資料產生部22於步驟S12中,從記憶裝置12讀取醫療資訊資料51、正例之組合42、負例之組合53、及正例負例以外之組合54,對於醫療資訊資料51進行前處理,之後於步驟S13,產生讀出的各組合所對應之屬性資料並將產生之屬性資料存放在記憶裝置12。
屬性資料,係表示關於組合,在所輸入之醫療事件的時間序列資訊中,在組合的醫藥品與傷病於同一患者共現的時點的周邊的時期中,其他的醫療事件發生或並未發生的特徵的資料。
於學習階段S2,在步驟S21,判別模型學習部23從記憶裝置12呼叫正例之組合52、負例之組合53、此等正例及負例所對應之屬性資料56、正例負例旗標55、及判別模型57,使用此等在步驟S22學習判別模型。已學習之判別模型回到記憶裝置12。
在有害事例分數算出階段S3,於步驟S31,有害事例分數算出部24從記憶裝置12讀取判別模型57、正例負例以外之組合54、及此組合所對應的屬性資料,將讀出的屬性資料在步驟S32套用於判別模型並算出有害事例分數。算出之有害事例分數存放在記憶裝置12。
於抽出階段S4,首先,於步驟S41,輸入部21從通訊界面部13或操作輸入部14接收抽出條件,存放在記憶裝置12。然後,於步驟S42,抽出部25從記憶裝置12讀取有害事例分數58及抽出條件59,並從正例負例以外之組合以符合抽出條件的方式抽出代表有害事例之組合,將此抽出結果保存在記憶裝置12。之後,於步驟S43,抽出部25將上述抽出結果輸出到畫面顯示部15或通過通訊界面部13輸出到外部。此時,宜將強烈判別為有害事例之有害事例分數較高的組合予以優先抽出,並且不將有害事例分數低之組合優先抽出較佳。亦即,宜將懷疑為有害事例的正例負例以外之組合排序後輸出較佳。又,本實施形態中能輸入多數針對各種醫藥品「醫藥品與傷病」之組合,但於此情形,由於考慮依醫藥品知曉懷疑為有害事例之組合為便利,故宜依有害事例分數排序後的結果進一步照醫藥品之種類別輸出較佳。
之後依屬性生成期S1、學習階段S2、有害事例分數算出階段S3、及抽出階段S4之動作說明詳情。
(1)屬性生成期S1之詳情: (1-1)步驟S11: 於步驟S11,從記憶裝置12讀取醫療資訊資料51、正例、負例、正例負例以外之組合(亦即正例之組合52、負例之組合53及正例負例以外之組合54)、及期間長度條件。以下舉正例、負例、正例負例以外之組合之例子。於屬性生成期S1中,不去區分為正例、負例、還是正例負例以外之組合,而是均作為組合而相同地處理。期間長度條件是控制參數69之一,預存放於記憶裝置12。
以下舉從記憶裝置12讀出的組合的例子。
(醫藥品A、傷病C)、(醫藥品B、傷病B)、(醫藥品C、傷病A)、… 又,以下顯示輸入之醫療資訊資料51之例子。輸入之醫療資訊資料作為下列資料。本説明中,係舉時間單位為月時為例,但時間單位為日、週、年均可。以下,為求簡便,舉時間單位為月時為例説明。 患者X、醫藥品A、內科 :0, 0, 1, 0, 0, 0, 0 患者X、醫藥品B、內科 :1, 0, 1, 0, 0, 0, 0 患者X、傷病A   :0, 0, 0, 0, 1, 0, 0 患者X、診療行為C  :1, 0, 1, 1, 1, 0, 0 患者X、診療行為D  :0, 0, 1, 1, 1, 0, 0 患者X、住院   :0, 1, 0, 1, 1, 0, 0 患者X、內科(診療科) :0, 0, 1, 1, 1, 0, 0 患者X、醫療費   :300, 550, 90, 140, 2500, 600, 0 患者Y、醫藥品A、內科 :0, 0, 0, 0, 1, 0, 0 患者Y、醫藥品C、皮膚科:0, 0, 1, 0, 1, 0, 0 患者Y、傷病A   :0, 0, 1, 0, 1, 0, 0 患者X、傷病D   :0, 0, 0, 0, 1, 1, 0 患者Y、住院   :0, 0, 0, 0, 1, 0, 0 患者Y、內科(診療科) :0, 0, 1, 0, 1, 1, 0 患者Y、皮膚科(診療科):0, 0, 0, 0, 1, 0, 0 患者Y、醫療費   :0, 0, 190, 0, 1650, 400, 0 患者Z、醫藥品B、內科 :0, 1, 1, 1, 0, 0, 0 患者Z、傷病A   :0, 1, 1, 0, 0, 0, 0 患者Z、傷病D   :0, 0, 0, 1, 0, 0, 1 患者Z、診療行為C  :0, 1, 1, 1, 0, 0, 1 患者Z、住院   :0, 1, 0, 1, 0, 0, 0 患者Z、內科(診療科) :0, 0, 1, 1, 0, 0, 0 患者Z、外科(診療科) :0, 0, 1, 1, 0, 0, 1 患者Z、醫療費   :0, 390, 550, 1000, 0, 0, 300 (1-2)步驟S12: 於步驟S12,對於在步驟S11從記憶裝置12讀出的醫療資訊資料51進行以下説明之前處理,以產生對於在下一步驟進行之屬性資料之產生為必要之新的醫療事件的時間序列資訊。再者,從記憶裝置12讀出的醫療資訊資料51所含之各醫療事件的時間序列資訊不須處理在某決定的單位的醫療事件相關的時間序列資訊,故將醫療事件之單位變換為其他單位,並重新產生變換之單位之醫療事件的時間序列資訊。再者,當醫療資訊資料51含有實數等二進制資料以外之時間序列資訊時,為了容易產生屬性資料,將此等資料變換為二進制資料。
作為對於屬性資料產生為必要之新醫療事件的時間序列資訊,有: 「同時診療行為」、「併用醫藥品」、「診療科變化」的3個時間序列資訊。此等新的醫療事件各別代表如下的含意。
「同時診療行為」係代表特定患者在特定時點,於同時點實施了預定的閾値以上的種類的診療行為的醫療事件。又,「併用醫藥品」係代表特定患者在特定時點,於同時點被開立了預定的閾値以上之種類數之醫藥品的醫療事件。「診療科變化」係特定患者在特定時點,從和已開立某特定醫藥品之處方之診療科為不同的診療科被開立了其他醫藥品的處方的醫療事件。
此等「同時診療行為」、「併用醫藥品」、及「診療科變化」之醫療事件的時間序列資訊若已直接包含在輸入之診療報酬明細、診療記錄資訊等醫療資訊資料,則無須另外產生。但是若未包含時,則必須對於醫療資訊資料進行前處理,而重新產生該等醫療事件。從醫療資訊資料產生「同時診療行為」、「併用醫藥品」、「診療科變化」之3個醫療事件的時間序列資訊的方法說明如下。
作為前處理,舉產生「同時診療行為」之醫療事件的時間序列資訊之例。關於同一名患者,如(變換前)所示,就診療行為之種別各有多數時間序列資訊。藉由計數此名患者以月計接受了幾件診療行為,可以產生(變換後)所示之「同時診療行為」之醫療事件的時間序列資訊。下例中,針對令閾値為20、10、7、5時之情形説明。閾値為控制參數69之一。
(變換前) 患者X、診療行為A  :0, 0, 1, 0, 0, 1, 0 患者X、診療行為B  :0, 0, 1, 0, 0, 1, 0 患者X、診療行為C  :0, 0, 1, 0, 0, 1, 0 患者X、診療行為D  :0, 0, 1, 0, 1, 0, 0 患者X、診療行為E  :0, 0, 1, 0, 0, 0, 0 患者X、診療行為F  :0, 0, 1, 0, 0, 1, 0 患者X、診療行為G  :0, 0, 1, 0, 0, 1, 0 (變換後) 患者X、同時診療行為(20種以上):0, 0, 0, 0, 0, 0, 0 患者X、同時診療行為(10種以上):0, 0, 0, 0, 0, 0, 0 患者X、同時診療行為(7種以上) :0, 0, 1, 0, 0, 0, 0 患者X、同時診療行為(5種以上) :0, 0, 1, 0, 0, 1, 0 然後,作為前處理,舉產生「併用醫藥品」之醫療事件的時間序列資訊之例。關於同一名患者,如(變換前)所示,就醫藥品之種別各有多數時間序列資訊。藉由計數此名患者以月計被開立幾件醫藥品的處方,可以產生(變換後)所示之「併用醫藥品」之醫療事件的時間序列資訊。下例中,針對令閾値為20、10、7、5時之情形説明。
(變換前) 患者X、醫藥品A、內科:0, 0, 1, 0, 0, 1, 0 患者X、醫藥品B、外科:0, 0, 1, 0, 0, 1, 0 患者X、醫藥品C、內科:0, 0, 1, 0, 0, 1, 0 患者X、醫藥品D、內科:0, 0, 1, 0, 1, 0, 0 患者X、醫藥品E、內科:0, 0, 1, 0, 0, 0, 0 患者X、醫藥品F、內科:0, 0, 1, 0, 0, 1, 0 患者X、醫藥品G、內科:0, 0, 1, 0, 0, 1, 0 (變換後) 患者X、併用醫藥品(20種以上):0, 0, 0, 0, 0, 0, 0 患者X、併用醫藥品(10種以上):0, 0, 0, 0, 0, 0, 0 患者X、併用醫藥品(7種以上) :0, 0, 1, 0, 0, 0, 0 患者X、併用醫藥品(5種以上) :0, 0, 1, 0, 0, 1, 0 然後,作為前處理,舉產生「診療科變化」之醫療事件的時間序列資訊之例。關於同一名患者,如(變換前)所示,就醫藥品及開立此醫藥品之處方之診療科之組合之種別各有多數時間序列資訊。藉由就醫藥品與開立了此醫藥品之處方的診療科相關之組合逐一檢查是否為從和開立此醫藥品處方之診療科為不同的診療科已開立某醫藥品處方之月份,可以產生(變換後)所示之「診療科變化」之醫療事件的時間序列資訊。以下顯示「診療科變化」之醫療事件的時間序列資訊之產生例。
(變換前) 患者X、醫藥品A、內科  :0, 0, 1, 0, 0, 1, 0 患者X、醫藥品B、外科  :0, 1, 0, 0, 0, 1, 0 患者X、醫藥品C、皮膚科  :0, 0, 0, 1, 1, 1, 0 (變換後) 患者X、診療科變化(醫藥品A):0, 1, 0, 1, 1, 0, 0 患者X、診療科變化(醫藥品B):0, 0, 1, 1, 1, 0, 0 患者X、診療科變化(醫藥品C):0, 1, 1, 0, 0, 0, 0 從記憶裝置12讀出的醫療資訊資料51所含之各醫療事件的時間序列資訊不須處理在某決定的單位的醫療事件相關的時間序列資訊,故將醫療事件之單位變換為其他單位,並重新產生變換之單位之醫療事件的時間序列資訊。
例如將傷病之時間序列資訊使用變換為ICD10碼(疾病及關連保健問題之國際統計分類(ICD:International Statistical Classification of Diseases and Related Health Problems)第10版碼)之變換表而產生代表ICD10單位之傷病之履歷的新的醫療事件的時間序列資訊。再者,醫藥品之時間序列使用變換為ATC碼(解剖治療化學分類法(ATC: Anatomical Therapeutic Chemical Classification System))之變換表而產生代表ATC碼單位之醫藥品之處方履歷之新的醫療事件的時間序列資訊。以下舉就前處理而言,將「傷病」之醫療事件的時間序列資訊變換為ICD10單位時之例子。如就(變換前)所示,令對於患者X在某特定之月份診斷出「心肌症」或「續發性心肌症」的情形。於此情形,「心肌症」和「續發性心肌症」同樣對應於I429之ICD10碼,故如(變換後)所示,能產生I429之關於傷病之時間序列資訊。 (變換前) 患者X、心肌症  :0, 0, 1, 0, 0, 0, 0 患者X、續發性心肌症 :0, 0, 0, 0, 0, 1, 0 (變換後) 患者X、心肌症  :0, 0, 1, 0, 0, 0, 0 患者X、續發性心肌症 :0, 0, 0, 0, 0, 1, 0 患者X、I429  :0, 0, 1, 0, 0, 1, 0 當醫療資訊資料含有實數等二進制資料以外之時間序列資訊時,為了容易產生屬性資料,將此等資料變換為二進制資料。例如:「醫療費」之醫療事件的時間序列資訊有時以實數之時間序列資訊的方式記載於醫療資訊資料。以下說明將「醫療費」之醫療事件的時間序列資訊作為變換對象之例子。
醫藥品有害事例查明時,相較於處理「醫藥費」之金額等詳細資訊,以是否為高額醫療費、或是否為小額醫療費等的方式變換為大略資訊之粒度更為適合。又,如醫療資訊資料所含之其他醫療事件之方式變換為0/1之二進制資料之形式,可藉此使醫療資訊資料所含之醫療事件的時間序列資訊齊一為相同形式,故也有容易處理醫療資訊資料的好處。
設定一定之閾値(例如1000)而將是否為此閾値以上以「0」及「1」表達,並以是否為閾値以上來表達「醫療費」之醫療事件的方式進行資料的變換。此閾値也是控制參數69之一。
以下舉變換前與變換後之「醫療費」之醫療事件之例子。下例中,針對令閾値為1000(4位數)、100(3位數)的情形説明。
(變換前) 患者X,醫療費:300, 550, 90, 140, 2500, 600, 0 (變換後) 患者X,醫療費(1000以上):0, 0, 0, 0, 1, 0, 0 患者X,醫療費(100以上) :1, 1, 0, 1, 1, 1, 0 (1-2)步驟S13: 於步驟S13產生屬性資料。本實施形態中,屬性資料Xn 一般係由多個要素構成的向量表達。就對於每一「醫藥品與傷病」之組合賦予識別此組合之號碼而言,第1組合(亦即n=1)若要素之數目為7,則成為X1 =(0,0,3,2,1,0,0)。 此係代表n=1之組合中,屬性項目1之値為0、屬性項目2之値為0、屬性項目3之値為3、屬性項目4之値為2、屬性項目5之値為1、屬性項目6之値為0、屬性項目7之値為0。產生的屬性資料存放在記憶裝置12。
屬性資料,係表示關於各組合,組合的醫藥品與傷病在,於醫療資訊資料上於同一患者共現的時點的周邊的時期中,是否發生了包含於醫療資訊資料的醫療事件發生或並未發生的特徵的資料。其係基於發生了是否如下的事件的知識而產生:於發生有害事例的時間點,該患者發生比至今為止更高額醫療費、或發生住院、至今為止已處方之醫藥品中止、或為了治療有害事例而追加了某種醫藥品、診療行為、看了和開立醫藥品處方的診療科不同的診療科。
為了從醫療資訊資料以高精準度查明醫藥品有害事例,須於發生有害事例的情形和未發生有害事例之情形之間,就屬性資料而言存在某差異,所以,據認為:藉由將發生有害事例的時間點是否發生或未發生特定醫療事件的特徵表達為屬性資料,則能於發生了有害事例的情形和未發生有害事例的情形之間,就屬性資料而言出現某差異。
以下針對屬性資料之產生方法說明詳情。屬性資料的種類可例如分成以下的6種。
(樣式屬性資料) 第1種為樣式屬性資料。此屬性資料,如圖3所示,係針對組合之醫藥品與傷病,於對同一患者開立醫藥品處方後起算預定長度之第1期間內發生傷病的情形,則以其發生的時點作為基準,抽出代表在此前後之預定的第2期間內是否發生預定種類之醫療事件之順序的樣式,而表示各樣式在醫療資訊資料全體之發生率之屬性資料。第1及第2期間之長度係依為控制參數69之一的期間長度條件決定。
此屬性係基於在發生及非發生有害事例的情形,在發生組合所含之傷病之前後之期間中,可能會發生或不發生高額醫療費、住院等醫療事件的順序方面出現某差異的概念而產生。
例如可認為以下列方式出現差異:於發生代表有害事例之組合所含之傷病前之期間,不會發生高額醫療費,但於傷病發生後之期間,高額醫療費在每時點連續發生的樣式的發生率高,而於非有害事例之組合所含之傷病發生後之期間,高額醫療費在每時點連續發生之樣式之發生率低。
說明樣式屬性資料之一具體例。若關於某名患者,考量以基準時間為中心之前後共7個月的期間,令此期間之每1個月中無住院表達為「0」(無住院)、有注院表達為「1」(有住院),則當在此7個月的期間內至少有1次住院時,以「0」與「1」之組合表達的樣式總共有127種(=27 -1)。可以將此127種樣式分別作為屬性項目,將各樣式之發生率作為屬性項目之値。
(發生率) 第2種屬性資料是發生率屬性資料。此屬性資料,如圖3所示,係代表針對組合之醫藥品與傷病,於對同一患者開立了醫藥品處方後起算預定的長度的第1期間內發生傷病時,預定種類之醫療事件在醫藥品處方後起算到傷病發生為止之期間之發生率之屬性資料。
此屬性資料係基於以下的概念而產生:當發生或未發生有害事例的情形,在組合所含之醫藥品被開立處方後到傷病發生之間之期間中,高額醫療費、住院等醫療事件發生之比例方面可能會出現某差異。
例如:認為在代表有害事例之組合所含之醫藥品被開立處方之時點到傷病發生之時點之間之期間,患者訴說因醫藥品處方而有身體不適並接受醫師診察時,會於同時間實施為了檢查患者的身體情況的各種診療行為,會發生同時診療行為數(10以上)的事件的情形等,所以認為同時診療行為數(10以上)之醫療事件之發生率高。另一方面,非有害事例之組合所含之醫藥品被開立處方之時點到傷病發生之時點之間之期間,患者不會訴說因醫藥品處方而有身體不適並接受醫師診察,故可認為同時診療行為數(10以上)之醫療事件之發生率低。
(轉變機率) 第3種屬性資料是轉變機率屬性資料。此屬性資料,如圖4所示,係代表:針對組合之醫藥品與傷病,對於同一患者開立了醫藥品處方後起算預定的長度的第1期間內發生傷病時,以其發生之時點為基準,在其之前之預定的第3期間與之後之預定的第4期間發生或未發生預定種類之醫療事件之轉變機率之屬性資料。
此屬性資料係基於以下的概念而產生:當發生或未發生有害事例的情形,在組合所含之傷病發生前之期間與後之期間,是否發生高額醫療費、住院等醫療事件之順序可能會出現某差異。
例如:據認為:在代表有害事例之組合所含之傷病發生前之期間,不會發生高額醫療費,在傷病發生後之期間,為了治療有害事例會伴隨發生高額醫療費,如此,高額醫療費之醫療事件從未發生轉變為發生的機率增高。另一方面,據認為非有害事例之組合所含之傷病發生之前與後之期間,兩期間皆不發生高額醫療費,故高額醫療費之醫療事件從未發生轉變為未發生的機率增高。
(事件發生比率之差) 第4種屬性資料是事件發生比率差屬性資料。此屬性資料係針對組合之醫藥品與傷病,於同一患者在醫藥品開立處方後起算預定的長度的第1期間內發生傷病時,將其發生之時點作為基準,使用其之前之預定的第3期間之預定種類之醫療事件之第1發生率、及之後之預定的第4期間之預定種類之醫療事件之第2發生率,進行第1發生率與第2發生率無差異的虛無假設、及有差異的對立假說中,2群之比率之差異的檢定,代表當虛無假設正確時將虛無假設拒絕之機率之p値之屬性資料。
此屬性資料係基於以下的概念而產生:當發生或未發生有害事例的情形,在組合所含之傷病發生前與後之期間中,高額醫療費、住院等醫療事件發生率方面可能會出現差異。
例如:據認為代表有害事例之組合所含之傷病發生前之期間中,發生高額醫療費的機率低,但傷病發生後之期間,為了治療有害事例,發生高額醫療費之機率高,故可認為傷病發生前後在發生率方面有差異,p値減小。另一方面,據認為在非有害事例之組合所含之傷病發生前與後之期間,兩期間發生高額醫療費之機率皆低,所以可認為在傷病發生前後,發生率無差異,p値增大。
(異常値) 第5種屬性資料為異常値屬性資料。此屬性資料係使用針對輸入之各組合之醫藥品與傷病,將對於同一患者開立了醫藥品處方之時點作為基準點,彙整抽出代表在其前後之預定的第2期間內發生或未發生預定種類之醫療事件之順序的樣式的結果而成的第1醫療事件樣式集合,及對於同一患者開立了醫藥品處方之後起算預定的長度之第1期間內發生傷病時,將傷病發生之時點作為基準,彙整抽出代表在其前後之預定的第2期間內發生或未發生預定種類之醫療事件之順序之樣式的結果而成的第2醫療事件樣式集合,使用第1醫療事件樣式集合以機率模型學習醫療事件之樣式,並將表示第2醫療事件樣式集合所含之各樣式就從學習之機率模型生成之樣式而言有多大程度的異常之數値當作屬性資料。
此屬性資料係基於以下的概念而產生:當發生或未發生有害事例的情形,在組合所含之傷病發生前後之期間中,高額醫療費、住院等醫療事件發生或不發生的順序方面可能會出現某差異。
再者,據認為:開立醫藥品處理而發生有害事例的情形很少,大部分的情形即使開立醫藥品處方仍不會發生有害事例。所以,若不論發生或不發生有害事例皆以機率模型學習對於該醫療事件在患者開立了該醫藥品處方之時間點之發生樣式,可能醫療事件在對於患者開立醫藥品處方而發生有害事例之時間點之發生樣式會呈現鮮少發生之發生樣式。
所以據認為:藉由以機率模型學習該醫療事件在對於患者開立了該醫藥品之時間點之發生樣式,將從就學習之機率模型生成之樣式而言顯示異常程度之數値作為屬性資料,則此屬性資料在發生及未發生有害事例的情形可能會出現差異。
例如:據認為當被開立醫藥品而發生有害事例時,伴隨治療有害事例,會發生高額醫療費會在每時點連續發生之樣式,另一方面,在對於患者開立了醫藥品之時間點的醫療事件的時間序列資訊中,不易發生高額醫療費在每時點連續發生的樣式。
機率模型例如可以使用馬可夫(Markov)機率模型,於此情形,藉由將醫療事件之發生樣式作為馬可夫過程操作,並輸入已學習完畢的馬可夫機率模型,可算出屬性資料。或機率模型可使用簡單貝氏模型(Naive BayesModel)。
(離群值) 第6種屬性資料是離群值屬性資料。此屬性資料係表達:使用相關於輸入之各組合之醫藥品與傷病之上述樣式屬性資料,將各組合之樣式屬性資料和所輸入之其他組合之樣式屬性資料比較,樣式屬性資料之各屬性項目之値之大小的傾向離群的程度。
此屬性係基於以下概念而產生:有害事例是鮮少發生的事例,大多數組合為不代表有害事例之組合,且樣式屬性資料之各屬性項目之値之大小之傾向在不代表有害事例之組合彼此之間雖類似,然而若和代表有害事例之組合比較則並非類似,所以組合全體之中,代表有害事例之組合之屬性資料之各屬性項目之値之大小之傾向可能比起其他許多組合會大幅地離群。
例如:據認為針對代表有害事例之組合,醫藥品被開立處方而發生傷病的情形,高額醫療費在每時點連續發生的樣式的發生率高,但針對其他許多不代表有害事例之組合,高額醫療費在每時點連續發生之樣式之發生率低。所以,高額醫療費在每時點連續發生之這樣的樣式之發生率之觀點,代表有害事例之組合相較於其他組合被認為是離群。
此屬性資料之產生係使用算出從其他組合離群之程度的技術。和其相關的技術,已知有離群值查明技術,其中,已知的一般方法之一有:1級支持向量機 [ one class SVM(support vector machine) ]。1級支持向量機係如下方法:輸入之資料當中,將以高密度分布之資料判別為正例並輸出正値,不符合之資料則判別為負例並輸出負値,以此方式學習判別模型,藉由使用此經學習之判別模型,若輸入以低密度分布之資料(亦即,和輸入的其他資料離群之資料),則輸出負値。
上述6種以外之屬性資料有各種變形例之屬性資料。以下針對變形例之屬性資料説明。
(指示函數) 變形例之屬性資料例如:指示函數屬性資料。此屬性資料係代表關於輸入之各組合之醫藥品與傷病,傷病是係屬哪一ICD10碼之屬性資料。
此屬性係基於以下的概念而產生:和表示有害事例之組合含有傷病屬於相同ICD10碼之傷病可能同樣是有害事例。ICD10碼係用於將傷病分類之代碼,故若ICD10碼相,可看成傷病之種類也類似。故若某傷病為醫藥品之有害事例,則可看成ICD10碼為相同的其別傷病也可能是代表相同醫藥品之有害事例。
說明指示函數屬性資料之具體產生方法。從記憶裝置12讀出的正例、負例、非正例負例之組合所含之所有種類之醫藥品與傷病名之中產生出唯一的醫藥品的種類的表和唯一的傷病名的種類的表。又,將唯一的傷病名之種類之表所含之各傷病名使用變換為ICD10之代碼變換表變換成ICD10單位,再產生代表其中之唯一的ICD10之種類之表。然後,使用唯一的醫藥品之種類之表與唯一的ICD10之種類之表重新產生出代表醫藥品與ICD10之全部組合之表。例如:醫藥品之種類為10種,ICD10之種類為100種時,則成為代表醫藥品與ICD10之1000種組合之表。
然後,將此表記載之各組合作為屬性項目,針對正例或負例或非正例亦非負例之「醫藥品與傷病」之各組合,首先將組合所含之傷病使用變換為ICD10之代碼變換表變換成ICD10單位,若此組合所含之醫藥品與ICD10之組合和屬性項目所示之醫藥品與ICD10之組合為一致則令屬性項目之値為「1」,若不一致則令屬性項目之値為「0」。
以上已說明了本實施形態能使用之各種屬性資料,在此列舉之外之屬性資料也可使用。又,本實施形態中,可改變預定之醫療事件之種類,以同樣方式產生上述屬性資料。醫療事件之種類,例如有:住院、醫療費(4位數以上)、醫療費(3位數以上)、同時診療行為(20種以上)、同時診療行為(10種以上)、同時診療行為(7種以上)、同時診療行為(5種以上)、併用醫藥品數(20種以上)、併用醫藥品數(10種以上)、併用醫藥品數(7種以上)、併用醫藥品數(5種以上)等、變換為ICD10單位後之傷病相關之醫療事件、變換為ATC單位後之醫藥品之處方相關之醫療事件等。
又,也可就患者之性別、年齡層,以同樣方式產生上述屬性資料。例如:可將男性且為20幾歲之患者之住院事件之發生率作為屬性資料。其相當求取以下的屬性資料: 代表對於男性且為20幾歲之同一患者開立了醫藥品處方後起算預定的長度之第1期間內發生傷病的情形,醫藥品處方後到傷病發生為止之期間之預定種類之醫療事件之發生率。
又,當求取「醫藥品與傷病」之組合相關之屬性資料時,也可以關於此醫藥品之處方只考慮第1次處方而產生屬性資料。又,醫藥品之處方後有時在第1期間中,傷病會在多個時點發生,於此情形可以只將第1次的傷病作為基準點,限制產生屬性資料。或,也可不只限於第1次處方,以第2次之後的各傷病作為基準點,分別產生屬性資料。或也可以將限定上述醫藥品之處方之條件和限定作為基準點之傷病之條件加以組合。
(2)學習階段S2之詳情: (2-1)步驟S21: 在步驟S21,從記憶裝置12讀取正例之組合52、負例之組合53、及此等正例及負例所對應之正例負例旗標55及屬性資料56。讀出N個正例、負例之組合並對於各組合賦予組合號碼n(n=1,…,N)。又,令有害事例旗標為Yn (n=1,…,N)。亦即,Yn 係代表組合n是正例之組合(Yn =1)還是負例之組合(Yn =-1)的旗標。又,令讀出的屬性資料為Xn (n=1,2,…,N)。Xn 如上述,係組合n所對應之屬性資料。
(2-2)步驟S22: 本實施形態中輸入到判別模型並求得之値為有害事例分數S(Xn )。步驟S22中,決定用以算出此値之判別模型並學習其參數。此有害事例分數S(Xn )代表懷疑組合n為有害事例之強度。以下說明學習算出有害事例分數S(Xn )之判別模型之動作。
作為判別模型可使用當賦予例如:正例負例旗標Yn =1之正例之組合所對應之屬性資料Xn 時能輸出代表某Xn 之Yn =1之強度之分數的線性支持向量機(以下稱為線形SVM)。線形SVM是從Xn 判別Yn =1還是Yn =-1之二進制判別問題中常套用的模型。又,也可以使用邏輯回歸模型等其他的判別模型。
以下以線形SVM為例說明學習判別模型的動作。
線形SVM中,使用以下的線形判別函數,若令加權向量W為M維的加權向量,則對於正例之組合之屬性資料輸出正値,並對於負例之組合之屬性資料輸出負値,藉此判別正例與負例。
f(Xn ,W)=WT Xn …(1) 在此,上標文字的“T”代表向量的轉置。
線形SVM中,當就判別模型之學習資料而言,賦予關於正例與負例之組合之(Xn ,Yn )、(n=1,…,N)時,藉由將以下之目的函數予以最小化,算出加權向量W之値。
【數1】
右邊第1項代表判別誤差之和。當Yn 與WT Xn 的符號一致時,則誤差為零,當符號不一致時,相應於誤差,右邊第1項增大。右邊第2項代表懲罰項(penalty term)。|W|為W之範數(norm)。通常使用範數2或範數1。參數C係調整第1項(是否正例與負例之判別之誤差減小)與第2項(懲罰項)之均衡性之參數。參數C可於事前賦予作為控制參數69。或可針對參數C賦予多數候選,使用交叉驗證(cross validation)法自動選擇最適當的C。
令將L(W)最小化之參數之値為W* ,並令判別模型之參數為W* 。又,作為求出L(W)為最小化之W之方法,已有人提出各種最適化方法。例如:非專利文獻2記載的方法等。
學習階段S2之處理結果判別模型係利用上述學習之模型參數W* 表達(定義)。
(3)有害事例分數算出階段S3之詳情: (3-1)步驟S31: 於步驟S31,從記憶裝置12讀出已學習完畢的判別模型57、正例負例以外之組合54、及此組合所對應的屬性資料。K個正例負例以外之組合及和此組合對應之屬性資料每次各讀出K個。在此,令讀出的屬性資料為Xk (k=1,2,…,K)。
(3-2)步驟S32: 於步驟S32,使用叫出的判別模型W* 來計算Xk 之有害事例分數S(Xk )。具體而言,計算如下: S(Xk ) = W*T Xk …(3) 將計算之有害事例分數S(Xk )存放在記憶裝置12。
(4)抽出階段S4之詳情: (4-1)步驟S41: 於步驟S41,從記憶裝置12讀出K個正例負例以外之組合、和此各組合對應之有害事例分數S(Xk )(k=1,…,K)、及抽出條件。在此例如將抽出組合數之最大數、有害事例分數之閾値作為抽出條件。
(4-2)步驟S42: 當令抽出之組合數之最大數H作為抽出條件時,利用有害事例分數將組合排序,並從有害事例分數較大者開始抽出H個。又,當令有害事例分數之閾値T作為條件時,以有害事例分數將組合排序,將有害事例分數之値為T以上之組合從上開始依序抽出。
(4-3)步驟S43: 步驟S43中,將於步驟S42抽出之抽出結果之強烈懷疑為有害事例之組合之表保存在記憶裝置12。或將抽出結果輸出到畫面顯示部15,或通過通訊界面部13而輸出到外部。
如上,依本實施形態,可依據醫療資訊資料而從正例負例以外之組合之中,依代表為有害事例之可疑性之有害事例分數,以符合抽出條件的方式抽出有害事例之組合。
本實施形態中,將「醫藥品與傷病」之組合作為對象而從預定期間內之醫療事件的時間序列資訊求出屬性資料時,就醫療事件而言,係使用包括對於患者已開立醫藥品處方及於此患者觀察到傷病,以及同時包括對於此患者已實施之醫療行為及伴隨於此醫療行為代表此醫療行為已實施的中至少一者。當患者發生有害事例時,為了對其治療,會於任一診療科受診並實施為了對於檢查・治療之診療行為,並請求相應的醫療費,所以,診療行為、住院、醫療費、及診療科之醫療事件的時間序列資訊方面,在發生和未發生有害事例的情形,會出現某差異。
故關於有害事例之組合與非有害事例之組合,即便在醫藥品之處方期間之關於傷病之發生次數的屬性資料為相同內容,但仍可藉由產生相關於診療行為、診療科、醫療費、住院有無之醫療事件之發生的多種屬性資料,以防止關於有害事例之組合與非有害事例之組合,屬性資料成為相同內容。從本實施形態可知:依照本發明,藉由除了醫藥品與傷病之發生之時間序列資訊以外還使用至少其他1種醫療事件資訊產生屬性資料,比起只使用醫藥品與傷病之發生產生屬性資料的情形,能以更少錯誤、更廣泛地抽出有害事例。
以上説明之本實施形態之醫藥品有害事例抽出裝置中,處理裝置11內設置之輸入部21、屬性資料產生部22、判別模型學習部23、有害事例分數算出部24及抽出部25,可分別製成各別專用的硬體而構成。或,可藉由具備CPU(中央處理裝置)等微處理器及其周邊電路的電腦來構成處理裝置11之全體。當以電腦實現處理裝置11時,使電腦讀取用以執行上述輸入部21、屬性資料產生部22、判別模型學習部23、有害事例分數算出部24及抽出部25之機能之程式並使電腦執行即可。此程式係經由通訊界面部13等而從外部裝置讀取,或從電腦可讀取之記憶媒體讀取並預先存在記憶裝置12或和記憶裝置12分開設置的程式用記憶體內。再者,屬性資料之產生、判別模型之學習、有害事例分數之算出、顯示有害事例所對應組合之抽出之全部或一部分也可由多數處理器分散執行。
以上已就本發明之一實施形態説明,但本發明不只限於以上之實施形態,可進行其他各種的附加改變。以下,針對上述實施形態之各種變形例。又,依各變形例之醫藥品有害事例抽出裝置,也可藉由使電腦讀取對應之程式而使其執行以實現各處理裝置11。
[變形例1] 圖5顯示變形例1之醫藥品有害事例抽出裝置之構成。圖1所示之醫藥品有害事例抽出裝置中,須要預先輸入正例之組合、負例之組合、及正例負例以外之組合之3種組合。而,因為醫療資訊資料51所含之各患者之醫療事件的時間序列資訊當中也含有醫藥品處方之時間序列資訊及是否何時發生了何種傷病的時間序列資訊,所以若有區別正例、負例及正例負例以外之組合之某種機制,則應該可不須預先輸入正例之組合、負例之組合及正例負例以外之組合的3種組合而仍能進行醫藥品有害資訊事例之抽出。如圖4所示者,係在圖1所示之裝置中,在記憶裝置12內配置了記載對於「醫藥品與傷病」之各組合應分類為正例還是應分類為負例之正例負例詞典61,而於處理裝置11內設置組合抽出部26,以從醫療資訊資料51所含之各患者之醫療事件的時間序列資訊抽出「醫藥品與傷病」之組合,並且依據正例負例詞典61將抽出之組合是正例還是負例、或正例負例以外予以自動分類。組合抽出部26相當於組合抽出機構。
圖6顯示圖5所示之變形例1之醫藥品有害事例抽出裝置之動作。此裝置中,在圖2所示之動作之屬性產生階段S1之前,設置組合抽出階段S5,以從醫療資訊資料抽出「醫藥品與傷病」之組合並參照正例負例詞典61將抽出之組合區分為正例之組合、負例之組合以及正例負例以外之組合。
於組合抽出階段S5,首先,於步驟S51,輸入部21接收醫療資訊資料、對象醫藥品及正例負例詞典並存放在記憶裝置12。然後,於步驟S52中,組合抽出部26從醫療資訊資料51抽出組合。此時,參考控制參數69所含之期間長度條件,例如當某患者在某醫藥品處方開立後之第1期間之間(參照圖3)有發生傷病時,則將該醫藥品與該傷病之組合作為抽出對象。並且,參照正例負例詞典61而判定抽出之組合是正例還是負例,若為正例則作為正例之組合存放在記憶裝置12,若為負例則作為負例之組合存放在記憶裝置12,除此以外的情形,則作為正例負例以外之組合存放在記憶裝置12。
步驟S52結束後,和圖2所示之情形同樣,依序執行屬性產生階段S1、學習階段S2、有害事例分數算出階段S3及抽出階段S4。
[變形例2] 圖7顯示依變形例2之醫藥品有害事例抽出裝置之構成。醫藥品有害事例抽出時,會有據認為和某醫藥品大致無關係的傷病。若也將包括如此的傷病的「醫藥品與傷病」之組合作為對象來進行有害事例之抽出,演算時間會延長、或有造成精準度降低之虞。圖7所示之醫藥品有害事例抽出裝置,係將圖5所示之裝置之正例負例詞典改成正例負例停止字詞典62並存在記憶裝置12。如圖7所示,正例負例停止字詞典62係於在變形例1之正例負例詞典61中更存放不認為是成為處理對象之組合的傷病之表作為停止字之表。變形例2中,藉由使用正例負例停止字詞典62,不使用含有該當於停止字之傷病之組合。
圖8顯示圖7所示之變形例2之醫藥品有害事例抽出裝置之動作。變形例2之動作係將圖5所示之變形例1之動作之組合抽出階段S5改為設置組合抽出階段S5a,以藉由參照正例負例停止字詞典62,將從醫療資訊資料抽出之「醫藥品與傷病」之組合之中不要的組合除去並將其餘的組合作為正例之組合或負例之組合抽出。在組合抽出階段S5a中,首先在步驟S53中,輸入部21接收醫療資訊資料、對象醫藥品、期間長度條件、及正例負例停止字詞典並存放在記憶裝置12。然後,在步驟S54中,組合抽出部26從醫療資訊資料51抽出組合。此時,參照控制參數69所含之期間長度條件,於例如:某患者中在某醫藥品處方開立後第1期間之間(參照圖3)有發生傷病時,則將該醫藥品與該傷病之組合作為抽出對象。並且,參照正例負例停止字詞典62,先判定抽出之組合是否為停止字,為停止字時則排除此組合並針對其餘的組合參照正例負例停止字詞典62判定是正例還是負例,若為正例則作為正例之組合存在記憶裝置12,若為負例則作為負例之組合存在記憶裝置12,為除此以外的情形則作為正例負例以外之組合存放在記憶裝置12。
步驟S54結束後,和如圖2所示情形同樣依序執行屬性產生階段S1、學習階段S2、有害事例分數算出階段S3及抽出階段S4。
[變形例3] 圖9顯示變形例3之醫藥品有害事例抽出裝置之構成。至此為止記述之例中,係對於多種醫藥品使用單一判別模型,但變形例3係就各醫藥品之種類使用不同的判別模型。所以,記憶裝置12內係將圖1所示之裝置之判別模型57及有害事例分數58改為存在多數醫藥品判別模型63及多數醫藥品別有害事例分數64。
圖10顯示圖9所示之變形例3之醫藥品有害事例抽出裝置之動作。變形例3之動作係將圖2所示之動作之學習階段S2及有害事例分數算出階段S3改為分別設置學習階段S2a及有害事例分數算出階段S3a。學習階段S2a中,當已執行圖2之學習階段S2之步驟S21後(惟,不叫出判別模型57而是叫出醫藥品別判別模型63),判別模型學習部23在步驟S23中,按醫藥品之種類分割正例之組合與負例之組合,在步驟24中,學習因應醫藥品之種類而對應之醫藥品別判別模型63並將結果存放在記憶裝置12。又,有害事例分數算出階段S3a中,於執行圖2之有害事例分數算出階段S3之步驟S31後,有害事例分數算出部24因應醫藥品之種類而套用對應屬性資料之醫藥品別判別模型63而算出醫藥品別有害事例分數。算出之醫藥品有害事例分數存放在記憶裝置12。
又,變形例3中,在學習階段S2a可不分別學習醫藥品別判別模型,而是採用同時學習之多工學習方法。多工學習方法係同時學習相關連之多數模型(本實施形態中判別模型)之學習方法,比起個別學習,已知有時能以提高各模型之性能(就本實施形態而言,係判別模型判別正例負例之性能提高)的方式學習模型。多工學習方法之代表例記載於非專利文獻3。多工學習方法有各種種類,可使用其中最為一般的方法之一即Trace-Norm Regularized Multi-Task Learning(追蹤範數正則化多工學習)。此方法係以使多數模型之各別的模型參數存在於多數模型共通之低維空間內的方式同時學習之方法。
再者,多工學習方法已知能以同時學習模型(本實施形態中判別模型)之間愈有某種強關連性則各模型之成果(本實施形態之例中係指判別模型判別正例負例之性能)愈高的方式學習模型。所以,本實施形態中,可以不是在全部的醫藥品別判別模型之學習採用多工學習方法,而是如下所示之變形例3-1所説明,以關於藥效相同之醫藥品之醫藥品別判別模型之單位採用多工學習方法。藉此,據認為能更獲得採用多工學習方法之效果。原因為:據認為若藥效相同,因醫藥品之處方引起之有害事例之種類也類似。
再者,變形例3中,也可和變形例1同樣設置正例負例詞典並且自動抽出正例之組合與負例之組合,也可設置和變形例2同樣的正例負例停止字詞典,並自動抽出正例之組合與負例之組合且同時不使用不要的組合。
[變形例3-1] 變形例3中,係就各醫藥品種類使用了不同的判別模型,其中之一的變化是在變形例3-1係依各藥效使用不同的判別模型。亦即,對於藥效相同之多數醫藥品使用單一判別模型。此變形例3-1相當於就「醫藥品之種類」而言並非使用醫藥品之品牌等而使用「醫藥品之藥效」。因此記憶裝置12內,並非如圖9所示之裝置存放多數醫藥品判別模型63及多數醫藥品別有害事例分數64,而是存放多數之藥效別判別模型及多數之藥效別有害事例分數。
變形例3-1之醫藥品有害事例抽出裝置之動作和圖10所示之變形例3之動作相同,但步驟S24係將進行醫藥品別之判別模型之學習替換為進行藥效別之判別模型之學習,並將於步驟S33之醫藥品別之有害事例分數之算出替換為進行藥效別之有害事例分數之算出。
[變形例3-2] 至此為止已記述之例中,係以無關乎正例與負例之組合之醫療資訊資料的頻度之狀態以判別模型學習正例與負例之組合,但變形例3-2中,係分別以個自的判別模型學習醫療資訊資料上之頻度高之正例與負例之組合、及頻度低之正例與負例之組合。因此記憶裝置12內,不是存放圖9所示之裝置之多數醫藥品判別模型63及多數醫藥品別有害事例分數64,而是存放頻度之高低別之判別模型及頻度之高低別之有害事例分數。
當學習用以判別以共現之頻度的觀點有共通特性之正例與負例之判別模型時,據認為:比起在混雜著頻繁地共同發生之醫藥品與傷病之組合與鮮少共現之醫藥品與傷病之組合當中抽出有害事例,如變形例3-2所示,藉由個別地處理頻繁地共現之組合與鮮少共現的組合,判別正例負例之性能會較高。例如:有害事例有頻繁發生的輕有害事例、罕見的重大有害事例的各種種類,所以若使用頻繁地共同發生之醫藥品與傷病之正例之組合與負例之組合來學習判別模型,據認為能查明同樣頻繁發生的有害事例。又,另一方面,若使用鮮少共同發生之醫藥品與傷病之正例之組合與負例之組合來學習判別模型,據認為可查明鮮少發生的有害事例。如此,藉由就頻度之高低別學習判別模型,能期待有害事例之查明精度提高。
變形例3-2之醫藥品有害事例抽出裝置之動作和圖10所示之變形例3之動作同樣,但於步驟S23分割組合時,係設定某閾値並分割成頻度為閾値以上之組合與頻度小於閾値之組合,於步驟S24則將醫藥品別之判別模型之學習替換為學習因應為高頻度還是低頻度而對應的頻度別判別模型,於步驟S33之醫藥品別之有害事例分數之算出中,因應組合之頻度高低來將屬性資料套用到對應的頻度別判別模型,算出頻度別有害事例分數。
又,學習階段使用之頻度之閾値,可預先準備多數候選者後,利用交叉驗證法使用求出之最適閾値。
[變形例4] 圖11顯示變形例4之醫藥品有害事例抽出裝置之構成。圖11所示之裝置係於圖1所示之裝置中就將有害事例分數排序並抽出正例負例以外之組合而言,對於此抽出之正例負例以外之組合進行分組。圖11所示之裝置具有以下構成:對於圖1所示之裝置在處理裝置11內設置分組部27,並於記憶裝置12內存放分組完畢的組合65、分組完畢的有害事例分數66、及分組條件67。分組部27相當於分組機構。
藉由將正例負例以外之組合予以分組,即使例如代表有害事例之組合之分別的代表懷疑為有害事例之分數小,若就各傷病之群組彙總分數,據認為會比起其他傷病群組,包含代表有害事例之組合之傷病群組之分數變得相對較大,可能此傷病群組會上升到分數上位。變形例4中,對於各正例負例以外之組合輸出有害事例分數後,將各組合之傷病名使用否某基準分組,並將屬於同傷病群組之多數之組合之分數彙整為一而算出分組完畢的有害事例分數,然後成組地輸出分組完畢的組合與分組完畢的有害事例分數。
圖12顯示圖11所示之變形例4之醫藥品有害事例抽出裝置之動作。變形例4之動作係於圖2所示之動作之有害事例分數算出階段S3與抽出階段S4之間設置了分組階段S6。於分組階段S6,分組部27先於步驟S61中從記憶裝置12讀取正例負例以外之組合54、有害事例分數58、及分組條件71,並於步驟S62執行正例負例以外之組合54之分組,將分組完畢的組合、及和其對應之分組完畢的有害事例分數存放在記憶裝置12。接續分組階段S6之抽出階段S4中,依據分組完畢的組合65與分組完畢的有害事例分數66,抽出懷疑為有害事例之組合。
又,也可和變形例1同樣地設置正例負例詞典而自動抽出正例之組合與負例之組合,也可設置和變形例2同樣的正例負例停止字詞典而自動抽出正例之組合與負例之組合且不使用不要的組合。
變形例4中,可考慮各種將各組合之傷病名予以分組之條件,例如可將ICD10碼(疾病及關連保健問題之國際統計分類(ICD:International Statistical Classification of Diseases and Related Health Problems)第10版碼)之前4位數(細分類)為相同之各組合之傷病名包括在相同傷病群組。
又,針對將分組完畢的組合所含之多數之組合之分數彙整為一而算出分組完畢的有害事例分數之方法也有各種方法。分組完畢的有害事例分數之計算方法若不同,則容易被抽出到分數上位之分組完畢的組合之傾向不同,故須因應要將帶有哪種性質之分組完畢的組合上升到分數上位的目的而決定計算方法。以下就各種分組完畢的有害事例分數算出方法及其特徵簡單説明。
例如可採用將包括屬於相同ICD10碼(前4位數)之傷病之多數組合之個別的分數的平均値作為分組完畢的有害事例分數之方法。藉由將平均値作為分組完畢的有害事例分數,屬於同群組之組合之分數平均較高之群組會被抽出到分數上位。或即使在只有一部分之組合之分數極端大時,也會將此群組抽出到分數上位。
或也可採用將包括屬於相同ICD10碼(前4位數)之傷病之多數組合個別分數之最大値作為分組完畢的有害事例分數之方法。藉由將最大値作為分組完畢的有害事例分數,包括屬於同群組之組合中強烈懷疑為有害事例(分數之値大)之組合即使為1種此群組仍容易被抽出到分數上位。
或也可採用將包括屬於相同ICD10碼(前4位數)之傷病之多數組合個別分數之中央値作為分組完畢的有害事例分數之方法。藉由將中央値作為分組完畢的有害事例分數,會將屬於同群組之多數組合之分數全體為高之群組抽出到分數上位。當只有某一部分之組合之有害事例分數極端大時,此群組不易被抽出到分數上位。
或可採用將包括屬於相同ICD10碼(前4位數)之傷病之多數組合個自的分數當中只將正的分數合計而得的値作為分組完畢的有害事例分數之方法。藉由以此方式算出,在同群組中含有多數帶有正之高分數之組合的群組容易被抽出到分數上位。
再者,也可採用以下方法:以對於正例負例以外之所以組合賦予之有害事例分數成為0~1之範圍之値方式進行正規化後,將屬於相同ICD10碼(前4位數)之組合之各有害事例分數之合計値作為分組完畢的有害事例分數之方法。藉由在正規化後取合計値,在同群組中含有多數高分數之組合而且同群組所含之組合數較多之傷病群組容易被抽出到分數上位。因為係將順位之分數之値全部正規化為0-1之間後進行分組處理,所以即使同群組有正規化前之分數之値小(負值大)之組合,合計値仍不會下降。屬於同群組之組合多的群組的分組完畢的有害事例分數有增大之傾向。
又,也可採用以下方法:以對於正例負例以外之所以組合賦予之有害事例分數成為0~1之範圍之値方式進行正規化後,將屬於相同ICD10碼(前4位數)之組合之各有害事例分數之平均値作為分組完畢的有害事例分數之方法。藉由在正規化後取平均値,會將屬於同群組之多數組合之分數全體較高之群組抽出到分數上位。因為係將分數之値全部正規化為0-1之間後進行分組處理,所以即使同群組有正規化前之分數之値小(負值大)之組合,合計値仍不會下降。藉由取平均值,會壓抑屬於同群組之組合多的群組的分組完畢的有害事例分數增大之傾向。
以上説明係依據ICD10碼,尤其其前4位數分組,但也可使用ICD10碼以外之傷病分類體系,例如:ICD9碼(ICD第9版碼)分組。
[變形例5] 圖13顯示變形例5之醫藥品有害事例抽出裝置之構成。從醫療資訊資料獲得之「醫藥品與傷病」之組合有時會包括據認為是雜訊(noise)的組合。變形例5之裝置,係於圖1所示之裝置中,在記憶裝置12先存放雜訊之組合71,當抽出懷疑為有害事例之組合時,將該當於雜訊之組合除外。
在此,雜訊之組合是指不易被認定是有害事例之組合。例如:針對組合所含之醫藥品與傷病,在醫藥品之初次處方以後3個月以內出現傷病之患者數為零之組合可視為雜訊。原因為據認為:在初次處方以後3個月以內未曾發生之傷病就因該醫藥品引起之有害事例之可疑性弱。又,例如針對組合所含之醫藥品與傷病,在醫藥品之處方以後3個月以內在任何患者皆未發生傷病之組合也可視為雜訊。原因為:在醫藥品處方之前於患者發生之傷病為有害事例之可疑性弱。
圖14顯示圖13所示之變形例5之醫藥品有害事例抽出裝置之動作。變形例5之動作係將圖2所示之動作之抽出階段S4進行部分變更而作為抽出階段S4a。在抽出階段S4a,首先,步驟S44,輸入部21從通訊界面部13或操作輸入部14接收抽出條件及雜訊之組合,存放在記憶裝置12。然後,於步驟S45,抽出部25從記憶裝置12將有害事例分數58、抽出條件59及雜訊之組合71從正例負例以外之組合以不該當雜訊之組合且符合抽出條件的方式抽出代表有害事例之組合,並將其抽出結果保存在記憶裝置12。之後,抽出部25進行圖2所示之步驟S43,亦即輸出抽出結果。
[變形例6] 圖15顯示變形例6之醫藥品有害事例抽出裝置之構成。上述變形例5中,預先提供雜訊之組合,但變形例6只提供用以判斷雜訊之條件,亦即只提供雜訊條件,並自動地從組合之中將雜訊之組合抽出。如此之變形例6之裝置,係於變形例5之裝置中設置進行雜訊之組合之雜訊抽出部31於處理裝置11內,且在記憶裝置12更存放雜訊條件72。雜訊抽出部31相當於雜訊抽出機構。
雜訊條件,例如可使用以下條件:於醫療資訊資料上在醫藥品之初次處方以後3個月以內出現傷病之患者數為零時,則定義此「醫藥品與傷病」之組合為雜訊。原因為據認為:於初次處方以後3個月以內未曾發生之傷病為因該醫藥品引起之有害事例之可疑性弱。又,例如也可採用醫藥品之處方以後3個月以內無任何患者發生傷病之組合作為雜訊。原因為據認為醫藥品處方前於患者發生之傷病為有害事例之可疑性弱。
圖16顯示圖15所示之變形例6之醫藥品有害事例抽出裝置之動作。變形例6之動作係於圖14所示之變形例5之動作中,在屬性產生階段S1之前執行雜訊抽出階段S7,且將抽出階段S4a進行部分變更而作為抽出階段S4b。於雜訊抽出階段S7,首先,於步驟S71,輸入部21從通訊界面部13或操作輸入部14接收醫療資訊資料與雜訊條件,存放在記憶裝置12。然後,於步驟S72中,雜訊抽出部31從記憶裝置12讀取醫療資訊資料與雜訊條件,搜尋醫療資訊資料當中滿足雜訊條件者,並依據搜尋結果找出成為雜訊之組合,將其存放在記憶裝置12。另一方面,於抽出階段S4b,執行圖2所示之抽出階段S4之步驟41,然後輸入部21從通訊界面部13或操作輸入部14接收抽出條件並存放在記憶裝置12,然後,於步驟S45,抽出部25從記憶裝置12將有害事例分數58、抽出條件59及雜訊之組合71從正例負例以外之組合以不該當雜訊之組合且符合抽出條件之方式抽出代表有害事例之組合,將此抽出結果保存在記憶裝置12。之後,抽出部25進行圖2所示之步驟S43,亦即抽出結果之輸出。
[變形例7] 圖17顯示變形例7之醫藥品有害事例抽出裝置之構成。當為了抽出醫藥品有害事例而使用正例之組合與負例之組合時,有時正例與負例中任一者的數目會比另一者還多,當正例與負例之間的件數有偏差時,判別模型之學習精準度降低,醫藥品有害事例之抽出精準度有降低之虞。變形例7中,為了校正正例之組合與負例之組合之間之個數偏差,係於圖1所示之醫藥品有害事例處理裝置中,在處理裝置11內設置校正正例與負例之間之件數之偏差之偏差校正部32,並於記憶裝置12內存放校正完畢之正例之組合73與校正完畢之負例之組合74。偏差校正部32相當於校正機構,藉由針對正例與負例當中件數較少之一者生成虛擬例(虛擬正例或虛擬負例),或是從正例與負例當中件數較多之一者刪除一些組合,以校正正例與負例之間之件數之偏差。可以生成虛擬正例與虛擬負例兩者使生成之數不同以校正正例與負例之間之件數之偏差,也可以刪除正例與負例兩方使刪除之數目不同而校正正例與負例之間之件數之偏差。實施如此之校正後之正例之組合及負例之組合,分別作為校正完畢之正例之組合及校正完畢之負例之組合。判別模型57學習時,使用校正完畢之正例之組合73及校正完畢之負例之組合74,並以正例與負例之間之件數不偏差的方式實施判別模型57之學習。
圖18顯示圖17所示之變形例7之醫藥品有害事例抽出裝置之動作。變形例7之動作,係於圖2所示之動作中,在緊接於屬性產生階段S1後執行偏差校正階段S8,且將學習階段S2替換為學習階段S2b以進行利用校正完畢之正例及校正完畢之負例之組合學習判別模型。
於偏差校正階段S8,偏差校正部32,首先,於步驟S81,從記憶裝置12接收正例之組合52與負例之組合53與此等之屬性資料56與正例負例旗標55,然後,在步驟S82,執行生成虛擬正例及虛擬負例之組合至少一者並存放在記憶裝置12之偏差校正之處理。虛擬正例及虛擬負例之組合並非由實際之醫療資訊資料導出,但是係以能作為正例之組合、負例之組合而使用在判別模型學習之方式就「醫藥品與傷病」之組合而虛擬生成之資料。虛擬地生成正例或負例之方法,例如可使用非專利文獻4記載之方法。
或於步驟S82,偏差校正部32實施將正例或負例中件數較多之哪一者之組合予以刪除之校正並存放在記憶裝置12之偏差校正之處理。作為如何選擇將正例或負例中之件數較多之哪一者之組合之中刪除之組合之方法,例如可使用非專利文獻5記載之方法。
又,步驟S82中,當對於正例及負例中之一者實施虛擬例之生成或組合之刪除時,針對正例及負例當中未實施如此之虛擬例之生成、組合之刪除者,維持最初之正例或負例之組合而成為校正完畢之之組合。
於學習階段S2b,於步驟S25,判別模型學習部23從記憶裝置12叫出校正完畢之正例之組合73、校正完畢之負例之組合74、該等組合所對應之屬性資料56、正例負例旗標55、及判別模型57,使用此等和圖2所示之情形同樣於步驟S22學習判別模型。已學習之判別模型回到記憶裝置12。接續學習步驟S2b,直接執行圖2所示之有害事例分數算出階段S3及抽出階段S4。
[變形例8] 圖19顯示變形例8之醫藥品有害事例抽出裝置之構成。在至此為止記述之例中,係於假設學習資料(正例之組合及負例之組合)之屬性資料空間上之分布與評價資料(正例負例以外之組合)之分布相似的假設,使用正例之組合與負例之組合而學習判別模型,並從正例負例以外之組合之中對於屬性資料和正例類似之組合給予高有害事例分數,藉此能以高精準度抽出醫藥品有害事例。但是當學習資料之屬性資料空間上之分布和評價資料之分布之間有差異時,即便直接使用正例及負例之組合學習判別模型,仍有難以使用此判別模型從正例負例以外之組合之中以高精準度抽出醫藥品有害事例之虞。
另一方面,本發明中,係將已知是有害事例之正例之組合與已知不是有害事例之負例之組合作為學習資料,就各組合從醫療資訊資料產生屬性資料,但是據認為此醫療資訊資料之中包括醫師為了壓抑既知之有害事例被發現而施加之醫療事件之履歷之影響、醫師於已知不是有害事例之狀況施加之醫療事件之履歷之影響等。所以,據認為:正例之組合或負例之組合、與是或不是有害事例或不是很明確知道是不是有害事例之組合之間,在屬性資料空間上之分布有某些差異。
當學習資料之屬性資料空間上之分布與評價資料之分布有差異的狀況,輸出(本實施形態中該當於有害事例分數)對於給予之輸入(本實施形態中該當於「醫藥品與傷病」之組合)之規則性在學習資料(判別模型之學習使用之正例及負例之組合)與評價資料(正例負例以外之組合)間無不同,但可以就發生給予之學習資料與評價資料之屬性資料空間上之分布不同的共變量平移的狀況解釋。
變形例8中,係套用已知是即使發生共變量平移仍能使用判別模型以高精準度判別正例與負例之學習方法的共變量平移學習方法。
為了套用共變量平移學習方法,須於使用學習資料學習判別模型時預先知道評價資料之分布,本實施形態之方法因已預先知道評價資料(正例負例以外之組合),故為能套用共變量平移學習方法之狀況。一般的機械學習之問題中,鮮少有預先知道評價資料的狀況,預先知道評價資料係本實施形態之特徵之一。
代表性的共變量平移學習方法的例子記載於非專利文獻6。此方法係對於位在評價資料之屬性資料空間上之密度高之範圍的學習資料賦以高權重,並考慮權重而學習判別模型之方法。亦即,較重點地學習評價資料和屬性資料類似之高權重之學習資料,而對於屬性資料不類似之權重小之學習資料較不反映於判別模型之學習之方法。
若令評價資料之組合x之密度為ptest (x)、學習資料之組合x之密度為ptrain (x),則可依下式導出組合x之權重W(x)。
【數2】
上式係代表對於組合x,當評價資料之屬性資料空間上之密度時則賦予較高權重。換言之,學習資料所含之組合x在評價資料之屬性資料空間上之密度愈高則可獲得愈大權重。一般而言,如此的密度ptest (x),ptrain (x)的推估的成本高,故尋求能壓低計算成本之方法。非專利文獻6記載非直接推估ptest (x)及ptrain (x),而是直接推估密度W(x)而壓低計算成本之技術。變形例8中,也可使用如非專利文獻6之方法作為在共變量平移下之學習方法。
又,變形例8中,也可以使用搜尋和正例負例以外之組合為同質之正例與負例之組合並重點地學習此正例與負例之組合以推估密度或密度比之方法。此方法之中,係依句在屬性資料空間之歐幾里德(Euclidean)距離來搜尋同質的正例與負例之組合。以下將使用此方法之情形為例,說明變形例8之裝置及其動作。
變形例8之裝置係利用共變量平移處理而生成校正完畢之正例之組合及校正完畢之負例之組合,將圖17所示之裝置之偏差校正部32替換為設置執行共變量平移處理之共變量平移處理部33。變形例8之校正完畢之正例及校正完畢之負例之組合,和變形例7的情形同樣係追加生成虛擬正例、虛擬負例之組合、或將原本的正例及負例之組合的一部分刪除而得。共變量平移部33相當於共變量平移機構。如上述,屬性資料係以多維向量表達,故若將含此多維向量之向量空間稱為屬性資料空間,則當利用共變量平移處理產生虛擬正例及虛擬負例之組合時,宜產生各組合以使虛擬正例、虛擬負例之屬性資料配置在屬性資料空間中之正例負例以外之組合之屬性資料存在的附近較佳。當利用共變量平移處理將原本的正例及負例之組合之一部分刪除時,宜將屬性資料空間中遠離正例負例以外之組合之屬性資料之屬性資料所對應之正例之組合、負例之組合予以刪除較佳。
圖20顯示圖19所示之變形例8之醫藥品有害事例抽出裝置之動作。變形例8之動作係將圖18所示之變形例7之動作之偏差校正階段S8替換為共變量平移階段S9。共變量平移階段S9中,共變量平移處理部33首先在步驟S91從記憶裝置12接收正例之組合52與負例之組合53與此等之屬性資料56與正例負例旗標55,然後於步驟S92利用共變量平移處理生成虛擬正例之組合及虛擬負例之組合中至少一者,並將原本之正例及負例之組合和將此等組合存放在記憶裝置12作為校正完畢之正例之組合73及校正完畢之負例之組合74。或於步驟S92,共變量平移部33執行將正例及負例之組合之一部分刪除之校正,並將已刪除一部分後之正例及負例之組合存放在記憶裝置12作為校正完畢之正例之組合73及校正完畢之負例之組合74。可以同時進行虛擬正例、虛擬負例之組合之生成及追加、以及原本之正例及負例之組合之部分刪除,並將其結果作為校正完畢之正例之組合73及校正完畢之負例之組合74。
在此,針對共變量平移處理簡單說明處理之流程。
令組合x之屬性資料為d維之向量,將x之第k位的向量項以xk 表達。代表正例負例以外之組合之評價資料以Dtest 表示,代表正例與負例之組合之學習資料以Dtrain 表示。
評價資料Dtest 之中心點(形心)xc ,係指各向量項以下式算出的向量。
【數3】
在此,n為評價資料數(即,正例負例以外之組合數)。評價資料Dtest 之形心距離平均mean係以下式計算之從評價資料到形心之平均距離。
【數4】
在此,樣本xi 和樣本xj 間之歐幾里德距離以dist(xi , xj )表達,具體而言,以下式計算。
【數5】
測試資料Dtest 之形心距離偏差stdev係以下式:
【數6】
計算之評價資料到形心之距離之標準偏差。
同樣,評價資料Dtest 之形心距離中位值median係定義為從評價資料到形心之距離之中位值(中央値)。形心距離偏差stdev之計算可使用mean,也可不使用mean而使用median。
此方法中,係利用歐幾里德距離空間將評價資料到形心之歐幾里德距離較小的學習資料視為對於評價資料之分布也近的學習資料而進行重點學習。又,為了進一步簡化,權重之値只有2,1,0的3種。即,對於重點學習之學習資料給予權重2,反之不想反映在判別模型之學習資料給予權重0,其他之學習資料給予權重1。並且,針對權重2之學習資料進行複製(亦即虛擬正例或虛擬負例之組合)並加到學習資料,並去除權重0之學習資料(亦即,刪除對應的正例或負例之組合)。計算程序如下。
1:計算評價資料之形心xc 、形心距離平均mean、及形心距離偏差stdev,並計算學習資料x之權重w(x)。具體而言,針對各學習資料x,計算距形心xc 之距離dist(x, xc )並以下式求出權重W(x)。
【數7】
在此,a及b為正數參數。上式中,也可不使用mean而使用形心距離中位值median。使用mean還是使用median都可就參數選擇。該等參數作為控制參數69存放在記憶裝置12。
2:w(x)為2時,在學習資料再追加1個x。w(x)為0時,從學習資料去除x。
如上述,就共變量平移處理而言,追加虛擬正例之組合及虛擬負例之組合,或刪除屬性資料空間當中遠離正例負例以外之組合之屬性資料之屬性資料所對應之正例之組合及負例之組合。
[變形例9] 圖21顯示變形例9之醫藥品有害事例抽出裝置之構成。醫藥品有害事例抽出時,考慮此有害事例是否會帶來嚴重的健康受害係為重要。宜更早期查明帶有嚴重的健康受害之有害事例較佳。圖21所示之變形例9之裝置,將正例之組合區分成嚴重之有害事例所對應之組合(將其命名為「正例(嚴重)之組合」)及非嚴重之有害事例所對應之組合(將其命名為「正例(非嚴重)之組合」)。是「嚴重」還是「非嚴重」是反映嚴重度的不同。尚有負例之組合,故變形例3係關連於三値判別問題。圖21所示之變形例9之裝置,和圖1所示之裝置比較,係於記憶裝置12中不存放正例之組合52與判別模型57而是存放正例(嚴重)之組合81、正例(非嚴重)之組合82、正例(嚴重)判別模型83、正例(非嚴重)判別模型84、及負例判別模型85,並且更存放正例(嚴重)分數86、正例(非嚴重)分數87及負例分數88。
圖22顯示圖21所示之變形例9之醫藥品有害事例抽出裝置之動作。變形例9之動作係將圖2所示之動作之學習階段S2及有害事例分數算出階段S3替換為分別設置學習階段S2c及有害事例分數算出階段S3b。
於學習階段S2c,在步驟S26,判別模型學習部23從記憶裝置12叫出正例(嚴重)之組合81、正例(非嚴重)之組合82、負例之組合53、此等之正例(嚴重)、正例(非嚴重)及負例所對應之屬性資料56、正例負例旗標55、正例(嚴重)判別模型83、正例(非嚴重)判別模型84、以及負例判別模型85,並於步驟S27中將正例(嚴重)之組合作為正例,將其他(正例(非嚴重)與負例)作為負例而學習正例(嚴重)判別模型85,並將正例(非嚴重)之組合作為正例,將其他(正例(嚴重)與負例)作為負例,學習正例(非嚴重)判別模型86,並將負例之組合作為正例,將其他(正例(嚴重)與正例(非嚴重))作為負例,而學習負例判別模型85。已學習之各判別模型84~86回到記憶裝置12。
於有害事例分數算出階段S3b,有害事例分數算出部24於步驟S31從記憶裝置12讀出正例(嚴重)判別模型83、正例(非嚴重)判別模型84、負例判別模型85、正例負例以外之組合54、以及此組合所對應的屬性資料。
有害事例分數算出部24在接續的步驟S34中,將讀出的屬性資料套用於正例(嚴重)判別模型83並算出正例(嚴重)分數,存放在記憶裝置12,於步驟S35將讀出的屬性資料套用於正例(非嚴重)判別模型84並算出正例(非嚴重)分數,存放在記憶裝置12,於步驟S36將讀出的屬性資料套用於負例判別模型85並算出負例分數,存放在記憶裝置12。
最後於步驟S4中,抽出部25從記憶裝置12讀出各正例負例以外之組合與各組合之正例(嚴重)分數、正例(非嚴重)分數及負例分,依旬下列例子所示之規則順序按順序進行抽出。
1:將正例(嚴重)分數與正例(非嚴重)分數為正且負例分數為負之組合按正例(嚴重)分數之遞降順序排列並抽出; 2:將正例(嚴重)分數為正且正例(非嚴重)分數與負例分數為負之組合按正例(嚴重)分數之遞降順序排列並抽出; 3:將正例(非嚴重)分數為正且正例(嚴重)分數與負例分數為負之組合按正例(非嚴重)分數之遞降順序排列並抽出; 4:將正例(嚴重)分數與正例(非嚴重)分數與負例分數均為負之組合按負例分數之絕對値大小按之遞降順序排列並抽出; 5:將負例分數為正且正例(嚴重)分數為正且正例(非嚴重)分數為負之組合,按正例(嚴重)分數之遞降順序排列並抽出; 6:將負例分數為正且正例(嚴重)分數為負且正例(非嚴重)分數為正之組合,按正例(非嚴重)分數之遞降順序排列並抽出; 7:將負例分數為正且正例(嚴重)分數與正例(非嚴重)分數為負之組合按負例分數之遞升順序排列並抽出; 又,也可依非上述例子之方法之規則順序按順序進行抽出。
變形例9係導入某種嚴重度而將正例區分為嚴重與非嚴重2種,但也可因應嚴重度將正例區分為3階段以上。
[變形例10] 圖23顯示變形例10之醫藥品有害事例抽出裝置之構成。變形例4中對於已抽出之組合進行分組,變形例10之裝置以輸入之醫療資訊資料之階段進行分組(也稱為事前分組)。例如當顯示相同藥效之醫藥品有多數時,有時將此等多數之醫藥品作為1種醫藥品來處理較理想。變形例10之裝置係在圖1所示之裝置中於處理裝置11內設置進行分組之分組部28,並於記憶裝置12存放分組條件67及分組完畢的醫療資訊資料68。分組部28相當於事前分組機構。
圖24顯示圖23所示之變形例10之醫藥品有害事例抽出裝置之動作。變形例10之動作係將圖2所示之動作之屬性產生階段S1替換為實施分組完畢的醫療資訊資料所對應之屬性產生階段S1a,並且為了產生分組完畢的醫療資訊資料,在屬性產生階段S1a之前段設置分組階段S6a。於分組階段S6a,於步驟S63,輸入部21從通訊界面部13或操作輸入部14接收醫療資訊資料、與正例、負例、正例負例以外之組合、及分組條件,並存放在記憶裝置12。此時,係使用對應於分組者作為正例、負例、正例負例以外之組合。然後,於步驟S64,分組部28從記憶裝置12讀出醫療資訊資料51與分組條件67,依據分組條件進行醫療資訊資料之分組,並將結果存放在記憶裝置12作為分組完畢的醫療資訊資料。於屬性產生階段S1a,屬性資料產生部22首先於步驟S14從從記憶裝置12讀出分組完畢的醫療資訊資料68、正例之組合42、負例之組合53、正例負例以外之組合54及控制參數69,然後,於步驟S12進行前處理,於步驟S13產生讀出的各組合所對應之屬性資料並將產生之屬性資料存放在記憶裝置12。之後,以圖2所示之動作執行學習階段S2、有害事例分數算出階段S3及抽出階段。
於變形例10,將藥效相同之醫藥品進行分組時,分組條件係使用同藥效群之表(顯示同藥效之醫藥品之表)。並且,分組部28執行將醫療資訊資料所含之醫藥品名且係記載於同藥效群之表之醫藥品名替換為同藥效群名之處理。於學習階段,除了已替換成藥效群名之分組完畢的醫療資訊資料,還輸出以同藥效群名代表醫藥品之正例、負例、正例負例以外之組合作為輸入進行判別模型之學習,之後在有害事例分數算出階段S3,使用此已學習完畢的判別模型算出有害事例分數。
又,於變形例10也可進行傷病名之分組。當將傷病名分組時,宜使用ICD10碼較佳。ICD10碼以外也可使用ICD9碼等。以ICD10碼分組時,使用ICD10碼與傷病名之對應表作為分組條件,由分組部28執行將醫療資訊資料所含之傷病名重讀為ICD10碼之處理。在學習階段,除了傷病名已替換為ICD10碼之分組完畢的醫療資訊資料,還輸入以ICD10碼代表傷病之正例、負例、正例負例以外之組合,學習判別模型,之後於有害事例分數算出階段S3使用此已學習完畢的判別模型算出有害事例分數。
以上已說明本實施形態之各種變形例,該等變形例除了如變形例2與變形例3就原理上無法組合者以外,均可任意組合。
上述實施形態及變形例中,當從醫療事件的時間序列資訊就「醫藥品與傷病」之各組合求出屬性資料時,就醫療事件而言,係使用包括對於患者開立醫藥品之處方及在患者觀察到的傷病,以及對於患者實施之醫療行為及顯示附隨於此醫療行為而實施此醫療行為之事件中之至少一者。當患者發生有害事例時,為了加以治療會到任一診療科接受診療並實質為了將其檢查・治療之診療行為,並請求相應之醫療費,所以於診療行為、住院、醫療費、及診療科等醫療事件的時間序列資訊中,可以期待發生與未發生有害事例的情形會出現某種不同。上述實施形態、各變形例,不是使用只著眼在於醫藥品之處方期間發生傷病之屬性資料,而使用可能因應有害事例是否發生而反映出如此的差異的屬性資料,所以能以錯誤更少、更廣泛地抽出有害事例。
以上已參照實施形態、其變形例說明本發明,但本發明不限定於上述實施形態及變形例。本發明之構成、詳情可於本發明之範圍內進行該技術領域中有通常知識者可理解的各種變更。
本申請案基於2014年3月20日提申之日本專利申請案日本特願2014-57635主張優先權,其揭示全部納入於此。
上述實施形態之一部分或全部也可如以下之附記的方式記載,但不限於以下。
[附記1] 一種醫藥品有害事例抽出方法,係抽出為醫藥品與傷病之組合且該當於醫藥品有害事例之組合之醫藥品有害事例抽出方法, 係將已知代表醫藥品有害事例之組合的組合作為正例之組合,將已知並非醫藥品有害事例之組合的組合作為負例之組合,並將給予非正例之組合也非負例之組合的組合作為正例負例以外之組合, 具有以下步驟: 使用各患者之包含醫療事件的時間序列資訊之醫療資訊資料,對於各前述正例之組合、各前述負例之組合、及各前述正例負例以外之組合依據前述醫療事件的時間序列資訊生成屬性資料; 利用前述正例之組合所對應之屬性資料及前述負例之組合所對應之屬性資料學習判別模型; 將前述正例負例以外之組合所對應之屬性資料輸入到前述判別模型並算出分數; 對於就各前述正例負例以外之組合分別算出之前述分數套用抽出條件,抽出懷疑是醫藥品有害事例之前述正例負例以外之組合; 前述各患者之醫療事件包括對於該患者之醫藥品之處方及在該患者觀察到的傷病, 前述各患者之醫療事件更包括對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而代表該醫療行為已實施之事件中之至少一者。
[附記2] 如附記1之方法,其中,前述醫療事件包括對於前述患者新開立處方之醫藥品、以對應之組合規定之傷病以外之傷病、是否住院、醫療費之請求、及該患者受診之診療科中之至少一者以上。
[附記3] 如附記1或2之方法,其中,前述屬性資料係顯示:關於前述各組合,在前述醫療資訊資料中,在同一患者共現該組合之醫藥品與傷病之時點之周邊之時期中,對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而顯示該醫療行為已實施之事件中之至少一者的醫療事件已發生或是未發生之特徵的資料。
[附記4] 如附記3之方法,其中,前述屬性資料使用下列中之至少一者: 當從醫藥品之處方預先決定的第1期間內發生傷病時,就該醫藥品與該傷病之組合成為屬性資料生成之對象的組合而言,將包括前述傷病發生時點之預先決定的長度的第2期間是否發生預先決定之種類之醫療事件以時間序列表示之樣式、 於前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在前述醫藥品之處方到前述傷病發生為止之期間內發生預先決定之種類之醫療事件之發生率、 前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在包括前述傷病發生之時點之預先決定之長度之第2期間發生或是未發生預先決定種類之醫療事件之轉變機率、 前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,對於在前述傷病發生之時點之前後,預定種類之醫療事件之發生率無顯著差異之虛無假設及有顯著差異之對立假說進行檢定,當一方假說正確時拒絕該假說之機率、 針對輸入之各組合之醫藥品與傷病,將對於同一患者處方醫藥品之時點作為基點,彙整抽出代表在該基點前後預定的第3期間內發生及未發生預定種類之醫療事件之順序之樣式的結果的第1醫療事件樣式集合,及對於前述同一患者處方醫藥品後起在前述第1期間內發生傷病時,以傷病發生之時點作為基準在此前後之前述第3期間內,彙整抽出代表發生及未發生前述預定種類之醫療事件之順序之樣式的結果的第2醫療事件樣式集合,使用前述第1醫療事件樣式集合以機率模型進行學習,表示前述第2醫療事件樣式集合所含之各樣式就已學習之前述機率模型生成之樣式而言有多少程度的異常之數値,及 使用輸入之各組合之醫藥品與傷病相關之前述樣式屬性資料,依據各組合之樣式屬性資料之各屬性項目之値之大小的傾向,該樣式屬性資料和輸入的其他組合之樣式屬性資料比較有多少程度的偏離。
[附記5] 如附記3或4之方法,其中,該屬性資料包括表示關於輸入之各組合之醫藥品與傷病,傷病是屬於哪個ICD10碼之資料。
[附記6] 如附記1至5中任一項之方法,其中,更包括執行前處理,係從該醫療資訊資料所含之多數之醫療事件的時間序列資訊生成雖非直接含於該醫療資訊資料但是用於該屬性資料生成之新的醫療事件的時間序列資訊。
[附記7] 如附記1至6中任一項之方法,其中,在生成該屬性資料之前,更包括以下步驟:從該醫療資訊資料將該組合抽出,並將已抽出之組合依據詞典分類為該正例之組合與該負例之組合。
[附記8] 如附記7之方法,係使用更記載應忽略傷病之前述詞典,將包括前述應忽略傷病以外之傷病之前述抽出之組合分類為前述正例之組合與前述負例之組合。
[附記9] 如附記1~8中任一項之方法,其使用針對醫藥品之種類之前述判別模型,就前述醫藥品各種類算出前述有害事例分數。
[附記10] 如附記1~8中任一項之方法,係因應前述醫療資訊資料之各組合之頻度之高低別而使用不同的前述判別模型,針對前述頻度之高低別算出前述有害事例分數。
[附記11] 如附記1~10中任一項之方法,係基於前述分數從醫藥品有害事例之可疑性高之組合當中輸出抽出結果。
[附記12] 如附記11之方法,係以醫藥品之種類別輸出前述抽出結果。
[附記13] 如附記1~10中任一項之方法,具有將前述已抽出之前述正例負例以外之組合予以分組之步驟。
[附記14] 如附記1~13中任一項之方法,具有以下步驟:從前述抽出之正例負例以外之組合將該當於視為雜訊之組合之正例負例以外之組合從抽出當中排除。
[附記15] 如附記1~13中任一項之方法,係依據雜訊條件來判斷輸入之組合是否為視為雜訊之組合; 將該當於視為前述雜訊之組合的前述正例負例以外之組合從前述抽出結果排除。
[附記16] 如附記1~15中任一項之方法,其執行生成並追加成為虛擬正例之組合、生成並追加成為虛擬負例之組合、及刪除前述正例之組合及前述負例之組合之一部分中的至少一者,而生成校正完畢之正例之組合及校正完畢之負例之組合, 依據前述校正完畢之正例之組合及前述校正完畢之負例之組合生成屬性資料,進行前述判別模型之學習。
[附記17] 如附記16之方法,以校正前述正例之組合及前述負例之組合之偏差之方式,生成前述校正完畢之正例之組合及前述校正完畢之負例之組合。
[附記18] 如附記16之方法,係套用共變量平移學習而生成前述校正完畢之正例之組合及前述校正完畢之負例之組合。
[附記19] 如附記1~18中任一項之方法,係因應作為有害事例之傷病之嚴重度之不同而分割正例之組合,並使用判別正例之組合之針對嚴重度之判別模型及判別負例之組合之判別模型。
[附記20] 如附記1~19中任一項之方法,係依據分組條件將醫藥品或傷病予以分組,以將前述醫療資訊資料分組而作為分組完畢的醫療資訊資料, 使用前述分組完畢的醫療資訊資料,產生因應前述已分組之醫藥品或傷病的前述屬性資料。
[附記21] 一種醫藥品有害事例抽出裝置,係將為醫藥品與傷病之組合且該當於醫藥品有害事例之組合予以抽出; 係將已知代表醫藥品有害事例之組合的組合作為正例之組合,將已知並非醫藥品有害事例之組合的組合作為負例之組合,將給予非正例之組合也非負例之組合的組合作為正例負例以外之組合, 包括: 屬性產生機構,使用存放於記憶裝置之包括各患者之醫療事件的時間序列資訊之醫療資訊資料,就存放於該記憶裝置之各該正例之組合、存放於該記憶裝置之各該負例之組合、及存放於該記憶裝置之各該正例負例以外之組合,分別依據該醫療事件的時間序列資訊生成屬性資料而存放於該記憶裝置; 學習機構,利用該正例之組合所對應之屬性資料及該負例之組合所對應之屬性資料學習判別模型; 算出機構,將存放於該記憶裝置之該正例負例以外之組合所對應之屬性資料輸入到該判別模型並算出分數; 抽出機構,對於針對該正例負例以外之各組合算出之該分數套用抽出條件,並將懷疑為醫藥品有害事例之該正例負例以外之組合抽出; 該各患者之醫療事件包括對於該患者開立之醫藥品之處方及於該患者觀察到的傷病; 該各患者之醫療事件更包括對於該患者實施之醫療行為及顯示附隨於對於該患者實施之醫療行為而實施了該醫療行為之事件中之至少一者。
[附記22] 如附記21之裝置,其中,該醫療事件包括對於該患者新處方之醫藥品、以對應之組合規定之傷病以外之傷病、是否住院、醫療費之請求、及該患者就診之診療科中之至少1者以上。
[附記23] 如附記21或22之裝置,其中,該屬性資料係顯示:關於該各組合,在該醫療資訊資料上,該組合之醫藥品與傷病共現於同一患者之時點之周邊之時期中,是否發生還是未發生對於該患者實施之醫療行為及代表附隨於對於該患者實施醫療行為已實施該醫療行為之事件中之至少一醫療事件之特徵的資料。
[附記24] 如附記21或22之裝置,其中,前述屬性資料使用下列中之至少一者: 當從醫藥品之處方預先決定的第1期間內發生傷病時,就該醫藥品與該傷病之組合成為屬性資料生成之對象的組合而言,將包括前述傷病發生時點之預先決定的長度的第2期間是否發生預先決定之種類之醫療事件以時間序列表示之樣式、 於前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在前述醫藥品之處方到前述傷病發生為止之期間內發生預先決定之種類之醫療事件之發生率、 前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在包括前述傷病發生之時點之預先決定之長度之第2期間發生或是未發生預先決定種類之醫療事件之轉變機率、 前述第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,對於在前述傷病發生之時點之前後,預定種類之醫療事件之發生率無顯著差異之虛無假設及有顯著差異之對立假說進行檢定,當一方假說正確時拒絕該假說之機率、 針對輸入之各組合之醫藥品與傷病,將對於同一患者處方醫藥品之時點作為基點,彙整抽出代表在該基點前後預定的第3期間內發生及未發生預定種類之醫療事件之順序之樣式的結果的第1醫療事件樣式集合,及對於前述同一患者處方醫藥品後起在前述第1期間內發生傷病時,以傷病發生之時點作為基準在此前後之前述第3期間內,彙整抽出代表發生及未發生前述預定種類之醫療事件之順序之樣式的結果的第2醫療事件樣式集合,使用前述第1醫療事件樣式集合以機率模型進行學習,表示前述第2醫療事件樣式集合所含之各樣式就已學習之前述機率模型生成之樣式而言有多少程度的異常之數値,及 使用輸入之各組合之醫藥品與傷病相關之前述樣式屬性資料,依據各組合之樣式屬性資料之各屬性項目之値之大小的傾向,該樣式屬性資料和輸入的其他組合之樣式屬性資料比較有多少程度的偏離。
[附記25] 如附記23或24之裝置,其中,該屬性資料包括表示關於輸入之各組合之醫藥品與傷病,傷病是屬於哪個ICD10碼之資料。
[附記26] 如附記21~25中任一項之裝置,更包括執行前處理,係從該醫療資訊資料所含之多數之醫療事件的時間序列資訊生成雖非直接含於該醫療資訊資料但是用於該屬性資料生成之新的醫療事件的時間序列資訊。
[附記27] 如附記21~16中任一項之裝置,更具備組合抽出機構,從該醫療資訊資料將該組合抽出,並將已抽出之組合依據詞典分類為該正例之組合與該負例之組合,存放在前述記憶裝置。
[附記28] 如附記27之裝置,前述詞典更記載應忽略之傷病,前述組合抽出機構將包括前述應忽略傷病以外之傷病之前述抽出之組合分類為前述正例之組合與前述負例之組合。
[附記29] 如附記21~28中任一項之裝置,其針對醫藥品之種類設置前述判別模型,該算出機構就前述醫藥品各種類算出前述有害事例分數。
[附記30] 如附記21~28中任一項之裝置,設有因應前述醫療資訊資料之各組合之頻度之高低別之不同的前述判別模型,前述算出機構針對前述頻度之高低別算出前述有害事例分數。
[附記31] 如附記21~30中任一項之裝置,前述抽出機構依據前述分數從醫藥品有害事例之可疑性高之組合輸出抽出結果。
[附記32] 如附記31之裝置,前述抽出機構就醫藥品之種類別輸出前述抽出結果。
[附記33] 如附記21~30中任一項之裝置,具有對於前述抽出機構獲得之結果進行分組之分組機構。
[附記34] 如附記21~33中任一項之裝置,其中,前述抽出機構將該當於視為雜訊之組合之前述正例負例以外之組合從抽出排除。
[附記35] 如附記21~33中任一項之裝置,更具有雜訊抽出機構,其依據雜訊條件判斷是否輸入之組合為視為雜訊之組合; 前述抽出機構將該當於視為前述雜訊之組合之前述正例負例以外之組合從抽出排除。
[附記36] 如附記21~35中任一項之裝置,具有校正機構,其執行生成並追加成為虛擬正例之組合、生成並追加成為虛擬負例之組合、刪除前述正例之組合及前述負例之組合之一部分中之至少一者,而生成校正完畢之正例之組合及校正完畢之負例之組合; 前述屬性產生機構基於前述校正完畢之正例之組合所對應之屬性資料及前述校正完畢之負例之組合產生屬性資料; 前述學習機構利用前述校正完畢之正例之組合所對應之屬性資料及前述校正完畢之負例之組合所對應之屬性資料學習判別模型。
[附記37] 如附記36之裝置,其中,前述校正機構以校正前述正例之組合及前述負例之組合之偏差之方式生成前述校正完畢之正例之組合及前述校正完畢之負例之組合。
[附記38] 如附記36之裝置,其中,前述校正機構係套用共變量平移學習而生成前述校正完畢之正例之組合及前述校正完畢之負例之組合之共變量平移機構。
[附記39] 如附記31~38中任一項之裝置,其因應作為有害事例之傷病之嚴重度之差異分割正例之組合,並使用針對判別正例之組合之嚴重度之判別模型及判別負例之組合之判別模型。
[附記40] 如附記31~39中任一項之裝置,具有事前分組機構,其依據分組條件將醫藥品或傷病予以分組而將前述醫療資訊資料分組作為分組完畢的醫療資訊資料,並將該分組完畢的醫療資訊資料存放在前述記憶裝置, 前述屬性產生機構使用前述分組完畢的醫療資訊資料,產生因應前述已分組之醫藥品或傷病的前述屬性資料。
[附記41] 一種程式,係使輸入醫藥品與傷病之組合之電腦進行以下的功能: 係將已知代表醫藥品有害事例之組合的組合作為正例之組合,已知並非醫藥品有害事例之組合的組合作為負例之組合,並將非正例之組合也非負例之組合的組合作為正例負例以外之組合, 具有以下機構: 屬性產生機構,使用各患者之包含醫療事件的時間序列資訊之醫療資訊資料,對於各前述正例之組合、各前述負例之組合、及各前述正例負例以外之組合依據前述醫療事件的時間序列資訊生成屬性資料; 學習機構,利用前述正例之組合所對應之屬性資料及前述負例之組合所對應之屬性資料學習判別模型; 算出機構,將前述正例負例以外之組合所對應之屬性資料輸入到前述判別模型並算出分數; 抽出機構,對於就各前述正例負例以外之組合分別算出之前述分數套用抽出條件,抽出懷疑是醫藥品有害事例之前述正例負例以外之組合; 前述各患者之醫療事件包括對於該患者之醫藥品之處方及在該患者觀察到的傷病, 前述各患者之醫療事件更包括對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而代表該醫療行為已實施之事件中之至少一者。
11‧‧‧處理裝置
12‧‧‧記憶裝置
13‧‧‧通訊I/F部
13‧‧‧通訊I/F部
14‧‧‧操作輸入部
15‧‧‧畫面顯示部
21‧‧‧輸入部
22‧‧‧屬性資料產生部
23‧‧‧判別模型學習部
24‧‧‧有害事例分數算出部
25‧‧‧抽出部
26‧‧‧組合抽出部
27‧‧‧分組部
28‧‧‧分組部
31‧‧‧雜訊抽出部
32‧‧‧偏差校正部
33‧‧‧共變量平移處理部
51‧‧‧醫療資訊資料
52‧‧‧正例之組合
53‧‧‧負例之組合
54‧‧‧正例負例以外之組合
55‧‧‧正例負例旗標
56‧‧‧屬性資料
57‧‧‧判別模型
58‧‧‧有害事例分數
59‧‧‧抽出條件
60‧‧‧抽出結果
61‧‧‧正例負例詞典
62‧‧‧正例負例停止字詞典
63‧‧‧醫藥品判別模型
64‧‧‧醫藥品別有害事例分數
65‧‧‧分組完畢之組合
66‧‧‧分組完畢之有害事例分數
67‧‧‧分組條件
68‧‧‧分組完畢之醫療資訊資料
69‧‧‧控制參數
71‧‧‧雜訊之組合
72‧‧‧雜訊條件
73‧‧‧校正完畢之正例之組合
74‧‧‧校正完畢之負例之組合
81‧‧‧正例(嚴重)之組合
82‧‧‧正例(非嚴重)之組合
83‧‧‧正例(嚴重)判別模型
84‧‧‧正例(非嚴重)判別模型
85‧‧‧負例判別模型
86‧‧‧正例(嚴重)分數
87‧‧‧正例(非嚴重)分數
88‧‧‧負例分數
S1‧‧‧屬性產生階段
S11‧‧‧醫療資訊資料、組合的輸入
S12‧‧‧前處理
S13‧‧‧屬性資料之產生
S14‧‧‧分組完畢之醫療資訊資料、組合之輸入
S1a‧‧‧屬性產生階段
S2‧‧‧學習階段
S21‧‧‧正例負例之組合、屬性資料、正例負例旗標之輸入
S22‧‧‧判別模式之學習
S23‧‧‧組合之分割
S24‧‧‧醫藥品別判別模型之學習
S25‧‧‧校正完畢之組合、屬性資料、正例負例旗標之輸入
S26‧‧‧正例(嚴重、非嚴重)負例之組合、屬性資料、正例負例旗標之輸入
S27‧‧‧正例(嚴重)判別模型之學習
S28‧‧‧正例(非嚴重)判別模型之學習
S29‧‧‧負例判別模型之學習
S2a‧‧‧學習階段
S2b‧‧‧學習階段
S2c‧‧‧學習階段
S3‧‧‧有害事例分數算出階段
S31‧‧‧正例負例以外之組合及其屬性資料之輸入
S32‧‧‧有害事例分數之算出
S33‧‧‧醫藥品別之有害事例之算出
S34‧‧‧正例(嚴重)分數之算出
S35‧‧‧正例(非嚴重)分數之算出
S36‧‧‧負例分數之算出
S3a‧‧‧有害事例分數算出階段
S3b‧‧‧有害事例分數算出階段
S4‧‧‧抽出階段
S41‧‧‧抽出條件之輸入
S42‧‧‧抽出處理
S43‧‧‧抽出結果之輸入
S44‧‧‧抽出條件、雜訊之組合之輸入
S45‧‧‧抽出處理
S4a‧‧‧抽出階段
S4b‧‧‧抽出階段
S5‧‧‧組合抽出階段
S51‧‧‧醫療資訊資料、對象醫藥品及正例負例詞典之輸入
S52‧‧‧組合之抽出
S53‧‧‧醫療資訊資料、對象醫藥品、正例負例停止字詞典之輸入
S54‧‧‧組合之抽出
S5a‧‧‧組合抽出階段
S6‧‧‧分組階段
S61‧‧‧正例負例以外之組合、有害事例、分組條件之輸入
S62‧‧‧組合之分組
S63‧‧‧醫療資訊資料、分組完畢條件之輸入
S64‧‧‧分組
S8‧‧‧偏差校正階段
S81‧‧‧正例負例之組合、屬性資料、正例負例旗標之輸入
S82‧‧‧偏差校正
S9‧‧‧共變量平移階段
S91‧‧‧正例負例之組合、屬性資料、正例負例旗標之輸入
S92‧‧‧共變量平移校正
圖1係顯示本發明之一實施形態之醫藥品有害事例抽出裝置之構成之方塊圖。 圖2係顯示圖1所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖3係顯示第1期間與第2期間之關係之圖。 圖4係顯示第1至第4期間之關係之圖。 圖5係顯示變形例1之醫藥品有害事例抽出裝置之構成之方塊圖。 圖6係顯示圖5所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖7係顯示變形例2之醫藥品有害事例抽出裝置之構成之方塊圖。 圖8係顯示圖7所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖9係顯示變形例3之醫藥品有害事例抽出裝置之構成之方塊圖。 圖10係顯示圖9所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖11係顯示變形例4之醫藥品有害事例抽出裝置之構成之方塊圖。 圖12係顯示圖11所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖13係顯示變形例5之醫藥品有害事例抽出裝置之構成之方塊圖。 圖14係顯示圖13所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖15係顯示變形例6之醫藥品有害事例抽出裝置之構成之方塊圖。 圖16係顯示圖15所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖17係顯示變形例7之醫藥品有害事例抽出裝置之構成之方塊圖。 圖18係顯示圖11所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖19係顯示變形例8之醫藥品有害事例抽出裝置之構成之方塊圖。 圖20係顯示圖19所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖21係顯示變形例9之醫藥品有害事例抽出裝置之構成之方塊圖。 圖22係顯示圖21所示之醫藥品有害事例抽出裝置之動作之流程圖。 圖23係顯示變形例10之醫藥品有害事例抽出裝置之構成之方塊圖。 圖24係顯示圖23所示之醫藥品有害事例抽出裝置之動作之流程圖。
11‧‧‧處理裝置
12‧‧‧記憶裝置
13‧‧‧通訊I/F部
14‧‧‧操作輸入部
15‧‧‧畫面顯示部
21‧‧‧輸入部
22‧‧‧屬性資料產生部
23‧‧‧判別模型學習部
24‧‧‧有害事例分數算出部
25‧‧‧抽出部
51‧‧‧醫療資訊資料
52‧‧‧正例之組合
53‧‧‧負例之組合
54‧‧‧正例負例以外之組合
55‧‧‧正例負例旗標
56‧‧‧屬性資料
57‧‧‧判別模型
58‧‧‧有害事例分數
59‧‧‧抽出條件
60‧‧‧抽出結果
69‧‧‧控制參數

Claims (20)

  1. 一種醫藥品有害事例抽出方法,係抽出為醫藥品與傷病之組合且該當於醫藥品有害事例之組合之醫藥品有害事例抽出方法, 係將已知代表醫藥品有害事例之組合的組合作為正例之組合,已知並非醫藥品有害事例之組合的組合作為負例之組合,並將非給予正例之組合也非負例之組合的組合作為正例負例以外之組合, 具有以下步驟: 使用各患者之包含醫療事件的時間序列資訊之醫療資訊資料,對於各該正例之組合、各該負例之組合、及各該正例負例以外之組合依據該醫療事件的時間序列資訊生成屬性資料; 利用該正例之組合所對應之屬性資料及該負例之組合所對應之屬性資料學習判別模型; 將該正例負例以外之組合所對應之屬性資料輸入到該判別模型並算出分數; 對於就各該正例負例以外之組合分別算出之該分數套用抽出條件,抽出懷疑是醫藥品有害事例之該正例負例以外之組合; 該各患者之醫療事件包括對於該患者之醫藥品之處方及在該患者觀察到的傷病, 該各患者之醫療事件更包括對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而代表該醫療行為已實施之事件中之至少一者。
  2. 如申請專利範圍第1項之醫藥品有害事例抽出方法,其中,該醫療事件包括對於該患者新處方之醫藥品、於對應之組合規定之傷病以外之傷病、住院之有無、醫療費之請求、及該患者相關之診療科中之至少1者以上。
  3. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,其中,該屬性資料係顯示:關於該各組合,在該醫療資訊資料中,在同一患者共現該組合之醫藥品與傷病之時點之周邊之時期中,對於該患者實施之醫療行為及附隨於對於該患者實施之醫療行為而顯示該醫療行為已實施之事件中之至少一者的醫療事件已發生或是未發生之特徵的資料。
  4. 如申請專利範圍第3項之醫藥品有害事例抽出方法,其中,該屬性資料使用下列中之至少一者: 當從醫藥品之處方預先決定的第1期間內發生傷病時,就該醫藥品與該傷病之組合成為屬性資料生成之對象的組合而言,將包括該傷病發生時點之預先決定的長度的第2期間是否發生預先決定之種類之醫療事件以時間序列表示之樣式、 於該第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在該醫藥品之處方到該傷病發生為止之期間內發生預先決定之種類之醫療事件之發生率、 該第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,在包括該傷病發生之時點之預先決定之長度之第2期間發生或是未發生預先決定種類之醫療事件之轉變機率、 該第1期間內發生傷病時,將該醫藥品與該傷病之組合作為成為屬性資料生成之對象之組合,對於在該傷病發生之時點之前後,預定種類之醫療事件之發生率無顯著差異之虛無假設及有顯著差異之對立假說進行檢定,當一方假說正確時拒絕該假說之機率、 針對輸入之各組合之醫藥品與傷病,將對於同一患者處方醫藥品之時點作為基點,彙整抽出代表在該基點前後預定的第3期間內發生及未發生預定種類之醫療事件之順序之樣式的結果的第1醫療事件樣式集合,及對於該同一患者處方醫藥品後起在該第1期間內發生傷病時,以傷病發生之時點作為基準在此前後之該第3期間內,彙整抽出代表發生及未發生該預定種類之醫療事件之順序之樣式的結果的第2醫療事件樣式集合,使用該第1醫療事件樣式集合以機率模型進行學習,表示該第2醫療事件樣式集合所含之各樣式就已學習之該機率模型生成之樣式而言有多少程度的異常之數値,及 使用輸入之各組合之醫藥品與傷病相關之該樣式屬性資料,依據各組合之樣式屬性資料之各屬性項目之値之大小的傾向,該樣式屬性資料和輸入的其他組合之樣式屬性資料比較有多少程度的偏離。
  5. 如申請專利範圍第3項之醫藥品有害事例抽出方法,其中,該屬性資料包括表示關於輸入之各組合之醫藥品與傷病,傷病是屬於哪個ICD10碼之資料。
  6. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,更包括執行前處理,係從該醫療資訊資料所含之多數之醫療事件的時間序列資訊生成雖非直接含於該醫療資訊資料但是用於該屬性資料生成之新的醫療事件的時間序列資訊。
  7. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,其中,在生成該屬性資料之前,更包括以下步驟:從該醫療資訊資料將該組合抽出,並將已抽出之組合依據詞典分類為該正例之組合與該負例之組合。
  8. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,係使用針對醫藥品種類之該判別模型就該醫藥品之各種類算出該有害事例分數。
  9. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,係因應該醫療資訊資料之各組合之頻度高低別而使用不同之該判別模型,就該頻度高低別分別算出該有害事例分數。
  10. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,具有將該抽出之該正例負例以外之組合予以分組的步驟。
  11. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,其係執行生成並追加成為虛擬正例之組合、生成並追加成為虛擬負例之組合、刪除該正例之組合及該負例之組合之一部分中之至少一者並生成校正完畢之正例之組合及校正完畢之負例之組合, 依據該校正完畢之正例之組合及該校正完畢之負例之組合生成屬性資料並學習該判別模型。
  12. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,其係因應作為有害事例之傷病之嚴重度的不同分割正例之組合,並使用判別正例之組合之就嚴重度之判別模型及判別負例之組合的判別模型。
  13. 如申請專利範圍第1或2項之醫藥品有害事例抽出方法,係依據分組條件將醫藥品或傷病分組以將該醫療資訊資料分組作為分組完畢的醫療資訊資料, 使用該分組完畢的醫療資訊資料產生因應該已分組之醫藥品或傷病之該屬性資料。
  14. 一種醫藥品有害事例抽出裝置,係將為醫藥品與傷病之組合且該當於醫藥品有害事例之組合予以抽出; 係將已知代表醫藥品有害事例之組合的組合作為正例之組合,將已知並非醫藥品有害事例之組合的組合作為負例之組合,將給予非正例之組合也非負例之組合的組合作為正例負例以外之組合, 包括: 屬性產生機構,使用存放於記憶裝置之包括各患者之醫療事件的時間序列資訊之醫療資訊資料,就存放於該記憶裝置之各該正例之組合、存放於該記憶裝置之各該負例之組合、及存放於該記憶裝置之各該正例負例以外之組合,分別依據該醫療事件的時間序列資訊生成屬性資料而存放於該記憶裝置; 學習機構,利用該正例之組合所對應之屬性資料及該負例之組合所對應之屬性資料學習判別模型; 算出機構,將存放於該記憶裝置之該正例負例以外之組合所對應之屬性資料輸入到該判別模型並算出分數; 抽出機構,對於針對該正例負例以外之各組合算出之該分數套用抽出條件,並將懷疑為醫藥品有害事例之該正例負例以外之組合抽出; 該各患者之醫療事件包括對於該患者開立之醫藥品之處方及於該患者觀察到的傷病; 該各患者之醫療事件更包括對於該患者實施之醫療行為及顯示附隨於對於該患者實施之醫療行為而實施了該醫療行為之事件中之至少一者。
  15. 如申請專利範圍第14項之醫藥品有害事例抽出裝置,其中,該醫療事件包括對於該患者新處方之醫藥品、以對應之組合規定之傷病以外之傷病、是否住院、醫療費之請求、及該患者就診之診療科中之至少1者以上。
  16. 如申請專利範圍第14或15項之醫藥品有害事例抽出裝置,其中,該屬性資料係顯示:關於該各組合,在該醫療資訊資料上,該組合之醫藥品與傷病共現於同一患者之時點之周邊之時期中,是否發生還是未發生對於該患者實施之醫療行為及代表附隨於對於該患者實施醫療行為已實施該醫療行為之事件中之至少一醫療事件之特徵的資料。
  17. 如申請專利範圍第14或15項之醫藥品有害事例抽出裝置,更具備組合抽出機構,從該醫療資訊資料將該組合抽出,並將已抽出之組合依據詞典分類為該正例之組合與該負例之組合,存放在該記憶裝置。
  18. 如申請專利範圍第14或15項之醫藥品有害事例抽出裝置,具有對於該抽出機構獲得之結果進行分組之分組機構。
  19. 如申請專利範圍第14或15項之醫藥品有害事例抽出裝置,具備校正機構,其執行生成並追加成為虛擬正例之組合、生成並追加成為虛擬負例之組合、刪除該正例之組合及該負例之組合之一部分中之至少一者,而生成校正完畢之正例之組合及校正完畢之負例之組合; 該屬性產生機構依據該校正完畢之正例之組合所對應之屬性資料及該校正完畢之負例之組合生成屬性資料, 該學習機構利用該校正完畢之正例之組合所對應之屬性資料及該校正完畢之負例之組合所對應之屬性資料學習判別模型。
  20. 如申請專利範圍第14或15項之醫藥品有害事例抽出裝置,具有事前分組機構,其依據分組條件將醫藥品或傷病予以分組以將該醫療資訊資料分組作為分組完畢的醫療資訊資料,並將該分組完畢的醫療資訊資料存放在該記憶裝置, 該屬性產生機構使用該分組完畢的醫療資訊資料,產生因應該已分組之醫藥品或傷病的該屬性資料。
TW104108866A 2014-03-20 2015-03-20 Method and device for extracting harmful cases of medicine TWI596564B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014057635A JP6410289B2 (ja) 2014-03-20 2014-03-20 医薬品有害事象抽出方法及び装置

Publications (2)

Publication Number Publication Date
TW201610905A TW201610905A (zh) 2016-03-16
TWI596564B true TWI596564B (zh) 2017-08-21

Family

ID=54144688

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104108866A TWI596564B (zh) 2014-03-20 2015-03-20 Method and device for extracting harmful cases of medicine

Country Status (4)

Country Link
US (1) US10886025B2 (zh)
JP (1) JP6410289B2 (zh)
TW (1) TWI596564B (zh)
WO (1) WO2015141724A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170116376A1 (en) * 2015-10-22 2017-04-27 International Business Machines Corporation Prediction of adverse drug events
CN106909981B (zh) * 2015-12-23 2020-08-25 阿里巴巴集团控股有限公司 模型训练、样本平衡方法及装置以及个人信用评分***
JP6908977B2 (ja) * 2016-07-22 2021-07-28 株式会社トプコン 医療情報処理システム、医療情報処理装置及び医療情報処理方法
CN109564782B (zh) * 2016-08-08 2024-03-08 皇家飞利浦有限公司 基于医院人口统计的电子临床决策支持设备
JP6265453B1 (ja) * 2017-02-14 2018-01-24 ジャパンモード株式会社 情報判別システム及び方法、情報判別プログラム
JP7106195B2 (ja) * 2017-12-27 2022-07-26 株式会社オプティム コンピュータシステム、薬提案方法及びプログラム
US11164678B2 (en) * 2018-03-06 2021-11-02 International Business Machines Corporation Finding precise causal multi-drug-drug interactions for adverse drug reaction analysis
JP7092186B2 (ja) * 2018-03-28 2022-06-28 日本電気株式会社 情報処理装置、情報処理方法、プログラム
CN108831560B (zh) * 2018-06-21 2020-09-22 北京嘉和海森健康科技有限公司 一种确定医疗数据属性数据的方法和装置
JP7007243B2 (ja) 2018-07-04 2022-01-24 株式会社日立製作所 異常検知システム
JP7161688B2 (ja) 2018-08-02 2022-10-27 Necソリューションイノベータ株式会社 手術後感染予測装置、手術後感染予測装置生産方法、手術後感染予測方法およびプログラム
US11783189B2 (en) * 2019-08-29 2023-10-10 Nec Corporation Adversarial cooperative imitation learning for dynamic treatment
CN110767320B (zh) * 2019-10-31 2023-03-24 望海康信(北京)科技股份公司 数据处理方法、装置、电子设备及可读存储介质
CN111782904B (zh) * 2019-12-10 2023-10-27 国网天津市电力公司电力科学研究院 一种基于改进smote算法的非平衡数据集处理方法及***
JP7105846B2 (ja) * 2020-10-20 2022-07-25 Epsホールディングス株式会社 統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201232464A (en) * 2011-01-31 2012-08-01 Yuekang Healthcare Man Consultants Inc Online integrating system for anamnesis
TW201329902A (zh) * 2011-10-28 2013-07-16 Mohan Kutty 電子健康記錄系統及方法
TW201333740A (zh) * 2013-03-07 2013-08-16 Yen-Ju Huang 健康資料收集整合利用裝置及系統
US8543422B2 (en) * 2011-04-04 2013-09-24 International Business Machines Corporation Personalized medical content recommendation
TW201403532A (zh) * 2012-07-11 2014-01-16 Mackay Memorial Hospital 醫療資訊交換管理系統
TW201411546A (zh) * 2012-09-11 2014-03-16 Taida Medical Info Technology Co Ltd 藥歷資訊管理方法及系統
US8676599B2 (en) * 2001-10-17 2014-03-18 Siemens Medical Solutions Usa, Inc. System and method for ordering patient specific healthcare services

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010595A1 (en) * 1998-02-27 2002-01-24 Kapp Thomas L. Web-based medication management system
JP2002342336A (ja) * 2001-05-18 2002-11-29 Pml Laboratories Inc 医薬品情報データベース、及び医薬品情報システム
US7461006B2 (en) * 2001-08-29 2008-12-02 Victor Gogolak Method and system for the analysis and association of patient-specific and population-based genomic data with drug safety adverse event data
US20100241453A1 (en) * 2009-03-20 2010-09-23 Mckesson Financial Holdings Limited Method, Apparatus And Computer Program Product For Displaying And Permitting Revision Of A Potential Interaction
WO2010124137A1 (en) * 2009-04-22 2010-10-28 Millennium Pharmacy Systems, Inc. Pharmacy management and administration with bedside real-time medical event data collection
US20120203566A1 (en) * 2010-12-23 2012-08-09 Stratice Llc System and method for providing electronic orders for medical equipment
US9934361B2 (en) * 2011-09-30 2018-04-03 Univfy Inc. Method for generating healthcare-related validated prediction models from multiple sources
US20130226616A1 (en) * 2011-10-13 2013-08-29 The Board of Trustees for the Leland Stanford, Junior, University Method and System for Examining Practice-based Evidence
US9977864B2 (en) 2011-10-28 2018-05-22 Jeffrey S. Melcher Electronic health record system and method
WO2013116243A1 (en) * 2012-01-30 2013-08-08 Ross Medical Corporation Dynamic risk management and resource allocation and treatment system and method
US20140052464A1 (en) * 2012-08-16 2014-02-20 Abhijit Ray Method and system for remote patient monitoring
US20140095201A1 (en) * 2012-09-28 2014-04-03 Siemens Medical Solutions Usa, Inc. Leveraging Public Health Data for Prediction and Prevention of Adverse Events

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676599B2 (en) * 2001-10-17 2014-03-18 Siemens Medical Solutions Usa, Inc. System and method for ordering patient specific healthcare services
TW201232464A (en) * 2011-01-31 2012-08-01 Yuekang Healthcare Man Consultants Inc Online integrating system for anamnesis
US8543422B2 (en) * 2011-04-04 2013-09-24 International Business Machines Corporation Personalized medical content recommendation
TW201329902A (zh) * 2011-10-28 2013-07-16 Mohan Kutty 電子健康記錄系統及方法
TW201403532A (zh) * 2012-07-11 2014-01-16 Mackay Memorial Hospital 醫療資訊交換管理系統
TW201411546A (zh) * 2012-09-11 2014-03-16 Taida Medical Info Technology Co Ltd 藥歷資訊管理方法及系統
TW201333740A (zh) * 2013-03-07 2013-08-16 Yen-Ju Huang 健康資料收集整合利用裝置及系統

Also Published As

Publication number Publication date
JP6410289B2 (ja) 2018-10-24
WO2015141724A1 (ja) 2015-09-24
JP2015184693A (ja) 2015-10-22
US20170083670A1 (en) 2017-03-23
US10886025B2 (en) 2021-01-05
TW201610905A (zh) 2016-03-16

Similar Documents

Publication Publication Date Title
TWI596564B (zh) Method and device for extracting harmful cases of medicine
Kim Measuring frailty in health care databases for clinical care and research
US20190108912A1 (en) Methods for predicting or detecting disease
Murugan et al. E-DiCoNet: Extreme learning machine based classifier for diagnosis of COVID-19 using deep convolutional network
Li et al. A method to combine signals from spontaneous reporting systems and observational healthcare data to detect adverse drug reactions
US20140257832A1 (en) Identifying potential audit targets in fraud and abuse investigations
CN109427420A (zh) 诊断有效性工具
Estiri et al. High-throughput phenotyping with temporal sequences
Wojtusiak et al. Computational Barthel Index: an automated tool for assessing and predicting activities of daily living among nursing home patients
Karthikeyani et al. Comparison a performance of data mining algorithms (CPDMA) in prediction of diabetes disease
CN111180027B (zh) 一种基于医疗大数据的患者画像相关性规则筛选方法及装置
Ibrahim et al. A knowledge distillation ensemble framework for predicting short-and long-term hospitalization outcomes from electronic health records data
Enad et al. A review on artificial intelligence and quantum machine learning for heart disease diagnosis: Current techniques, challenges and issues, recent developments, and future directions
Ho et al. An app for predicting patient dementia classes using convolutional neural networks (CNN) and artificial neural networks (ANN): Comparison of prediction accuracy in Microsoft Excel
Kennion et al. Machine learning as a new horizon for colorectal cancer risk prediction? A systematic review
Alshraideh et al. Enhancing heart attack prediction with machine learning: A study at jordan university hospital
Mathew et al. Applying sequence analysis to uncover'real-world'clinical pathways from routinely collected data: a systematic review
Mandava MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning
Fu et al. The implication of latent information quality to the reproducibility of secondary use of electronic health records
Pham et al. Mining heterogeneous information graph for health status classification
Boytcheva et al. Integrating Data Analysis Tools for Better Treatment of Diabetic Patients.
KR20180108671A (ko) 전자 건강 기록들을 사용하여 의학적 상태들에 대한 진단 및 치료 옵션들을 식별하는 방법 및 시스템
Mahadevaswamy et al. A Hybrid Model approach for Heart Disease Prediction
Rebane et al. Learning from administrative health registries
Zhan Health services information: patient safety research using administrative data