CN111260448B - 基于人工智能的药品推荐方法及相关设备 - Google Patents
基于人工智能的药品推荐方法及相关设备 Download PDFInfo
- Publication number
- CN111260448B CN111260448B CN202010090681.0A CN202010090681A CN111260448B CN 111260448 B CN111260448 B CN 111260448B CN 202010090681 A CN202010090681 A CN 202010090681A CN 111260448 B CN111260448 B CN 111260448B
- Authority
- CN
- China
- Prior art keywords
- medicine
- target
- standard
- recommendation
- probability value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于人工智能的药品推荐方法、***、计算机设备及计算机可读存储介质,所述方法包括以下步骤:采集历史医疗数据以构建原始画像;对原始画像进行预处理并输出特征数据集;经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;并通过XGBOOST推荐模型和深度神经网络推荐模型获得第一推荐强度概率值与第二推荐强度概率值;再进行线性相加以获得目标推荐强度概率值;根据目标推荐强度概率值筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。本发明将两者的模型结果进行线性相加,可有效提高药品推荐的精确率。
Description
技术领域
本发明涉及医药领域,尤其涉及一种基于人工智能的药品推荐方法、***、计算机设备及计算机可读存储介质。
背景技术
现有的患者在购买药品时,通常是选择去连锁药店等实体医药零售店进行购买,具体是患者将自己的症状描述给药师,药师选择相应的药品给患者,但是这种方式存在以下缺陷,药店内的执业药师的水平可能参差不齐,进而导致推荐的药品并不一定适合患者,另外各实体店需配备多名药师进而使人力成本急速上升,因此现在涌现出许多能给使用者推荐药品的***,现有的大多数荐药***基本上都是基于药品自身适应症来与药品适应症进行匹配,理论上确实可行,但忽略了大量专业化的药历数据。药历数据的完整性和有效性将决定药品推荐的准确率,因此,如何提高药品推荐的精确率,是目前所需解决的问题。
发明内容
本发明的目的是提供一种基于人工智能的药品推荐方法、***、计算机设备及计算机可读存储介质,可有效提高药品推荐的精确率。
为实现所述目的,本发明提供一种基于人工智能的药品推荐方法,其包括以下步骤:
采集历史医疗数据以构建原始画像;
对原始画像进行预处理并输出特征数据集;
经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
XGBOOST推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第一推荐强度概率值;
深度神经网络推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第二推荐强度概率值;
将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。
特别地,所述原始画像包括基础信息与病历信息,原始画像的数据来源包括多个不同的数据来源,且多个不同的数据来源所包括的多维度特征不一致。
特别地,采集历史医疗数据的同时,通过关联提取法将历史医疗数据中的数据与关联数据库中的数据建立表对应关系,并采集得到关联数据库中的关联数据以构建原始画像。
特别地,所述预处理包括特征扩充、饱和度探查筛选、缺失值填补、数据集异构与扩充、回馈选择以及相关性筛选。
特别地,所述原始画像包括n×m维度矩阵的特征,所述对原始画像进行预处理包括:用tsfresh算法将n×m维度矩阵的特征简化为若干n×1维度向量的横向拼接,再进行粒子扫描,所述粒子扫描包括单维度粒子扫描与多维度粒子扫描。
特别地,所述对原始画像进行预处理包括:所述单维度粒子扫描通过滑动扫描以衍生出单维度扩充特征集L1,所述多维度粒子扫描通过滑动扫描以衍生出多维度扩充特征集L2,再将单维度扩充特征集、多维度扩充特征集与原始画像进行拼接得到蕴含更多信息量的特征数据集。
特别地,所述采集历史医疗数据时,非标准药品名称的归类包括以下步骤,对非标准药品名称与标准药品名称分别进行分字处理;
基于Word2Vec浅层神经网络,并基于skip_gram算法对非标准药品名称与标准药品名称中的字分别进行字向量的转化;
运用池化的法则纵向进行向量的拼接,以获得非标准药品名称与标准药品名称的词向量拼接;
对非标准药品名称与标准药品名称进行向量距离计算;
找出与非标准药品名称的向量距离最相近的标准药品名称;
将非标准药品名称按照向量距离最相近的标准药品名称的归类标准进行归类处理。
本发明还提供一种基于人工智能的药品推荐***,其包括:
采集模块,其用于采集历史医疗数据以构建原始画像;
预处理模块,其用于对原始画像进行预处理并输出特征数据集;
模型训练模块,其用于将经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
输入模块,其用于获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
处理模块,其用于通过XGBOOST推荐模型计算取得所述药品请求信息对应的目标药品的第一推荐强度概率值,通过深度神经网络推荐模型计算取得所述药品请求信息对应的目标药品的第二推荐强度概率值;并将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
输出模块,其用于将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。
本发明还提供一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明又提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
本发明将XGBOOST推荐模型与深度神经网络推荐模型进行组合,将两者的模型结果进行线性相加,推荐的精确率比非模型的精确率提升了200%,且排名前三的正确药品推荐率从75%提升到了95%。本发明对原始画像中的历史医疗数据通过特征扩充提取出更多的隐含信息以确保特征值的完整性,利用饱和度探查筛选删除不具训练意义的特征值,从而形成完整且有效的特征数据集。此外,本发明将XGBOOST推荐模型与深度神经网络推荐模型组合而成,自动化程度较高,且可自适应训练和预测,提升了药品推荐的效率。
附图说明
图1为本发明基于人工智能的药品推荐方法的流程图;
图2为图1中步骤S10的历史医疗数据涉及非标准药品名称时的归类处理的流程图;
图3为本发明基于人工智能的药品推荐***的模块图;
图4为本发明基于人工智能的药品推荐方法的计算机设备的硬件结构示意图。
附图标记:
1、基于人工智能的药品推荐*** 10、采集模块 20、预处理模块
30、模型训练模块 40、输入模块 50、处理模块
60、输出模块 2、计算机设备 21、存储器 22、处理器
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1所示,本发明基于人工智能的药品推荐方法中包括预先训练形成药品推荐模型的过程和依据所述药品推荐模型进行药品推荐的过程,其包括以下步骤:
步骤S10:采集历史医疗数据以构建原始画像;
步骤S20:对原始画像进行预处理并输出特征数据集;
步骤S30:经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
步骤S40:获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
步骤S50:XGBOOST推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第一推荐强度概率值;
步骤S60:深度神经网络推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第二推荐强度概率值;
步骤S70:将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
步骤S80:将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。
请参阅图2所示,图2为图1中步骤S10的历史医疗数据涉及非标准药品名称时的归类处理的流程图,若历史医疗数据中的药品名称并不是严格的国家标准ICD10编码,无法准确地进行药品的定位和归类。本发明通过可读性介质的文本摘取匹配方法对历史医疗数据中的非标准药品名称进行定位与匹配,以利于对非标准药品名称准确地进行药品的定位和归类。
非标准药品名称的归类包括以下步骤:
步骤S110:对非标准药品名称与标准药品名称分别进行分字处理。
步骤S120:基于Word2Vec浅层神经网络,并基于skip_gram算法对非标准药品名称与标准药品名称中的字分别进行字向量的转化;例如,通过Word2vec的网络训练,将“感”这一个字转化成了向量[1.90334,2.9874,…,0.988],维度5×1。
步骤S130:运用池化的法则纵向进行向量的拼接,以获得非标准药品名称与标准药品名称的词向量拼接;例如,感冒药就可以转化成向量[1.0334,10.51184,…,1.8115],维度15×1。
步骤S140:对非标准药品名称与标准药品名称进行向量距离计算。
步骤S150:找出与非标准药品名称的向量距离最相近的标准药品名称。
步骤S160:将非标准药品名称按照向量距离最相近的标准药品名称的归类标准进行归类处理。
于本实施例中,步骤S10中的原始画像包括基础信息与病历信息,原始画像的数据来源包括多个不同的数据来源,且多个不同的数据来源所包括的多维度特征不一致。
基础信息包括是药品购买者或就医人员的性别、年龄、血型、婚姻、手机号、等等字段信息;
病历信息包括病历概要如目前症状、症状持续时间、症状严重情况、手术史、医疗费用、药品、药品剂型、以及住院天数、住院医嘱等。流感、水痘、手足口等急性病的病历信息、对应发病时间、用药等;高血压、糖尿病、慢阻肺等慢性疾病信息的随访信息,包括患病持续时间、用药等。
不同的数据来源包含的多维度特征不一致,例如,哨点医院的多维度特征会比较丰富和充足,通常包括性别、年龄、血型、婚姻、舒张压、收缩压、各类体检、抽验指标等,中小型门诊、社区医院等可能就只有基础信息;品牌药店就更少了,可能只有用户手机号、药品、药品剂型等。
步骤S10中采集历史医疗数据的同时,通过关联提取法将历史医疗数据中的数据与关联数据库中的数据建立表对应关系,并采集得到关联数据库中的关联数据以构建原始画像,其中,关联数据库为医疗领域以外的数据库,可为保险、金融、科技等多个领域的数据库,关联数据库可为内部数据库或外部免费数据库(例如MySQL数据库),并通过多表主键关联提取法对原始画像中的信息进行多维度的扩充和补缺,以构建更加完善的原始画像。其中,所述主键就是ID,例如经过数据脱敏后的人员社保账号/身份证号。
以关联数据为金融领域的数据为例,通过对金融领域关联数据库的数据进行分析和挖掘,建立用户的消费能力特征维度,从而扩充个人画像的消费能力特征维度,若金融领域关联数据库的数据中包括未参加金融衍生品的理财、未购买保险,则建立用户的消费能力特征维度--消费能力低;若金融领域关联数据库的数据中包括参加过很多金融衍生品的理财、购买过多种保险,则建立用户的消费能力特征维度--消费能力高,所述用户的消费能力特征维度作为训练数据用于训练得到XGBOOST推荐模型和深度神经网络推荐模型。消费能力低的训练数据所训练得到的XGBOOST推荐模型和深度神经网络推荐模型所推荐的药品与其消费能力相对应,即推荐便宜但效果较慢的药品;消费能力高的训练数据所训练得到的XGBOOST推荐模型和深度神经网络推荐模型所推荐的药品与其消费能力相对应,即推荐贵且效果显著的药品。
步骤S10中采集历史医疗数据的同时,还采集其它关联数据,并通过多表主键关联提取法对原始画像中的信息进行多维度的扩充和补缺。
于本于本实施例中,步骤S20中的预处理包括特征扩充、饱和度探查筛选、缺失值填补、数据集异构与扩充、回馈选择以及相关性筛选。
特征扩充的具体实施方式如下,用tsfresh算法进行扩充,计算了许多中间统计变量譬如方差、标准差、极值、各类均值等等。譬如每两列特征f1,f2进行了方差、标准差、极值、各类均值等等统计指标的计算。扩充之后会存在一些列数据的缺失,或者分布不明显的特征譬如整个列都是0或者-1,这样的特征列没有区分性,输入药品推荐模型没有意义,将会对这样的数据列进行删除。
于本实施例中,所述原始画像包括n×m维度矩阵的特征,在对原始画像进行预处理时用tsfresh算法将n×m维度矩阵的特征简化为若干n×1维度向量的横向拼接,例如{H_1,H_2,…,H_m},再进行粒子扫描,所述粒子扫描包括单维度粒子扫描与多维度粒子扫描。
于本实施例中,在对原始画像进行预处理时,所述单维度粒子扫描通过滑动扫描以衍生出单维度扩充特征集L1,所述多维度粒子扫描通过滑动扫描以衍生出多维度扩充特征集L2,再将单维度扩充特征集、多维度扩充特征集与原始画像进行拼接得到蕴含更多信息量的特征数据集。
以单维度粒子扫描为例,上述的每一个H都是一个n×1维度的向量。
首先,定义一个window_size为k的a×1的扫描粒子进行扫描。在对单维度上进行扫描时,应用window_size为k的粒子a×1进行滑动扫描。每滑动到对应单维度上时,将粒子在单维度上得到的扫描数据a-×1进行函数计算,该函数可以为各类统计指标如统计指标如方差、标准差、极值、均值等函数,也可以是tanh、relu等非线性函数。计算得到粒子扫描值。然后,进行窗口滑动,再进行扫描,然后再进行窗口滑动扫描循环下去直至整个单列扫描完毕,则每一个单列特征可以衍生出多列方差、标准差、极值等等多维度的特征。将衍生出来的特征concat成一个单维度扩充特征集L1。原始的特征画像中的特征结合衍生出来的单维度扩充特征集形成预处理后的特征数据集。
以多维度粒子扫描为例,可以取C为一个list作为备选维度。然后从C中循环取出c1,c2等进行操作。假设本次取出c2,则将循环对c2列特征进行粒子形态为d×c2的扫描,同样定义一个新的window_size_2,在c2维度向量上滑动扫描。同样将扫描得到的数据进行了函数计算。
最终每一组c2特征都可以衍生出一组衍生特征。而可以循环对所有特征进行c2扫描。此外,可以取到C中不同的小c如c1,c3,…进行扫描。最终将多粒子扫描得到的画像concat成一个多维度扩充特征集L2。最终将L1,L2与原始画像进行拼接得到蕴含更多信息量的画像W。原始的特征画像中的特征结合衍生出来的多维度扩充特征集形成预处理后的特征数据集。
饱和度探查筛选的具体实施方式如下,对某一维度特征进行探查筛选,以从原始画像中删除饱和度很小的维度特征。以对年龄进行探查筛选为例,假设总共100个人,70个人有年龄的数据特征记录,30个人没有,则年龄这列数据的饱和度为70%,饱和度很小的特征会酌情删除,因为缺失过于严重无法保留有效信息。
缺失值填补的具体实施方式如下,基于非线性插值法、rpart法进行分列缺失值填补,并通过结果回溯进行缺失值填补方案选取。
数据集异构、扩充的具体实施方式如下,以基于可读介质的文本提取进行数据集异构、扩充为例,假设100万人的患病史这列特征里面有糖尿病、高血压等等疾病,那这么多文本信息堆积在这一列特征里面无法让模型直接获取有效的文本介质。因此将这列特征里面有糖尿病的抽取介质成新的一列特征,这100万人中有糖尿病则在新的这列特征标记为1,没有糖尿病则在这列特征标记为0;以此类推其他病种及其他的情况。
于本实施例中,步骤S30中预先训练得到XGBOOST推荐模型和深度神经网络推荐模型的具体实施方式:先根据步骤S20的特征数据集训练得到初始深度神经网络推荐模型与初始XGBOOST推荐模型,经测试数据集测试及优化后获得优化后的深度神经网络推荐模型与XGBOOST推荐模型。
XGBOOST推荐模型和深度神经网络推荐模型的输出数据是待推荐药品及对应的概率值。
所述优化是指在步骤S20的预处理完成之后,搭建好XGBOOST推荐模型和深度神经网络推荐模型,根据计算资源和时间调整两个模型的参数和超参数,给参数和超参数设置阈值,限定其上限与下限,防止进入死循环。
将步骤S20的特征数据集作为训练数据,训练得到初始深度神经网络推荐模型。其中,初始深度神经网络推荐模型为5层神经网络模型,其包括全连接层,所述全连接层包含256个神经元、128个神经元以及64个神经元,并在全连接层都加入Dropout层。初始深度神经网络推荐模型通过反向传播算法求偏导,求偏导遵循链式法则;并通过TensorFlow深度学习框架进行持续的网络训练和调参,最终获得优化后的深度神经网络推荐模型。将步骤S20的特征数据集作为训练数据,训练得到初始XGBOOST推荐模型,初始XGBOOST推荐模型通过自带的feature importance进行进一步的特征因子重要性排序,并筛除权重较低的因子,最终获得优化后的XGBOOST推荐模型。
于本实施例中,步骤S40中的用户的药品请求信息可通过多种方式获取,语音输入后转换成标准格式的文本信息或代码,病历扫描识别后转换成标准格式的文本信息或代码,或手动输入关键栏位信息后转换成标准格式的文本信息或代码,转换后的标准格式的文本信息或代码作为药品请求信息。用户通过***输入的药品请求信息包括年龄、症状、病史等,不同的用户输入的药品请求信息不完全相同。例如,第一用户的药品请求信息包括年龄3岁,第一症状为发烧39度四天,第二症状为干咳两天,第三症状为流浓涕两天。第二用户的药品请求信息包括年龄65岁,症状为头晕,病史为高血压十年,服药十年。
于本实施例中,步骤S50中不同的药品请求信息通过XGBOOST推荐模型计算获得不同的第一推荐强度概率值。例如,XGBOOST推荐模型根据所述用户的药品请求信息计算获得药品库中每一药品的第一推荐强度概率值,分别为第一药品,0.19;第二药品,0.55;第三药品,0.97;……。
于本实施例中,步骤S60中不同的药品请求信息通过深度神经网络推荐模型计算获得不同的第二推荐强度概率值。例如,深度神经网络推荐模型根据所述用户的药品请求信息计算获得药品库中每一药品的第二推荐强度概率值,分别为第一药品,0.89;第二药品,0.15;第三药品,0.07;……。
于本实施例中,步骤S70中的第一推荐强度概率值与第二推荐强度概率值按照权重占比进行线性相加,其中,权重占比通过线性回归(Linear Regression)进行调参,最终获取了组合模型的目标推荐强度概率值。假设,XGBOOST推荐模型的权重占比为第一权重占比,深度神经网络推荐模型的权重占比为第二权重占比,第一权重占比+第二权重占比=1。
第一药品的目标推荐强度概率值=第一药品的第一推荐强度概率值×第一权重占比+第一药品的第二推荐强度概率值×第二权重占比。
第二药品的目标推荐强度概率值=第二药品的第一推荐强度概率值×第一权重占比+第二药品的第二推荐强度概率值×第二权重占比。
以此类推,计算得到药品库中所有的药品的目标推荐强度概率值。
于本实施例中,步骤S80的具体筛选方式可为:通过对目标推荐强度概率值倒序排列后选取排名前三的药品并保存。药品保存的信息包括筛选后的药品排名信息、筛选后的药品名称,也可选择性保存筛选后的目标推荐强度概率值,所述药品排名信息、药品名称与目标推荐强度概率值一一对应。例如,所述第一用户的药品推荐结果分别为第一排名-第三药品-0.97;第二排名-第七药品-0.92;第三排名-第五十药品-0.89。所述第二用户的药品推荐结果分别为第一排名-第一药品-0.89;第二排名-第二药品-0.83;第三排名-第三药口品-0.81。
本发明将XGBOOST推荐模型与深度神经网络推荐模型进行组合,将两者的模型结果进行线性相加,推荐的精确率比非学习模型推荐的精确率提升了200%,且排名前三的正确药品推荐率从75%提升到了95%。本发明对原始画像中的历史医疗数据通过特征扩充提取出更多的隐含信息以确保特征值的完整性,利用饱和度探查筛选删除不具训练意义的特征值,从而形成完整且有效的特征数据集。此外,本发明将XGBOOST推荐模型与深度神经网络推荐模型组合而成,自动化程度较高,且可自适应训练和预测,提升了药品推荐的效率。
请参阅图3所示,本发明还提供一种基于人工智能的药品推荐***,其包括:
采集模块10,其用于采集历史医疗数据以构建原始画像;
预处理模块20,其用于对原始画像进行预处理并输出特征数据集;
模型训练模块30,其用于将经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
输入模块40,其用于获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
处理模块50,其用于通过XGBOOST推荐模型计算取得所述药品请求信息对应的目标药品的第一推荐强度概率值,通过深度神经网络推荐模型计算取得所述药品请求信息对应的目标药品的第二推荐强度概率值;并将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
输出模块60,其用于将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。
请参阅图4所示,本发明还提供一种计算机设备2,所述计算机设备2包括:
存储器21,用于存储可执行程序代码;以及
处理器22,用于调用所述存储器21中的所述可执行程序代码,执行步骤包括上述的基于人工智能的药品推荐方法。
图4中以一个处理器22为例。
存储器21作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的基于人工智能的药品推荐方法对应的程序指令/模块。处理器22通过运行存储在存储器21中的非易失性软件程序、指令以及模块,从而执行计算机设备2的各种功能应用以及数据处理,即实现上述任意方法实施例中的基于人工智能的药品推荐方法。
存储器21可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储用户在计算机设备2的历史医疗数据。此外,存储器21可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器21可选包括相对于处理器22远程设置的存储器21,这些远程存储器21可以通过网络连接至基于人工智能的药品推荐***1。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器21中,当被所述一个或者多个处理器22执行时,执行上述任意方法实施例中的基于人工智能的药品推荐方法,例如,执行以上描述的图1-图2的程序。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例的计算机设备2以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
本申请又一实施例还提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图4中的一个处理器22,可使得上述一个或多个处理器22可执行上述任意方法实施例中的基于人工智能的药品推荐方法,例如,执行以上描述的图1-图2的程序。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到至少两个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
所述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到所述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种基于人工智能的药品推荐方法,其特征在于包括以下步骤:
采集历史医疗数据以构建原始画像;
对原始画像进行预处理并输出特征数据集;
经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
XGBOOST推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第一推荐强度概率值;
深度神经网络推荐模型根据药品请求信息计算获得所述药品请求信息对应的目标药品的第二推荐强度概率值;
将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户;
其中,所述采集历史医疗数据时,非标准药品名称的归类包括以下步骤,
对非标准药品名称与标准药品名称分别进行分字处理;
基于Word2Vec浅层神经网络,并基于skip_gram算法对非标准药品名称与标准药品名称中的字分别进行字向量的转化;
运用池化的法则纵向进行向量的拼接,以获得非标准药品名称与标准药品名称的词向量拼接;
对非标准药品名称与标准药品名称进行向量距离计算;
找出与非标准药品名称的向量距离最相近的标准药品名称;
将非标准药品名称按照向量距离最相近的标准药品名称的归类标准进行归类处理。
2.根据权利要求1所述的基于人工智能的药品推荐方法,其特征在于:所述原始画像包括基础信息与病历信息,原始画像的数据来源包括多个不同的数据来源,且多个不同的数据来源所包括的多维度特征不一致。
3.根据权利要求1所述的基于人工智能的药品推荐方法,其特征在于:采集历史医疗数据的同时,通过关联提取法将历史医疗数据中的数据与关联数据库中的数据建立表对应关系,并采集得到关联数据库中的关联数据以构建原始画像。
4.根据权利要求1所述的基于人工智能的药品推荐方法,其特征在于:所述预处理包括特征扩充、饱和度探查筛选、缺失值填补、数据集异构与扩充、回馈选择以及相关性筛选。
5.根据权利要求1所述的基于人工智能的药品推荐方法,其特征在于:所述原始画像包括n×m维度矩阵的特征,所述对原始画像进行预处理包括:
用tsfresh算法将n×m维度矩阵的特征简化为若干n×1维度向量的横向拼接,再进行粒子扫描,所述粒子扫描包括单维度粒子扫描与多维度粒子扫描。
6.根据权利要求5所述的基于人工智能的药品推荐方法,其特征在于:所述对原始画像进行预处理包括:所述单维度粒子扫描通过滑动扫描以衍生出单维度扩充特征集L1,所述多维度粒子扫描通过滑动扫描以衍生出多维度扩充特征集L2,再将单维度扩充特征集、多维度扩充特征集与原始画像进行拼接得到蕴含更多信息量的特征数据集。
7.一种基于人工智能的药品推荐***,其特征在于包括:
采集模块,其用于采集历史医疗数据以构建原始画像;其中,所述采集历史医疗数据时,非标准药品名称的归类包括以下步骤,对非标准药品名称与标准药品名称分别进行分字处理;基于Word2Vec浅层神经网络,并基于skip_gram算法对非标准药品名称与标准药品名称中的字分别进行字向量的转化;运用池化的法则纵向进行向量的拼接,以获得非标准药品名称与标准药品名称的词向量拼接;对非标准药品名称与标准药品名称进行向量距离计算;找出与非标准药品名称的向量距离最相近的标准药品名称;将非标准药品名称按照向量距离最相近的标准药品名称的归类标准进行归类处理;
预处理模块,其用于对原始画像进行预处理并输出特征数据集;
模型训练模块,其用于将经过预处理的特征数据集作为训练数据,分别预先训练得到XGBOOST推荐模型和深度神经网络推荐模型;
输入模块,其用于获取用户的药品请求信息并输入到XGBOOST推荐模型和深度神经网络推荐模型中;
处理模块,其用于通过XGBOOST推荐模型计算取得所述药品请求信息对应的目标药品的第一推荐强度概率值,通过深度神经网络推荐模型计算取得所述药品请求信息对应的目标药品的第二推荐强度概率值;并将各所述目标药品的第一推荐强度概率值与第二推荐强度概率值进行线性相加以获得各所述目标药品的目标推荐强度概率值;
输出模块,其用于将各所述目标药品的目标药品信息按照对应的目标推荐强度概率值从高到低排序,筛选出排名前预设数量的目标药品信息,并将所述目标药品信息推送至所述用户。
8.一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的基于人工智能的药品推荐方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至6任一项所述的基于人工智能的药品推荐方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010090681.0A CN111260448B (zh) | 2020-02-13 | 2020-02-13 | 基于人工智能的药品推荐方法及相关设备 |
PCT/CN2020/093297 WO2021159640A1 (zh) | 2020-02-13 | 2020-05-29 | 基于人工智能的药品推荐方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010090681.0A CN111260448B (zh) | 2020-02-13 | 2020-02-13 | 基于人工智能的药品推荐方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111260448A CN111260448A (zh) | 2020-06-09 |
CN111260448B true CN111260448B (zh) | 2023-10-20 |
Family
ID=70954445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010090681.0A Active CN111260448B (zh) | 2020-02-13 | 2020-02-13 | 基于人工智能的药品推荐方法及相关设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111260448B (zh) |
WO (1) | WO2021159640A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230091973A1 (en) * | 2020-03-09 | 2023-03-23 | Amar Chowdry | Medzone. |
CN111914164B (zh) * | 2020-06-20 | 2024-04-26 | 武汉海云健康科技股份有限公司 | 一种基于医疗大数据的用药预测方法及*** |
CN112035757A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗瀑布流推送方法、装置、设备及存储介质 |
CN111949888B (zh) * | 2020-09-02 | 2023-10-10 | 度小满科技(北京)有限公司 | 一种数据推荐方法及装置 |
CN112131788B (zh) * | 2020-09-18 | 2022-09-02 | 江西兰叶科技有限公司 | 用于教学的电机设计方法及*** |
CN112486338A (zh) * | 2020-11-23 | 2021-03-12 | 深圳市鹰硕教育服务有限公司 | 医疗信息处理方法、装置及电子设备 |
CN112562854A (zh) * | 2020-12-17 | 2021-03-26 | 山东大学 | 一种高龄人员精准医疗关怀服务推荐方法及*** |
CN113393295A (zh) * | 2021-06-15 | 2021-09-14 | 北方健康医疗大数据科技有限公司 | 服务数据的推送方法、装置、电子设备及存储介质 |
CN113344415A (zh) * | 2021-06-23 | 2021-09-03 | 中国平安财产保险股份有限公司 | 基于深度神经网络的业务分配方法、装置、设备及介质 |
CN113722371B (zh) * | 2021-08-31 | 2024-04-12 | 深圳平安智慧医健科技有限公司 | 一种基于决策树的药品推荐方法、装置、设备及存储介质 |
CN113764067B (zh) * | 2021-09-08 | 2023-09-08 | 深圳平安智慧医健科技有限公司 | 药物推荐方法、***、设备及存储介质 |
CN113988949A (zh) * | 2021-11-15 | 2022-01-28 | 北京有竹居网络技术有限公司 | 一种推广信息处理方法、装置、设备及介质、程序产品 |
CN114722976A (zh) * | 2022-06-09 | 2022-07-08 | 青岛美迪康数字工程有限公司 | 一种药品推荐***及构建方法 |
CN116504354B (zh) * | 2023-06-28 | 2024-01-09 | 合肥工业大学 | 一种基于智慧医疗的智能化服务推荐方法及*** |
CN117198513B (zh) * | 2023-11-07 | 2024-03-29 | 北京烔凡科技有限公司 | 一种针对高血压患者的健康指导方法及*** |
CN117252664A (zh) * | 2023-11-10 | 2023-12-19 | 浙江口碑网络技术有限公司 | 药品推荐理由生成方法、装置、介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备 |
CN109087691A (zh) * | 2018-08-02 | 2018-12-25 | 科大智能机器人技术有限公司 | 一种基于深度学习的非处方药品推荐***和推荐方法 |
CN109871464A (zh) * | 2019-01-17 | 2019-06-11 | 东南大学 | 一种基于ucl语义标引的视频推荐方法与装置 |
CN109933729A (zh) * | 2019-03-28 | 2019-06-25 | 广州麦迪森在线医疗科技有限公司 | 一种基于用户偏好的医疗学术资讯推荐方法及*** |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6733886B2 (ja) * | 2016-07-12 | 2020-08-05 | グロースメディスン株式会社 | 骨粗鬆症の推奨薬の提示システム |
CN107945847B (zh) * | 2017-12-12 | 2021-05-28 | 科大智能机器人技术有限公司 | 一种非处方药品的推荐***及方法 |
CN109102855A (zh) * | 2018-07-03 | 2018-12-28 | 北京康夫子科技有限公司 | 药物推荐方法 |
CN109711887B (zh) * | 2018-12-28 | 2021-02-09 | 拉扎斯网络科技(上海)有限公司 | 商城推荐列表的生成方法、装置、电子设备及计算机介质 |
CN110085292B (zh) * | 2019-04-28 | 2022-07-26 | 广东技术师范大学 | 药品推荐方法、装置及计算机可读存储介质 |
-
2020
- 2020-02-13 CN CN202010090681.0A patent/CN111260448B/zh active Active
- 2020-05-29 WO PCT/CN2020/093297 patent/WO2021159640A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备 |
CN109087691A (zh) * | 2018-08-02 | 2018-12-25 | 科大智能机器人技术有限公司 | 一种基于深度学习的非处方药品推荐***和推荐方法 |
CN109871464A (zh) * | 2019-01-17 | 2019-06-11 | 东南大学 | 一种基于ucl语义标引的视频推荐方法与装置 |
CN109933729A (zh) * | 2019-03-28 | 2019-06-25 | 广州麦迪森在线医疗科技有限公司 | 一种基于用户偏好的医疗学术资讯推荐方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN111260448A (zh) | 2020-06-09 |
WO2021159640A1 (zh) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111260448B (zh) | 基于人工智能的药品推荐方法及相关设备 | |
Hofstra et al. | Sources of segregation in social networks: A novel approach using Facebook | |
CN108766512B (zh) | 健康数据管理方法、装置、计算机设备和存储介质 | |
Ditzen | Estimating long-run effects and the exponent of cross-sectional dependence: An update to xtdcce2 | |
Haraty et al. | An enhanced k-means clustering algorithm for pattern discovery in healthcare data | |
Johnson | Market segmentation: A strategic management tool | |
CN113360671B (zh) | 一种基于知识图谱的医保医疗单据审核方法及其*** | |
US11321361B2 (en) | Genealogical entity resolution system and method | |
CN106156693A (zh) | 用于面部识别的基于多模型表示的鲁棒错误纠正方法 | |
Tan et al. | Investigation on the data augmentation using machine learning algorithms in structural health monitoring information | |
Price et al. | Procedures for reliable cultural model analysis using semi-structured interviews | |
Magnus et al. | Item response modeling of multivariate count data with zero inflation, maximum inflation, and heaping | |
US12008047B2 (en) | Providing an object-based response to a natural language query | |
Hall et al. | Targeting item–level nuances leads to small but robust improvements in personality prediction from digital footprints | |
Al Mazidi et al. | Study of general education diploma students’ performance and prediction in Sultanate of Oman, based on data mining approaches | |
CN114207604A (zh) | 使用针对性问题回答来提取科学测量背景的***和方法 | |
Islam et al. | Predictive analytics framework for accurate estimation of child mortality rates for Internet of Things enabled smart healthcare systems | |
Beck et al. | Personalized prediction of behaviors and experiences: An idiographic person–situation test | |
Rupnik et al. | Integrating data mining and decision support through data mining based decision support system | |
CN117786086A (zh) | 答复文本生成方法、装置、计算机设备和可读存储介质 | |
US11836633B2 (en) | Generating realistic counterfactuals with residual generative adversarial nets | |
Paganin et al. | Computational strategies and estimation performance with Bayesian semiparametric item response theory models | |
Browett | Into the cul de sac of the Dependency Paradigm with AG Frank1 | |
Hamoud et al. | Design and implementing cancer data warehouse to support clinical decisions | |
Filippova et al. | Humans in the loop: Incorporating expert and crowd-sourced knowledge for predictions using survey data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40020788 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |