CN111986808B - 健康保险风险评估及控制的方法、装置及介质 - Google Patents
健康保险风险评估及控制的方法、装置及介质 Download PDFInfo
- Publication number
- CN111986808B CN111986808B CN202010751841.1A CN202010751841A CN111986808B CN 111986808 B CN111986808 B CN 111986808B CN 202010751841 A CN202010751841 A CN 202010751841A CN 111986808 B CN111986808 B CN 111986808B
- Authority
- CN
- China
- Prior art keywords
- data
- health insurance
- index
- health
- insurance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000036541 health Effects 0.000 title claims abstract description 152
- 238000012954 risk control Methods 0.000 title claims abstract description 73
- 238000012502 risk assessment Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000011156 evaluation Methods 0.000 claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 43
- 238000013135 deep learning Methods 0.000 claims abstract description 24
- 238000013136 deep learning model Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000013210 evaluation model Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 41
- 238000012360 testing method Methods 0.000 claims description 25
- 238000012795 verification Methods 0.000 claims description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 10
- 239000010931 gold Substances 0.000 claims description 10
- 229910052737 gold Inorganic materials 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000000474 nursing effect Effects 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 7
- 230000006399 behavior Effects 0.000 claims description 6
- 230000009295 sperm incapacitation Effects 0.000 claims description 6
- 208000012260 Accidental injury Diseases 0.000 claims description 4
- 208000014674 injury Diseases 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000013461 design Methods 0.000 description 13
- 238000007726 management method Methods 0.000 description 13
- 230000008901 benefit Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012550 audit Methods 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002431 foraging effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Pathology (AREA)
- Development Economics (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种健康保险风险评估及控制的方法、装置及介质的技术方案,包括:通过大数据环境对一项或多项涉及健康保险风险评估的维度数据进行采集;进行健康保险精算指标进行计算;根据维度数据及健康保险精算指标进行预处理和正则化处理,得到评价指标数据;根据评价指标数据和健康保险精算指标数据计算健康保险风险评指标,构建三维面板数据并进行预测,输出最优预测结果;以时间序列深度学***台,实现健康保险精算工作的各大指标,降低供保单位逆选择的风险。
Description
技术领域
本发明涉及计算机领域,具体涉及了一种健康保险风险评估及控制的方法、装置及介质。
背景技术
健康保险是以人的身体健康为目标,对因疾病或意外伤害所发生的医疗费用或因疾病或意外失能所造成的收入损失的保险,此外,健康保险还包括因年老、疾病、伤残需要长期护理而给予经济补偿的保险。社会医疗保险和商业健康保险均属于健康保险。对于健康保险经营管理的基础工作之一便是精算工作,主要分为费率制定、赔付率制定和准备金提取三大部分。费率制定是精算工作的主要任务。定价和公平是健康保险费率制定的两大基本原则。赔付率制定是评价精算工作主要指标之一。准备金提取是衡量健康保险企业能否在一段时间内正常运营,或衡量健康保险企业一段时间内能承接的保单数量等。
现有技术没有有效的技术方案能够实现对健康保险风险评估及控制。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供了一种健康保险风险评估及控制的方法、装置及介质,通过分布式大数据采集相关数据,基于深度学***台,实现健康保险精算工作的各大指标,降低供保单位逆选择的风险。
本发明的技术方案包括一种健康保险风险评估及控制的方法,其特征在于,该方法包括:S100,构建大数据环境;S200,通过所述大数据环境对一项或多项涉及健康保险风险评估的维度数据进行采集,S300,对所述维度数据进行健康保险精算指标进行计算;S400,根据所述维度数据及所述健康保险精算指标进行预处理和正则化处理,得到评价指标数据,所述预处理包括将文本数据和/或定性数据进行量化处理;S500,根据所述评价指标数据和所述健康保险精算指标数据计算健康保险风险评指标,构建对应的三维面板数据;S600,将所述三维面板数据作为训练数据和验证数据通过时间序列深度学习模型进行预测,输出最优预测结果。
根据所述的健康保险风险评估及控制的方法,其中该方法还包括:S700,随机选取多个所述面板数据作为测试数据,通过所述时间序列深度学习模型进行训练,并以所述时间序列深度学习模型的准确率、召回率和AUC值等作为健康保险风险评估模型的评价参数。
根据所述的健康保险风险评估及控制的方法,其中S700包括:S710,扩充所述训练数据和所述验证数据的数据库,输入到所述S600中的所述时间序列深度学习模型进行反复训练;S720,重新抽取训练和验证数据,改变抽取比例,输入至所述时间序列深度学习模型中进行所述S600的模型训练和参数选择,并对所述时间序列深度学习模型进行S700时的所述时间序列深度学习模型进行重复评价,直至评价参数稳定在设定范围,并确定最优模型参数。
根据所述的健康保险风险评估及控制的方法,其中S200包括:调用一个或多个平台的接口获取对应的维度数据,所述维度数据包括评价相关因素指标数据及评价指标数据;其中,评价相关因素指标数据包括健康保险公司内部运营数据、约定赔保条件相关数据、投保人健康管理相关数据;评价指标数据主要包括但不限于指定保险类型的参保率、基金征缴额度、续保率、资金结存率、人均在该保险种类年度消费金额。
根据所述的健康保险风险评估及控制的方法,其中S300包括:对于约定疾病的疾病保险、约定医疗行为的医疗保险、约定疾病或意外伤害导致的工作能力丧失类的失能收入丧失保险以及约定日常生活能力障碍引起的护理需要类的护理保险进行精算;对应的精算指标包括费率制定的精算指标、赔付率指标及准备金指标;所述费率制定的精算指标包括但不限于索赔总额、等待期、免赔额、保单续保率、保单失效率、利率和安全余量、费用金额范围、免赔额、最高限额及公报比例;所述赔付率指标包括但不限于满期赔付率、历年制赔付率及综合赔付率;所述准备金指标包括但不限于已发生未报案责任准备金及已发生未充分报案责任准备金。
根据所述的健康保险风险评估及控制的方法,其中S400包括:根据所述维度数据及所述健康保险精算指标进行预处理和正则化处理;其中量化处理包括使用one-hot及其他量化方法将定性的数据或文本量化到[0,1]范围内,去除无用数据填充缺失数据,其中0表示指标程度最小,1表示指标程度最大;通过Python对预处理数据进行正则化处理。
根据所述的健康保险风险评估及控制的方法,其中S500包括:通过公式对健康风险评估的值进行计算,并将健康风险评估的值作为健康保险风险评价值;以时间为X轴,正则化的评价相关因素指标数据和健康保险精算指标数据为Y轴,评价指标数为Z轴的构建三维面板数据。
根据所述的健康保险风险评估及控制的方法,其中S600包括:以所述三维面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,时间序列深度学习预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC最接近1的一组模型参数作为最优结果。
本发明的技术方案还包括一种健康保险风险评估及控制的装置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现任一所述的方法步骤。
本发明的技术方案还包括一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现任一所述的方法步骤。
本发明的有益效果为:基于深度学***台,实现健康保险精算工作的各大指标,降低供保单位逆选择的风险。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1所示为根据本发明实施方式的总体流程图;
图2所示为根据本发明实施方式的健康保险风险评估流程图;
图3所示为根据本发明实施方式的健康保险风险评估相关数据分类示意图;
图4所示为根据本发明实施方式的健康保险风险控制的流程图;
图5所示为根据本发明实施方式的装置及介质图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。
在本发明的描述中,对方法步骤的连续标号是为了方便审查和理解,结合本发明的整体技术方案以及各个步骤之间的逻辑关系,调整步骤之间的实施顺序并不会影响本发明技术方案所达到的技术效果。
本发明的描述中,除非另有明确的限定,设置等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
图1所示为根据本发明实施方式的总体流程图。该流程包括:S100,构建大数据环境;S200,通过大数据环境对一项或多项涉及健康保险风险评估的维度数据进行采集;S300,对维度数据进行健康保险精算指标进行计算;S400,根据维度数据及健康保险精算指标进行预处理和正则化处理,得到评价指标数据,预处理包括将文本数据和/或定性数据进行量化处理;S500,根据评价指标数据和健康保险精算指标数据计算健康保险风险评指标,构建对应的三维面板数据;S600,将三维面板数据作为训练数据和验证数据通过时间序列深度学习模型进行预测,输出最优预测结果;S700,随机选取多个面板数据作为测试数据,通过时间序列深度学习模型进行训练,并以时间序列深度学习模型的准确率、召回率和AUC值等作为健康保险风险评估模型的评价参数。
图2所示为根据本发明实施方式的健康保险风险评估流程图,结合图1的流程及如图2所示流程,本发明提供了以下具体实施方式:
大数据环境搭建、健康保险风险评估相关数据采集、数据预处理及正则化处理、健康保险精算指标的计算、计算健康风险评估指标、基于深度学习的健康风险评估、健康保险风险评估模型评价及优化。
步骤一:大数据环境搭建包括,搭建spark+mapreduce+hive+pyspark+python+mysql为基础的大数据开发环境,结合多核多线程多进程的并行计算开发和运行,提高开发及后台运行速度与数据单位吞吐量。
步骤二:健康保险风险评估相关数据采集包括,通过调用API等多种数据搜集方式,搜集健康保险风险评估相关数据,该数据集共分为两大类,分别是:评价相关因素指标数据;评价指标数据。其中,评价相关因素指标数据包括健康保险公司内部运营数据、约定赔保条件相关数据、投保人健康管理相关数据;评价指标数据主要包括但不限于指定保险类型的参保率、基金征缴额度、续保率、资金结存率、人均在该保险种类年度消费金额。
其中,健康保险公司内部运营数据包括但不限于:
1、该公司的运营相关数据,例如部门KPI达标情况、公司在职人数、公司每月培训次数、公司管理规范自评分数、公司管理严格程度自评分数、公司文化建设自评分数等,该数据可通过调查、问卷、访问、座谈、公司财务审计、企查查、网上口碑等多种方式获得;
2、该公司的产品服务相关数据,例如公司业务流程自评及口碑分数、产品设计合理性自评及口碑分数、承保和理赔顺畅程度自评及口碑分数,该数据可通过调查、问卷、访问、座谈、公司财务审计、企查查、网上口碑等多种方式获得。
约定赔保条件相关数据包括但不限于:约定赔保条件合理性自评及口碑分数、过往因约定赔保条件不严谨造成公司损失金额及保单数目、指定保险类型约定赔保条件数目、过往就约定赔保条件引起的法律纠纷案件数目、市场上针对相同赔保条件引起的法律纠纷案件数目等。该数据可通过爬虫、问卷调查、公司文案整理、市场分析等方式获得。
投保人健康管理相关数据包括但不限于:特定保险类型投保人群体貌特征数据、特定保险类型投保人群健康档案数据、特定保险类型投保人群健康卫生服务记录表单、特定保险类型投保人群社会数据、特定保险类型投保人群家族健康状况数据及投保、承保、赔保数据等。该数据可通过与第三方机构合作,调查、问卷、访问、座谈等方式获得。其具体参考图3所示的健康保险风险评估相关数据分类示意图。
步骤三,健康保险精算指标的计算包括:对于约定疾病的疾病保险、约定医疗行为的医疗保险、约定疾病或意外伤害导致的工作能力丧失类的失能收入丧失保险、以及约定日常生活能力障碍引起的护理需要类的护理保险,相对应的精算指标包括:费率制定的精算目标指标包括但不限于:索赔总额、等待期、免赔额、保单续保率、保单失效率、利率和安全余量、(约定保险范围内引起的消费)费用金额范围、免赔额、最高限额、公报比例;赔付率指标包括但不限于:满期赔付率、历年制赔付率、综合赔付率;准备金指标包括但不限于:已发生未报案责任准备金(IBNR)、已发生未充分报案责任准备金(INBER)。
步骤四,数据预处理及正则化处理主要包括:将步骤二和步骤三的评价指标数据和健康保险精算指标数据进行预处理,采用one-hot及其他量化方法将定性的数据或文本量化到[0,1]范围内,其中0表示指标程度最小(若涉及到风险或者公司收益,风险程度最大或者公司收益最小),1表示指标程度最大(若涉及到风险或者公司收益,风险程度最小或者公司收益最大);去除无用数据填充缺失数据。此外,采用但不限于Python的sklearn.preprocessing程序包对预处理数据进行正则化处理。采用信息熵的方法,处理各项数据。
步骤五,计算健康风险评估指标包括:对步骤四中正则化的评价指标数据和健康保险精算指标数据求取健康风险评估指标作为健康保险风险评价值。计算公式如下。最后将该数据整理为以时间为X轴,正则化的评价相关因素指标数据和健康保险精算指标数据为Y轴,评价指标数为Z轴的面板数据。健康保险风险评估结果越高,风险越大,保险单位收益越小。
步骤六,基于深度学习的健康风险评估包括:
上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROC Curve ROC曲线下面积)最接近1的一组模型参数。
步骤七,健康保险风险评估模型评价及优化包括:
模型评价:随机选取三分之一的面板数据作为测试数据,不限于采用该模型的准确率、召回率和AUC值等作为健康保险风险评估模型的评价参数。
优化过程包括:
1、扩充训练及验证数据库,输入到步骤6中反复训练;
2、重新抽取训练和验证数据,改变抽取比例,输入到模型中进行步骤六中的模型训练和参数选择,再对此模型进行步骤7中的模型评价,反复进行,直到健康保险风险评估模型的评价参数稳定在较优的一定范围,确定此时最优模型参数。
图4所示为根据本发明实施方式的健康保险风险控制的流程图,结合图2,本发明进一步提出了健康保险风险控制,具体实施如下:
健康保险风险控制***的建立共分为10个步骤,分别为:大数据环境搭建、健康保险风险控制相关数据采集、数据预处理及正则化处理、基于深度学习的条款设计时的风险控制、基于深度学习的核保的风险控制、基于深度学习的理赔的风险控制、基于深度学习的判断再保险范围、基于深度学习的其他健康保险风险控制、健康保险风险控制方式选择、健康保险风险控制模型评价及优化。
步骤一:大数据环境搭建包括:
spark+mapreduce+hive+pyspark+python+mysql为基础的大数据开发环境,结合多核多线程多进程的并行计算开发和运行,提高开发及后台运行速度与数据单位吞吐量。
步骤二:健康保险风险控制相关数据采集包括:
通过调查、问卷、走访、访谈、爬虫、API、公司文档整理、保险精算等方式,结合健康保险风险评估***数据库,建立健康保险风险控制相关数据库,该数据库包括条款设计时的风险控制数据、核保的风险控制数据、理赔的风险控制数据、案例是否再保险以及其他健康保险风险控制数据。
其中,条款设计时的风险控制数据包括健康保险风险评估***数据库中案例针对风险管理的条款设计,例如:免赔额、比例共付、保险金给付限额、除外责任、等待期等。
核保的风险控制数据包括健康保险风险评估***数据库中案例中关于核保风险管理措施,例如是否核保标准风险承保、是否次标准风险承保、是否举报等。
理赔的风险控制数据包括健康保险风险评估***数据库中案例中关于理赔风险管理措施,保险人是否隐瞒既往病史参保、保险人针对医疗服务等保险项目是否超过供保单位预计范围、是否存在保险项目相关医疗机构或护理机构与保险人相互勾结、是否存在嫁接费用等。
案例是否再保险即健康保险风险评估***数据库中案例是否存在供保单位再保险的规避风险行为,以及再保险最后收益等。
其他健康保险风险控制数据主要包括:
1、对医疗服务过程的控制数据,例如:医疗服务利用审查数据、第二诊疗意见相关数据、医疗服务监测数据等;
2、医疗服务补偿方式数据,例如:是否预付方式实现服务项目付费、预付制为按病种付费、按人头预付、按诊断相关分类预付等;
3、无偿款优待和其他利润分享措施,例如是否提供免费体检、提供健康服务种类、保费返还期限及金额、优待款金额及期限、利润分享额度等;
4、健康管理机制相关数据,例如:是否有定期检查服务、是否有免费制定健康计划服务、是否有预约专家服务、是否设立健康热线、是否开办保健知识讲座、是否编印健康知识手册以及其他健康管理措施等;
5、管理式医疗包括案例保险人是否使用到供保单位选择性医疗服务网站、主管医师等。
步骤三:数据预处理及正则化处理包括:将收集数据预处理:1:对于条款设计时的风险控制数据、核保的风险控制数据、理赔的风险控制数据以及其他健康保险风险控制数据,采用one-hot、设置阈值及其他量化方法将定性的数据或文本量化为0或1,其中0表示程度最小,1表示程度最深;去除无用数据填充缺失数据。此外,采用但不限于Python的sklearn.preprocessing程序包对预处理数据进行正则化处理。采用信息熵的方法,处理各项数据;2:对于案例是否再保险数据,采用one-hot及其他量化方法将定性的数据或文本量化到[0,1]范围内,其中0表示程度最小,1表示程度最深;去除无用数据填充缺失数据。此外,采用但不限于Python的sklearn.preprocessing程序包对预处理数据进行正则化处理。采用信息熵的方法,处理各项数据。
步骤四:基于深度学习的条款设计时的风险控制包括:
建立条款设计风险控制预测模型:将步骤三中条款设计时的风险控制数据及健康风险评估结果数据合并,以时间为X轴,以风险管理的条款设计相关数据为Y轴,健康风险评估结果数据为Z轴,建立面板数据。上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROC Curve ROC曲线下面积)最接近1的一组模型参数。
建立测试数据集:将条款设计时的风险控制指标数据自由组合,例如指标A和B,则测试数据如下表1所示:
指标 | A | B |
测试数据组合1 | 0 | 1 |
测试数据组合2 | 0 | 0 |
测试数据组合3 | 1 | 0 |
测试数据组合4 | 1 | 1 |
表1测试数据
将测试数据集输入到条款设计风险控制预测模型中,选取健康风险评估结果数据预测值最小的一组Y轴指标组合作为条款设计时的风险控制最优措施。
步骤五:基于深度学习的核保的风险控制包括:
建立核保风险控制预测模型:将步骤三中对核保的风险控制数据及健康风险评估结果数据合并,以时间为X轴,以风险管理的核保相关数据为Y轴,健康风险评估结果数据为Z轴,建立面板数据。
上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROC Curve ROC曲线下面积)最接近1的一组模型参数。
建立测试数据集:将核保的风险控制指标数据自由组合,组合方式如步骤四中的测试数据及建立方式。
将测试数据集输入到核保风险控制预测模型中,选取健康风险评估结果数据预测值最小的一组Y轴指标组合作为核保时的风险控制最优措施。
步骤六:基于深度学习的理赔的风险控制包括:
建立理赔风险控制预测模型:将步骤三中对理赔的风险控制数据及健康风险评估结果数据合并,以时间为X轴,以风险管理的理赔相关数据为Y轴,健康风险评估结果数据为Z轴,建立面板数据。上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROC Curve ROC曲线下面积)最接近1的一组模型参数。
建立测试数据集:将理赔的风险控制指标数据组合,组合方式如步骤四中的测试数据及建立方式
将测试数据集输入到理赔风险控制预测模型中,选取健康风险评估结果数据预测值最小的一组Y轴指标组合作为理赔时的风险控制最优措施。
步骤七:基于深度学习的判断再保险范围包括:
建立再保险风险控制预测模型:将健康保险评估***步骤四中正则化的评价指标数据和健康保险精算指标数据及步骤三中对风险管理的再保险相关数据合并,建立面板数据,时间作为X轴,再保险相关数据中再保险后的收益正则化数据作为Z轴,健康保险评估***正则化指标数据及再保险除收益以外指标数据作为Y轴。上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROCCurve ROC曲线下面积)最接近1的一组模型参数。
建立测试数据集:将Y轴指标数据自由组合,组合方式如步骤四中的测试数据及建立方式。
将测试数据集输入到理赔风险控制预测模型中,选取:1、再保险值为1(有再保险行为),收益数据预测值大于0,且在较大范围内的一组或者多组Y轴指标组合,作为需要再保险范围,及在这些组合的指标下,供保公司需要提供再保行为;2、再保险值为0(无再保险行为),收益数据预测值大于0,且在较大范围内的的一组或者多组Y轴指标组合,作为无需再保险范围,及在这些组合的指标下,供保公司不需要提供再保行为。
步骤八:基于深度学习的其他健康保险风险控制包括:
建立其他风险控制预测模型:将步骤三中对其他健康保险风险控制相关数据及健康风险评估结果数据合并,以时间为X轴,以其他健康保险风险控制相关数据为Y轴,健康风险评估结果数据为Z轴,建立面板数据。上述整理好的面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,预测模型选用但不仅限于DeepAR,自动选用使得准确率最高、AUC(Area Under ROC Curve ROC曲线下面积)最接近1的一组模型参数。
建立测试数据集:将其他健康保险风险控制相关指标数据自由组合,组合方式如步骤四中的测试数据及建立方式
将测试数据集输入到其他风险控制预测模型中,选取健康风险评估结果数据预测值最小的一组Y轴指标组合作为其他时的风险控制最优措施。
步骤九:健康保险风险控制方式选择包括:
将步骤四、五、六、八中的条款设计时的风险控制、核保的风险控制、理赔的风险控制以及其他健康保险风险控制方式组合在一起,即为最优的健康保险风险控制方式,同时根据步骤七中的结果,判断特定情况是否在保险范围中,若在即采用再保险方式规避风险,若不在则不采用此方式。
步骤十:健康保险风险控制模型评价及优化包括:
模型评价:针对步骤四到步骤八中的各模型,分别随机选取各自三分之一的面板数据作为测试数据,不限于采用该模型的准确率、召回率和AUC值等作为健康保险风险评估模型的评价参数。
优化过程包括:
1、扩充训练及验证数据库,输入到步骤6中反复训练;
2、重新抽取训练和验证数据,改变抽取比例,输入到模型中进行步骤四到步骤八中的模型训练和参数选择,再对此模型进行步骤十中的模型评价,反复进行,直到健康保险风险评估模型的评价参数稳定在较优的一定范围,确定此时最优模型参数。
图5所示为根据本发明实施方式的装置及介质图。图5所示为根据本发明实施方式的装置示意图。装置包括存储器100及处理器200,其中处理器200存储有计算机程序,计算机程序用于执行:通过大数据环境对一项或多项涉及健康保险风险评估的维度数据进行采集;进行健康保险精算指标进行计算;根据维度数据及健康保险精算指标进行预处理和正则化处理,得到评价指标数据;根据评价指标数据和健康保险精算指标数据计算健康保险风险评指标,构建三维面板数据并进行预测,输出最优预测结果;以时间序列深度学习模型的准确率、召回率和AUC值等作为健康保险风险评估模型的评价参数。其中,存储器100用于存储数据。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (3)
1.一种健康保险风险评估及控制的方法,其特征在于,该方法包括:
S100,构建大数据环境;
S200,通过所述大数据环境对一项或多项涉及健康保险风险评估的维度数据进行采集,
S300,对所述维度数据进行健康保险精算指标计算;
S400,根据所述维度数据及所述健康保险精算指标进行预处理和正则化处理,得到评价指标数据,所述预处理包括将文本数据和/或定性数据进行量化理;
S500,根据所述评价指标数据和所述健康保险精算指标计算健康保险风险评指标,构建对应的三维面板数据;
S600,将所述三维面板数据作为训练数据和验证数据通过时间序列深度学习模型进行预测,输出最优预测结果;
S700,随机选取多个所述面板数据作为测试数据,通过所述时间序列深度学习模型进行训练,并以所述时间序列深度学习模型的准确率、召回率和AUC值作为健康保险风险评估模型的评价参数;
所述S700包括:S710,扩充所述训练数据和所述验证数据的数据库,输入到所述S600中的所述时间序列深度学习模型进行反复训练;S720,重新抽取训练和验证数据,改变抽取比例,输入至所述时间序列深度学习模型中进行所述S600的模型训练和参数选择,并对所述时间序列深度学习模型进行S700时的所述时间序列深度学习模型进行重复评价,直至评价参数稳定在设定范围,并确定最优模型参数;
所述S200包括:调用一个或多个平台的接口获取对应的维度数据,所述维度数据包括评价相关因素指标数据及评价指标数据;其中,评价相关因素指标数据包括健康保险公司内部运营数据、约定赔保条件相关数据、投保人健康管理相关数据;评价指标数据主要包括指定保险类型的参保率、基金征缴额度、续保率、资金结存率、人均在该保险种类年度消费金额;
所述S300包括:对于约定疾病的疾病保险、约定医疗行为的医疗保险、约定疾病或意外伤害导致的工作能力丧失类的失能收入丧失保险以及约定日常生活能力障碍引起的护理需要类的护理保险进行精算;对应的精算指标包括费率制定的精算指标、赔付率指标及准备金指标;所述费率制定的精算指标包括索赔总额、等待期、免赔额、保单续保率、保单失效率、利率和安全余量、费用金额范围、免赔额、最高限额及公报比例;所述赔付率指标包括满期赔付率、历年制赔付率及综合赔付率;所述准备金指标包括已发生未报案责任准备金及已发生未充分报案责任准备金;
所述S400包括:根据所述维度数据及所述健康保险精算指标进行预处理和正则化处理;其中量化处理包括使用one-hot及其他量化方法将定性的数据或文本量化到[0,1]范围内,去除无用数据填充缺失数据,其中0表示指标程度最小,1表示指标程度最大;通过Python对预处理数据进行正则化处理;
所述S500包括:通过公式
,
对健康风险评估的值进行计算,并将健康风险评估的值作为健康保险风险评价值;以时间为X轴,正则化的评价相关因素指标数据和健康保险精算指标为Y轴,评价指标数为Z轴的构建三维面板数据;
所述S600包括:以所述三维面板数据作为训练数据和验证数据,随机抽取训练数据和验证数据比例3:2,输入时间序列深度学习预测模型中,时间序列深度学习预测模型选用DeepAR,自动选用使得准确率最高、AUC最接近1的一组模型参数作为最优结果。
2.一种健康保险风险评估及控制的装置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1所述的方法步骤。
3.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010751841.1A CN111986808B (zh) | 2020-07-30 | 2020-07-30 | 健康保险风险评估及控制的方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010751841.1A CN111986808B (zh) | 2020-07-30 | 2020-07-30 | 健康保险风险评估及控制的方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111986808A CN111986808A (zh) | 2020-11-24 |
CN111986808B true CN111986808B (zh) | 2023-12-12 |
Family
ID=73445619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010751841.1A Active CN111986808B (zh) | 2020-07-30 | 2020-07-30 | 健康保险风险评估及控制的方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111986808B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112734582A (zh) * | 2021-01-15 | 2021-04-30 | 深轻(上海)科技有限公司 | 一种提高寿险精算模型运行速度的方法 |
CN116313072A (zh) * | 2023-02-10 | 2023-06-23 | 京大(北京)技术有限公司 | 基于人工智能大数据的老年人失能发生率预测评估方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008064334A2 (en) * | 2006-11-21 | 2008-05-29 | American International Group, Inc. | Method and system for determining rate of insurance |
US7392201B1 (en) * | 2000-11-15 | 2008-06-24 | Trurisk, Llc | Insurance claim forecasting system |
US7966203B1 (en) * | 2009-02-27 | 2011-06-21 | Millennium Information Services | Property insurance risk assessment using application data |
US8027850B1 (en) * | 2005-11-28 | 2011-09-27 | Millennium Information Services | Property insurance risk assessment processing system and method |
US8239246B1 (en) * | 2009-08-27 | 2012-08-07 | Accenture Global Services Limited | Health and life sciences payer high performance capability assessment |
CN107910068A (zh) * | 2017-11-29 | 2018-04-13 | 平安健康保险股份有限公司 | 投保用户的健康风险预测方法、装置、设备及存储介质 |
CN108573752A (zh) * | 2018-02-09 | 2018-09-25 | 上海米因医疗器械科技有限公司 | 一种基于健康大数据的健康信息处理的方法及*** |
CN109300040A (zh) * | 2018-08-29 | 2019-02-01 | 中国科学院自动化研究所 | 基于全媒体大数据技术的海外投资风险评估方法及*** |
CN109754157A (zh) * | 2018-11-30 | 2019-05-14 | 畅捷通信息技术股份有限公司 | 一种反映企业健康经营、融资增信的评分方法及*** |
CN109801094A (zh) * | 2018-12-07 | 2019-05-24 | 珠海中科先进技术研究院有限公司 | 一种商业分析管理推荐预测模型的方法及*** |
CN111353584A (zh) * | 2020-02-20 | 2020-06-30 | 中山大学 | 一种基于时间序列分析的深度学习训练任务行为预测方法 |
KR20200080466A (ko) * | 2018-12-26 | 2020-07-07 | 가천대학교 산학협력단 | 다중 선형 회귀를 이용한 해수욕장 위험도 평가 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8359209B2 (en) * | 2006-12-19 | 2013-01-22 | Hartford Fire Insurance Company | System and method for predicting and responding to likelihood of volatility |
-
2020
- 2020-07-30 CN CN202010751841.1A patent/CN111986808B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392201B1 (en) * | 2000-11-15 | 2008-06-24 | Trurisk, Llc | Insurance claim forecasting system |
US8027850B1 (en) * | 2005-11-28 | 2011-09-27 | Millennium Information Services | Property insurance risk assessment processing system and method |
WO2008064334A2 (en) * | 2006-11-21 | 2008-05-29 | American International Group, Inc. | Method and system for determining rate of insurance |
US7966203B1 (en) * | 2009-02-27 | 2011-06-21 | Millennium Information Services | Property insurance risk assessment using application data |
US8239246B1 (en) * | 2009-08-27 | 2012-08-07 | Accenture Global Services Limited | Health and life sciences payer high performance capability assessment |
CN107910068A (zh) * | 2017-11-29 | 2018-04-13 | 平安健康保险股份有限公司 | 投保用户的健康风险预测方法、装置、设备及存储介质 |
CN108573752A (zh) * | 2018-02-09 | 2018-09-25 | 上海米因医疗器械科技有限公司 | 一种基于健康大数据的健康信息处理的方法及*** |
CN109300040A (zh) * | 2018-08-29 | 2019-02-01 | 中国科学院自动化研究所 | 基于全媒体大数据技术的海外投资风险评估方法及*** |
CN109754157A (zh) * | 2018-11-30 | 2019-05-14 | 畅捷通信息技术股份有限公司 | 一种反映企业健康经营、融资增信的评分方法及*** |
CN109801094A (zh) * | 2018-12-07 | 2019-05-24 | 珠海中科先进技术研究院有限公司 | 一种商业分析管理推荐预测模型的方法及*** |
KR20200080466A (ko) * | 2018-12-26 | 2020-07-07 | 가천대학교 산학협력단 | 다중 선형 회귀를 이용한 해수욕장 위험도 평가 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
CN111353584A (zh) * | 2020-02-20 | 2020-06-30 | 中山大学 | 一种基于时间序列分析的深度学习训练任务行为预测方法 |
Non-Patent Citations (2)
Title |
---|
Community-based care for chronic wound management: an evidence-based analysis.;Medical Advisory secretariat;Ontario health technology assessment series;第9卷(第18期);1-24 * |
基于慢病风险评估的自助式健康档案管理***;王甜;曹煜明;蒋巍巍;;现代医院(第08期);1-2 * |
Also Published As
Publication number | Publication date |
---|---|
CN111986808A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Toumeh et al. | Surplus free cash flow, stock market segmentations and earnings management: The moderating role of independent audit committee | |
Kolstad et al. | Mandate-based health reform and the labor market: Evidence from the Massachusetts reform | |
Rust et al. | How social security and medicare affect retirement behavior in a world of incomplete markets | |
Bound et al. | Health, economic resources and the work decisions of older men | |
Cerqueiro et al. | Rules versus discretion in loan rate setting | |
Shen et al. | Hospital ownership and financial performance: what explains the different findings in the empirical literature? | |
Cribb et al. | What happens when employers are obliged to nudge? Automatic enrolment and pension saving in the UK | |
Herring | The effect of the availability of charity care to the uninsured on the demand for private health insurance | |
US20050171918A1 (en) | Method and system of cost variance analysis | |
US20130246086A1 (en) | Health quant data modeler | |
CN111986808B (zh) | 健康保险风险评估及控制的方法、装置及介质 | |
MacDonald et al. | How accurately does 70% final employment earnings replacement measure retirement income (in) adequacy? Introducing the Living Standards Replacement Rate (LSRR) | |
Kahraman et al. | Fuzzy multiattribute consumer choice among health insurance options | |
Lu | Broken-heart, common life, heterogeneity: Analyzing the spousal mortality dependence | |
Button et al. | Do stronger employment discrimination protections decrease reliance on Social Security Disability Insurance? Evidence from the US Social Security reforms | |
Falk | Comparing benefits and total compensation in the federal government and the private sector | |
Choukhmane et al. | Efficiency in Household Decision Making: Evidence from the Retirement Savings of US Couples | |
Demirhan et al. | Predicting the Financial Failures of Manufacturing Companies Trading in the Borsa Istanbul (2007-2019) | |
Capatina et al. | Health shocks and the evolution of consumption and income over the life-cycle | |
Falk et al. | The Effect of the Employer Match and Defaults on Federal Workers' Savings Behavior in the Thrift Savings Plan | |
OKOTH | Effects of tax incentives and subsidies on economic growth in developing economies | |
Bertoni et al. | Pension reforms, longer working horizons and depression. Does the risk of automation matter? | |
MacDonald | New Canada Pension Plan enhancements: What will they mean for Canadian seniors? | |
Almwajeh | Applying Altman's Z-Score model of bankruptcy for the prediction of financial distress of rural hospitals in Western Pennsylvania | |
Ma et al. | Aircraft insurance costs management for sustainable general aviation: insights from general aviation enterprises in China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |