CN112035611A - 目标用户推荐方法、装置、计算机设备和存储介质 - Google Patents

目标用户推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112035611A
CN112035611A CN202010887774.6A CN202010887774A CN112035611A CN 112035611 A CN112035611 A CN 112035611A CN 202010887774 A CN202010887774 A CN 202010887774A CN 112035611 A CN112035611 A CN 112035611A
Authority
CN
China
Prior art keywords
user
information
portrait
medical consultation
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010887774.6A
Other languages
English (en)
Other versions
CN112035611B (zh
Inventor
傅欣雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangjian Information Technology Shenzhen Co Ltd
Original Assignee
Kangjian Information Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangjian Information Technology Shenzhen Co Ltd filed Critical Kangjian Information Technology Shenzhen Co Ltd
Priority to CN202010887774.6A priority Critical patent/CN112035611B/zh
Publication of CN112035611A publication Critical patent/CN112035611A/zh
Application granted granted Critical
Publication of CN112035611B publication Critical patent/CN112035611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据分析领域的用户消费画像,具体涉及一种目标用户推荐方法、装置、计算机设备和存储介质。所述方法通过接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;根据所述用户特征信息获取所述用户对应的用户质量参数;根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。本申请通过用户的咨询消息以及用户画像信息挖掘来挖掘用户特征信息,基于用户特征信息来确定用户质量参数,从而遴选出目标客户,并对医疗服务提供方来推荐目标用户,可以有效提高目标用户的推荐有效率。

Description

目标用户推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据分析领域的用户消费画像,特别是涉及一种目标用户推荐方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术与人工智能技术的发展,出现了用户画像技术。用户画像作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,在各领域得到了广泛的应用。在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
目前,基于医疗大数据来做用户画像分析的技术主要聚焦在通过患者个人人口信息、电子健康档案、电子病历和体检报告等专业的结构化知识来分析。然而这种方案需要大量的人力物力成本,而且所得样本的地域性和普适性往往受限,从而不能有效的实现对用户的推荐。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高推荐有效率的目标用户推荐方法、装置、计算机设备和存储介质。
一种目标用户推荐方法,所述方法包括:
接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
根据所述用户特征信息获取所述用户对应的用户质量参数;
根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。
在其中一个实施例中,所述用户画像信息包括实时画像特征以及离线问诊特征;
所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息包括:
接收终端发送的医疗咨询消息;
解析所述医疗咨询消息,获取终端对应的用户标识;
根据所述用户标识从预设在线hive数据库平台提取所述实时画像特征,根据所述用户标识从预设离线更新平台提取所述离线问诊特征。
在其中一个实施例中,所述用户画像信息包括实时画像特征以及离线问诊特征;
所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息之前,还包括:
获取画像信息更新请求;
查找所述画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息;
根据所述用户身份信息以及所述历史问诊流程信息获取实时画像特征,将所述实时画像特征保存至预设在线hive数据库平台,根据所述历史问诊交易信息获取离线问诊特征,将所述离线问诊特征保存至预设离线更新平台。
在其中一个实施例中,所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息包括:
接收终端发送的医疗咨询消息;
将所述医疗咨询消息输入预设语义识别模型,获取识别结果;
当所述识别结果表征所述医疗咨询消息为有效消息时,根据所述医疗咨询消息查找用户画像,得到用户画像信息。
在其中一个实施例中,所述根据所述用户特征信息获取所述用户对应的用户质量参数包括:
根据所述用户特征信息构建多维特征矩阵;
将所述多维特征矩阵输入预设用户质量评估模型,获取所述用户对应的用户质量参数,所述预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
在其中一个实施例中,所述根据所述用户特征信息构建多维特征矩阵之前,还包括:
获取历史用户对应的用户类型以及历史特征数据;
根据所述历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;
对所述差异化特征进行pearson相关性系数分析,获取所述历史特征数据对应的强相关特征类型;
所述根据所述用户特征信息构建多维特征矩阵包括:
根据所述强相关特征类型对应的用户特征信息,构建多维特征矩阵。
一种目标用户推荐装置,所述装置包括:
信息查找模块,用于接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
特征提取模块,用于提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
质量参数评估模块,用于根据所述用户特征信息获取所述用户对应的用户质量参数;
目标推荐模块,用于根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。
在其中一个实施例中,所述用户画像信息包括实时画像特征以及离线问诊特征,所述信息查找模块用于:
接收终端发送的医疗咨询消息;
解析所述医疗咨询消息,获取终端对应的用户标识;
根据所述用户标识从预设在线hive数据库平台提取所述实时画像特征,根据所述用户标识从预设离线更新平台提取所述离线问诊特征。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
根据所述用户特征信息获取所述用户对应的用户质量参数;
根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
根据所述用户特征信息获取所述用户对应的用户质量参数;
根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。
上述目标用户推荐方法、装置、计算机设备和存储介质,通过接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;根据所述用户特征信息获取所述用户对应的用户质量参数;根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。本申请通过用户的咨询消息以及用户画像信息挖掘来挖掘用户特征信息,基于用户特征信息来确定用户质量参数,从而遴选出目标客户,并对医疗服务提供方来推荐目标用户,可以有效提高目标用户的推荐有效率。
附图说明
图1为一个实施例中目标用户推荐方法的应用场景图;
图2为一个实施例中目标用户推荐方法的流程示意图;
图3为一个实施例中图2中步骤201的子流程示意图;
图4为一个实施例中保存用户画像信息步骤的流程示意图;
图5为另一个实施例中图2中步骤201的子流程示意图;
图6为一个实施例中图2中步骤205的子流程示意图;
图7一个实施例中目标用户推荐装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的目标用户推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与目标推荐服务器104通过网络进行通信。当用户通过智能化的医疗交互平台来进行医疗问诊时,搭载本申请目标用户推荐方法的目标推荐服务器104可以通过医疗交互平台与用户进行模拟问答交流,从而以及用户的医疗咨询信息以及用户画像信息,来获得用户相应的用户质量参数。具体地,用户可以通过终端102来登录医疗交互平台。首先,终端102发送医疗咨询消息至目标推荐服务器104。目标推荐服务器104接收终端102发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息;提取医疗咨询消息以及用户画像信息对应的用户特征信息;根据用户特征信息获取用户对应的用户质量参数;根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种目标用户推荐方法,以该方法应用于图1中的目标推荐服务器104为例进行说明,包括以下步骤:
步骤201,接收终端发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息。
其中,医疗咨询消息是指用户向医疗交互平台提交的一条问询信息。具体可以包括:询问症状A对应什么疾病,或者甲疾病是否可以用药物a进行治疗之类的问询消息。而用户画像信息则是指针对用户进行画像后存储在***内的消息。
具体地。本申请的方案中用户推荐服务器可以基于用户对医疗交互平台的使用以及用户的身份信息为用户添加相应的特征标签,并构建用户的用户画像,当用户在使用在线医疗平台获取医疗服务时,即可通过用户画像信息来对用户进行分析,进而实现用户推荐的功能。服务器同时在咨询过程中,目标推荐服务器104还可以进行向用户反馈一些模拟问诊的消息,从而提取医疗咨询消息对应的主诉、模版问诊和诊断标签等数据,以对医疗自选消息进行更完整的补充。
步骤203,提取医疗咨询消息以及用户画像信息对应的用户特征信息。
其中,用户画像信息所包含的一般为具体的特征,为了能有效地进行后面的用户质量参数提取工作,需要从用户画像信息中提取出相应的用户特征信息,可以提取出医疗咨询消息以及用户画像信息中可用的用户特征,在其中一个具体的实施例中,提取出的信息具体可以包括医疗咨询消息对应的主诉、模版问诊和诊断标签,以及用户画像信息中历史问诊信息、用户身份信息以及历史问诊交易信息等。在其中一个实施例中,步骤S203还包含简化特征的步骤,如对于用户画像信息中包含的历史问诊交易信息,可以先获取不同历史时间段内用户的历史问诊交易信息,如直接以365天,180天,90天和60天的历史问诊交易信息作为特征进行计算,同时将历史问诊交易信息进行区间化表达,进一步缩减了特征向量的纵向维度,降低了构建特征向量所需的空间复杂度。还可以年龄,性别,省份等人口维度的特征通过一维的数字特征来表达,进一步对用户特征进行简化处理。
步骤205,根据用户特征信息获取用户对应的用户质量参数。
其中,用户质量参数是用于推荐用户的评估标准。可以根据多项不同的用户特征信息,来综合获取用户对应的用户质量参数。
具体地,在其中一个实施例中,可以通过医疗服务提供方的具体需求来进行用户质量参数,如可以根据用户成交率高的特征,为其分配一个较高的用户质量参数,或者根据用户咨询消息内容丰富的特征,为其分配一个较高的用户质量参数。在一个具体实施例中,可以通过预先构建的预设用户质量评估模型来提取用户特征信息对应的用户质量参数。预设用户质量评估模型具体可以为xgboost模型,通过有监督训练获得,通过将包含用户特征信息的多维特征矩阵输入到用户质量评估模型中,来对用户质量进行评估,如可以通过用户质量参数来体现在线用户对处方的购买意愿,从而有效地从提取出质量更高的平台用户。在其中一个实施例中,可以通过医疗服务提供方的具体需求来进行用户质量参数,如可以根据用户成交率高的特征,为其分配一个较高的用户质量参数,或者根据用户咨询消息内容丰富的特征,为其分配一个较高的用户质量参数。
其中,预设用户质量评估模型用于评价用户的质量,具体可以通过将用户的质量量化为相应的用户质量参数来进行目标用户的推荐,在其中一个实施例中,用户质量参数具体可以是指用户通过在线医疗平台完成处方药品交易的成功率。而预设用户质量评估模型具体可以为xgboost模型,通过有监督训练获得,通过将包含用户特征信息的多维特征矩阵输入到用户质量评估模型中,来对用户质量进行评估,从而将在线用户对处方的购买意愿从海量问诊中剥离出来,可以有效的从医疗交互平台的海量用户中提取出质量更高的平台用户。
步骤207,根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。
其中,医疗服务提供方是指在在线医疗平台上为用户提供医疗服务的处理方,如可以根据用户的医疗咨询对用户进行远程问诊以及开处方抓药等服务。类似于电子商务平台的店家。本申请的目标用户推荐方法即为向这些医疗服务提供方推荐质量高的用户。
在确定用户的质量参数之后,可以基于用户的质量参数向在线医疗平台上的医疗服务提供方推荐相应的目标用户,具体地,在线医疗平台的医疗服务提供方可以在线设置相应的用户质量参数同时设置可以接受带有哪些诊断标签的医疗咨询消息。当用户推荐服务器在得到用户对应的用户质量参数后,可以基于医疗咨询消息对应的诊断标签,以及用户质量参数,确定该用户符合哪些医疗服务提供方的要求,而后向这些医疗服务器提供方推荐当前的用户。
上述目标用户推荐方法,通过接收终端发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息;提取医疗咨询消息以及用户画像信息对应的用户特征信息;根据用户特征信息获取用户对应的用户质量参数;根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。本申请通过用户的咨询消息以及用户画像信息挖掘来挖掘用户特征信息,基于用户特征信息来确定用户质量参数,从而遴选出目标客户,并对医疗服务提供方来推荐目标用户,可以有效提高目标用户的推荐有效率。
在其中一个实施例中,用户画像信息包括实时画像特征以及离线问诊特征,如图3所示,步骤201包括:
步骤302,接收终端发送的医疗咨询消息。
步骤304,解析医疗咨询消息,获取终端对应的用户标识。
步骤306,根据用户标识从预设在线hive数据库平台提取实时画像特征,根据用户标识从预设离线更新平台提取离线问诊特征。
其中,用户画像信息可以通过在线hive数据库平台按照用户标识进行分层计算存储。用户画像信息的存储***分为在线实时存储模块和离线更新模块。其中,实时画像特征对应的在线模块可以实时响应用户的画像特征,该特征内包含的信息具体包括用户身份信息、问诊流程信息等信息。而离线问诊特征对应的离线模块则可以定时更新用户的历史问诊交易信息等特征。
具体地,为了提高目标推荐过程中的计算效率,在本申请中,通过离线存储以及在线更新两种方式来保存用户相关的画像信息。在需要进行目标用户推荐时,目标推荐服务器104首先会接收终端发送的医疗咨询消息,而后解析医疗咨询消息,来获取用户查找数据库内相应用户画像数据的用户标识;用户标识可以以UID的形式存在,即用户账号。而后目标推荐服务器104根据用户标识从预设在线hive数据库平台提取实时画像特征,同时根据用户标识从预设离线更新平台提取离线问诊特征。本实施例中,通过在线模块和离线模块的有机融合,可以在不影响处理环境的流畅性的前提下,更精确地实现对用户画像信息的存储,从而提高目标用户推荐的准确率。
在其中一个实施例中,如图4所示,步骤201之前,还包括:
步骤401,获取画像信息更新请求。
步骤403,查找画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息。
步骤405,根据用户身份信息以及历史问诊流程信息获取实时画像特征,将实时画像特征保存至预设在线hive数据库平台,根据历史问诊交易信息获取离线问诊特征,将离线问诊特征保存至预设离线更新平台。
其中,画像信息更新请求是指每次用户在使用医疗交互平台之后,都会生成相应的画像信息更新请求。历史问诊流程信息是指用户每次通过医疗交互平台进行在线问诊过程中产生的信息。历史问诊交易信息则是指用户通过医疗交互平台在在线问诊之后,是否接受医生在线开出的处方,并按处方购买药物对应的历史记录。
具体地,可以通过预先设计的高性能存储模块,来保存用户的用户画像信息来方便迅速调取用户的相关画像数据,如在一个实施例中,可以将23个维度的在线特征通过业务方以json字符串的形式入参传入预设在线hive数据库平台来进行保存,同时将15维的离线特征簇以后台zeus定时任务更新的模式在redis存储单元(从预设离线更新平台)存入并调用。线上模型调用的时候以用户标识作为搜索的键值,可以迅速调用相关特征。同时在***层面上,当前用户的综合特征用键值对的形式存入redis以便后续应用调取。在本实施例中,通过预设在线hive数据库平台以及预设离线更新平台来存储用户的用户画像信息,从而在目标用户推荐时,可以更高效地实现画像信息提取,保证处理的效率。
在其中一个实施例中,如图5所示,步骤201包括:
步骤502,接收终端发送的医疗咨询消息。
步骤504,将医疗咨询消息输入预设语义识别模型,获取识别结果。
步骤506,当识别结果表征医疗咨询消息为有效消息时,根据医疗咨询消息查找用户画像,得到用户画像信息。
其中,预设语义识别模型具体可以为一个分类神经网络模型,用于对用户输入的医疗咨询消息进行语义分类,将其划分为有效咨询以及无效咨询。当用输入的医疗咨询消息为“你好”或者“谢谢”之类的与问诊并无关联的无意义信息时,则确定用户输入的医疗咨询消息为有效咨询,而当用户输入的为具体的症状信息时,则可以判断用户输入的医疗咨询消息为无效咨询。
具体地,用户在在线医疗平台发送的消息不一定是有效地医疗信息,为了不浪费用户推荐服务器104的计算资源,可以在解析医疗咨询消息前,先判断其是否为有效医疗消息。这一步骤具体可以通过语义识别的神经网络模型来进行判断。对于医疗咨询消息不为有效医疗消息的情况,服务器会直接向用户反馈咨询失败的消息,而如果为有效消息,则可以进行后续的解析操作。通过对医疗咨询消息进行语义识别处理,剔除掉无效的信息,可以有效降低目标用户推荐的误操作率,提高推荐的处理效率。
在其中一个实施例中,如图6所示,步骤205包括:
步骤601,根据用户特征信息构建多维特征矩阵;
步骤603,将多维特征矩阵输入预设用户质量评估模型,获取用户对应的用户质量参数,预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
其中多维特征矩阵基于所有的用户特征信息来获取,例如可以年龄,性别,省份等用户身份维度的特征通过一维的数字特征来表达,进一步对用户特征进行简化处理。基于实时画像特征以及离线问诊特征中的所有特征可以构建一个与特征类型数相应的多维特征矩阵,从而将其作为模型输入来进行用户质量参数的估计。此外,在步骤603之前还包括构建预设用户质量评估模型的步骤,具体地可以获取历史数据,而后基于预先确定的特征参数构建历史数据对应的历史特征信息,并为历史特征信息添加对应的标签,而后基于这些带标签的历史特征信息来对初始的xgboost模型进行有监督训练,通过将带标签的历史特征信息分为训练集以及验证集,分别对预设用户质量评估模型进行训练及验证,当验证后得到的结果为模型可用时,则输出训练完成的模型,将其作为预设用户质量评估模型。在本实施例中,通过xgboost模型来进行用户质量参数的提取,可以有效提高质量参数提取过程的效率以及准确率。
在其中一个实施例中,步骤601之前,还包括:获取历史用户对应的用户类型以及历史特征数据;根据历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;对差异化特征进行pearson相关性系数分析,获取历史特征数据对应的强相关特征类型。步骤601包括:根据强相关特征类型对应的用户特征信息,构建多维特征矩阵。
其中,用户推荐服务器104可以预先根据医疗服务提供方的要求,确定历史用户中哪些用户是高质量用户,哪些用户是低质量用户,并为其添加相应的如可以将成交率高的作为高质量用户,而成交率低的为低质量用户。而后用户推荐服务器104可以针对在线医疗平台的实时大数据,进行计算机统计分析得到高质量用户和低质量用户件的差异化特征。而后通过在pearson相关性系数分析得到强相关特征。确定的强关联特征即为用户质量参数计算过程中的可用特征。本实施例中,通过与用户质量相关的强相关特征类型来构建多维特征矩阵,可以保证用于进行用户质量参数中用户参数的有效性,从而提高用户质量参数的计算准确率。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种目标用户推荐装置,包括:
信息查找模块702,用于接收终端发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息。
特征提取模块704,用于提取医疗咨询消息以及用户画像信息对应的用户特征信息。
质量参数评估模块706,用于根据用户特征信息获取用户对应的用户质量参数。
目标推荐模块708,用于根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。
在其中一个实施例中,用户画像信息包括实时画像特征以及离线问诊特征,信息查找模块702用于:接收终端发送的医疗咨询消息;解析医疗咨询消息,获取终端对应的用户标识;根据用户标识从预设在线hive数据库平台提取实时画像特征,根据用户标识从预设离线更新平台提取离线问诊特征。
在其中一个实施例中,用户画像信息包括实时画像特征以及离线问诊特征,装置还包括用户画像模块,用于:获取画像信息更新请求;查找画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息;根据用户身份信息以及历史问诊流程信息获取实时画像特征,将实时画像特征保存至预设在线hive数据库平台,根据历史问诊交易信息获取离线问诊特征,将离线问诊特征保存至预设离线更新平台。
在其中一个实施例中,还包括咨询消息校验模块,用于:接收终端发送的医疗咨询消息;将医疗咨询消息输入预设语义识别模型,获取识别结果;当识别结果表征医疗咨询消息为有效消息时,根据医疗咨询消息查找用户画像,得到用户画像信息。
在其中一个实施例中,质量参数评估模块具体用于:根据用户特征信息构建多维特征矩阵;将多维特征矩阵输入预设用户质量评估模型,获取用户对应的用户质量参数,预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
在其中一个实施例中,还包括特征筛选单元,用于:获取历史用户对应的用户类型以及历史特征数据;根据历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;对差异化特征进行pearson相关性系数分析,获取历史特征数据对应的强相关特征类型。
关于目标用户推荐装置的具体限定可以参见上文中对于目标用户推荐方法的限定,在此不再赘述。上述目标用户推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标用户推荐数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标用户推荐方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
接收终端发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息;
提取医疗咨询消息以及用户画像信息对应的用户特征信息;
根据用户特征信息获取用户对应的用户质量参数;
根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收终端发送的医疗咨询消息;解析医疗咨询消息,获取终端对应的用户标识;根据用户标识从预设在线hive数据库平台提取实时画像特征,根据用户标识从预设离线更新平台提取离线问诊特征。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取画像信息更新请求;查找画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息;根据用户身份信息以及历史问诊流程信息获取实时画像特征,将实时画像特征保存至预设在线hive数据库平台,根据历史问诊交易信息获取离线问诊特征,将离线问诊特征保存至预设离线更新平台。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收终端发送的医疗咨询消息;将医疗咨询消息输入预设语义识别模型,获取识别结果;当识别结果表征医疗咨询消息为有效消息时,根据医疗咨询消息查找用户画像,得到用户画像信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据用户特征信息构建多维特征矩阵;将多维特征矩阵输入预设用户质量评估模型,获取用户对应的用户质量参数,预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史用户对应的用户类型以及历史特征数据;根据历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;对差异化特征进行pearson相关性系数分析,获取历史特征数据对应的强相关特征类型。
在一个实施例中,提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收终端发送的医疗咨询消息,根据医疗咨询消息查找用户画像,得到用户画像信息;
提取医疗咨询消息以及用户画像信息对应的用户特征信息;
根据用户特征信息获取用户对应的用户质量参数;
根据用户画像信息以及用户质量参数向医疗服务提供方推荐目标用户。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收终端发送的医疗咨询消息;解析医疗咨询消息,获取终端对应的用户标识;根据用户标识从预设在线hive数据库平台提取实时画像特征,根据用户标识从预设离线更新平台提取离线问诊特征。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取画像信息更新请求;查找画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息;根据用户身份信息以及历史问诊流程信息获取实时画像特征,将实时画像特征保存至预设在线hive数据库平台,根据历史问诊交易信息获取离线问诊特征,将离线问诊特征保存至预设离线更新平台。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收终端发送的医疗咨询消息;将医疗咨询消息输入预设语义识别模型,获取识别结果;当识别结果表征医疗咨询消息为有效消息时,根据医疗咨询消息查找用户画像,得到用户画像信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据用户特征信息构建多维特征矩阵;将多维特征矩阵输入预设用户质量评估模型,获取用户对应的用户质量参数,预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史用户对应的用户类型以及历史特征数据;根据历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;对差异化特征进行pearson相关性系数分析,获取历史特征数据对应的强相关特征类型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种目标用户推荐方法,所述方法包括:
接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
提取与所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
根据所述用户特征信息,获取所述用户对应的用户质量参数;
根据所述用户画像信息以及所述用户质量参数推荐目标用户。
2.根据权利要求1所述的方法,其特征在于,所述用户画像信息包括实时画像特征以及离线问诊特征;
所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息包括:
接收终端发送的医疗咨询消息;
解析所述医疗咨询消息,获取终端对应的用户标识;
根据所述用户标识从预设在线hive数据库平台提取所述实时画像特征、并根据所述用户标识从预设离线更新平台提取所述离线问诊特征。
3.根据权利要求1所述的方法,其特征在于,所述用户画像信息包括实时画像特征以及离线问诊特征;
所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息之前,还包括:
获取画像信息更新请求;
查找所述画像信息更新请求对应的用户身份信息、历史问诊流程信息以及历史问诊交易信息;
根据所述用户身份信息以及所述历史问诊流程信息获取实时画像特征,将所述实时画像特征保存至预设在线hive数据库平台,根据所述历史问诊交易信息获取离线问诊特征,将所述离线问诊特征保存至预设离线更新平台。
4.根据权利要求3所述的方法,其特征在于,所述接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息包括:
接收终端发送的医疗咨询消息;
将所述医疗咨询消息输入预设语义识别模型,获取识别结果;
当所述识别结果表征所述医疗咨询消息为有效消息时,根据所述医疗咨询消息查找用户画像,得到用户画像信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用户特征信息获取所述用户对应的用户质量参数包括:
根据所述用户特征信息构建多维特征矩阵;
将所述多维特征矩阵输入预设用户质量评估模型,获取所述用户对应的用户质量参数,所述预设用户质量评估模型由初始xgboost模型基于带标注的历史特征数据通过有监督训练获取。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户特征信息构建多维特征矩阵之前,还包括:
获取历史用户对应的用户类型以及历史特征数据;
根据所述历史用户对应的用户类型以及历史特征数据,确定各类型用户对应的差异化特征;
对所述差异化特征进行pearson相关性系数分析,获取所述历史特征数据对应的强相关特征类型;
所述根据所述用户特征信息构建多维特征矩阵包括:
根据所述强相关特征类型对应的用户特征信息,构建多维特征矩阵。
7.一种目标用户推荐装置,其特征在于,所述装置包括:
信息查找模块,用于接收终端发送的医疗咨询消息,根据所述医疗咨询消息查找用户画像,得到用户画像信息;
特征提取模块,用于提取所述医疗咨询消息以及所述用户画像信息对应的用户特征信息;
质量参数评估模块,用于根据所述用户特征信息获取所述用户对应的用户质量参数;
目标推荐模块,用于根据所述用户画像信息以及所述用户质量参数向医疗服务提供方推荐目标用户。
8.根据权利要求7所述的装置,其特征在于,所述用户画像信息包括实时画像特征以及离线问诊特征,所述信息查找模块用于:
接收终端发送的医疗咨询消息;
解析所述医疗咨询消息,获取终端对应的用户标识;
根据所述用户标识从预设在线hive数据库平台提取所述实时画像特征,根据所述用户标识从预设离线更新平台提取所述离线问诊特征。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010887774.6A 2020-08-28 2020-08-28 目标用户推荐方法、装置、计算机设备和存储介质 Active CN112035611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010887774.6A CN112035611B (zh) 2020-08-28 2020-08-28 目标用户推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010887774.6A CN112035611B (zh) 2020-08-28 2020-08-28 目标用户推荐方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112035611A true CN112035611A (zh) 2020-12-04
CN112035611B CN112035611B (zh) 2023-05-30

Family

ID=73587687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010887774.6A Active CN112035611B (zh) 2020-08-28 2020-08-28 目标用户推荐方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112035611B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925982A (zh) * 2021-03-12 2021-06-08 上海意略明数字科技股份有限公司 用户重定向方法及装置、存储介质、计算机设备
CN113221570A (zh) * 2021-05-31 2021-08-06 康键信息技术(深圳)有限公司 基于线上问诊信息的处理方法、装置、设备及存储介质
CN113360941A (zh) * 2021-06-04 2021-09-07 深圳市第二人民医院(深圳市转化医学研究院) 基于数字孪生的医疗数据处理方法、装置和计算机设备
CN113486238A (zh) * 2021-06-29 2021-10-08 平安信托有限责任公司 基于用户画像的信息推送方法、装置、设备及存储介质
CN113722601A (zh) * 2021-09-07 2021-11-30 南方电网数字电网研究院有限公司 电力量测信息推荐方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010024926A2 (en) * 2008-08-28 2010-03-04 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
CN107220852A (zh) * 2017-05-26 2017-09-29 北京小度信息科技有限公司 用于确定目标推荐用户的方法、装置和服务器
CN109543863A (zh) * 2018-10-27 2019-03-29 平安医疗健康管理股份有限公司 一种就医任务管理方法、服务器及存储介质
CN110245687A (zh) * 2019-05-17 2019-09-17 腾讯科技(上海)有限公司 用户分类方法以及装置
CN110444297A (zh) * 2019-08-06 2019-11-12 重庆仙桃前沿消费行为大数据有限公司 医疗信息推荐方法、装置、设备及可读存储介质
CN111009311A (zh) * 2019-11-05 2020-04-14 泰康保险集团股份有限公司 一种医疗资源推荐方法、装置、介质和设备
CN111274380A (zh) * 2020-01-16 2020-06-12 平安银行股份有限公司 基于大数据的咨询投诉信息处理方法及相关装置
CN111368219A (zh) * 2020-02-27 2020-07-03 广州腾讯科技有限公司 信息推荐方法、装置、计算机设备以及存储介质
CN111460323A (zh) * 2020-06-17 2020-07-28 腾讯科技(深圳)有限公司 基于人工智能的焦点用户挖掘方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010024926A2 (en) * 2008-08-28 2010-03-04 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
CN107220852A (zh) * 2017-05-26 2017-09-29 北京小度信息科技有限公司 用于确定目标推荐用户的方法、装置和服务器
CN109543863A (zh) * 2018-10-27 2019-03-29 平安医疗健康管理股份有限公司 一种就医任务管理方法、服务器及存储介质
CN110245687A (zh) * 2019-05-17 2019-09-17 腾讯科技(上海)有限公司 用户分类方法以及装置
CN110444297A (zh) * 2019-08-06 2019-11-12 重庆仙桃前沿消费行为大数据有限公司 医疗信息推荐方法、装置、设备及可读存储介质
CN111009311A (zh) * 2019-11-05 2020-04-14 泰康保险集团股份有限公司 一种医疗资源推荐方法、装置、介质和设备
CN111274380A (zh) * 2020-01-16 2020-06-12 平安银行股份有限公司 基于大数据的咨询投诉信息处理方法及相关装置
CN111368219A (zh) * 2020-02-27 2020-07-03 广州腾讯科技有限公司 信息推荐方法、装置、计算机设备以及存储介质
CN111460323A (zh) * 2020-06-17 2020-07-28 腾讯科技(深圳)有限公司 基于人工智能的焦点用户挖掘方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925982A (zh) * 2021-03-12 2021-06-08 上海意略明数字科技股份有限公司 用户重定向方法及装置、存储介质、计算机设备
CN112925982B (zh) * 2021-03-12 2023-04-07 上海意略明数字科技股份有限公司 用户重定向方法及装置、存储介质、计算机设备
CN113221570A (zh) * 2021-05-31 2021-08-06 康键信息技术(深圳)有限公司 基于线上问诊信息的处理方法、装置、设备及存储介质
CN113360941A (zh) * 2021-06-04 2021-09-07 深圳市第二人民医院(深圳市转化医学研究院) 基于数字孪生的医疗数据处理方法、装置和计算机设备
CN113486238A (zh) * 2021-06-29 2021-10-08 平安信托有限责任公司 基于用户画像的信息推送方法、装置、设备及存储介质
CN113722601A (zh) * 2021-09-07 2021-11-30 南方电网数字电网研究院有限公司 电力量测信息推荐方法、装置、计算机设备和存储介质
CN113722601B (zh) * 2021-09-07 2024-04-16 南方电网数字电网研究院股份有限公司 电力量测信息推荐方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN112035611B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN112035611B (zh) 目标用户推荐方法、装置、计算机设备和存储介质
CN108874992B (zh) 舆情分析方法、***、计算机设备和存储介质
CN108595695B (zh) 数据处理方法、装置、计算机设备和存储介质
CN110457431B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN109815333B (zh) 信息获取方法、装置、计算机设备和存储介质
CN110504028A (zh) 一种疾病问诊方法、装置、***、计算机设备和存储介质
CN109036545B (zh) 医疗信息处理方法、装置、计算机设备和存储介质
WO2021047326A1 (zh) 信息推荐方法、装置、计算机设备和存储介质
CN108766545B (zh) 在线问诊科室分配方法、装置、计算机设备和存储介质
CN111445968A (zh) 电子病历查询方法、装置、计算机设备和存储介质
CN112036154A (zh) 基于问诊对话的电子病历生成方法、装置和计算机设备
CN110659298B (zh) 财务数据处理方法、装置、计算机设备和存储介质
CN112151141A (zh) 医疗数据处理方法、装置、计算机设备和存储介质
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN110489622B (zh) 对象信息的分享方法、装置、计算机设备和存储介质
CN112395500A (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN112015900A (zh) 医学属性知识图谱构建方法、装置、设备及介质
CN110880006A (zh) 用户分类方法、装置、计算机设备和存储介质
CN112035614A (zh) 测试集生成方法、装置、计算机设备和存储介质
CN111651666A (zh) 用户主题推荐方法、装置、计算机设备及存储介质
CN112288279A (zh) 基于自然语言处理和线性回归的业务风险评估方法和装置
CN113409907A (zh) 一种基于互联网医院的智能预问诊方法及***
CN112397197A (zh) 基于人工智能的问诊数据处理方法及装置
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN113707296A (zh) 医疗方案数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant