CN110879808B - 一种信息处理方法和装置 - Google Patents

一种信息处理方法和装置 Download PDF

Info

Publication number
CN110879808B
CN110879808B CN201911067254.4A CN201911067254A CN110879808B CN 110879808 B CN110879808 B CN 110879808B CN 201911067254 A CN201911067254 A CN 201911067254A CN 110879808 B CN110879808 B CN 110879808B
Authority
CN
China
Prior art keywords
information
user
identification
dimension
user information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911067254.4A
Other languages
English (en)
Other versions
CN110879808A (zh
Inventor
王宝松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201911067254.4A priority Critical patent/CN110879808B/zh
Publication of CN110879808A publication Critical patent/CN110879808A/zh
Application granted granted Critical
Publication of CN110879808B publication Critical patent/CN110879808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信息处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。该方法在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹。

Description

一种信息处理方法和装置
技术领域
本发明涉及计算机领域,尤其涉及一种信息处理方法和装置。
背景技术
近些年互联网的高速发展,带动了保险公司由传统保险方式向互联网保险的转变。但是互联网保险的场景众多、数据量、业务量远远超出传统保险,与此同时客户数量也大大增加,保险公司急需了解客户全貌信息,进而提供以客户为中心的服务,在提升客户体验的同时,扩展自身业务。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
保险公司需要从业务***抽取所需的客户信息,而业务***一般基于oracle数据库,处理速度慢,响应速度慢,而且不能在oracle数据库上对客户信息直接进行分析。
发明内容
有鉴于此,本发明实施例提供一种信息处理方法和装置,为用户信息生成用户标识,基于用户标识查询出对应的基本信息表,进而在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹。
为实现上述目的,根据本发明实施例的一个方面,提供了一种信息处理方法。
本发明实施例的一种信息处理方法,包括:获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。
可选地,所述用户标识包括信息质量标识字段和字符串字段;所述根据比对结果生成相应的用户标识,包括:根据所述用户信息中存在所述识别要素信息的数量,确定所述信息质量标识;使用标识生成算法对所述用户信息进行处理,得到所述字符串;将所述信息质量标识和所述字符串进行拼接,得到用户标识。
可选地,所述方法还包括:根据设定的取模规则,对所述字符串进行取模运算,得到所述用户标识对应的数据库编号和数据表编号;按照所述数据库编号和所述数据表编号,存储所述信息轨迹表和所述基本信息表。
可选地,若未查询出主键与所述用户标识相同的基本信息表,所述方法还包括:按照用户信息模型中信息表所存储信息的种类,将所述用户信息分别存储到相应的所述信息表中;其中,所述信息表包括所述基本信息表和所述信息轨迹表,所述信息表的主键为所述用户标识。
可选地,将所述用户信息与设定的识别要素信息进行比对的步骤之后,所述方法还包括:根据所述用户信息中存在所述识别要素信息的数量,判断相应的用户是否为可识别用户;将可识别用户的用户信息模型与不可识别用户的用户信息模型分别存储到不同的目标数据库。
可选地,所述获取用户信息,包括:从不同的数据源中获取业务数据,解析所述业务数据得到所述用户信息。
可选地,根据比对结果生成相应的用户标识的步骤之后,所述方法还包括:若多个所述用户标识对应同一用户时,将对应的多个所述用户信息进行合并。
为实现上述目的,根据本发明实施例的另一方面,提供了一种信息处理装置。
本发明实施例的一种信息处理装置,包括:标识生成模块,用于获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;差异确定模块,用于查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;追加更新模块,用于将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。
可选地,所述用户标识包括信息质量标识字段和字符串字段;所述标识生成模块,还用于:根据所述用户信息中存在所述识别要素信息的数量,确定所述信息质量标识;使用标识生成算法对所述用户信息进行处理,得到所述字符串;将所述信息质量标识和所述字符串进行拼接,得到用户标识。
可选地,所述装置还包括:第一存储模块,用于根据设定的取模规则,对所述字符串进行取模运算,得到所述用户标识对应的数据库编号和数据表编号;按照所述数据库编号和所述数据表编号,存储所述信息轨迹表和所述基本信息表。
可选地,所述装置还包括:第二存储模块,用于在未查询出主键与所述用户标识相同的基本信息表时,按照用户信息模型中信息表所存储信息的种类,将所述用户信息分别存储到相应的所述信息表中;其中,所述信息表包括所述基本信息表和所述信息轨迹表,所述信息表的主键为所述用户标识。
可选地,所述装置还包括:识别存储模块,用于根据所述用户信息中存在所述识别要素信息的数量,判断相应的用户是否为可识别用户;将可识别用户的用户信息模型与不可识别用户的用户信息模型分别存储到不同的目标数据库。
可选地,所述标识生成模块,还用于从不同的数据源中获取业务数据,解析所述业务数据得到所述用户信息。
可选地,所述装置还包括:信息合并模块,用于在多个所述用户标识对应同一用户时,将对应的多个所述用户信息进行合并。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种信息处理方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种信息处理方法。
上述发明中的一个实施例具有如下优点或有益效果:为用户信息生成用户标识,基于用户标识查询出对应的基本信息表,进而在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据;基于用户信息中识别要素信息的完整度,生成带有不同信息质量标识的用户标识,简单统计用户标识就能直观了解用户信息的质量;将用户信息进行分布式存储,可靠性高,易于扩展,存取效率高;按信息种类将用户信息存储到用户信息模型,方便查询用户在不同维度的信息轨迹记录,方便溯源;将可识别用户和不可识别用户的用户信息分别存储到不同的数据库,减少数据分析的数量,提高分析效率;将不同数据源的用户信息集中存储,实现了信息共享;将同一用户的用户信息进行合并,提高后续分析的准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例一的信息处理方法的主要步骤的示意图;
图2是根据本发明实施例二的信息处理方法的主要流程示意图;
图3是根据本发明实施例的用户信息模型示意图;
图4是根据本发明实施例三的信息处理方法的总体流程示意图;
图5是根据本发明实施例四的信息处理方法的主要流程示意图;
图6是根据本发明实施例的信息处理装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性***架构图;
图8是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例一的信息处理方法的主要步骤的示意图。如图1所示,本发明实施例一的信息处理方法,主要包括如下步骤:
步骤S101:获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识。从不同的数据源中获取业务数据,解析业务数据得到用户信息。将用户信息与设定的识别要素信息进行比对,进而根据用户信息中存在识别要素信息的数量,确定信息质量标识,之后使用标识生成算法对用户信息进行处理得到一个字符串,拼接信息质量标识与该字符串得到用户标识。
步骤S102:查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异。预先构建用户信息模型,该用户信息模型包括多个信息表,比如基本信息表、信息轨迹表。同一个用户信息对应信息表的主键相同,均为用户标识。查询是否存在主键与用户标识相同的基本信息表,如果存在,判断该基本信息表中目标维度的维度信息,与相同维度的用户信息是否存在差异。
步骤S103:将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。在基本信息表中目标维度的维度信息与相同维度的用户信息存在差异的情况下,先将维度信息追加存储到与基本信息表的主键相同的信息轨迹表中,之后再把对应维度的用户信息更新到基本信息表。通过上述方式实现了全部用户信息的存储,不会丢弃用户信息,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据。
图2是根据本发明实施例二的信息处理方法的主要流程示意图。
如图2所示,本发明实施例二的信息处理方法,主要包括如下步骤:
步骤S201:从不同的数据源中收集业务数据,解析业务数据得到用户信息,为每个用户信息生成相应的用户标识。用户标识包括信息质量标识字段和字符串字段。为一个用户信息生成对应的用户标识的实现过程如下:根据用户信息中存在识别要素信息的数量,确定信息质量标识;使用标识生成算法对用户信息进行处理,得到唯一的字符串;将信息质量标识和改字符串进行拼接,即可得到用户标识。
其中,识别要素信息用于作为识别多个用户为同一用户的标准,可以根据实际需求自定义,当识别要素信息完全相同时,认为是同一用户。同一用户的用户标识相同。信息质量标识用于标识用户信息的质量等级,可以用字母、数字等表示。下面举例说明:
假设识别要素信息为:姓名、证件号、证件类型、性别、出生日期这五个要素。对于五要素齐全的,用户标识可以为:A+字符串;对于仅有证件号+证件类型+姓名+出生日期/性别的,用户标识可以为:B+字符串;对于仅有证件号+证件类型+姓名的,用户标识可以为:C+字符串;对于仅有证件号+证件类型的,用户标识可以为:D+字符串;对于仅有证件号的,用户标识可以为:E+字符串;其他情况,用户标识可以为:F+字符串。
每个字符串由标识生成算法生成,比如SnowFlake算法、GUID(Globally UniqueIdentifier,全局唯一标识符)。其中,SnowFlake是Twitter开源的分布式ID生成算法,结果是一个long型的ID。需要注意的是,本实施例并不限定字母与字符串的先后顺序,字母也可以在字符串后面。通过用户标识的字母即可判定用户信息包含识别要素的数量,确定用户信息的完整性,比如字母为A,则用户信息是完整的。如果某个***只需要完整的用户信息,则可以将用户标识包含字母A的用户信息推送至该***。
步骤S202:判断是否存在主键与当前用户标识相同的基本信息表,如果存在,则执行步骤S203;如果不存在,则执行步骤S206。从全部用户标识中选取一个作为当前用户标识。将当前用户标识与基本信息表的主键比对,判断是否存在主键与当前用户标识相同的基本信息表。如果存在,说明数据库中已经存在该用户标识对应的用户信息模型;如果不存在,说明数据库中没有该用户标识对应的用户信息模型,需要构建该用户信息模型。
步骤S203:判断基本信息表中目标维度的维度信息与对应维度的用户信息是否存在差异,如果存在差异,则执行步骤S204;如果不存在差异,则执行步骤S205。目标维度即基本信息表包括的所有维度。比较基本信息表中目标维度的维度信息与对应维度的用户信息是否相同,如果相同,该用户的基本信息无需更新。如果不同,则需要更新基本信息。
步骤S204:将维度信息追加存储至具有相同主键的信息轨迹表,之后将对应维度的当前用户信息更新到基本信息表。在更新基本信息表之前,需先把维度信息追加存储到与该基本信息表的主键相同的信息轨迹表,之后再更新基本信息表,使得用户的历史轨迹信息可以查询和追溯。追加存储即在相同主键的信息轨迹表中增加数据记录。
步骤S205:按照信息种类,将对应维度的当前用户信息追加存储至对应的具有相同主键的其他信息表,执行步骤S207。对于存在差异和不存在差异两种情况,均需按照信息种类,把除目标维度外的其他维度的用户信息追加存储对应的其他信息表。这些信息表的主键与基本信息表的主键相同。
步骤S206:按照用户信息模型中信息表所存储信息的种类,将当前用户信息分别存储到相应的信息表中。用户信息的种类较多,比如基本信息、地址信息、联系信息、其他信息等。每项信息中可以包括多个维度信息,比如渠道来源、***来源、业务类型、业务时间、业务号等。此处的渠道可以指保险购买的渠道,比如支付宝、携程等。业务类型可以是承保业务、保单批改业务、保单理赔业务等。
图3是根据本发明实施例的用户信息模型示意图。如图3所示,该用户信息模型包括:基本信息表、信息轨迹表、地址信息表、联系信息表、第三方信息表、车辆信息表、设备号信息表、账号信息表和其他信息表。PK为主键,FK为外键,且图3中只展示了信息表的部分字段。其中,基本信息表:主要记录用户最新的基本信息,包括:用户标识、姓名、证件号、证件类型、出生日期、国籍、职业、渠道来源、***来源、业务类型、业务时间、业务号。
基本信息表的更新频率一般较少。信息轨迹表:在基本信息表有更新时,将更新前的信息写入信息轨迹表。地址信息表包括:用户标识、省、市、区(县)代码、地址(细化到门牌号)、渠道来源、***来源、业务类型、业务时间、业务号。联系信息表包括:用户标识、联系方式(比如具体手机号、邮箱具体值等)、联系类型(比如手机号、邮箱等)、渠道来源、***来源、业务类型、业务时间、业务号。
第三方信息表包括:用户标识、第三方ID(用户在第三方***的标识)、渠道来源、***来源、业务类型、业务时间、业务号。车辆信息表包括:用户标识、车辆机架号、车牌号、车辆出厂时间、渠道来源、***来源、业务类型、业务时间、业务号。设备号信息表包括:用户标识、设备(比如手机、电脑)ID、渠道来源、***来源、业务类型、业务时间、业务号。账号信息表包括:用户标识、账号(比如银行***、支付宝账号)、户主姓名、渠道来源、***来源、业务类型、业务时间、业务号。其他信息表包括:用户标识、婚姻状态、学历、身高、民族、渠道来源、***来源、业务类型、业务时间、业务号。
用户信息模型的每个信息表中均包含渠道来源、***来源、业务类型、业务时间、业务号这五个维度字段。每当保险公司获取到新的业务数据时,可以解析业务数据,将得到的用户信息存储到上述用户信息模型,可以方便快速的查询用户在不同渠道、不同***、不同业务类型等维度中的信息轨迹记录,起到用户信息溯源、多维分析用户行为的作用。
步骤S207:将当前用户信息对应的用户信息模型存储到目标数据库。根据设定的取模规则,对当前用户标识的字符串进行取模运算,得到对应的数据库编号和数据表编号;按照数据库编号和数据表编号,存储用户信息模型。比如,字符串为321123,数据库个数为64,数据表个数为128,则可以用字符串的前三位对64取模得到数据库编号,用字符串的后三位对128取模得到数据表编号。
步骤S208:将下一用户信息作为当前用户信息,执行步骤S202,直至处理完解析出的全部用户信息。收集到的业务数据,经解析后可能包含多条用户信息。对每一条用户信息均执行步骤S202至步骤S207的处理过程,直至解析出的全部用户信息被处理完成。根据用户标识能直接分析该用户的基本信息,提高大数据分析和统计的效率。
在一优选的实施例中,步骤S207将用户信息模型存储到目标数据库之前,可以先判断该用户是否为可识别用户,根据判断结果存储用户信息模型。具体为:根据当前用户信息中存在识别要素信息的数量,判定相应的用户是否为可识别用户;将可识别用户的用户信息模型与不可识别用户的用户信息模型分别存储到不同的目标数据库。实施例中,如果当前用户信息中包含全部的识别要素信息,则认为该用户是可识别用户,否则为不可识别用户。进而在存储时能将可识别用户存储到一个分布式集群中,不可识别用户存储到另外一个集群中,能够减少数据分析的数量,提高分析效率,降低分析成本。
图4是根据本发明实施例三的信息处理方法的总体流程示意图。如图4所示,本发明实施例三的信息处理方法由用户信息平台实现,包括三个部分,信息接入、信息处理和信息存储,以下进行详细说明。
信息接入:接收来自不同数据源的业务数据,从业务数据中解析出用户信息。此处的数据源可以为保险公司的业务***,比如寿险业务***、车险业务***、非车财险业务***、短险业务***、赠险业务***。一个公司的用户信息通常分散在不同的业务***中,故需将各个业务***的数据同步到用户信息平台。
信息处理:将用户信息组装成相应的用户信息模型,对用户信息模型中的信息表进行处理,为用户信息生成用户标识。用户信息包括自然人信息和法人信息,相应的用户信息模型包括自然人信息模型和法人信息模型。自然人信息模型即如图3所示的用户信息模型。
法人信息模型可以包括:基本信息表、信息轨迹表、地址信息表、联系信息表、账号信息表和其他信息表。其中,基本信息表包括:法人标识、机构名称、经营范围、公司证件类型、公司证件类型对应的证件号、经营执照有效起期、经营执照有效止期、法人代表姓名、法人代表证件号、法人代表证件类型、法人代表证件号有效起期、法人代表证件号有效期。
地址信息表包括:联系地址省代码、联系地址市代码、联系地址区代码、详细联系地址、机构地址。联系信息表包括:联系人姓名、联系人手机号、联系人邮箱、机构传真、联系人类型、职务、部门、联系人固定电话、投保人E_mail、性质类型。其他信息表包括:成立日期、注册资本、机构邮编、机构电话、行业类别、银行代码、银行名称、银行账号、***来源、数据接入时间、更新时间、单位性质。
对信息表的处理可以是标准化、合规化处理,比如去掉姓名中的空格、全角字符转半角字符、身份证号需符合身份证校验规则等。用户标识包括信息质量标识字段和字符串字段。具体生成过程如前所述。若多个用户标识对应同一用户时,可以将对应的多个用户信息模型进行合并。
信息存储:根据用户信息中存在识别要素信息的数量,判断相应的用户是否为可识别用户,将可识别用户与不可识别用户的用户信息模型分别存储到不同的数据库集群,将用户标识存储到索引库表,相同用户标识的用户信息追加存储到对应的信息表。
实施例中,数据库集群比如为Mysql集群,索引库用来判断用户标识是否重复,比如为Redis集群。在一优选的实施例中,可以通过中间件将数据库集群中的用户信息存储到ES集群。数据库集群、ES集群、索引库都可以有副本,保证某个服务器坏掉时仍然可用,保证数据的可用性、安全性。
在保险行业中,由于用户可能从同一家保险公司的不同渠道发生了直接联系,比如购买不同的产品、批改了某个保单的个人基本信息、理赔时又提供了一些其他的信息,而所有的这些信息目前只是和保单、或批单、或报案相联系,保险公司需要全面了解用户,就需要知道用户在保险公司的信息轨迹,能够追溯用户的包括不同的维度的各个信息版本。下面以保险行业为例,对本发明实施例的信息处理方法做进一步说明。
图5是根据本发明实施例四的信息处理方法的主要流程示意图。
如图5所示,本发明实施例四的信息处理方法,主要包括以下步骤:
步骤S501:用户信息平台收集不同业务***的业务数据。实施例中,用户信息平台可以基于kafka实现,并于其他***解耦。其中,kafka是一种高吞吐量的分布式发布订阅消息***。业务数据包括:保单信息、批单信息、理赔信息和第三方信息。
步骤S502:用户信息平台解析业务数据得到用户信息,为用户信息生成用户标识。用户信息比如基本信息、地址信息、联系信息等。生成用户标识的具体实现参见步骤S201,此处不再赘述。
步骤S503:用户信息平台在主键与用户标识相同的基本信息表存在更新的情况下,将基本信息表的当前信息追加存储至具有相同主键的信息轨迹表。用户与保险公司每一次交互的数据都会被保存下来,而且不在历史信息上修改,新增用户信息记录。
步骤S504:用户信息平台更新基本信息表,将其他信息直接追加存储到对应的其他信息表。基本信息表为主表,其他信息表包括地址信息表、联系信息表、第三方信息表、车辆信息表、设备号信息表、账号信息表和其他信息表。追加存储可以将用户的每一次交易都记录下来,包括交易时间、交易***来源、以及交易号等信息。基于追加信息,可以方便迅速的查询用户在保险公司的所有交易信息,方便分析用户行为。
通过本发明实施例的信息处理方法可以看出,为用户信息生成用户标识,基于用户标识查询出对应的基本信息表,进而在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据;基于用户信息中识别要素信息的完整度,生成带有不同信息质量标识的用户标识,简单统计用户标识就能直观了解用户信息的质量;将用户信息进行分布式存储,可靠性高,易于扩展,存取效率高。
本发明实施例的信息处理方法按信息种类将用户信息存储到用户信息模型,方便查询用户在不同维度的信息轨迹记录,方便溯源,提升用户体验;将可识别用户和不可识别用户的用户信息分别存储到不同的数据库,减少数据分析的数量,提高分析效率;将不同数据源的用户信息集中存储,实现了信息共享,为公司带来经济效益;将同一用户的用户信息进行合并,提高后续分析的准确性。
图6是根据本发明实施例的信息处理装置的主要模块的示意图。如图6所示,本发明实施例的信息处理装置600(即用户信息平台),主要包括:
标识生成模块601,用于获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识。从不同的数据源中获取业务数据,解析业务数据得到用户信息。将用户信息与设定的识别要素信息进行比对,进而根据用户信息中存在识别要素信息的数量,确定信息质量标识,之后使用标识生成算法对用户信息进行处理得到一个字符串,拼接信息质量标识与该字符串得到用户标识。
差异确定模块602,用于查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异。预先构建用户信息模型,该用户信息模型包括多个信息表,比如基本信息表、信息轨迹表。同一个用户信息对应信息表的主键相同,均为用户标识。查询是否存在主键与用户标识相同的基本信息表,如果存在,判断该基本信息表中目标维度的维度信息,与相同维度的用户信息是否存在差异。
追加更新模块,用于将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。在基本信息表中目标维度的维度信息与相同维度的用户信息存在差异的情况下,先将维度信息追加存储到与基本信息表的主键相同的信息轨迹表中,之后再把对应维度的用户信息更新到基本信息表。通过上述方式实现了全部用户信息的存储,不会丢弃用户信息,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据。
另外,本发明实施例的信息处理装置600还可以包括:第一存储模块、第二存储模块、识别存储模块和信息合并模块(图6中未示出)。其中,第一存储模块,用于根据设定的取模规则,对所述字符串进行取模运算,得到所述用户标识对应的数据库编号和数据表编号;按照所述数据库编号和所述数据表编号,存储所述信息轨迹表和所述基本信息表。
第二存储模块,用于在未查询出主键与所述用户标识相同的基本信息表时,按照用户信息模型中信息表所存储信息的种类,将所述用户信息分别存储到相应的所述信息表中;其中,所述信息表包括所述基本信息表和所述信息轨迹表,所述信息表的主键为所述用户标识。
识别存储模块,用于根据所述用户信息中存在所述识别要素信息的数量,判断相应的用户是否为可识别用户;将可识别用户的用户信息模型与不可识别用户的用户信息模型分别存储到不同的目标数据库。信息合并模块,用于在多个所述用户标识对应同一用户时,将对应的多个所述用户信息进行合并。
从以上描述可以看出,为用户信息生成用户标识,基于用户标识查询出对应的基本信息表,进而在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据。
图7示出了可以应用本发明实施例的信息处理方法或信息处理装置的示例性***架构700。
如图7所示,***架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如管理员利用终端设备701、702、703发送的用户信息进行处理的后台管理服务器。后台管理服务器可以为用户信息生成用户标识,更新信息轨迹表和基本信息表,并将处理结果(例如更新后的信息轨迹表)反馈给终端设备。
需要说明的是,本申请实施例所提供的信息处理方法一般由服务器705执行,相应地,信息处理装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种信息处理方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种信息处理方法。
下面参考图8,其示出了适用于来实现本发明实施例的电子设备的计算机***800的结构示意图。图8示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机***800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有计算机***800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括标识生成模块、差异确定模块和追加更新模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,标识生成模块还可以被描述为“获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;查询主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表。
从以上描述可以看出,为用户信息生成用户标识,基于用户标识查询出对应的基本信息表,进而在基本信息表的维度信息存在更新时,先将维度信息存储到信息轨迹表,再更新基本信息表,实现了全部用户信息的存储,同时可以追溯查询用户信息的历史轨迹,为核保核批提供依据。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (9)

1.一种信息处理方法,其特征在于,包括:
获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;
查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;
将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表;
所述用户标识包括信息质量标识字段和字符串字段;
所述根据比对结果生成相应的用户标识,包括:
根据所述用户信息中存在所述识别要素信息的数量,确定所述信息质量标识;
使用标识生成算法对所述用户信息进行处理,得到所述字符串;
将所述信息质量标识和所述字符串进行拼接,得到用户标识。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据设定的取模规则,对所述字符串进行取模运算,得到所述用户标识对应的数据库编号和数据表编号;
按照所述数据库编号和所述数据表编号,存储所述信息轨迹表和所述基本信息表。
3.根据权利要求1所述的方法,其特征在于,若未查询出主键与所述用户标识相同的基本信息表,所述方法还包括:
按照用户信息模型中信息表所存储信息的种类,将所述用户信息分别存储到相应的所述信息表中;其中,所述信息表包括所述基本信息表和所述信息轨迹表,所述信息表的主键为所述用户标识。
4.根据权利要求3所述的方法,其特征在于,将所述用户信息与设定的识别要素信息进行比对的步骤之后,所述方法还包括:
根据所述用户信息中存在所述识别要素信息的数量,判断相应的用户是否为可识别用户;
将可识别用户的用户信息模型与不可识别用户的用户信息模型分别存储到不同的目标数据库。
5.根据权利要求1所述的方法,其特征在于,所述获取用户信息,包括:
从不同的数据源中获取业务数据,解析所述业务数据得到所述用户信息。
6.根据权利要求1至5的任一项所述的方法,其特征在于,根据比对结果生成相应的用户标识的步骤之后,所述方法还包括:
若多个所述用户标识对应同一用户时,将对应的多个所述用户信息进行合并。
7.一种信息处理装置,其特征在于,包括:
标识生成模块,用于获取用户信息,将所述用户信息与设定的识别要素信息进行比对,以根据比对结果生成相应的用户标识;
差异确定模块,用于查询预设主键与所述用户标识相同的基本信息表,确定所述基本信息表中目标维度的维度信息与对应维度的用户信息存在差异;
追加更新模块,用于将所述维度信息追加存储至具有相同主键的信息轨迹表,将对应维度的用户信息更新到所述基本信息表;
所述用户标识包括信息质量标识字段和字符串字段;所述标识生成模块,还用于:根据所述用户信息中存在所述识别要素信息的数量,确定所述信息质量标识;使用标识生成算法对所述用户信息进行处理,得到所述字符串;将所述信息质量标识和所述字符串进行拼接,得到用户标识。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201911067254.4A 2019-11-04 2019-11-04 一种信息处理方法和装置 Active CN110879808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911067254.4A CN110879808B (zh) 2019-11-04 2019-11-04 一种信息处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911067254.4A CN110879808B (zh) 2019-11-04 2019-11-04 一种信息处理方法和装置

Publications (2)

Publication Number Publication Date
CN110879808A CN110879808A (zh) 2020-03-13
CN110879808B true CN110879808B (zh) 2022-09-27

Family

ID=69728931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911067254.4A Active CN110879808B (zh) 2019-11-04 2019-11-04 一种信息处理方法和装置

Country Status (1)

Country Link
CN (1) CN110879808B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488856B (zh) * 2020-11-23 2024-05-28 中国人寿保险股份有限公司 一种信息归类方法、设备、电子设备及存储介质
CN113763097A (zh) * 2020-12-14 2021-12-07 北京沃东天骏信息技术有限公司 一种物品信息更新的方法和装置
CN113835965B (zh) * 2021-09-27 2024-03-26 中电金信软件有限公司 一种参数轨迹留痕方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694333A (zh) * 2017-04-07 2018-10-23 华为技术有限公司 用户信息处理方法及装置
CN108846763A (zh) * 2018-06-05 2018-11-20 中国平安人寿保险股份有限公司 核保请求处理方法、装置、计算机设备和存储介质
CN109634976A (zh) * 2018-12-12 2019-04-16 泰康保险集团股份有限公司 非关系型数据库的运维方法、装置、***及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694333A (zh) * 2017-04-07 2018-10-23 华为技术有限公司 用户信息处理方法及装置
CN108846763A (zh) * 2018-06-05 2018-11-20 中国平安人寿保险股份有限公司 核保请求处理方法、装置、计算机设备和存储介质
CN109634976A (zh) * 2018-12-12 2019-04-16 泰康保险集团股份有限公司 非关系型数据库的运维方法、装置、***及可读存储介质

Also Published As

Publication number Publication date
CN110879808A (zh) 2020-03-13

Similar Documents

Publication Publication Date Title
US10540383B2 (en) Automatic ontology generation
CN110879808B (zh) 一种信息处理方法和装置
CN109522312B (zh) 一种数据处理方法、装置、服务器和存储介质
US20160162507A1 (en) Automated data duplicate identification
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN110674360B (zh) 一种用于数据的溯源方法和***
US20200202302A1 (en) Classifying and routing enterprise incident tickets
CN113205402A (zh) 对账方法、装置、电子设备及计算机可读介质
CN113434527A (zh) 数据处理的方法、装置、电子设备和存储介质
CN111339743B (zh) 一种账号生成的方法和装置
CN113435859A (zh) 信访件处理方法、装置、电子设备和计算机可读介质
CN110895587B (zh) 用于确定目标用户的方法和装置
CN112182138A (zh) 一种目录编制方法和装置
CN116127154A (zh) 知识标签推荐方法、装置、电子设备及存储介质
CN112612817B (zh) 数据处理方法、装置、终端设备及计算机可读存储介质
CN112256566B (zh) 一种测试案例的保鲜方法和装置
CN114860305A (zh) 数据处理方法和装置
CN114066603A (zh) 贷后风险预警方法、装置、电子设备和计算机可读介质
US20180101596A1 (en) Deriving and interpreting users collective data asset use across analytic software systems
CN113934729A (zh) 一种基于知识图谱的数据管理方法、相关设备及介质
CN112487262A (zh) 一种数据处理的方法和装置
CN113704222A (zh) 一种处理业务请求的方法和装置
CN111552703A (zh) 一种数据处理方法及装置
CN113742564A (zh) 目标资源的推送方法和装置
CN114416805B (zh) 数据核对方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant