CN111753496B

CN111753496B - 行业类别识别方法、装置、计算机设备及可读存储介质

Info

Publication number: CN111753496B
Application number: CN202010577837.8A
Authority: CN
Inventors: 胡怡文; 何亮飞; 徐巍越
Original assignee: Pingan Payment Technology Service Co Ltd
Current assignee: Pingan Payment Technology Service Co Ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2023-06-23
Anticipated expiration: 2040-06-22
Also published as: CN111753496A

Abstract

本发明涉及人工智能技术，公开了一种行业类别识别方法、装置、计算机设备及可读存储介质，包括：接收客户端发送的商户信息，根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果。本发明还涉及区块链技术，信息可存储于区块链节点中。本发明实现了从文本信息角度和现场图像角度综合分析商户信息的行业类别，无需基于大量交易或运营数据，即可对刚注册准入商户、或交易量小的商户、或不具有明显交易经营特征的商户的行业类型进行识别。

Description

行业类别识别方法、装置、计算机设备及可读存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种行业类别识别方法、装置、计算机设备及可读存储介质。

背景技术

商户的所属行业是银行等金融机构与第三方支付等非金融机构在银行卡收单业务中对特约商户管理的重要依据。收单机构对特约商户行业信息的收集和管理主要通过以下两种方式：1.在自有销售或服务商进件的情况下，由销售人员或者进件人员依据特约商户的营业执照中经营范围的信息及商家提供的主营业务内容，如经营场所实景，进行MCC码识别和申报。2.在特约商户自助进件的情况下，依赖商户自行按规定申报。由于特约商家数量庞大，营业执照的信息过于复杂，在进一步审核的过程中，很难保障覆盖性以及正确性。

为解决如何降低人工运营成本，目前业界通过基于一定数量的有交易的行业已知的商户的交易记录通过机器学习建模，再使用该模型来判定其他有交易的商户行业是否正确。

然而这种方法具有以下问题：

1.刚获得准入的商户：该方法必须使用商户的交易行为数据来判定商户的行业。但是商户一旦被收单机构同意准入，就需要按照其行业标准，对其后续交易进行监控。同时，行业信息需要通过商户类别码(Merchant Category Code，简称MCC码)透传给下游第三方支付机构及收单行。这种情形下，对于这样刚准入的商户，该方法就无法实施。

2.交易量小的商户：商户可能存在自身经营情况不理想导致交易数据稀疏，商户也可能拥有多种收款渠道，通过特定交易渠道的交易量较小。

3.商户所属行业不具备明显的交易经营特征：举例来说，餐饮业可具备时间段和交易金额范围的特征，但对于商场内的服装行业与美容护肤行业可能通过交易信息就无法进行准确区分。

综上，目前业界采用的行业类别识别方法，因需要基于大量交易或运营数据对商户的行业类别进行识别，而无法对刚注册准入商户、或交易量小的商户、或不具有明显交易经营特征的商户的行业类型进行识别。

发明内容

本发明的目的是提供一种行业类别识别方法、装置、计算机设备及可读存储介质，用于解决现有技术存在的因需要基于大量交易或运营数据方可对商户的行业类别进行识别，导致无法对刚注册准入商户、或交易量小的商户、或不具有明显交易经营特征的商户的行业类型进行识别的问题；本申请可应用于智慧政务场景中，从而推动智慧城市的建设。

为实现上述目的，本发明提供一种行业类别识别方法，包括：

接收客户端发送的商户信息，其中，所述商户信息至少包括用于表达商户信息所对应商户身份的身份信息，以及用于展示用户信息所对应商户营业现场的现场图像；

根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；其中，所述文本信息描述了所述商户信息所对应商户的属性数据，所述文本行业特征以特征编码的形式表征了文本信息中具有行业特征的特征词汇；

从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品；

将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果；所述图文分析结果以特征向量的形式表征了所述商户信息所属行业类别的概率。

上述方案中，接收客户端发送的商户信息之前，包括：

与保存有商户的认证信息的数据库建立通信连接；其中，通过TCP通信协议或UDP通信协议与数据库建立通信连接。

上述方案中，根据所述身份信息获取文本信息的步骤，包括：

判断是否能够从数据库中获得与所述身份信息对应的文本信息；若能够获得所述对应的文本信息，则判断所述身份信息与文本信息是否一致；若无法获得所述对应的文本信息，则判定所述商户信息为非法信息并结束；

若所述身份信息与文本信息一致，则判定商户信息为合法信息，并允许从文本信息中识别文本行业特征；若身份信息与文本信息不一致，则判定所述商户信息为非法信息并结束。

上述方案中，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征的步骤，包括：

从所述文本信息中获取文本数据，或通过OCR***识别所述文本信息中的内容以获取文本数据；

对所述文本数据进行分词处理和词性标注处理，以获得至少一个具有词性标注的词汇的分词集；

对所述分词集中的词汇进行句法分析以获得各所述分词之间的语义关系，记录各所述词汇的语义特征获得具有语义特征及词性标注的词汇的特征词汇，其中，语义特征表达了该词汇在文本信息中的词性；

构建所述特征词汇的特征编码，并将其录入预设的TextCNN模型进行合并编码，以抽象出能代表商户所属行业的关键信息。

上述方案中，构建所述特征词汇的特征编码的步骤，包括：

采用word2vec的CBOW连续词袋法对特征词汇中词汇进行编码获得词向量；

通过one-hot encoding或label-encoding分别对特征词汇中的词性标注和语义特征进行编码，获得词性向量和语义向量；

拼接所述词向量、词性向量和语义向量获得特征编码。

上述方案中，从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征的步骤，包括：

通过预设的成熟CNN模型获得现场图像的像素，所述CNN模型的卷积核识别所述现场图像中出现的物品并生成卷积向量；所述卷积向量以特征向量的形式表征了所述现场图像中出现的物品；

所述CNN模型的全连接层对所述卷积向量进行运算，以识别出具有行业特征的物品并生成图像行业特征；所述图像行业特征以特征向量的形式表征了所述具有行业特征的物品。

上述方案中，获得图文分析结果之后，还包括：

判断所述图文分析结果与所述商品信息的申请行业是否一致；若是，则向客户端发送校验通过信息；若否，则向客户端发送校验失败信息；

向客户端发送校验通过信息之后，还包括：

将所述图文分析结果上传至区块链中。

为实现上述目的，本发明还提供一种行业类别识别装置，包括：

输入模块，用于接收客户端发送的商户信息，其中，所述商户信息至少包括用于表达商户信息所对应商户身份的身份信息，以及用于展示用户信息所对应商户营业现场的现场图像；

文本识别模块，用于根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；其中，所述文本信息描述了所述商户信息所对应商户的属性数据，所述文本行业特征以特征编码的形式表征了文本信息中具有行业特征的特征词汇；

图像识别模块，用于从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品；

图文分析模块，用于将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果；所述图文分析结果以特征向量的形式表征了所述商户信息所属行业类别的概率。

为实现上述目的，本发明还提供一种计算机设备，其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述计算机设备的处理器执行所述计算机程序时实现上述行业类别识别方法的步骤。

为实现上述目的，本发明还提供一种计算机可读存储介质，所述可读存储介质上存储有计算机程序，所述可读存储介质存储的所述计算机程序被处理器执行时实现上述行业类别识别方法的步骤。

本发明提供的行业类别识别方法、装置、计算机设备及可读存储介质，通过从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征，以在文本角度上完成对商户信息的行业特征进行提取和识别；从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征，以在图像角度上完成对商户信息的行业特征进行提取和识别，实现了从现场图像的角度获知商户信息的行业类别的效果；从文本信息角度和现场图像角度综合分析商户信息的行业类别，因此无需基于大量交易或运营数据，即可对刚注册准入商户、或交易量小的商户、或不具有明显交易经营特征的商户的行业类型进行识别，提高了商户所属行业类别分析的准确度。

附图说明

图1为本发明行业类别识别方法实施例一的流程图；

图2为本发明行业类别识别方法实施例二的具体方法流程图；

图3为本发明行业类别识别方法实施例二中获取文本信息的流程图；

图4为本发明行业类别识别方法实施例二中从文本信息中识别出文本行业特征的流程图；

图5为本发明行业类别识别方法实施例二中从现场图像中识别出图像行业特征的流程图；

图6为本发明行业类别识别装置实施例三的程序模块示意图；

图7为本发明计算机设备实施例四中计算机设备的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的行业类别识别方法、装置、计算机设备及可读存储介质，适用于人工智能领域，为提供一种基于输入模块、文本识别模块、图像识别模块和图文分析模块的行业类别识别方法。本发明通过根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；将所述文本行业特征和图像行业特征录入预设的成熟DNN模型以获得图文分析结果。

实施例一：

请参阅图1，本实施例的一种行业类别识别方法，包括：

S101：接收客户端发送的商户信息，其中，所述商户信息至少包括用于表达商户信息所对应商户身份的身份信息，以及用于展示用户信息所对应商户营业现场的现场图像；

S102：根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；其中，所述文本信息描述了所述商户信息所对应商户的属性数据，所述文本行业特征以特征编码的形式表征了文本信息中具有行业特征的特征词汇；

S103：从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品；

S104：将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果；所述图文分析结果以特征向量的形式表征了所述商户信息所属行业类别的概率。

于本实施例中，通过从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征，以在文本角度上完成对商户信息的行业特征进行提取和识别。所述行业特征是指一个行业区别于其他行业的特别显著的征象、标志，于本实施例中，所述行业特征可为描述商户信息行业类别、经营范围的词汇，实现了从文本信息的角度获知商户信息的行业类别的效果。

通过从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征，以在图像角度上完成对商户信息的行业特征进行提取和识别，实现了从现场图像的角度获知商户信息的行业类别的效果。

利用成熟深度网络模型，对文本行业特征和图像行业特征进行分析，以实现结合文本信息中具有行业特征的特征词汇，以及现场图像中具有行业特征的物品对商户信息的行业类别进行分析，获得图文分析结果，实现了从文本信息角度和现场图像角度综合分析商户信息的行业类别的效果，提高了商户所属行业类别分析的准确度。

综上，由于本申请是从文本信息角度和现场图像角度综合分析商户信息的行业类别，因此无需基于大量交易或运营数据，即可对刚注册准入商户、或交易量小的商户、或不具有明显交易经营特征的商户的行业类型进行识别。

本申请可应用于智慧政务场景中，从而推动智慧城市的建设。

实施例二：

本实施例为上述实施例一的一种具体应用场景，通过本实施例，能够更加清楚、具体地阐述本发明所提供的方法。

下面，以运行有行业类别识别方法的服务器中，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征，从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征，并根据所述文本行业特征和图像行业特征获得图文分析结果为例，来对本实施例提供的方法进行具体说明。需要说明的是，本实施例只是示例性的，并不限制本发明实施例所保护的范围。

图2是本发明一个实施例提供的一种行业类别识别方法的具体方法流程图，该方法具体包括步骤S200至S205。

S200：与保存有商户的认证信息的数据库建立通信连接，其中，通过TCP通信协议或UDP通信协议与数据库建立通信连接。

需要说明的是，TCP(Transmission Control Protocol)传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC 793定义。在简化的计算机网络OSI模型中，它完成第四层传输层所指定的功能，用户数据报协议(UDP)是同一层内另一个重要的传输协议。在因特网协议族(Internet protocol suite)中，TCP层是位于IP层之上，应用层之下的中间层。不同主机的应用层之间经常需要可靠的、像管道一样的连接，但是IP层不提供这样的流机制，而是提供不可靠的包交换。UDP是User Datagram Protocol的简称，中文名是用户数据报协议，是OSI(Open System Interconnection，开放式***互联)参考模型中一种无连接的传输层协议，提供面向事务的简单不可靠信息传送服务，IETFRFC 768是UDP的正式规范。所述监控***是一种用于实时监测服务器及其数据库的硬件条件、环境状况以及运行状况的计算机设备。

S201：接收客户端发送的商户信息，其中，所述商户信息至少包括用于表达商户信息所对应商户身份的身份信息，以及用于展示用户信息所对应商户营业现场的现场图像。

S202：根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；其中，所述文本信息描述了所述商户信息所对应商户的属性数据，所述文本行业特征以特征编码的形式表征了文本信息中具有行业特征的特征词汇。

为准确的获得商户的真实身份，本步骤通过身份信息访问数据库，从所述数据库中获取与所述身份信息匹配的文本信息，其中，所述文本信息描述了所述商户信息所对应商户的属性数据，例如：营业执照影印件，营业执照电子文本等。由于数据库中保存有与商户对应的经过国家或认证机构(如：工商局)认证的文本信息(如：营业执照影印件或电子件，或组织机构代码证等)，因此保证了获得商户身份信息(即：文本信息)的准确度。

为能够从文本信息的角度获知商户信息的行业类别，本步骤通过从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征，以在文本角度上完成对商户信息的行业特征进行提取和识别。所述行业特征是指一个行业区别于其他行业的特别显著的征象、标志，于本实施例中，所述行业特征可为描述商户信息行业类别、经营范围的词汇。

在一个优选的实施例中，请参阅图3，根据所述身份信息获取文本信息的步骤，包括：

S212：判断是否能够从数据库中获得与所述身份信息对应的文本信息；

S222：若能够获得所述对应的文本信息，则判断所述身份信息与文本信息是否一致；

S232：若无法获得所述对应的文本信息，则判定所述商户信息为非法信息并结束。

S242：若所述身份信息与文本信息一致，则判定商户信息为合法信息，并允许从文本信息中识别文本行业特征；

S252：若所述身份信息与文本信息不一致，则判定所述商户信息为非法信息并结束。

示例性地，若商户信息中的内容在数据库中不存在，则说明商户信息可能是商户编造的，若通过商户信息中的内容与从数据库中获得的文本信息不一致，如，商户信息的内容为机械制造，获得的文本信息为食品销售，则判定身份信息与文本信息不一致。

在一个优选的实施例中，请参阅图4，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征的步骤，包括：

S262：从所述文本信息中获取文本数据，或通过OCR***识别所述文本信息中的内容以获取文本数据；

本步骤中，若所述文本信息为营业执照电子文本，所述电子文本包括有用于描述所述商户信息所对应商户的属性数据，通过预设的正则表达式或提取字段从所述属性数据中获取文本数据；若所述文本信息为营业执照影印件，所述影印件包括有用于描述所述商户信息所对应商户的属性数据，通过OCR***识别所述文本信息中的属性数据获得以电子文本形式展示的所述属性数据，通过预设的正则表达式或提取字段从所述属性数据中获取文本数据。其中，营业执照电子文本可通过调用API获得，营业执照影印件可通过从预设的数据库中获得。

于本实施例中，所述正则表达式或提取字段可根据使用者的需要设置，于本实施例中，所述正则表达式或提取字段是用于从文本信息中获取能够反应文本信息行业类别的元数据，例如，能够反应行业类别的元数据所对应的正则表达式或提取字段为“经营范围”，从属性数据中获取与“经营范围”对应的信息，如：“食品销售：预包装食品(不含冷藏冷冻食品)、散装食品”这样的经营范围。

需要说明的是，所述OCR(Optical Character Recognition，光学字符识别)***是一种通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字过程的设备；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

S272：对所述文本数据进行分词处理和词性标注处理，以获得至少一个具有词性标注的词汇的分词集。

本步骤中，通过自然语言处理***对所述文本数据进行分词处理获得至少一个词汇，对所述词汇进行词性标注处理获得具有词性标注的词汇；示例性地，对“食品销售：主要包括预包装食品(不含冷藏冷冻食品)，以及粮食、干果、水产品、肉类、酒类、调味品等散装食品”进行分词，获得“食品/销售/主要/包括/预包装/食品/不含/冷藏/冷冻/食品/以及/粮食/干果/水产品/肉类/酒类/调味品/等/散装/食品”，并对上述分词进行词性标注,如“食品，名词；销售，动词”等。

需要说明的是，本申请采用中文分词器作为所述自然语言处理***，是一种将连续的字序列按照一定的规范重新组合成词序列，并得到最好的分词结果的计算机程序，所述中文分词器可为Jieba，或SnowNLP，或PkuSeg，或THULAC，或HanLP。

S282：对所述分词集中的词汇进行句法分析以获得各所述分词之间的语义关系，记录各所述词汇的语义特征获得具有语义特征及词性标注的词汇的特征词汇，其中，语义特征表达了该词汇在文本信息中的词性。

所述词性是一种按照词在结构中能起的作用，即词的句法功能分的类；所述词性分为两个大类，14小类。大类即实词和虚词，名词、动词、形容词、数词、量词、代词、区别词共7小类是实词，副词、介词、连词、助词、叹词、语气词、拟声词等7小类是虚词。本步骤中，对所述分词集中各具有词性标注的词汇进行句法分析获得各词汇之间的语义关系，对具有语义关系的分词进行语义特征的标注形成特征词汇。由于经营范围往往比较复杂，存在多层次依赖及部分否定等情况，因此通过对分词集中各词汇的句法依存关系进行梳理，有助于更加准确的表述文本数据的真实含义。示例性地，对具有词性标注的词汇的语义关系进行分析，获得每个词汇在文本信息中的语义特征，如“食品，名词，主语；销售，动词，谓语；所述食品与销售之间具有依存关系”等；按照上述方法获得文本信息中所有词汇的语义特征，并分别形成特征词汇。

需要说明的是，句法分析是一种用于判断输入的单词序列(一般为句子)的构成是否合乎给定的语法，并通过构造句法树来确定句子的结构以及各层次句法成分之间的关系，即确定一个句子中的哪些词构成一个短语，哪些词是动词的主语或宾语等问题的计算机分析方法。于本实施例中，采用Stanford parser作为句法分析的功能模块，该模块是由斯坦福大学自然语言处理小组开发的开源句法分析器，是基于概率统计句法分析的一个JAVA实现。

S292：构建所述特征词汇的特征编码，并将其录入预设的TextCNN模型进行合并编码，以抽象出能代表商户所属行业的关键信息。

具体的，构建所述特征词汇的特征编码包括：

采用word2vec的CBOW连续词袋法对特征词汇中词汇进行编码获得词向量；通过one-hot encoding或label-encoding分别对特征词汇中的词性标注和语义特征进行编码，获得词性向量和语义向量；拼接所述词向量、词性向量和语义向量获得特征编码。

进一步地，将所述特征编码录入TextCNN模型；TextCNN模型通过卷积变形以抽象出具有行业类别的编码，将所述编码设为关键信息。其中，所述关键信息是能够描述商户信息所属行业类别的编码。

需要说明的是，Word2vec基于分布假设(经常具有相同相邻字词的字词往往在语义上相似)，将语义上相似的字词映射到在几何图形上邻近的嵌套矢量。Word2Vec通过训练神经网络来区分实际共同出现的多组字词与随机出现在一起的字词，从而充分利用此类上下文信息。输入层采用一种稀疏表示法用于组合一个目标字词与一个或多个上下文字词。这一输入层会连接到一个较小的隐藏层。CBOW会在给定上下文词的情况下计算目标词(或中心词)的条件概率，其中上下文词的选取范围通过窗口大小k决定Word2vec是一群用来产生词向量的相关模型，这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。

one-hot encoding，又称一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。label-encoding是一种采用标签对词汇进行编码，给特征变量自定义数字标签，量化特征的计算机程序。TextCNN模型是一种应用于文本分类任务的卷积神经网络，其利用多个不同size的kernel来提取句子中的关键信息(类似于多窗口大小的ngram)，从而能够更好地捕捉局部相关性。

TextCNN模型通过对特征编码进行运算，以识别所有特征编码中用于描述商户信息行业类别的编码，并将其视为关键信息；将所述关键信息所对应的特征编码提取出来获得文本行业特征。例如：通过TextCNN模型从输入的特征编码中，识别出“预包装食品”和“散装食品”所对应的特征编码能够反映行业特征的关键信息，故将“预包装食品”和“散装食品”所对应的向量作为文本行业特征。

S203：从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征，所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品。

为能够从现场图像的角度获知商户信息的行业类别，本步骤通过从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征，以在图像角度上完成对商户信息的行业特征进行提取和识别。所述行业特征是指一个行业区别于其他行业的特别显著的征象、标志，于本实施例中，所述行业特征可为描述商户信息行业类别、经营范围的词汇。

在一个优选的实施例中，请参阅图5，从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征的步骤，包括：

S213：通过预设的成熟CNN模型获得现场图像的像素，所述CNN模型的卷积核识别所述现场图像中出现的物品并生成卷积向量；所述卷积向量以特征向量的形式表征了所述现场图像中出现的物品。

本步骤中，成熟CNN模型用于从现场图像中识别特定物品，并生成包含现场图像中特定物体边缘信息的卷积向量。

例如：所述现场图像为“餐厅内景图”，通过成熟CNN模型从“餐厅内景图”中“识别”出如：“桌子”、“吧台”、“调料盒”、“照明灯”、“售卖柜”，的边缘信息所对应的特征向量。

S223：所述CNN模型的全连接层对所述卷积向量进行运算，以识别出具有行业特征的物品并生成图像行业特征；所述图像行业特征以特征向量的形式表征了所述具有行业特征的物品。

本步骤中，所述成熟CNN模型至少包括全连接层和至少一个卷积核，其中，所述卷积核用于通过图像中的像素提取所述图像内的内容并生成卷积向量，所述全连接层用于根据卷积核所输出的卷积向量，识别出图像中具有某种特征的物体。

例如：将“桌子”、“吧台”、“调料盒”、“照明灯”、“售卖柜”中具有行业特征的物品，如：“吧台”、“调料盒”、“售卖柜”所对应的向量作为图像行业特征。

需要说明的是，CNN模型是卷积神经网络模型，其为一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)，是深度学习(deep learning)的代表算法之一，用于识别图像中的内容，所述成熟CNN模型可通过预设的具有行业类别标签的内景训练图像训练获得，因CNN模型的训练过程属于现有技术，而本申请所要解决的技术问题是如何结合文本和图像两个维度对商户信息的行业类别进行识别，因此，CNN模型的训练过程在本申请中不做赘述。

S204：将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果，所述图文分析结果以特征向量的形式表征了所述商户信息所属行业类别的概率。

为结合从文本信息角度和现场图像角度综合分析商户信息的行业类别，本步骤利用成熟深度网络模型，对文本行业特征和图像行业特征进行分析，以实现结合文本信息中具有行业特征的特征词汇，以及现场图像中具有行业特征的物品对商户信息的行业类别进行分析，进而提高了商户所属行业类别分析的准确度。

例如，结合“预包装食品”和“散装食品”所对应的向量作为文本行业特征，“吧台”、“调料盒”、“售卖柜”所对应的向量作为图像行业特征，录入成熟DNN模型，使该模型根据所述向量对商户信息的行业类别进行分析，获得图文分析结果，如，{饭店，0.8；营业厅，0.1；服装店，0.1}。

具体地，所述成熟深度网络模型通过以下步骤获得：

S214：获取初始DNN神经网络和训练样本，所述训练样本至少包括训练文本行业特征、训练图像行业特征以及训练标签，所述训练标签表征了训练样本所属的行业类别。

其中，DNN神经网络为深度神经网络，其采用无监督学习对网络进行预训练得到的数据的一种表示，然后用有监督学习对网络进行训练(如BP算法)，得到P(Y|X)，其中Y为输出(比如类别标签)。该假设认为P(X)的学习有助于P(Y|X)的学习。

这种学习思路相对于单纯的有监督学习而言有助于降低过拟合的风险，因为它不仅学习了条件概率分布P(Y|X)，还学习了X和Y的联合概率分布。

S224：将所述训练文本行业特征和训练图像文本行业特征录入所述初始DNN神经网络获得输出结果。

其中，将所述训练文本行业特征和训练图像文本行业特征录入所述初始DNN神经网络的输入层，所述初始DNN神经网络的的隐藏层对训练文本行业特征和训练图像文本行业特征进行运算，并将运算结果发送初始DNN神经网络的输出层，所述输出层计算所述运算结果生成输出结果。

S234：计算所述输出结果与所述训练标签之间的差距获得损失值，通过损失函数和反向传播算法对所述初始DNN神经网络进行迭代运算，以调整所述初始DNN神经网络中隐藏层的权值和偏执值获得成熟DNN模型。

其中，本申请采用ReLU或maxout作为损失函数，本申请可采用BP算法(误差反向传播算法)作为所述反向传播算法，用于通过激励传播和权重更新两个环节反复循环迭代，直到网络的对输入的响应达到预定的目标范围为止。

S205：判断所述图文分析结果与所述商品信息的申请行业是否一致；若是，则向客户端发送校验通过信息；若否，则向客户端发送校验失败信息。

为保证客户端能够及时获知其上传或注册的商户信息的校验结果，本步骤通过将图文分析结果与商户信息上传或注册时所填写的申请行业进行对比，向客户端告知校验结果。

优选的，向客户端发送校验通过信息之后，还包括：

将所述图文分析结果上传至区块链中。

需要说明的是，基于图文分析结果得到对应的摘要信息，具体来说，摘要信息由图文分析结果进行散列处理得到，比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息，以便查证图文分析结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

实施例三：

请参阅图6，本实施例的一种行业类别识别装置1，包括：

输入模块11，用于接收客户端发送的商户信息，其中，所述商户信息至少包括用于表达商户信息所对应商户身份的身份信息，以及用于展示用户信息所对应商户营业现场的现场图像；

文本识别模块12，用于根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；其中，所述文本信息描述了所述商户信息所对应商户的属性数据，所述文本行业特征以特征编码的形式表征了文本信息中具有行业特征的特征词汇；

图像识别模块13，用于从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品；

图文分析模块14，用于将所述文本行业特征和图像行业特征录入预设的成熟DNN模型，以获得图文分析结果；所述图文分析结果以特征向量的形式表征了所述商户信息所属行业类别的概率。

可选的，所述行业类别识别装置1，还可包括：

连接模块10，用于与保存有商户的认证信息的数据库建立通信连接，其中，通过TCP通信协议或UDP通信协议与数据库建立通信连接。

可选的，所述行业类别识别装置1，还可包括：

判断模块15，用于判断所述图文分析结果与所述商品信息的申请行业是否一致；若是，则向客户端发送校验通过信息；若否，则向客户端发送校验失败信息。

本技术方案基于人工智能的智能决策技术，根据所述身份信息获取文本信息，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征；从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征；所述图像行业特征以特征向量的形式表征了现场图像中具有行业特征的物品；采用神经网络中的DNN模型作为分类模型，并将所述文本行业特征和图像行业特征录入神经网络以获得图文分析结果。

实施例四：

为实现上述目的，本发明还提供一种计算机设备，实施例三的行业类别识别装置1的组成部分可分散于不同的计算机设备2中，计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于：可通过***总线相互通信连接的存储器21、处理器22，如图6所示。需要指出的是，图6仅示出了具有组件-的计算机设备，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备的操作***和各类应用软件，例如实施例三的行业类别识别装置的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行行业类别识别装置，以实现实施例一和实施例二的行业类别识别方法。

实施例五：

为实现上述目的，本发明还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器22执行时实现相应功能。本实施例的计算机可读存储介质用于存储行业类别识别装置，被处理器22执行时实现实施例一和实施例二的行业类别识别方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种行业类别识别方法，其特征在于，包括：

2.根据权利要求1所述的行业类别识别方法，其特征在于，接收客户端发送的商户信息之前，包括：

3.根据权利要求2所述的行业类别识别方法，其特征在于，根据所述身份信息获取文本信息的步骤，包括：

4.根据权利要求1所述的行业类别识别方法，其特征在于，从文本信息中识别出能够反映所述商户信息所属行业类别的文本行业特征的步骤，包括：

5.根据权利要求4所述的行业类别识别方法，其特征在于，构建所述特征词汇的特征编码的步骤，包括：

采用word2vec 的 CBOW 连续词袋法对特征词汇中词汇进行编码获得词向量；

拼接所述词向量、词性向量和语义向量获得特征编码。

6.根据权利要求1所述的行业类别识别方法，其特征在于，从现场图像中识别出能够反映所述商户信息所属行业类别的图像行业特征的步骤，包括：

7.根据权利要求1所述的行业类别识别方法，其特征在于，获得图文分析结果之后，还包括：

判断所述图文分析结果与所述商户信息的申请行业是否一致；若是，则向客户端发送校验通过信息；若否，则向客户端发送校验失败信息；

向客户端发送校验通过信息之后，还包括：

将所述图文分析结果上传至区块链中。

8.一种行业类别识别装置，其特征在于，包括：

9.一种计算机设备，其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述计算机设备的处理器执行所述计算机程序时实现权利要求1至7任一项所述行业类别识别方法的步骤。

10.一种计算机可读存储介质，所述可读存储介质上存储有计算机程序，其特征在于，所述可读存储介质存储的所述计算机程序被处理器执行时实现权利要求1至7任一项所述行业类别识别方法的步骤。