CN111475158A - 子领域划分方法、装置、电子设备和计算机可读存储介质 - Google Patents
子领域划分方法、装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN111475158A CN111475158A CN202010183764.4A CN202010183764A CN111475158A CN 111475158 A CN111475158 A CN 111475158A CN 202010183764 A CN202010183764 A CN 202010183764A CN 111475158 A CN111475158 A CN 111475158A
- Authority
- CN
- China
- Prior art keywords
- attribute
- divided
- entities
- clustering
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims description 54
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 210000002569 neuron Anatomy 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 13
- 230000001419 dependent effect Effects 0.000 description 12
- 230000002349 favourable effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000004931 aggregating effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 108020001568 subdomains Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/35—Creation or generation of source code model driven
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/547—Remote procedure calls [RPC]; Web services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及计算机技术领域,公开了一种子领域划分方法、装置、电子设备和计算机可读存储介质。本发明中,上述子领域划分方法包括:获取待划分的业务实体的属性的属性值;根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;根据所述聚类结果,对所述待划分的业务实体进行子领域划分,使得可以提高子领域划分的合理性且降低子领域划分的成本。
Description
技术领域
本发明实施例涉及计算机技术领域,特别涉及一种子领域划分方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,以微服务方式开展的项目,其业务架构主要围绕领域模型驱动设计(DomainDriven Design,简称:DDD)展开,项目相关的领域专家和开发人员基于统一的领域描述语言深度沟通,深度沟通的过程中需要领域专家与开发人员结合经验,以人工的方式找出聚合的边界从而完成子领域的划分。
然而,发明人发现相关技术中至少存在如下问题:目前,针对复杂***的子领域划分是一件困难的事情,需要领域专家和开发人员紧密配合,以人工的方式并结合参与人员的经验找出聚合的边界完成子领域的划分,需要的成本较大且难以保证划分的合理性。
发明内容
本发明实施方式的目的在于提供一种子领域划分方法、装置、电子设备和计算机可读存储介质,使得可以提高子领域划分的合理性且降低子领域划分的成本。
为解决上述技术问题,本发明的实施方式提供了一种子领域划分方法,包括以下步骤:获取待划分的业务实体的属性的属性值;根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;根据所述聚类结果,对所述待划分的业务实体进行子领域划分。
本发明的实施方式还提供了一种子领域划分装置,包括:获取模块,用于获取待划分的业务实体的属性的属性值;聚类模块,用于根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;划分模块,用于根据所述聚类结果,对所述待划分的业务实体进行子领域划分。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的子领域划分方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的子领域划分方法。
本发明实施方式相对于现有技术而言,获取待划分的业务实体的属性的属性值,根据自组织神经网络SOM和待划分的业务实体的属性的属性值,对待划分的业务实体进行聚类,得到聚类结果;根据聚类结果,对待划分的业务实体进行子领域划分。自组织神经网络SOM具有无监督聚类的特性,因此,根据自组织神经网络SOM和待划分的业务实体的属性的属性值,有利于实现自动聚合相似的业务实体并划分聚合边界,得到的聚类结果中相同聚类内的业务实体有较好的相似性,不同聚类内的业务实体能够被更合理的区分。从而有利于根据聚类结果,对待划分的业务实体合理的进行子领域划分,为开发人员提供合理可行的参考方案,避免了过多的人工介入,有利于降低子领域划分的成本。
另外,所述业务实体的属性包括:自身属性和关联属性;其中,所述自身属性用于表征业务实体的固有特征,所述关联属性用于表征业务实体间的依赖关系。结合业务实体的自身属性的属性值和关联属性的属性值,有利于考虑到业务实体的固有特征和各业务实体之间的依赖关系,从而可以更加合理、准确的对待划分的业务实体进行聚类,得到聚类结果。
另外,所述根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果,包括:对待划分的业务实体的属性的属性值进行预处理;其中,对所述自身属性的属性值的预处理为归一化处理,对所述关联属性的属性值的预处理为01向量化处理;根据自组织神经网络SOM和进行预处理后的所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果。其中,对自身属性的属性值的归一化处理和对关联属性的属性值的01向量化处理,方便了对不同业务实体之间的相似度的计算,从而进一步方便进行聚类,且在一定程度上还有利于提高聚类的速度和精度。
另外,在所述将所述待划分的业务实体的属性的属性值作为输入样本输入所述自组织神经网络,对所述自组织神经网络以预设的训练参数进行训练,得到SOM训练模型之后,还包括:存储所述SOM训练模型;若确定引入新的业务实体,则获取所述新的业务实体的属性的属性值,并根据存储的所述SOM训练模型和所述新的业务实体的属性的属性值,确定所述新的业务实体所属的聚类簇;根据所述新的业务实体所属的聚类簇,对所述新的业务实体进行子领域划分。可以理解的是,随着项目的迭代,可能会引入新的业务实体,若确定引入新的业务实体,可以自动根据保存的SOM训练模型找出新的业务实体所属的聚类簇,从而进一步方便了快速对新加入的业务实体进行子领域划分,有利于帮助项目相关人员得到更全面的子领域划分参考信息。
另外,所述获取待划分的业务实体的属性的属性值,包括:获取待开发的项目的项目需求文本;基于自然语言处理算法对所述项目需求文本进行分析,获取待划分的业务实体的属性的属性值。提供了一种业务实体的属性的属性值的获取方式,基于自然语言处理算法对获取的项目需求文本进行分析,方便了快速获取待划分的业务实体的属性的属性值。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施方式的子领域划分方法的流程图;
图2是根据本发明第二实施方式的子领域划分方法的流程图;
图3是根据本发明第三实施方式的子领域划分装置的示意图;
图4是根据本发明第四实施方式的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种子领域划分方法。本实施方式在领域模型驱动设计DDD中,利用自组织神经网络(Self-Organizing feature Map,简称:SOM)的无监督聚类特性,以DDD实施过程中抽象出的业务实体为基础,自动聚合相似的业务实体,将各个业务实体划分进对应的聚类,同一个聚类内的业务实体有较好的相似性,从而有利于为项目团队提供合理且可行的子领域划分参考方案,以更好的完成子领域划分。下面对本实施方式的子领域划分方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的子领域划分方法的流程图如图1所示,具体包括:
步骤101:获取待划分的业务实体的属性的属性值。
其中,业务实体是指客观上或者逻辑上能够相互区分的事物,在具体实现中,待划分的业务实体可以根据待开发的项目确定,比如在项目开始前进行业务功能分析,根据业务功能得到项目中待划分的业务实体;其中,业务功能可以由若干个业务实体代表。在一个例子中,待开发的项目为用户订餐项目,则待划分的业务实体可以包括:订单具体项,顾客,餐厅等。在一个例子中,待开发的项目为图书馆借阅项目,则待划分的业务实体可以包括:借阅单、借阅单单项、图书、用户、押金等。
属性,可以理解为业务实体所具有的特性,一个业务实体可由若干个属性来刻画。其中,业务实体的属性可以包括:自身属性和关联属性;其中,自身属性用于表征业务实体的固有特征,关联属性用于表征业务实体间的依赖关系。以图书馆借阅项目为例,待划分的业务实体的自身属性可以包括:服务级别,关联属性可以包括:依赖的业务实体、所属的业务实体。可以理解的是,每个业务实体可以均具有对应的自身属性的属性值和关联属性的属性值,比如服务级别具体是哪个级别,依赖的业务实体是哪个,所属的业务实体是哪个。具体的,可以参考表1:
表1
业务实体名称 | 项目id | 业务实体id | 服务级别 | 依赖的业务实体 | 所属的业务实体 |
借阅单 | 1 | 1 | 0 | [2,4,5,7] | [1] |
借阅单单项 | 1 | 2 | 0 | [4,5,7] | [1] |
图书馆 | 1 | 3 | 2 | [0] | [3] |
图书 | 1 | 4 | 0 | [6] | [4] |
用户 | 1 | 5 | 0 | [6,7] | [5] |
检索 | 1 | 6 | 1 | [0] | [6] |
押金 | 1 | 7 | 0 | [0] | [5] |
其中,可以理解为图书馆借阅项目的项目id为1,因此表1中各业务实体对应的项目id均为1。其中,业务实体id、服务级别、依赖的业务实体、所属的业务实体可以作为筛选出的关键的属性,在具体实现中,可以根据实际需要筛选出关键的属性,本实施方式中筛选出的属性只是以表格中的为例,在具体实现中,并不以此为限。表1中,列出的多个属性可以理解为不同维度的属性,具体的服务级别这一属性包含0-2三个枚举数值;0代表该业务实体对应的服务最重要,务必要保证在线;1代表该业务实体对应的服务为次要的服务,允许短时间的掉线,但也要尽快恢复;2代表该业务实体对应的服务为非核心的服务,在***负载过高的时候可以做降级处理。依赖的业务实体这一属性代表当前业务实体会调用或者关联的其他业务实体,比如用户实体会调用检索和押金实体,没有依赖的业务实体可以填[0]。所属的业务实体这一属性代表当前业务实体从属的父类实体,如果没有父类实体,就从属于自己。
在一个例子中,也可以获取待开发的项目的项目需求文本,再基于自然语言处理算法对项目需求文本进行分析,获取待划分的业务实体的属性的属性值。在具体实现中,也可以由领域专家和开发人员从项目需求中人工抽取出业务实体的属性的属性值。然而,本实施方式对此不作具体限定。
步骤102:根据自组织神经网络SOM和待划分的业务实体的属性的属性值,对待划分的业务实体进行聚类,得到聚类结果。
具体的说,可以利用自组织神经网络(Self-Organizing feature Map,简称:SOM)的无监督聚类特性,以待划分的业务实体的属性的属性值为基础自动聚合相似的业务实体,将各个业务进行无监督聚类,得到聚类结果。这里的无监督是指事先并不知道聚类个数,而是将待划分的业务实体的属性的属性值作为输入样本在自组织神经网络的训练过程中自行聚类。
在一个例子中,可以先对待划分的业务实体的属性的属性值进行预处理;其中,对自身属性的属性值的预处理为归一化处理,对关联属性的属性值的预处理为01向量化处理。然后再根据自组织神经网络SOM和进行预处理后的待划分的业务实体的属性的属性值,对待划分的业务实体进行聚类,得到聚类结果。在具体实现中,也可以同时将预处理后的业务实体的属性的属性值再次存储到数据库中,以方便下次训练直接读取。下面以表1为例,对如何进行预处理进行举例说明:
对于服务级别这一属性的属性值,可以按照如下公式进行归一化处理:
其中,x'表示归一化处理后的属性值,x表示归一化处理前的属性值,min(x)和max(x)分别表示针对服务级别这一属性预设的的属性值的最小值和最大值,在本实施方式中该最小值和最大值分别为0和2。
对于依赖的业务实体这一属性和所属的业务实体这一属性的属性值进行01向量化处理,可以理解为:将所有业务实体看做一个向量,以表1为例,由于表1中有7个业务实体,则01向量化处理后依赖的业务实体这一属性的属性值可以用7位01向量表示,7位向量中的每一位分别代表一个业务实体。表1中借阅单这一业务实体,依赖的业务实体id为[2,4,5,7],则01向量化处理后的属性值可以表示为[0,1,0,1,1,0,1],即7位向量中第2、4、5、7位分别用编码1表示,表明借阅单依赖的业务实体为:业务实体id分别为2、4、5、7的4个业务实体。对所属的业务实体这一属性的属性值进行01向量化处理的方式与对依赖的业务实体的属性的属性值进行01向量化处理的方式类似,本实施方式对此不再赘述。
对服务级别这一属性的属性值进行归一化处理且对所属的业务实体与依赖的业务实体这两个属性的属性值进行01向量化后的属性值可以参考如下表2:
表2
业务实体名称 | 项目id | 业务实体id | 服务级别 | 依赖的业务实体 | 所属的业务实体 |
借阅单 | 1 | 1 | 0 | [0,1,0,1,1,0,1] | [1,0,0,0,0,0,0] |
借阅单单项 | 1 | 2 | 0 | [0,0,0,1,1,0,1] | [1,0,0,0,0,0,0] |
图书馆 | 1 | 3 | 1 | [0,0,0,0,0,0,0] | [0,0,1,0,0,0,0] |
图书 | 1 | 4 | 0 | [0,0,0,0,0,1,0] | [0,0,0,1,0,0,0] |
用户 | 1 | 5 | 0 | [0,0,0,0,0,1,1] | [0,0,0,0,1,0,0] |
检索 | 1 | 6 | 0.5 | [0,0,0,0,0,0,0] | [0,0,0,0,0,1,0] |
押金 | 1 | 7 | 0 | [0,0,0,0,0,0,0] | [0,0,0,0,1,0,0] |
在一个例子中,根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果的实现方式可以为:先将待划分的业务实体的属性的属性值作为输入样本输入自组织神经网络,以预设的训练参数对自组织神经网络进行训练,得到SOM训练模型,将SOM训练模型输出的若干个聚类簇,作为对待划分的业务实体进行聚类得到的聚类结果;其中,预设的训练参数包括:神经元拓扑排列结构、神经元个数、训练次数、学***面上,即自组织神经网络可以通过竞争、合作、自组织、收敛等过程,最后达到稳定状态,所有的业务实体按照各自的属性的属性值自动聚合到相应的输出神经元上,形成若干个聚类簇,并且使各个聚类间的差距较大,而各聚类中的聚合性较高。
在一个例子中SOM训练模型的训练流程可以如下:
首先,确定训练参数,包括:神经元拓扑排列结构可以选择矩形结构Gridtop。神经元个数为L;其中每个横排L1个,每个纵排L2个(L=L1*L2)。最大训练次数n(n>=10000)。学***均值,叠加的随机数可以较小。
接着,根据确定的训练参数进行自组织训练。具体的,每次随机选择一个输入样本进行SOM网络训练;整个过程按照两个阶段进行,即前n1次的自组织阶段(排序阶段)和后n2次的收敛阶段(微调阶段)(n1<n2,且n1+n2=n)。其中,一个输入样本可以为一个业务实体的所有属性的属性值,比如,表2中每一行都可以作为一个输入样本。
然后,得到SOM训练模型。具体的,经过n次网络训练,得到SOM训练模型,SOM训练模型将输入的业务实体的属性的属性值有序的映射到二维输出平面上。训练结果按照矩形结构L1*L2排列的L个神经元最后形成K个有效的聚类簇。
最后,评估SOM训练模型的训练效果,可以通过检验聚类的类间差距性和类中聚合性确定训练效果,比如类间差距性越大、类中聚合性越小,则可认为训练效果越好。在具体实现中,可以通过修改网络以及训练参数,进行多次训练,选择具有较好训练效果的SOM训练模型,并将具有较好训练效果的SOM训练模型输出的若干个聚类簇,作为对待划分的业务实体进行聚类得到的聚类结果。
步骤103:根据聚类结果,对待划分的业务实体进行子领域划分。
具体的说,在同一个聚类下的业务实体更有可能代表一个子领域。在具体实现中,可以根据业务实体对应的聚类结果,生成二维表格,点击表格中的某个聚类单元格,可以查看该聚类下的业务实体列表,同时点击每个列表元素可以查看该业务实体对应的业务实体详细信息。通过查看二维表格可以直观的看到各个聚类簇的基础信息以及每个业务实体间的关联性,为项目团队提供在复杂业务背景下子领域划分的一种可行的参考方案,从而合理的对待划分的业务实体进行子领域划分。
需要说明的是,本实施方式中的上述各示例均为为方便理解进行的举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式,获取待划分的业务实体的属性的属性值,根据自组织神经网络SOM和待划分的业务实体的属性的属性值,对待划分的业务实体进行聚类,得到聚类结果;根据聚类结果,对待划分的业务实体进行子领域划分。自组织神经网络SOM具有无监督聚类的特性,因此,根据自组织神经网络SOM和待划分的业务实体的属性的属性值,有利于实现自动聚合相似的业务实体并划分聚合边界,得到的聚类结果中相同聚类内的业务实体有较好的相似性,不同聚类内的业务实体能够被更合理的区分。从而有利于根据聚类结果,对待划分的业务实体合理的进行子领域划分,为开发人员提供合理可行的参考方案,避免了过多的人工介入,有利于降低子领域划分的成本。
本发明的第二实施方式涉及一种子领域划分方法。下面对本实施方式的子领域划分方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的子领域划分方法的流程图如图2所示,具体包括:
步骤201:获取待划分的业务实体的属性的属性值。
步骤202:将待划分的业务实体的属性的属性值作为输入样本输入自组织神经网络,以预设的训练参数对自组织神经网络进行训练,得到SOM训练模型。
步骤203:将SOM训练模型输出的若干个聚类簇,作为对待划分的业务实体进行聚类得到的聚类结果。
步骤204:根据聚类结果,对待划分的业务实体进行子领域划分。
其中,步骤201至步骤204均在第一实施方式中已经进行过描述,可以参考第一实施方式中的相关描述,为避免重复本实施方式在此不再赘述。
步骤205:存储SOM训练模型。
具体的说,可以将SOM训练模型存在模型库中,该模型库可以为数据库或者NoSQL;其中,NoSQL,泛指非关系型的数据库。
步骤206:若确定引入新的业务实体,则获取新的业务实体的属性的属性值,并根据存储的SOM训练模型和新的业务实体的属性的属性值,确定新的业务实体所属的聚类簇。
具体的说,随着项目的迭代,可能会引入新的业务实体,此时可以获取新的业务实体的属性的属性值,然后根据保存的SOM训练模型找出和新的业务实体相似的聚类簇即新的业务实体所属的聚类簇。比如,可以将新的业务实体的属性的属性值输入保存的SOM训练模型,从而输出新的业务实体所属的聚类簇。
另外,新的业务实体的属性的属性也可以参与新一轮的模型训练,随着数据量的增加,训练出的模型的泛化能力也会不断提高。
步骤207:根据新的业务实体所属的聚类簇,对新的业务实体进行子领域划分。
比如,新的业务实体所属的聚类簇可以对应有子领域,从而可以将新的业务实体划分进新的业务实体所属的聚类簇所对应有子领域。
需要说明的是,本实施方式中的上述各示例均为为方便理解进行的举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式考虑到随着项目的迭代,可能会引入新的业务实体,若确定引入新的业务实体,可以自动根据保存的SOM训练模型找出新的业务实体所属的聚类簇,从而进一步方便了快速对新加入的业务实体进行子领域划分,有利于帮助项目相关人员得到更全面的子领域划分参考信息。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种子领域划分装置,如图3所示,包括:获取模块301,用于获取待划分的业务实体的属性的属性值;聚类模块302,用于根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;划分模块303,用于根据所述聚类结果,对所述待划分的业务实体进行子领域划分。
不难发现,本实施方式为与第一或第二实施方式相对应的装置实施例,本实施方式可与第一或第二实施方式互相配合实施。第一或第二实施方式中提到的相关技术细节和技术效果在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一或第二实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第四实施方式涉及一种电子设备,如图4所示,包括至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行第一、或第二实施方式中的子领域划分方法。
其中,存储器402和处理器401采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器401和存储器402的各种电路连接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器401处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器401。
处理器401负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器402可以被用于存储处理器401在执行操作时所使用的数据。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种子领域划分方法,其特征在于,包括:
获取待划分的业务实体的属性的属性值;
根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;
根据所述聚类结果,对所述待划分的业务实体进行子领域划分。
2.根据权利要求1所述的子领域划分方法,其特征在于,所述业务实体的属性包括:自身属性和关联属性;其中,所述自身属性用于表征业务实体的固有特征,所述关联属性用于表征业务实体间的依赖关系。
3.根据权利要求2所述的子领域划分方法,其特征在于,所述根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果,包括:
对待划分的业务实体的属性的属性值进行预处理;其中,对所述自身属性的属性值的预处理为归一化处理,对所述关联属性的属性值的预处理为01向量化处理;
根据自组织神经网络SOM和进行预处理后的所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果。
4.根据权利要求1所述的子领域划分方法,其特征在于,所述根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果,包括:
将所述待划分的业务实体的属性的属性值作为输入样本输入所述自组织神经网络,以预设的训练参数对所述自组织神经网络进行训练,得到SOM训练模型;其中,所述预设的训练参数包括:神经元拓扑排列结构、神经元个数、训练次数、学习速率初始值、权值初始值;
将所述SOM训练模型输出的若干个聚类簇,作为对所述待划分的业务实体进行聚类得到的聚类结果。
5.根据权利要求4所述的子领域划分方法,其特征在于,所述业务实体的属性包括不同维度的属性,
所述权值初始值为所述输入样本的中心向量迭加上随机数,所述中心向量为所述输入样本的每个维度上的属性的属性值的平均值。
6.根据权利要求4所述的子领域划分方法,其特征在于,在所述将所述待划分的业务实体的属性的属性值作为输入样本输入所述自组织神经网络,以预设的训练参数对所述自组织神经网络进行训练,得到SOM训练模型之后,还包括:
存储所述SOM训练模型;
若确定引入新的业务实体,则获取所述新的业务实体的属性的属性值,并根据存储的所述SOM训练模型和所述新的业务实体的属性的属性值,确定所述新的业务实体所属的聚类簇;
根据所述新的业务实体所属的聚类簇,对所述新的业务实体进行子领域划分。
7.根据权利要求1所述的子领域划分方法,其特征在于,所述获取待划分的业务实体的属性的属性值,包括:
获取待开发的项目的项目需求文本;
基于自然语言处理算法对所述项目需求文本进行分析,获取待划分的业务实体的属性的属性值。
8.一种子领域划分装置,其特征在于,包括:
获取模块,用于获取待划分的业务实体的属性的属性值;
聚类模块,用于根据自组织神经网络SOM和所述待划分的业务实体的属性的属性值,对所述待划分的业务实体进行聚类,得到聚类结果;
划分模块,用于根据所述聚类结果,对所述待划分的业务实体进行子领域划分。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的子领域划分方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的子领域划分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183764.4A CN111475158A (zh) | 2020-03-16 | 2020-03-16 | 子领域划分方法、装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183764.4A CN111475158A (zh) | 2020-03-16 | 2020-03-16 | 子领域划分方法、装置、电子设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111475158A true CN111475158A (zh) | 2020-07-31 |
Family
ID=71747489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010183764.4A Pending CN111475158A (zh) | 2020-03-16 | 2020-03-16 | 子领域划分方法、装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111475158A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540749A (zh) * | 2020-11-16 | 2021-03-23 | 南方电网数字电网研究院有限公司 | 微服务划分方法、装置、计算机设备和可读存储介质 |
CN113946634A (zh) * | 2021-12-20 | 2022-01-18 | 昆仑智汇数据科技(北京)有限公司 | 一种业务数据的领域模型的处理方法、装置及设备 |
WO2023107670A3 (en) * | 2021-12-10 | 2023-09-14 | Adrenaline Ip | Methods, systems, and apparatuses for collection, receiving and utilizing data and enabling gameplay |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268810A1 (en) * | 2012-04-06 | 2013-10-10 | Fujitsu Limited | Detection of Dead Widgets in Software Applications |
CN103559025A (zh) * | 2013-10-21 | 2014-02-05 | 沈阳建筑大学 | 一种采用聚类方式进行软件重构的方法 |
US20150006225A1 (en) * | 2013-06-28 | 2015-01-01 | Shreevathsa S | Project management application with business rules framework |
CN108416392A (zh) * | 2018-03-16 | 2018-08-17 | 电子科技大学成都研究院 | 基于som神经网络的建筑物聚类方法 |
-
2020
- 2020-03-16 CN CN202010183764.4A patent/CN111475158A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268810A1 (en) * | 2012-04-06 | 2013-10-10 | Fujitsu Limited | Detection of Dead Widgets in Software Applications |
US20150006225A1 (en) * | 2013-06-28 | 2015-01-01 | Shreevathsa S | Project management application with business rules framework |
CN103559025A (zh) * | 2013-10-21 | 2014-02-05 | 沈阳建筑大学 | 一种采用聚类方式进行软件重构的方法 |
CN108416392A (zh) * | 2018-03-16 | 2018-08-17 | 电子科技大学成都研究院 | 基于som神经网络的建筑物聚类方法 |
Non-Patent Citations (3)
Title |
---|
张宇献等: "基于异构值差度量的SOM混合属性数据聚类算法", 《仪器仪表学报》 * |
段文影等: "基于粗糙集和自组织神经网络的聚类方法", 《江西科学》 * |
郑永前等: "一种基于属性约简和SOM的客户细分方法", 《工业工程》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540749A (zh) * | 2020-11-16 | 2021-03-23 | 南方电网数字电网研究院有限公司 | 微服务划分方法、装置、计算机设备和可读存储介质 |
CN112540749B (zh) * | 2020-11-16 | 2023-10-24 | 南方电网数字平台科技(广东)有限公司 | 微服务划分方法、装置、计算机设备和可读存储介质 |
WO2023107670A3 (en) * | 2021-12-10 | 2023-09-14 | Adrenaline Ip | Methods, systems, and apparatuses for collection, receiving and utilizing data and enabling gameplay |
CN113946634A (zh) * | 2021-12-20 | 2022-01-18 | 昆仑智汇数据科技(北京)有限公司 | 一种业务数据的领域模型的处理方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9875294B2 (en) | Method and apparatus for classifying object based on social networking service, and storage medium | |
US9536201B2 (en) | Identifying associations in data and performing data analysis using a normalized highest mutual information score | |
CN111475158A (zh) | 子领域划分方法、装置、电子设备和计算机可读存储介质 | |
CN110636445B (zh) | 基于wifi的室内定位方法、装置、设备及介质 | |
CN104574192A (zh) | 在多个社交网络中识别同一用户的方法及装置 | |
CN102831129B (zh) | 一种基于多示例学习的检索方法及*** | |
CN111489201A (zh) | 一种客户价值分析的方法、设备、存储介质 | |
CN111539612B (zh) | 一种风险分类模型的训练方法和*** | |
Rastogi et al. | GA based clustering of mixed data type of attributes (numeric, categorical, ordinal, binary and ratio-scaled) | |
CN115081515A (zh) | 能效评价模型构建方法、装置、终端及存储介质 | |
CN115130536A (zh) | 特征提取模型的训练方法、数据处理方法、装置及设备 | |
CN110162769B (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
CN114254615A (zh) | 组卷方法、装置、电子设备和存储介质 | |
CN111984842B (zh) | 银行客户数据处理方法及装置 | |
CN113568888A (zh) | 索引推荐方法及装置 | |
CN114268625B (zh) | 特征选择方法、装置、设备及存储介质 | |
CN115982634A (zh) | 应用程序分类方法、装置、电子设备及计算机程序产品 | |
CN114118411A (zh) | 图像识别网络的训练方法、图像识别方法及装置 | |
CN116029187A (zh) | 一种深度学习模型并行策略空间的表示方法 | |
CN115034799A (zh) | 营销预测方法、装置、电子设备及存储介质 | |
Si | [Retracted] Classification Method of Ideological and Political Resources of Broadcasting and Hosting Professional Courses Based on SOM Artificial Neural Network | |
CN112215441A (zh) | 预测模型训练方法及*** | |
CN111400413A (zh) | 一种确定知识库中知识点类目的方法及*** | |
Liu et al. | An enterprise operation management method based on mobile edge computing and data mining | |
CN115147225B (zh) | 一种数据转移信息识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200731 |
|
RJ01 | Rejection of invention patent application after publication |