CN117951547B - 基于人工智能的招投标数据处理方法及装置 - Google Patents
基于人工智能的招投标数据处理方法及装置 Download PDFInfo
- Publication number
- CN117951547B CN117951547B CN202410350613.1A CN202410350613A CN117951547B CN 117951547 B CN117951547 B CN 117951547B CN 202410350613 A CN202410350613 A CN 202410350613A CN 117951547 B CN117951547 B CN 117951547B
- Authority
- CN
- China
- Prior art keywords
- model
- bidding
- feature
- preset
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 55
- 238000003672 processing method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 113
- 230000004927 fusion Effects 0.000 claims abstract description 65
- 238000012797 qualification Methods 0.000 claims abstract description 59
- 238000003066 decision tree Methods 0.000 claims abstract description 56
- 238000003058 natural language processing Methods 0.000 claims abstract description 44
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 40
- 238000003062 neural network model Methods 0.000 claims abstract description 38
- 238000010276 construction Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000007637 random forest analysis Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 13
- 230000002457 bidirectional effect Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims 4
- 230000015654 memory Effects 0.000 description 24
- 238000004590 computer program Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 11
- 230000000306 recurrent effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000001419 dependent effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Bioinformatics & Computational Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种基于人工智能的招投标数据处理方法及装置,方法包括:根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合;本申请能够有效提高招投标文件的匹配准确率和效率。
Description
技术领域
本申请涉及人工智能领域,具体涉及一种基于人工智能的招投标数据处理方法及装置。
背景技术
招投标领域是商业交易中至关重要的一个环节,然而,目前存在的一个显著问题是招标文件和投标文件中的表达常常不够清晰明了,导致了在招投标匹配过程中的不准确性和效率低下。
具体来说,在招标文件中,招标方往往面临难以准确表达需求的挑战。有时由于技术术语使用不当、表述模糊或者描述不足,招标文件可能会引发多种解释,给投标方带来理解上的困扰。同样,在投标文件中,投标方也可能因为对招标文件理解不足而未能充分满足招标方的需求。
此外,由于人工审核招投标文件的匹配,存在主观判断、繁琐的手工操作和易错的问题,导致了整个招投标过程的低效性。
因此,现有技术在招投标文件的撰写和匹配方面存在着一系列问题,包括但不限于信息不清晰、匹配不准确、效率低下等,亟需一种新的技术手段来提高招投标过程的质量和效率。
以上问题,在制作招标文件时,需要考全面考虑各个方面的细节和潜在问题,确保招标文件既能满足项目需求,又能提现公平公证的竞争原则,并兼顾效率与效益。
发明内容
针对现有技术中的问题,本申请提供一种基于人工智能的招投标数据处理方法及装置,能够有效提高招投标文件的匹配准确率和效率。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种基于人工智能的招投标数据处理方法,包括:
根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
进一步地,所述根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,包括:
将历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设深度双向网络学习模型进行预训练,确定单词的上下文相关表示;
为所述单词的上下文相关表示添加招标需求标签,并通过所述深度双向网络学习模型输出对应的招标需求。
进一步地,所述将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型,包括:
将所述招标需求作为模型训练集和验证集对预设决策树模型进行模型训练,逐步增加所述决策树模型的深度值和/或***节点所需最小样本数直至所述决策树模型在所述验证集上的性能开始下降,确定对应的性能最佳深度值;
根据所述性能最佳深度值得到第一特征模型。
进一步地, 所述根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,包括:
对历史投标文件中的团队专业描述、技术方案描述以及团队资质进行分词处理并添加投标服务标签后输入预设循环神经网络模型中进行文本分类;
通过反向传播算法对所述循环神经网络模型进行参数调优,得到所述循环神经网络模型输出的投标服务。
进一步地,所述将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型,包括:
确定所述投标服务中所述文本序列的最大长度,并根据所述最大长度和预设零向量进行文本序列填充;
将经所述文本序列填充后的所述投标服务划分为模型训练集和验证集,并将所述训练集输入预设循环神经网络模型,通过设定均方误差损失函数对所述循环神经网络模型进行迭代训练,得到第二特征模型。
进一步地,所述将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,包括:
从所述第一特征模型中提取决策树深度值和节点***条件并作为招标需求特征,从所述第二特征模型中提取循环神经网络隐藏层的输出和学习到的时序关系作为投标服务特征;
将所述招标需求特征和所述投标服务特征输入随机森林模型的特征融合层中进行特征融合操作。
进一步地,所述将所述招标需求特征和所述投标服务特征输入随机森林模型的特征融合层中进行特征融合操作,包括:
将所述招标需求特征作为第一特征向量,将所述投标服务特征作为第二特征向量;
对所述第一特征向量和所述第二特征向量进行拼接操作,得到包含有来自所述决策树模型和所述循环神经网络模型的所有特征信息。
第二方面,本申请提供一种基于人工智能的招投标数据处理装置,包括:
第一特征模型构建模块,用于根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
第二特征模型构建模块,用于根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
模型融合预测模块,用于将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于人工智能的招投标数据处理方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于人工智能的招投标数据处理方法的步骤。
第五方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的基于人工智能的招投标数据处理方法的步骤。
由上述技术方案可知,本申请提供一种基于人工智能的招投标数据处理方法及装置,通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高招投标文件的匹配准确率和效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之一;
图2为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之二;
图3为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之三;
图4为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之四;
图5为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之五;
图6为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之六;
图7为本申请实施例中的基于人工智能的招投标数据处理方法的流程示意图之七;
图8为本申请实施例中的基于人工智能的招投标数据处理装置的结构图;
图9为本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
考虑到现有技术中现有技术在招投标文件的撰写和匹配方面存在着一系列问题,包括但不限于信息不清晰、匹配不准确、效率低下等的问题,本申请提供一种基于人工智能的招投标数据处理方法及装置,通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
为了能够有效提高招投标文件的匹配准确率和效率,本申请提供一种基于人工智能的招投标数据处理方法的实施例,参见图1,所述基于人工智能的招投标数据处理方法具体包含有如下内容:
步骤S101:根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
可以理解的,招标方在招标的时候可能会存在以下问题:
1 、需求定义不清,招标文件的核心是明确、具体地描述项目的需求和目标,如果对项目的技术参数、服务标准、工期要求等关键信息表述模糊或不准确,可能导致投标人理解偏差,影响投标质量和后续项目的实施效果。
2 、资质要求设定不合理,在设定投标人的资质条件时,若过于严苛或者与实际项目需求不符,可能会限制有实力但暂时不具备某种特定资质的企业参与投标,降低竞争性;反之,过低的门槛则可能吸引众多不具备实际执行能力的企业,增加筛选难度。
3 、评分标准制定困难,制定科学、公正且具有可操作性的评标标准是一项技术活。如何合理分配商务、技术、价格等因素的权重,既要保证公平公正,又要能够引导投标人提供最优解决方案。
对此,可选的,本实施例中可以使用自然语言处理(NLP)和文本语义识别的方法,实现根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求确定对应的招标需求,
可选的,本实施例可以通过BERT(深度双向Transformer网络学习模型)学习上下文相关的单词表示。可以通过对历史招标文件进行微调,使其能够理解技术参数、服务标准、工期要求和资质要求之间的语义关系。
可以理解的是,BERT(Bidirectional Encoder Representations fromTransformers) 是一种预训练的语言模型,通过深度双向Transformer网络学习上下文相关的单词表示。可以通过对历史招标文件进行微调,使其能够理解技术参数、服务标准、工期要求和资质要求之间的语义关系。
可选的,本实施例中,可以收集并整理包含招标需求文本和相应标签(例如招标类型、服务需求等)的数据集。对招标需求文本进行分词、去停用词等预处理操作,将文本转换成模型可接受的输入格式。然后,对标签进行编码,将其转换成模型可识别的格式,例如数值型或独热编码。选择决策树模型作为拟合招标需求的模型。决策树模型能够根据输入特征做出决策,并适用于分类问题。将招标需求文本作为输入特征,相应标签作为输出标签,进行模型训练。训练完成后,得到了一个用于拟合招标需求的决策树模型,可以将其称为第一特征模型。
通过这个过程,本实施例可以将招标需求文本用于训练决策树模型,得到了一个用于特征提取和招标需求分类的第一特征模型。这个模型可以帮助理解招标需求文本中的关键信息,为后续的任务提供有价值的特征。
步骤S102:根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
可以理解的是,投标方在进行标书撰写的时候可能存在以下问题:
1 、招标文件理解,对招标文件的理解与分析是撰写标书的第一部,这里面包含一些技术规格、商务要求、法律条款等,需要准确理解和把握这些内容,防止遗漏关键信息造成标书作废。
2 、项目需求匹配度,企业需要准确评估自身产品或服务是否与招标项目的需求匹配,匹配度是多少?并在标书中清晰阐述如何满足项目需求。
3 、技术方案设计,根据项目特点和技术要求制定详细、可行且具有竞争力的技术解决方案,这需要专业技术团队的支持,确保方案的先进性、可靠性及经济合理性。
4 、资质证明材料准备,收集并整理齐全的企业资质、业绩案例、质量认证等相关证明材料,确保其符合招标文件规定的要求,任何缺失或不合规都可能导致废标。
可选的,本实施例中,为了根据历史投标文件中的团队专业描述、技术方案描述以及团队资质确定对应的投标服务,可以采用自然语言处理(NLP)模型来实现。
可选的,获取并整理历史投标文件,包括团队专业描述、技术方案描述以及团队资质等相关信息。为每个历史投标文件标注对应的投标服务标签,例如服务类型、项目规模等。基于循环神经网络RNN的模型进行文本分类,这些模型也可以用于捕捉文本中的语义信息。
同时,可以对文本进行分词和标记化,将文本转换成模型可接受的输入格式。对文本序列进行填充,确保输入的文本长度一致,以适应模型的输入要求。然后,将历史投标文件的文本数据输入到模型中,并为每个文件标注相应的投标服务标签。在历史投标文件上进行模型微调,通过反向传播算法调整模型参数,使其能够更好地理解文本中的语义关系。利用微调后的模型,输入新的投标文件,进行投标服务的预测。
可选的,当将投标服务作为模型训练集,对预设循环神经网络(RNN)模型进行训练时,本实施例将得到一个用于特征提取的第二特征模型。
具体的,将历史投标文件中已经标注好的投标服务作为训练集。每个投标服务文本与其对应的标签(投标服务类型)组成训练集样本。对投标服务文本进行分词和标记化,将文本转换成模型可接受的输入格式。对文本序列进行填充,确保输入的文本长度一致,以适应RNN模型的输入要求。设计循环神经网络结构,可以选择简单的RNN结构或更复杂的变体,例如长短时记忆网络(LSTM)或门控循环单元(GRU)。定义RNN模型的输入层,考虑输入文本的维度。定义输出层,确保能够预测投标服务的类型。
然后,将投标服务文本的数据输入到RNN模型中,并为每个文本标注相应的投标服务类型标签。通过反向传播算法,调整模型参数,使其能够更好地理解文本中的语义关系。使用验证集对训练好的RNN模型进行评估,确保模型在未见过的数据上有较好的泛化性能。根据评估结果,可能需要调整模型的超参数以优化性能。训练完成后,我们得到了一个用于特征提取的RNN模型,可以将其称为第二特征模型。
其中,利用训练好的RNN模型,输入新的投标文件,通过中间层的隐藏状态或输出层的特征表示进行特征提取。
步骤S103:将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
可选的,本实施例中,可以使用已经训练好的决策树模型,提取决策树的深度值和节点***条件作为招标需求的特征。利用训练好的循环神经网络(RNN)模型,提取隐藏层的输出和学习到的时序关系作为投标服务的特征。
然后,将提取的招标需求特征和投标服务特征输入到随机森林模型的特征融合层。随机森林是一种集成学习方法,可以同时处理多个特征,通过组合多个决策树的预测结果来提高模型性能。在特征融合层中,随机森林模型将招标需求特征和投标服务特征进行融合操作,以产生最终的特征表示。随机森林模型的输出即为融合后的特征表示,它捕捉了招标需求和投标服务的关键特征。这个融合后的特征表示可以用于后续的任务,例如招标需求和投标服务的匹配。
通过这个过程,利用随机森林模型的特征融合能力,将招标需求特征和投标服务特征整合在一起,以更全面的方式捕捉两者的信息,从而提高整体模型的性能。
从上述描述可知,本申请实施例提供的基于人工智能的招投标数据处理方法,能够通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图2,还可以具体包含如下内容:
步骤S201:将历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设深度双向网络学习模型进行预训练,确定单词的上下文相关表示;
步骤S202:为所述单词的上下文相关表示添加招标需求标签,并通过所述深度双向网络学习模型输出对应的招标需求。
可选的,本实施例可以通过BERT(深度双向Transformer网络学习模型)学习上下文相关的单词表示。可以通过对历史招标文件进行微调,使其能够理解技术参数、服务标准、工期要求和资质要求之间的语义关系。
可以理解的是,BERT(Bidirectional Encoder Representations fromTransformers) 是一种预训练的语言模型,通过深度双向Transformer网络学习上下文相关的单词表示。可以通过对历史招标文件进行微调,使其能够理解技术参数、服务标准、工期要求和资质要求之间的语义关系。
具体的,BERT采用了预训练-微调的两阶段方法。在预训练阶段,模型在大规模文本语料上学习语言模型,从而获取单词的上下文相关表示。同时,BERT是一种双向的语言模型,通过深度双向Transformer网络,可以同时考虑一个单词左侧和右侧的上下文信息,使得模型更好地理解单词的语义。
可选的,在预训练后,可以通过在具体任务上进行微调,使得BERT适应特定领域或任务。这种微调可以帮助模型理解历史招标文件中的特定语境。将BERT模型加载进入训练环境,并将历史招标文件的数据输入到模型中。通过在招标需求任务上进行微调,调整模型参数,使其适应特定的招标需求识别任务。使用验证集评估微调后的BERT模型的性能,进行模型调优,确保模型能够准确地根据技术参数、服务标准、工期要求和资质要求确定对应的招标需求。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图3,还可以具体包含如下内容:
步骤S301:将所述招标需求作为模型训练集和验证集对预设决策树模型进行模型训练,逐步增加所述决策树模型的深度值和/或***节点所需最小样本数直至所述决策树模型在所述验证集上的性能开始下降,确定对应的性能最佳深度值;
步骤S302:根据所述性能最佳深度值得到第一特征模型。
可选的,本实施例中, 将招标需求文本划分为训练集和验证集,确保两个集合都包含足够的样本以反映整体分布。选择决策树模型作为拟合招标需求的模型。初始化决策树模型,设定一个较小的深度值(树的层数),开始模型的训练。在训练集上训练决策树模型,并使用验证集对当前深度值的模型性能进行评估。
可选的,本实施例中,逐步增加决策树的深度值,即增加树的层数。可以同时考虑增加节点***所需的最小样本数,以控制树的生长。在每一步增加深度和节点***条件后,使用验证集对模型性能进行评估。监控模型在验证集上的性能变化,了解随着深度值的增加,模型的泛化性能是否提高。当模型在验证集上的性能开始下降时,说明模型过拟合,选择该点前的深度值作为性能最佳深度值。将性能最佳深度值应用于决策树模型,得到最终的第一特征模型。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图4,还可以具体包含如下内容:
步骤S401:对历史投标文件中的团队专业描述、技术方案描述以及团队资质进行分词处理并添加投标服务标签后输入预设循环神经网络模型中进行文本分类;
步骤S402:通过反向传播算法对所述循环神经网络模型进行参数调优,得到所述循环神经网络模型输出的投标服务。
可选的,本实施例中,为了根据历史投标文件中的团队专业描述、技术方案描述以及团队资质确定对应的投标服务,可以采用自然语言处理(NLP)模型来实现。
可选的,获取并整理历史投标文件,包括团队专业描述、技术方案描述以及团队资质等相关信息。为每个历史投标文件标注对应的投标服务标签,例如服务类型、项目规模等。基于循环神经网络RNN的模型进行文本分类,这些模型也可以用于捕捉文本中的语义信息。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图5,还可以具体包含如下内容:
步骤S501:确定所述投标服务中所述文本序列的最大长度,并根据所述最大长度和预设零向量进行文本序列填充;
步骤S502:将经所述文本序列填充后的所述投标服务划分为模型训练集和验证集,并将所述训练集输入预设循环神经网络模型,通过设定均方误差损失函数对所述循环神经网络模型进行迭代训练,得到第二特征模型。
可以理解的是,文本序列填充是为了确保输入的文本在进行循环神经网络(RNN)训练时具有一致的长度。在处理文本数据时,由于不同文本长度的差异,需要通过填充将所有文本序列的长度调整为相同,以满足模型的输入要求。
可选的,不同投标服务文本的长度可能不同,有些较短,而有些较长。这种变异性会导致在构建输入数据集时,需要处理不同长度文本的方式。本实施例可以选择一个填充符号(通常用零向量)作为填充标记。确定数据集中所有文本序列的最大长度。这个最大长度可以是所有文本中最长的文本的长度。对于每个文本序列,如果其长度小于最大长度,就在其末尾用填充符号进行填充,直到达到最大长度。
可选的,当将投标服务作为模型训练集,对预设循环神经网络(RNN)模型进行训练时,本实施例将得到一个用于特征提取的第二特征模型。
具体的,将历史投标文件中已经标注好的投标服务作为训练集。每个投标服务文本与其对应的标签(投标服务类型)组成训练集样本。对投标服务文本进行分词和标记化,将文本转换成模型可接受的输入格式。对文本序列进行填充,确保输入的文本长度一致,以适应RNN模型的输入要求。设计循环神经网络结构,可以选择简单的RNN结构或更复杂的变体,例如长短时记忆网络(LSTM)或门控循环单元(GRU)。定义RNN模型的输入层,考虑输入文本的维度。定义输出层,确保能够预测投标服务的类型。
然后,将投标服务文本的数据输入到RNN模型中,并为每个文本标注相应的投标服务类型标签。通过反向传播算法,调整模型参数,使其能够更好地理解文本中的语义关系。使用验证集对训练好的RNN模型进行评估,确保模型在未见过的数据上有较好的泛化性能。根据评估结果,可能需要调整模型的超参数以优化性能。训练完成后,我们得到了一个用于特征提取的RNN模型,可以将其称为第二特征模型。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图6,还可以具体包含如下内容:
步骤S601:从所述第一特征模型中提取决策树深度值和节点***条件并作为招标需求特征,从所述第二特征模型中提取循环神经网络隐藏层的输出和学习到的时序关系作为投标服务特征;
步骤S602:将所述招标需求特征和所述投标服务特征输入随机森林模型的特征融合层中进行特征融合操作。
可选的,本实施例中,可以使用已经训练好的决策树模型,提取决策树的深度值和节点***条件作为招标需求的特征。利用训练好的循环神经网络(RNN)模型,提取隐藏层的输出和学习到的时序关系作为投标服务的特征。
然后,将提取的招标需求特征和投标服务特征输入到随机森林模型的特征融合层。随机森林是一种集成学习方法,可以同时处理多个特征,通过组合多个决策树的预测结果来提高模型性能。在特征融合层中,随机森林模型将招标需求特征和投标服务特征进行融合操作,以产生最终的特征表示。随机森林模型的输出即为融合后的特征表示,它捕捉了招标需求和投标服务的关键特征。这个融合后的特征表示可以用于后续的任务,例如招标需求和投标服务的匹配。
在本申请的基于人工智能的招投标数据处理方法的一实施例中,参见图7,还可以具体包含如下内容:
步骤S701:将所述招标需求特征作为第一特征向量,将所述投标服务特征作为第二特征向量;
步骤S702:对所述第一特征向量和所述第二特征向量进行拼接操作,得到包含有来自所述决策树模型和所述循环神经网络模型的所有特征信息。
可选的,本实施例中,可以从第一特征模型中提取决策树深度值和节点***条件,构成招标需求特征向量。从第二特征模型中提取循环神经网络隐藏层的输出和学习到的时序关系,构成投标服务特征向量。然后,对第一特征向量和第二特征向量进行拼接操作,将它们连接在一起,形成一个综合的特征向量。拼接后的综合特征向量包含了来自决策树模型和循环神经网络模型的所有重要特征信息。
为了能够有效提高招投标文件的匹配准确率和效率,本申请提供一种用于实现所述基于人工智能的招投标数据处理方法的全部或部分内容的基于人工智能的招投标数据处理装置的实施例,参见图8,所述基于人工智能的招投标数据处理装置具体包含有如下内容:
第一特征模型构建模块10,用于根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
第二特征模型构建模块20,用于根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
模型融合预测模块30,用于将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
从上述描述可知,本申请实施例提供的基于人工智能的招投标数据处理装置,能够通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
从硬件层面来说,为了能够有效提高招投标文件的匹配准确率和效率,本申请提供一种用于实现所述基于人工智能的招投标数据处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(processor) 、存储器(memory) 、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现基于人工智能的招投标数据处理装置与核心业务***、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的基于人工智能的招投标数据处理方法的实施例,以及基于人工智能的招投标数据处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,基于人工智能的招投标数据处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
图9为本申请实施例的电子设备9600的***构成的示意框图。如图9所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图9是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,基于人工智能的招投标数据处理方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤S101:根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
步骤S102:根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
步骤S103:将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
从上述描述可知,本申请实施例提供的电子设备,通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
在另一个实施方式中,基于人工智能的招投标数据处理装置可以与中央处理器9100分开配置,例如可以将基于人工智能的招投标数据处理装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现基于人工智能的招投标数据处理方法功能。
如图9所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图9中所示的所有部件;此外,电子设备9600还可以包括图9中没有示出的部件,可以参考现有技术。
如图9所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的基于人工智能的招投标数据处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的基于人工智能的招投标数据处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤S101:根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
步骤S102:根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
步骤S103:将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
从上述描述可知,本申请实施例提供的计算机可读存储介质,通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的基于人工智能的招投标数据处理方法中全部步骤的一种计算机程序产品,该计算机程序/指令被处理器执行时实现所述的基于人工智能的招投标数据处理方法的步骤,例如,所述计算机程序/指令实现下述步骤:
步骤S101:根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
步骤S102:根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
步骤S103:将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据。
从上述描述可知,本申请实施例提供的计算机程序产品,通过根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,由此能够有效提高匹配率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于人工智能的招投标数据处理方法,其特征在于,所述方法包括:
根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据,其中,所述招标需求特征为从所述第一特征模型中提取的决策树深度值和节点***条件,所述投标服务特征为从所述第二特征模型中提取的循环神经网络隐藏层的输出和学习到的时序关系。
2.根据权利要求1所述的基于人工智能的招投标数据处理方法,其特征在于,所述根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,包括:
将历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设深度双向网络学习模型进行预训练,确定单词的上下文相关表示;
为所述单词的上下文相关表示添加招标需求标签,并通过所述深度双向网络学习模型输出对应的招标需求。
3.根据权利要求1所述的基于人工智能的招投标数据处理方法,其特征在于,所述将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型,包括:
将所述招标需求作为模型训练集和验证集对预设决策树模型进行模型训练,逐步增加所述决策树模型的深度值和/或***节点所需最小样本数直至所述决策树模型在所述验证集上的性能开始下降,确定对应的性能最佳深度值;
根据所述性能最佳深度值得到第一特征模型。
4.根据权利要求1所述的基于人工智能的招投标数据处理方法,其特征在于,所述根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,包括:
对历史投标文件中的团队专业描述、技术方案描述以及团队资质进行分词处理并添加投标服务标签后输入预设循环神经网络模型中进行文本分类;
通过反向传播算法对所述循环神经网络模型进行参数调优,得到所述循环神经网络模型输出的投标服务。
5.根据权利要求1所述的基于人工智能的招投标数据处理方法,其特征在于,所述将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型,包括:
确定所述投标服务中文本序列的最大长度,并根据所述最大长度和预设零向量进行文本序列填充;
将经所述文本序列填充后的所述投标服务划分为模型训练集和验证集,并将所述训练集输入预设循环神经网络模型,通过设定均方误差损失函数对所述循环神经网络模型进行迭代训练,得到第二特征模型。
6.根据权利要求1所述的基于人工智能的招投标数据处理方法,其特征在于,所述将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,包括:
从所述第一特征模型中提取决策树深度值和节点***条件并作为招标需求特征,从所述第二特征模型中提取循环神经网络隐藏层的输出和学习到的时序关系作为投标服务特征;
将所述招标需求特征和所述投标服务特征输入随机森林模型的特征融合层中进行特征融合操作。
7.根据权利要求6所述的基于人工智能的招投标数据处理方法,其特征在于,所述将所述招标需求特征和所述投标服务特征输入随机森林模型的特征融合层中进行特征融合操作,包括:
将所述招标需求特征作为第一特征向量,将所述投标服务特征作为第二特征向量;
对所述第一特征向量和所述第二特征向量进行拼接操作,得到包含有来自所述决策树模型和所述循环神经网络模型的所有特征信息。
8.一种基于人工智能的招投标数据处理装置,其特征在于,所述装置包括:
第一特征模型构建模块,用于根据历史招标文件中的技术参数、服务标准、工期要求以及资质要求输入预设自然语言处理模型确定对应的招标需求,将所述招标需求作为模型训练集对预设决策树模型进行模型训练,得到第一特征模型;
第二特征模型构建模块,用于根据历史投标文件中的团队专业描述、技术方案描述以及团队资质输入预设自然语言处理模型确定对应的投标服务,将所述投标服务作为模型训练集对预设循环神经网络模型进行模型训练,得到第二特征模型;
模型融合预测模块,用于将从所述第一特征模型提取的招标需求特征和从所述第二特征模型提取的投标服务特征输入预设集成模型的特征融合层进行特征融合,将所述特征融合的结果输入所述集成模型的输出层,并通过所述集成模型的输出层输出招投标匹配数据,其中,所述招标需求特征为从所述第一特征模型中提取的决策树深度值和节点***条件,所述投标服务特征为从所述第二特征模型中提取的循环神经网络隐藏层的输出和学习到的时序关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410350613.1A CN117951547B (zh) | 2024-03-26 | 2024-03-26 | 基于人工智能的招投标数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410350613.1A CN117951547B (zh) | 2024-03-26 | 2024-03-26 | 基于人工智能的招投标数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117951547A CN117951547A (zh) | 2024-04-30 |
CN117951547B true CN117951547B (zh) | 2024-06-21 |
Family
ID=90794678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410350613.1A Active CN117951547B (zh) | 2024-03-26 | 2024-03-26 | 基于人工智能的招投标数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117951547B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493218A (zh) * | 2022-01-18 | 2022-05-13 | 紫金诚征信有限公司 | 投标主体的信用评价***、方法、电子设备及存储介质 |
CN114707503A (zh) * | 2022-02-14 | 2022-07-05 | 慧言科技(天津)有限公司 | 基于多任务学习的前端文本分析方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113129118A (zh) * | 2021-05-17 | 2021-07-16 | 政采云有限公司 | 一种基于自然语言处理的围标串标行为识别方法及装置 |
US11720615B2 (en) * | 2021-07-30 | 2023-08-08 | DSilo Inc. | Self-executing protocol generation from natural language text |
CN114580348A (zh) * | 2022-02-24 | 2022-06-03 | 来也科技(北京)有限公司 | 结合rpa及ai的招标文档获取方法、装置、终端及存储介质 |
CN116681063A (zh) * | 2023-04-20 | 2023-09-01 | 安徽省优质采科技发展有限责任公司 | 一种基于自然语言处理的招标文件范本处理方法及*** |
CN116775872A (zh) * | 2023-06-19 | 2023-09-19 | 中国电信股份有限公司 | 一种文本处理方法、装置、电子设备及存储介质 |
-
2024
- 2024-03-26 CN CN202410350613.1A patent/CN117951547B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493218A (zh) * | 2022-01-18 | 2022-05-13 | 紫金诚征信有限公司 | 投标主体的信用评价***、方法、电子设备及存储介质 |
CN114707503A (zh) * | 2022-02-14 | 2022-07-05 | 慧言科技(天津)有限公司 | 基于多任务学习的前端文本分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117951547A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210182680A1 (en) | Processing sequential interaction data | |
CN107291840B (zh) | 一种用户属性预测模型构建方法和装置 | |
CN111932267A (zh) | 企业金融服务风险预测方法及装置 | |
CN111783873B (zh) | 基于增量朴素贝叶斯模型的用户画像方法及装置 | |
TW201633289A (zh) | 輸出文字資料之內容至發送者之語音的方法 | |
CN111460290B (zh) | 信息的推荐方法、装置、设备和存储介质 | |
WO2023287910A1 (en) | Intelligent task completion detection at a computing device | |
CN112784112B (zh) | 报文校验方法及装置 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
CN112579773A (zh) | 风险事件分级方法及装置 | |
CN111309887A (zh) | 一种训练文本关键内容提取模型的方法和*** | |
CN113342948A (zh) | 一种智能问答方法及装置 | |
CN112734565B (zh) | 流动性覆盖率预测方法及装置 | |
CN111581347B (zh) | 语句相似度匹配方法及装置 | |
CN112905787B (zh) | 文本信息处理方法、短信处理方法、电子设备及可读介质 | |
CN112925895A (zh) | 自然语言软件运维方法及装置 | |
CN113011195A (zh) | 基于预训练语言模型的推荐***效果增强方法及装置 | |
CN111666408A (zh) | 重要条款筛选与展示的方法及装置 | |
CN117951547B (zh) | 基于人工智能的招投标数据处理方法及装置 | |
CN116304043A (zh) | 一种低资源条件下的文本分类方法及装置 | |
CN111143529A (zh) | 一种与对话机器人进行对话的方法与设备 | |
CN113190460B (zh) | 一种测试案例自动生成方法及装置 | |
CN117972222B (zh) | 基于人工智能的企业信息检索方法及装置 | |
CN117453273A (zh) | 一种程序代码智能补全方法及装置 | |
CN118096358A (zh) | 企业信用报告智能生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |