CN115249007A - 一种基于电子投标文件比对的围串标行为检测方法及装置 - Google Patents
一种基于电子投标文件比对的围串标行为检测方法及装置 Download PDFInfo
- Publication number
- CN115249007A CN115249007A CN202210897373.8A CN202210897373A CN115249007A CN 115249007 A CN115249007 A CN 115249007A CN 202210897373 A CN202210897373 A CN 202210897373A CN 115249007 A CN115249007 A CN 115249007A
- Authority
- CN
- China
- Prior art keywords
- information
- document
- bid
- bidding
- suppliers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于电子投标文件比对的围串标行为检测方法及装置,方法包括:将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;根据法规、上述得到信息进行对比判断投标人是否为围串标行为;可以更为直观准确的定位出可能存在的围串标行为,进一步减少平时专家的工作量,提升评审专家的效率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种基于电子投标文件比对的围串标行为检测方法及装置。
背景技术
现有在招标时,供应商为了利益,可能会出现围标或者串标行为,这就极大的损害了招标者的利益;若是仅仅是通过人为阅读和比较投标文件,则效率低下,且准确率不高;若是采用软件方式存在以下三大问题:
一、可靠性(准确率)不高,存在较大的误判可能:
实操中,相似度多高能判断为围串标,在不同的采购项目或是在不同的场景中,并没法得出一个确定的参考值,检测出的相似度不能直接作为判断围串标的直接依据;
二、仅通过相似度,并不能标识出两份投标文件具体哪些内容存在相同:
基于第一点的情况,在检测出高相似度的两份投标文件时,评审专家需要人工介入判断是否存在围串标行为,仅一个相似度信息,评审专家无法快速定位出哪些内容是高度一致或相似的,还是需要人工两份投标文件完整的阅读比对;
三、一些关键的能够判定围串标行为的信息无法体现:
两份投标文件中,可能出现法人的身份证号码一致情况,这种情况肯定是可以判定为围串标的,但是仅仅身份证号码一致并不会带来两份投标文件相似度大幅提升,这个时候仅基于相似度信息是无法直接定位出该关键信息的;
在申请号:2019113581250;发明名称为:一种投标文件相似度计算方法及装置,具体公开了该方法包括:获取第一投标文件的有效文本信息以及第二投标文件的有效文本信息;根据预设的相同词语查找算法在第二投标文件的有效文本信息的第N-a页至第N+b页中查找出与第一投标文件的有效文本信息的第N页中的段落语义相同的段落;根据查找出的语义相同的段落确定第一投标文件的有效文本信息和第二投标文件的有效文本信息的相同词数;根据所述相同词数确定第一投标文件和第二投标文件的相似度。本发明方法大大提高发现围标串标的效率和准确率,且能够大幅降低人力成本和可扩展性成本;该发明实现思路是计算出两份投标文件的文本相似度;该方案虽然能间接的检测出可能的围串标,但是在实际情况中,仅仅基于文本相似度信息,并不能简单的判断存在围串标可能。
发明内容
本发明要解决的技术问题,在于提供一种基于电子投标文件比对的围串标行为检测方法及装置,可以更为直观准确的定位出可能存在的围串标行为,进一步减少平时专家的工作量,提升评审专家的效率。
第一方面,本发明提供了一种基于电子投标文件比对的围串标行为检测方法,包括:
步骤1、将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
步骤2、将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;
步骤3、将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
步骤4、根据法规、步骤2中得到信息以及步骤3中得到信息进行对比判断投标人是否为围串标行为。
进一步地,还包括步骤5、根据设定需求将步骤2中的信息、步骤3中的信息以及步骤4中的结果进行显示。
进一步地,所述步骤2进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。
进一步地,所述步骤3进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号。
进一步地,所述步骤4进一步具体为:
将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为。
第二方面,本发明提供了一种基于电子投标文件比对的围串标行为检测装置,包括:
投标文件预处理模块,将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
投标文件相似内容检测模块,将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;
投标文件关键信息提取模块,将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
投标文件检测模块,根据法规、投标文件相似内容检测模块中得到信息以及投标文件关键信息提取模块中得到信息进行对比判断投标人是否为围串标行为。
进一步地,还包括展示模块,根据设定需求将投标文件相似内容检测模块中的信息、投标文件关键信息提取模块中的信息以及投标文件关键信息提取模块中的结果进行显示。
进一步地,所述投标文件相似内容检测模块进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。
进一步地,所述投标文件关键信息提取模块进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号。
进一步地,所述投标文件关键信息提取模块进一步具体为:
将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的一种基于电子投标文件比对的围串标行为检测方法及装置,本发明基于投标文件相似内容比对展示以及关键信息提取,可以更为直观准确的定位出可能存在的围串标行为,进一步减少平时专家的工作量,提升评审专家的效率,也使原本可能遗漏的围串标信息在本发明的辅助下能够得以关注。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明***的框架示意图;
图2为本发明实施例一中方法中的流程图;
图3为本发明实施例二中装置的结构示意图。
具体实施方式
本申请实施例通过提供一种基于电子投标文件比对的围串标行为检测方法及装置,解决了现有技术中无法准确的的判断围串标行为,通过本发明的技术方案使得可以更加准确的定位出存在的围串标行为,大大减少了专家的工作量。
本申请实施例中的技术方案,总体思路如下:
1.如图1所示,本发明由以下几个部分组成:
一、投标文件预处理模块;
二、投标文件相似内容检测模块;
三、投标文件关键信息提取模块;
四、投标文件围串标行为分析检测模块;
五、投标文件相似内容以及相同关键信息展示模块。
2.各组成部分的特征及其作用如下:
一、投标文件预处理模块
1.将投标文件转换为纯文本(txt):投标文件同一为pdf文档,通过Spire.Pdf工具包将pdf转换成文本文档(txt)
2.将处理转换后的文本文档去噪:主要是处理转换后的文本文档的排版问题,因pdf文件的特性,转换后的文本文档可能存在排版问题,比如多余空格和换行等,本步骤将多余的空格和换行符等去除
3.去除采购文件中的关键内容:为了避免后续步骤中存在误判,将上述文本文档中和采购文件中关键信息一致的内容去除
基于下文的投标文件相似内容检测模块的算法,把采购文件作为参与比对的其中一个对象,逐一和所有的投标文件进行比对,得出投标文件中和采购文件中相似内容或相似段落,然后将各投标文件中和采购文件中的相似内容或相似段落对应的文本删除。
经过以上3个步骤的预处理,得到投标文件的有效文本文档,以下简称文本
二、投标文件相似内容检测模块
1.对文本进行分句:以常用标点符号(逗号、句号、问号、换行符等,包括中文和英文标点符号)作为一个句子的分隔符,将文本分好句。
2.筛选出有效句子:
①首先将本身相同的句子做去重处理;
②然后选出句子长度大于预设长度的句子:考虑到一些短句在实际应用中判为重复会干扰正常的判断,只需将长度大于预设长度的句子做进一步处理,一般预设长度为12字符较为合理。
3.计算句子simhash值:将投标文件相似内容检测模块中筛选出的句子逐一计算simhash值,并存入内存数据库中备用。
4.重复执行以上步骤,将所有的供应商投标文件均计算出句子的simhash值(以下简称simhash值)。
5.找出不同供应商的投标文件相似句子:主要实现方式是将不同供应商的投标文件基于句子simhash值做两两进行比对。
①遍历取出A供应商投标文件的所有simhash值,依次和B供应商投标文件的所有simhash值做海明距离计算
②将海明距离小于预设值(实践一般取值3较为理想)的两组simhash值所对应的句子标记为相似内容,并存储进数据库中
6.找出不同供应商的投标文件相似段落:进一步的,基于上述5中的相似句子结果,通过句子连续相似扩散查找方法,得出相似段落信息(即基于前序步骤得出相似句子,把连续相似的句子,一句一句的字符串进行拼接,得出一个由多个句子组成的段落信息),并存储进数据库中。
三、投标文件关键信息提取模块
基于步骤一中投标文件预处理模块得到的投标文件的有效文本文档,进一步的提取出能作为围串标行为检测的关键信息。具体提取了以下信息:
1.基础关键信息提取子模块
①中文姓名提取子模块
基于mmseg算法(一种基于词典的中文分词算法)以及中文姓氏词库,将文本中可能的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中。
②电话号码提取子模块
使用正则表达式提取出文本中带有的电话号码(包含座机号和手机号码),正则表达式为/^([1]\d{10}|([\((]?0[0-9]{2,3}[)\)]?[-]?)?([2-9][0-9]{6,7})+(\-[0-9]{1,4})?)$/。并将提取出的电话号码信息存储进数据库中。
③地址提取子模块
基于mmseg算法(一种基于词典的中文分词算法)以及行政区划词库及常用地址词库,将文本中可能的地址信息识别并提取出来,并将提取出的地址信息存储进数据库中。
④电子邮箱地址提取子模块
使用正则表达式提取出文本中带有的电子邮箱,正则表达式为/^[A-Za-z0-9]+([_\.][A-Za-z0-9]+)*@([A-Za-z0-9\-]+\.)+[A-Za-z]{2,6}$/。并将提取出的电子邮箱信息存储进数据库中。
⑤公司名称提取子模块
基于mmseg算法(一种基于词典的中文分词算法)以及常用公司名称词库,将文本中可能的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中。
2.报价信息提取子模块
供应商进行报价是按结构化进行响应的,这部分数据无需特殊处理即可从数据库中获取(实际的实现中,供应商的报价信息有以结构化形式存储到数据库中,从实现方便性上看直接从数据库中取数更方便;也可以通过算法形式从投标文件中获取),报价信息也是围串标行为判断的一大依据,这里也作为关键信息加入到关键信息中
3.供应商电子投标文件制作信息提取子模块
在供应商上传电子投标文件时,***记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址,作为围串标判断的关键信息使用
4.投标保证金缴交账户信息提取子模块
在供应商缴交保证金时,***记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号,作为围串标判断的关键信息使用
四、投标文件围串标行为分析检测模块
《中华人民共和国招标投标法实施条例》第四十条:
有下列情形之一的,视为投标人相互串通投标:
(一)不同投标人的投标文件由同一单位或者个人编制;
(二)不同投标人委托同一单位或者个人办理投标事宜;
(三)不同投标人的投标文件载明的项目管理成员为同一人;
(四)不同投标人的投标文件异常一致或者投标报价呈规律性差异;
(五)不同投标人的投标文件相互混装;
(六)不同投标人的投标保证金从同一单位或者个人的账户转出。
基于以上法规规定,可以通过技术手段识别检测出以上几种互相串通投标的行为。
1.不同投标人的投标文件由同一单位或者个人编制检测子模块:
通过步骤三中供应商电子投标文件制作信息提取子模块,对不同供应商的投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑
2.不同投标人委托同一单位或者个人办理投标事宜,项目管理成员为同一人检测子模块
通过步骤三中基础关键信息提取子模块,对不同供应商的基础关键信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称、地址等信息中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为,待评审专家进一步介入判定
3.不同投标人的投标文件异常一致或者投标报价呈规律性差异检测子模块
通过步骤三中报价信息提取子模块,对不同供应商的报价信息进行两两比对,规律性差异判定方法有以下几种:
①:两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率
报价畸高畸低的判定方法:
两家或多家供应商的报价与各供应商的平均报价差异20%(该阈值为普遍情况下的经验值)以上,差异阈值可根据不同的采购项目类型和采购预算动态调整。调整算法基于历史数据的大数据分析结果。
评标基准价=所有供应商投标报价中最低的报价
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%
整体偏差率=参与计算的各供应商投标报价偏差率的平均值
两家或多家供应商投标报价数额偏差率小于所有供应商报价的整体偏差率指的是这些供应商的投标报价体现出明显的“抱团”相似现象,即这些供应商的报价数额非常接近。
②:大于两家供应商报价存在阶梯报价情况,例如A、B、C三家供应商,分别报价100,200,300,他们的阶梯间隔就是100;
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,例如n家供应商共可得出n*(n-1)/2个差值绝对值。找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商。这些供应商的报价即是阶梯报价。
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为,待评审专家进一步介入判定
4.不同投标人的投标文件相互混装检测子模块
通过步骤二投标文件相似内容检测模块得出的相似段落内容,计算出不同投标文件间的参考相似度值,
A、B两份投标文件的相似度值Sab计算方法为:
设通过步骤二投标文件相似内容检测模块计算得出的A、B两份投标文件的相似段落内容的文本长度(字符数量)为S;
A投标文件剔除与采购文件相似文本后的文本长度为La;
B投标文件剔除与采购文件相似文本后的文本长度为Lb;
则A、B两份投标文件的相似度值Sab=S/Min(La,Lb)*100%。(Min函数指的是取参数内的最小值)
通过投标文件比对界面展示给评审专家,待评审专家进一步介入判定
5.不同投标人的投标保证金从同一单位或者个人的账户转出检测子模块
通过步骤三投标保证金缴交账户信息提取子模块,对不同供应商的保证金缴交情况进行两两比对,如果存在不同供应商使用了相同的转出账户或者相同的转入账户,则直接判定对应供应商存在围串标行为
五、投标文件相似内容以及相同关键信息展示模块
基于步骤二、三、四的处理结果,需要能给到评审专家一个更为直观清晰的界面,做出最终的供应商围串标行为判定,展示模块具有以下特性:
1、同一页面支持最多4家供应商的投标文件展示;
2、支持将步骤二检测出的相似句子或段落做高亮对比展示;
3、支持将步骤三检测出的关键信息按不同颜色和标记方式做对比展示;
4、支持将步骤四检测出的确定的以及可疑的围串标行为结果进行展示,并支持评审专家快速完成最终评定。
实施例一
如图2所示,本实施例提供本发明提供了一种基于电子投标文件比对的围串标行为检测方法,包括:
步骤1、将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
步骤2、根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息;
步骤3、将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号;
步骤4、将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为;
步骤5、根据设定需求将步骤2中的信息、步骤3中的信息以及步骤4中的结果进行显示;通过显示该信息,可以让评审专家再次进行评审。
基于同一发明构思,本申请还提供了与实施例一中的方法对应的装置,详见实施例二。
实施例二
如图3所示,在本实施例中提供了第二方面,本发明提供了一种基于电子投标文件比对的围串标行为检测装置,包括:
投标文件预处理模块,将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
投标文件相似内容检测模块,根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息;
投标文件关键信息提取模块,将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号;
投标文件检测模块,
将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为;
展示模块,根据设定需求将投标文件相似内容检测模块中的信息、投标文件关键信息提取模块中的信息以及投标文件关键信息提取模块中的结果进行显示;通过显示该信息,可以让评审专家再次进行评审。
由于本发明实施例二所介绍的装置,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (10)
1.一种基于电子投标文件比对的围串标行为检测方法,其特征在于:包括:
步骤1、将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
步骤2、将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;
步骤3、将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
步骤4、根据法规、步骤2中得到信息以及步骤3中得到信息进行对比判断投标人是否为围串标行为。
2.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:还包括步骤5、根据设定需求将步骤2中的信息、步骤3中的信息以及步骤4中的结果进行显示。
3.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤2进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。
4.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤3进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号。
5.根据权利要求1所述的一种基于电子投标文件比对的围串标行为检测方法,其特征在于:所述步骤4进一步具体为:
将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为。
6.一种基于电子投标文件比对的围串标行为检测装置,其特征在于:包括:
投标文件预处理模块,将投标文件转换为纯文本,将纯文本进行去噪,并将其中和招标的采购文件中信息一致的内容去除,得到有效文本文档;
投标文件相似内容检测模块,将所有的有效文本文档进行分句,筛选其中设定句子,并计算句子的simhash值,将不同有效文本文档的相似句子查找出来,并将其中连续的句子拼接,得到相似信息;
投标文件关键信息提取模块,将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
投标文件检测模块,根据法规、投标文件相似内容检测模块中得到信息以及投标文件关键信息提取模块中得到信息进行对比判断投标人是否为围串标行为。
7.根据权利要求6所述的一种基于电子投标文件比对的围串标行为检测装置,其特征在于:还包括展示模块,根据设定需求将投标文件相似内容检测模块中的信息、投标文件关键信息提取模块中的信息以及投标文件关键信息提取模块中的结果进行显示。
8.根据权利要求6所述的一种基于电子投标文件比对的围串标行为检测装置,其特征在于:所述投标文件相似内容检测模块进一步具体为:根据设定的标点符号作为句子的分隔符将所有的有效文本文档进行分句;
筛选其中设定句子:首先将同一有效文本文档中相同的句子做去重处理,然后将选出长度大于预设定长度的句子;
计算每句选出句子的simhash值;
遍历取出一有效文本文档的所有simhash值,依次和另一有效文本文档的所有simhash值做海明距离计算;将海明距离小于预设值的两组simhash值所对应的句子标记为相似句子;若其中存在连续的句子,则进行拼接,得到相似信息。
9.根据权利要求6所述的一种基于电子投标文件比对的围串标行为检测装置,其特征在于:所述投标文件关键信息提取模块进一步具体为:将所有的有效文本文档中提取基础关键信息、报价信息、供应商电子投标文件制作信息以及投标保证金缴费账户信息;
所述基础关键信息包括:中文姓名、电话号码、地址、电子邮箱以及公司名称;
所述中文姓名提取:基于mmseg算法以及中文姓氏词库,将有效文本文档中的姓名信息识别并提取出来,并将提取出的姓名信息存储进数据库中;
所述电话号码提取:使用正则表达式提取出有效文本文档中的电话号码,并将提取出的电话号码信息存储进数据库中;
所述地址提取:基于mmseg算法、行政区划词库及地址词库,将有效文本文档中地址信息识别并提取出来,并将提取出的地址信息存储进数据库中;
所述电子邮箱提取:使用正则表达式提取出有效文本文档中的电子邮箱信息,并将提取出的电子邮箱信息存储进数据库中;
所述公司名称提取:基于mmseg算法以及公司名称词库,将有效文本文档中的公司名称信息识别并提取出来,并将提取出的公司名称信息存储进数据库中;
所述报价信息:根据供应商从数据库中获取对应的报价信息;
所述供应商电子投标文件制作信息:在供应商上传电子投标文件时,记录下该电子投标文件加密电脑以及上传电脑的mac地址和ip地址;
所述投标保证金缴交账户信息:在供应商缴交保证金时,记录下供应商的转出账户户号以及转入的唯一虚拟保证金户号。
10.根据权利要求6所述的一种基于电子投标文件比对的围串标行为检测装置,其特征在于:所述投标文件关键信息提取模块进一步具体为:
将不同供应商的供应商电子投标文件制作信息进行两两比对,如果不同供应商的投标文件加密或上传电脑的mac地址一致,则判定这两家供应商具有围串标嫌疑;
将不同供应商的基础信息进行两两比对,如果存在姓名、电话号码、电子邮箱、公司名称以及地址中的一个或多个一致,则将这两家供应商标记为具有围串标可疑行为;
将不同供应商的报价信息进行两两比对:
①、若两家或多家供应商报价均畸高或者畸低,且报价数额偏差率小于所有供应商报价的整体偏差率;
报价畸高或畸低的判定方法:
若两家或多家供应商的报价与各供应商的平均报价差异在畸高畸低差异阈值以上,则为报价畸高或畸低;
评标基准价=所有供应商投标报价中最低的报价;
偏差率=|(投标人报价-评标基准价)|/评标基准价×100%;
整体偏差率=参与计算的各供应商投标报价偏差率的平均值;
②、两家以上供应商报价存在阶梯报价情况
阶梯报价判定方法:
计算所有供应商投标报价两两间的差值绝对值,找出计算得出的差值绝对值一样且相同个数大于2的所关联的供应商,该关联的供应商的报价即是阶梯报价;
当报价信息满足以上任意一个条件时,将对应供应商标记为具有围串标可疑行为;
计算出不同投标文件间的相似度值;
两份有效文本文档的相似度值Sab计算方法为:
计算得出的两份有效文本文档的相似信息内容的文本长度为S;
一有效文本文档的文本长度为La;另一有效文本文档的文本长度为Lb;
则相似度值Sab=S/Min(La,Lb)*100%,若该相似度值大于设定阈值,则判定这两家供应商具有围串标嫌疑;
将对不同供应商的投标保证金缴交账户信息进行两两比对,如果存在不同供应商使用相同的转出账户户号,或者相同的转入的唯一虚拟保证金户号,则直接判定对应供应商存在围串标行为。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612185.8A CN114492323A (zh) | 2021-12-27 | 2021-12-27 | 一种基于电子投标文件比对的围串标行为检测方法及装置 |
CN2021116121858 | 2021-12-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115249007A true CN115249007A (zh) | 2022-10-28 |
Family
ID=81495415
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111612185.8A Pending CN114492323A (zh) | 2021-12-27 | 2021-12-27 | 一种基于电子投标文件比对的围串标行为检测方法及装置 |
CN202210897373.8A Pending CN115249007A (zh) | 2021-12-27 | 2022-07-28 | 一种基于电子投标文件比对的围串标行为检测方法及装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111612185.8A Pending CN114492323A (zh) | 2021-12-27 | 2021-12-27 | 一种基于电子投标文件比对的围串标行为检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN114492323A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252194A (zh) * | 2023-11-17 | 2023-12-19 | 上海百通项目管理咨询有限公司 | 一种基于自然语义模型的投标文件检测方法及*** |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117114720B (zh) * | 2023-10-25 | 2024-02-20 | 湖南华菱电子商务有限公司 | 基于互联网的电商平台管理*** |
-
2021
- 2021-12-27 CN CN202111612185.8A patent/CN114492323A/zh active Pending
-
2022
- 2022-07-28 CN CN202210897373.8A patent/CN115249007A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252194A (zh) * | 2023-11-17 | 2023-12-19 | 上海百通项目管理咨询有限公司 | 一种基于自然语义模型的投标文件检测方法及*** |
CN117252194B (zh) * | 2023-11-17 | 2024-02-23 | 上海百通项目管理咨询有限公司 | 一种基于自然语义模型的投标文件检测方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN114492323A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11663254B2 (en) | System and engine for seeded clustering of news events | |
CN110069623B (zh) | 摘要文本生成方法、装置、存储介质和计算机设备 | |
CN107330752B (zh) | 识别品牌词的方法和装置 | |
RU2679209C2 (ru) | Обработка электронных документов для распознавания инвойсов | |
CN115249007A (zh) | 一种基于电子投标文件比对的围串标行为检测方法及装置 | |
CN111797210A (zh) | 基于用户画像的信息推荐方法、装置、设备及存储介质 | |
US10699112B1 (en) | Identification of key segments in document images | |
CN111191614B (zh) | 一种单据分类方法和装置 | |
US20130275451A1 (en) | Systems And Methods For Contract Assurance | |
US9256805B2 (en) | Method and system of identifying an entity from a digital image of a physical text | |
CN110766486A (zh) | 确定物品类目的方法和装置 | |
CN112131348B (zh) | 基于文本和图像相似度防止项目重复申报的方法 | |
CN111078839A (zh) | 一种用于裁判文书的结构化处理方法及处理装置 | |
CA2956627A1 (en) | System and engine for seeded clustering of news events | |
US20240193522A1 (en) | Citation and policy based document classification | |
CN111881943A (zh) | 图像分类的方法、装置、设备和计算机可读介质 | |
CN115098440A (zh) | 电子档案查询方法、装置、存储介质和设备 | |
CN116739626A (zh) | 商品数据挖掘处理方法、装置、电子设备及可读介质 | |
CN113408660A (zh) | 图书聚类方法、装置、设备和存储介质 | |
CN112487808A (zh) | 基于大数据的新闻消息推送方法、装置、设备及存储介质 | |
CN113706207A (zh) | 基于语义解析的订单成交率分析方法、装置、设备及介质 | |
CN112862305A (zh) | 确定对象风险状态的方法、装置、设备和存储介质 | |
CN112818215A (zh) | 产品数据的处理方法、装置、设备及存储介质 | |
CN112308251A (zh) | 一种基于机器学习的工单分派方法和*** | |
CN112445955A (zh) | 商机信息管理方法、***及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |