CN111881183A - 企业名称匹配方法和装置、以及存储介质和电子设备 - Google Patents
企业名称匹配方法和装置、以及存储介质和电子设备 Download PDFInfo
- Publication number
- CN111881183A CN111881183A CN202010737249.6A CN202010737249A CN111881183A CN 111881183 A CN111881183 A CN 111881183A CN 202010737249 A CN202010737249 A CN 202010737249A CN 111881183 A CN111881183 A CN 111881183A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- enterprise name
- name
- determining
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000011218 segmentation Effects 0.000 claims abstract description 54
- 230000004044 response Effects 0.000 claims abstract description 21
- 238000004590 computer program Methods 0.000 claims description 8
- 230000007547 defect Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本公开的实施例公开了一种企业名称匹配方法和装置、电子设备和存储介质,其中,该方法包括:接收企业名称请求信息;响应于企业名称请求信息为企业索引信息,基于企业索引信息确定企业名称请求信息对应的企业名称;响应于企业名称请求信息不为企业索引信息,基于预设的分词词典确定企业名称请求信息对应的企业名称。由此,本公开实施例可以利用企业索引信息和预设的分词词典快速准确的匹配到用户所需的企业名称,此外,还克服了现有技术中当用户输入不完整企业名称或仅输入企业的项目名称或品牌名称可能出现检索不到对应企业名称或检索到错误企业名称等缺陷。
Description
技术领域
本公开涉及计算机技术领域,尤其是一种企业名称匹配方法、装置、以及存储介质和电子设备。
背景技术
在企业大数据产品中经常会涉及获取批量企业名单的操作,如关系发现中发现组中企业的选择、企业加入监控、企业信用报告的下载、按企业名单导出数据等。
在实现本公开的过程中,发明人发现:用户对批量企业名单的生成需求存在多样性,有时用户依关键词搜索即可得到所需批量企业的名称,有时用户虽然有相关的企业名录,但通常用户提供的企业名称并不准确,例如企业名称不完整、不准确或仅为企业的项目名称或品牌名称,导致不仅无法进行批量企业名单的相关操作,还需要用户对所需的批量企业名称进行逐一核对,降低了用户体验。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种企业名称匹配方法和装置、电子设备和存储介质。
根据本公开实施例的一个方面,提供了一种企业名称匹配方法,包括:
接收企业名称请求信息;
响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称;
响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称。
可选地,在本公开上述各方法实施例中,所述企业名称请求信息包括:企业名称关键词或企业名称文件;
其中,所述企业名称文件包括多个企业名称关键词。
可选地,在本公开上述各方法实施例中,所述响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称,包括:响应于所述企业名称关键词为所述企业索引信息,基于所述企业索引信息从索引数据库中获取所述企业名称关键词对应的企业名称。
可选地,在本公开上述各方法实施例中,所述企业索引信息包括以下任意一项或多项:企业名称、企业曾用名称、企业股票简称、企业股票代码、企业项目、企业品牌、以及企业产品。
可选地,在本公开上述各方法实施例中,所述响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称,包括:
响应于所述企业名称关键词不为企业索引信息,基于预设的分词词典,对所述企业名称关键词中的分词进行提取,获得所述企业名称关键词的至少一个分词信息;
基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称。
可选地,在本公开上述各方法实施例中,所述基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称,包括:
基于所述企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和所述至少一个待确定企业名称的匹配度;
基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称。
可选地,在本公开上述各方法实施例中,所述基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称,包括:
将匹配度最高的待确定企业名称确定为所述企业名称关键词对应的企业名称;或
基于所述至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。
根据本公开实施例的另一个方面,提供了一种企业名称匹配装置,包括:
接收模块,用于接收企业名称请求信息;
第一确定模块,用于响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称;
第二确定模块,用于响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称。
可选地,在本公开上述各装置实施例中,所述第一确定模块具体用于:响应于所述企业名称关键词为所述企业索引信息,基于所述企业索引信息从索引数据库中获取所述企业名称关键词对应的企业名称。
可选地,在本公开上述各装置实施例中,所述第二确定模块,包括:
获得单元,用于响应于所述企业名称关键词不为企业索引信息,基于预设的分词词典,对所述企业名称关键词中的分词进行提取,获得所述企业名称关键词的至少一个分词信息;
确定单元,用于基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称。
可选地,在本公开上述各装置实施例中,所述确定单元,包括:
获得子单元,用于基于所述企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和所述至少一个待确定企业名称的匹配度;
确定子单元,用于基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称。
可选地,在本公开上述各装置实施例中,所述确定子单元具体用于:将匹配度最高的待确定企业名称确定为所述企业名称关键词对应的企业名称;或
基于所述至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。
根据本公开实施例的又一个方面,提供了一种计算机可读存储介质,该存储介质存储有计算机程序,所述计算机程序用于执行本公开上述任一实施例所述的企业名称匹配方法。
根据本公开实施例的又一个方面,提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的企业名称匹配方法。
基于本公开上述实施例提供的企业名称匹配方法和装置、电子设备和存储介质,接收企业名称请求信息;响应于企业名称请求信息为企业索引信息,基于企业索引信息确定企业名称请求信息对应的企业名称;响应于企业名称请求信息不为企业索引信息,基于预设的分词词典确定企业名称请求信息对应的企业名称。由此,本公开实施例可以利用企业索引信息和预设的分词词典快速准确的匹配到用户所需的企业名称,此外,还克服了现有技术中当用户输入不完整企业名称或仅输入企业的项目名称或品牌名称可能出现检索不到对应企业名称或检索到错误企业名称等缺陷。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开一示例性实施例提供的企业名称匹配方法的流程示意图。
图2是本公开另一示例性实施例提供的企业名称匹配方法的流程示意图。
图3是本公开又一示例性实施例提供的企业名称匹配方法的流程示意图。
图4是本公开一示例性实施例提供的企业名称匹配装置的结构示意图。
图5是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机***、服务器等电子设备,其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于:个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***﹑大型计算机***和包括上述任何***的分布式云计算技术环境,等等。
终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算***存储介质上。
图1是本公开一示例性实施例提供的企业名称匹配方法流程图。本实施例可应用在电子设备上,如图1所示,该企业名称匹配方法包括如下步骤:
S102,接收企业名称请求信息。
在本公开实施例中的企业名称请求信息可以包括:企业名称关键词或企业名称文件,其中,企业名称文件可以包括多个企业名称关键词,例如:保存有多个企业名称关键词的txt或excel文档,或者用户也可以将企业名称文件中的企业名单直接复制粘贴到***接收企业名称请求信息的可编辑区域。
其中,企业名称关键词用于表示含有企业名称的可识别信息,例如:京东、华为技术、中广天择、麦当劳(中国)有限公司等。
S104,响应于企业名称请求信息为企业索引信息,基于企业索引信息确定企业名称请求信息对应的企业名称。
其中,企业索引信息用于表示可以识别企业名称的标签信息,具体可以包括以下任意一项或多项:企业名称、企业曾用名称、企业股票简称、企业股票代码、企业电话、注册地址、企业项目、企业品牌、企业产品等。其中,企业索引信息预存在索引数据库(例如:搜索引擎ES和开放搜索平台opensearch)中。
例如,“金拱门(中国)有限公司”的曾用名称为“麦当劳(中国)有限公司”,当用户输入企业名称关键词“麦当劳(中国)有限公司”时,基于企业索引信息(企业曾用名称)可以确定“麦当劳(中国)有限公司”的企业名称为“金拱门(中国)有限公司”。“中广天择传媒股份有限公司”的股票简称为“中广天择”,当用户输入企业名称关键词“中广天择”时,基于该企业索引信息(企业股票简称)可以确定“中广天择”的企业名称为“中广天择传媒股份有限公司”。
S106,响应于企业名称请求信息不为企业索引信息,基于预设的分词词典确定企业名称请求信息对应的企业名称。
其中,预设的分词词典用于表示索引数据库中预设的类别分词,例如:地域分词、商号分词、行业分词等。
在一个具体的例子中,响应于企业名称请求信息不为企业索引信息,即在索引数据库中无法识别到该企业名称请求信息对应的企业名称的标签信息,如用户输入的企业名称请求信息为不完整的企业名称“华为技术”,可以利用预设的分词词典,将“华为技术”划分为“华为”和“技术”后,在索引数据库中进行匹配得到的“华为技术有限公司”、“华为软件技术有限公司”、“浙江华为技术通信有限公司”等企业名称确定用户需要的企业名称。
基于本公开上述实施例提供的企业名称匹配方法,接收企业名称请求信息;响应于企业名称请求信息为企业索引信息,基于企业索引信息确定企业名称请求信息对应的企业名称;响应于企业名称请求信息不为企业索引信息,基于预设的分词词典确定企业名称请求信息对应的企业名称。由此,本公开实施例可以利用企业索引信息和预设的分词词典快速准确的匹配到用户所需的企业名称,此外,还克服了现有技术中当用户输入不完整企业名称或仅输入企业的项目名称或品牌名称可能出现检索不到对应企业名称或检索到错误企业名称等缺陷。
在一些可选的实施方式中,步骤S104具体可以包括:
响应于企业名称关键词为企业索引信息,基于企业索引信息从索引数据库中获取企业名称关键词对应的企业名称。例如,响应于企业名称关键词“美团”(企业品牌)存在企业索引信息,基于该企业索引信息“美团”从开放搜索平台opensearch中获取其对应的企业名称“北京三快在线科技有限公司”。
由此,本公开实施例可以精确匹配到用户输入的企业名称关键字对应的企业名称,此外,还可以选择多种方式导入批量企业名称关键字,方便快捷的生成用户所需的批量企业名单信息。
如图2所示,在上述图1所示实施例的基础上,其中一些可选的实施方式中,步骤S106可以具体可以包括如下步骤:
S201,响应于企业名称关键词不为企业索引信息,基于预设的分词词典,对企业名称关键词中的分词进行提取,获得企业名称关键词的至少一个分词信息。
S202,基于企业名称关键词的至少一个分词信息,确定企业名称关键词对应的企业名称。
例如,响应于企业名称关键词“北京AABB新能源”不是企业索引信息,利用分词工具和预设的分词词典,对“北京AABB新能源”进行划分获得地域分词“北京”、商号分词“AABB”和行业分词“新能源”,并基于获得的上述分词在索引数据库中进行模糊匹配,确定企业名称为“北京AABB新能源科技技术有限公司”。
如图3所示,在上述图2所示实施例的基础上,其中一些可选的实施方式中,步骤S202具体可以包括如下步骤:
S301,基于企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和至少一个待确定企业名称的匹配度。
其中,可以利用开放搜索平台OpenSearch搜索语句中的文本相关性特征函数text_relevance计算各待确定企业名称的匹配度,该相关性特征函数的计算参数可以包括:企业名称的完整度、命中次数(索引数据库中检索的频率)、分词的顺序等。
S302,基于至少一个待确定企业名称的匹配度,确定企业名称关键词对应的企业名称。
在本公开实施例中将匹配度最高的待确定企业名称确定为企业名称关键词对应的企业名称;或基于至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。
在一个具体的例子中,基于企业名称关键词“华为技术”的分词信息“华为”和“技术”,获得待确定企业名称及匹配度:“华为技术有限公司”95%、“华为软件技术有限公司”80%、“浙江华为技术通信有限公司”75%,将匹配度最高的“华为技术有限公司”确定为“华为技术”对应的企业名称。若该匹配结果不是用户所需的企业名称,则用户需要继续补充企业名称关键词信息进行再次匹配,例如,用户可以补充地域分词“浙江”形成新的企业名称关键词“浙江华为技术”。
此外,本公开实施例还可以将上述各待确定企业名称根据其匹配度的高低进行依次展示,由用户自行选择其需要的企业名称,从而实现企业名称的精准定位。
由此,本公开实施例对于输入不准确或不完整的企业名称可以通过模糊匹配的方式得到最接近的企业名称,并将其作为推荐项,此外,对于企业名称关键词不完全导致的错误匹配,还可以进一步补充修正后再次进行匹配,不仅提高了企业名称的匹配效率和准确率,还提升了用户体验。
此外,本公开实施例还可以通过用户常用组分方式直接获取企业名称,例如,对于用户经常使用的企业名称,可以将其保存在***的“常用组”中,并标记常用组的名称。当该用户需要再次使用常用组中的某一或某些企业名称时,可以直接从常用组中选择企业名称进行添加,也可以添加整个常用组。
本公开实施例提供的任一种企业名称匹配方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种企业名称匹配方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种企业名称匹配方法。下文不再赘述。
图4是本公开一示例性实施例提供的企业名称匹配装置的结构示意图。该测试装置可以设置于终端设备、服务器等电子设备中,执行本公开上述任一实施例的企业名称匹配方法。如图4所示,该企业名称匹配装置包括:
接收模块41,用于接收企业名称请求信息;
第一确定模块42,用于响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称;
第二确定模块43,用于响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称。
基于本公开上述实施例提供的企业名称匹配装置,接收企业名称请求信息;响应于企业名称请求信息为企业索引信息,基于企业索引信息确定企业名称请求信息对应的企业名称;响应于企业名称请求信息不为企业索引信息,基于预设的分词词典确定企业名称请求信息对应的企业名称。由此,本公开实施例可以利用企业索引信息和预设的分词词典快速准确的匹配到用户所需的企业名称,此外,还克服了现有技术中当用户输入不完整企业名称或仅输入企业的项目名称或品牌名称可能出现检索不到对应企业名称或检索到错误企业名称等缺陷。
在其中一些实施方式中,所述第一确定模块42具体用于:响应于所述企业名称关键词为所述企业索引信息,基于所述企业索引信息从索引数据库中获取所述企业名称关键词对应的企业名称。
在其中一些实施方式中,所述第二确定模块43,包括:
获得单元,用于响应于所述企业名称关键词不为企业索引信息,基于预设的分词词典,对所述企业名称关键词中的分词进行提取,获得所述企业名称关键词的至少一个分词信息;
确定单元,用于基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称。
在其中一些实施方式中,所述确定单元,包括:
获得子单元,用于基于所述企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和所述至少一个待确定企业名称的匹配度;
确定子单元,用于基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称。
在其中一些实施方式中,所述确定子单元具体用于:将匹配度最高的待确定企业名称确定为所述企业名称关键词对应的企业名称;或基于至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。。
另外,本公开实施例还提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本公开上述任一实施例所述的企业名称匹配方法。
下面,参考图5来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。图5图示了根据本公开实施例的电子设备的框图。如图5所示,电子设备包括一个或多个处理器51和存储器52。
处理器51可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器52可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器51可以运行所述程序指令,以实现上文所述的本公开的各个实施例的软件程序的企业名称匹配方法以及/或者其他期望的功能。在一个示例中,电子设备还可以包括:输入装置53和输出装置54,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
此外,该输入设备53还可以包括例如键盘、鼠标等等。
该输出装置54可以向外部输出各种信息。该输出设备54可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述各种实施例的软件程序的企业名称匹配方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述各种实施例的软件程序的企业名称匹配方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (14)
1.一种企业名称匹配方法,其特征在于,包括:
接收企业名称请求信息;
响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称;
响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称。
2.根据权利要求1所述的方法,其特征在于,所述企业名称请求信息包括:企业名称关键词或企业名称文件;
其中,所述企业名称文件包括多个企业名称关键词。
3.根据权利要求1或2所述的方法,其特征在于,所述响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称,包括:
响应于所述企业名称关键词为所述企业索引信息,基于所述企业索引信息从索引数据库中获取所述企业名称关键词对应的企业名称。
4.根据权利要求3所述的方法,其特征在于,所述企业索引信息包括以下任意一项或多项:企业名称、企业曾用名称、企业股票简称、企业股票代码、企业项目、企业品牌、以及企业产品。
5.根据权利要求2所述的方法,其特征在于,所述响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称,包括:
响应于所述企业名称关键词不为企业索引信息,基于预设的分词词典,对所述企业名称关键词中的分词进行提取,获得所述企业名称关键词的至少一个分词信息;
基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称。
6.根据权利要求5所述的方法,其特征在于,所述基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称,包括:
基于所述企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和所述至少一个待确定企业名称的匹配度;
基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称。
7.根据权利要求6所述的方法,其特征在于,所述基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称,包括:
将匹配度最高的待确定企业名称确定为所述企业名称关键词对应的企业名称;或
基于所述至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。
8.一种企业名称匹配装置,其特征在于,包括:
接收模块,用于接收企业名称请求信息;
第一确定模块,用于响应于所述企业名称请求信息为企业索引信息,基于所述企业索引信息确定所述企业名称请求信息对应的企业名称;
第二确定模块,用于响应于所述企业名称请求信息不为企业索引信息,基于预设的分词词典确定所述企业名称请求信息对应的企业名称。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块具体用于:响应于所述企业名称关键词为所述企业索引信息,基于所述企业索引信息从索引数据库中获取所述企业名称关键词对应的企业名称。
10.根据权利要求9所述的装置,其特征在于,所述第二确定模块,包括:
获得单元,用于响应于所述企业名称关键词不为企业索引信息,基于预设的分词词典,对所述企业名称关键词中的分词进行提取,获得所述企业名称关键词的至少一个分词信息;
确定单元,用于基于所述企业名称关键词的至少一个分词信息,确定所述企业名称关键词对应的企业名称。
11.根据权利要求10所述的装置,其特征在于,所述确定单元,包括:
获得子单元,用于基于所述企业名称关键词的至少一个分词信息,获得至少一个待确定企业名称和所述至少一个待确定企业名称的匹配度;
确定子单元,用于基于所述至少一个待确定企业名称的匹配度,确定所述企业名称关键词对应的企业名称。
12.根据权利要求11所述的装置,其特征在于,所述确定子单元具体用于:
将匹配度最高的待确定企业名称确定为所述企业名称关键词对应的企业名称;或
基于所述至少一个待确定企业名称的匹配度高低,对至少一个待确定企业名称进行依次展示,由用户确定企业名称关键词对应的企业名称。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的企业名称匹配方法。
14.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的企业名称匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010737249.6A CN111881183A (zh) | 2020-07-28 | 2020-07-28 | 企业名称匹配方法和装置、以及存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010737249.6A CN111881183A (zh) | 2020-07-28 | 2020-07-28 | 企业名称匹配方法和装置、以及存储介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111881183A true CN111881183A (zh) | 2020-11-03 |
Family
ID=73201489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010737249.6A Pending CN111881183A (zh) | 2020-07-28 | 2020-07-28 | 企业名称匹配方法和装置、以及存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881183A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010791A (zh) * | 2021-03-31 | 2021-06-22 | 北京金堤征信服务有限公司 | 搜索结果展示处理方法、装置及计算机可读存储介质 |
CN113836379A (zh) * | 2021-09-26 | 2021-12-24 | 北京百炼智能科技有限公司 | 一种基于客户画像的智能推荐方法和*** |
CN114298038A (zh) * | 2022-03-07 | 2022-04-08 | 北京英视睿达科技股份有限公司 | 企业名称的模糊匹配方法、装置、存储介质及计算机设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002552A1 (en) * | 2000-06-30 | 2002-01-03 | Schultz Troy L. | Method and apparatus for a GIS based search engine utilizing real time advertising |
US6523021B1 (en) * | 2000-07-31 | 2003-02-18 | Microsoft Corporation | Business directory search engine |
JP2004157779A (ja) * | 2002-11-06 | 2004-06-03 | Takamitsu Ishikawa | 企業名称検索システム |
CN101146155A (zh) * | 2007-11-16 | 2008-03-19 | 中国电信股份有限公司 | 一种在语音平台上基于关键词的信息查询方法和*** |
CN106354871A (zh) * | 2016-09-18 | 2017-01-25 | 长城计算机软件与***有限公司 | 一种企业名称的相似性检索方法 |
CN107515904A (zh) * | 2017-07-31 | 2017-12-26 | 北京拉勾科技有限公司 | 一种职位搜索方法和计算设备 |
CN107908684A (zh) * | 2017-10-31 | 2018-04-13 | 北京金堤科技有限公司 | 企业信息搜索方法及装置 |
CN108595435A (zh) * | 2018-05-03 | 2018-09-28 | 鹏元征信有限公司 | 一种机构名称识别处理方法、智能终端及存储介质 |
CN108628943A (zh) * | 2018-03-28 | 2018-10-09 | 北京三快在线科技有限公司 | 一种数据处理方法、装置和电子设备 |
CN109033132A (zh) * | 2018-06-05 | 2018-12-18 | 中证征信(深圳)有限公司 | 利用知识图谱计算文本和主体相关度的方法以及装置 |
CN109800346A (zh) * | 2019-01-11 | 2019-05-24 | 金蝶软件(中国)有限公司 | 文本匹配方法、装置、计算机设备和存储介质 |
CN110413764A (zh) * | 2019-06-18 | 2019-11-05 | 杭州熊猫智云企业服务有限公司 | 基于预建词库的长文本企业名称识别算法 |
CN111008265A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯云计算(北京)有限责任公司 | 企业信息搜索方法及装置 |
-
2020
- 2020-07-28 CN CN202010737249.6A patent/CN111881183A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002552A1 (en) * | 2000-06-30 | 2002-01-03 | Schultz Troy L. | Method and apparatus for a GIS based search engine utilizing real time advertising |
US6523021B1 (en) * | 2000-07-31 | 2003-02-18 | Microsoft Corporation | Business directory search engine |
JP2004157779A (ja) * | 2002-11-06 | 2004-06-03 | Takamitsu Ishikawa | 企業名称検索システム |
CN101146155A (zh) * | 2007-11-16 | 2008-03-19 | 中国电信股份有限公司 | 一种在语音平台上基于关键词的信息查询方法和*** |
CN106354871A (zh) * | 2016-09-18 | 2017-01-25 | 长城计算机软件与***有限公司 | 一种企业名称的相似性检索方法 |
CN107515904A (zh) * | 2017-07-31 | 2017-12-26 | 北京拉勾科技有限公司 | 一种职位搜索方法和计算设备 |
CN107908684A (zh) * | 2017-10-31 | 2018-04-13 | 北京金堤科技有限公司 | 企业信息搜索方法及装置 |
CN108628943A (zh) * | 2018-03-28 | 2018-10-09 | 北京三快在线科技有限公司 | 一种数据处理方法、装置和电子设备 |
WO2019184463A1 (zh) * | 2018-03-28 | 2019-10-03 | 北京三快在线科技有限公司 | 数据处理 |
CN108595435A (zh) * | 2018-05-03 | 2018-09-28 | 鹏元征信有限公司 | 一种机构名称识别处理方法、智能终端及存储介质 |
CN109033132A (zh) * | 2018-06-05 | 2018-12-18 | 中证征信(深圳)有限公司 | 利用知识图谱计算文本和主体相关度的方法以及装置 |
CN109800346A (zh) * | 2019-01-11 | 2019-05-24 | 金蝶软件(中国)有限公司 | 文本匹配方法、装置、计算机设备和存储介质 |
CN110413764A (zh) * | 2019-06-18 | 2019-11-05 | 杭州熊猫智云企业服务有限公司 | 基于预建词库的长文本企业名称识别算法 |
CN111008265A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯云计算(北京)有限责任公司 | 企业信息搜索方法及装置 |
Non-Patent Citations (4)
Title |
---|
HESHAM H. ABDEL GHAFOUR 等: "AEDA: Arabic edit distance algorithm Towards a new approach for Arabic name matching", THE 2011 INTERNATIONAL CONFERENCE ON COMPUTER ENGINEERING & SYSTEMS, 30 January 2012 (2012-01-30), pages 1 - 3 * |
T156XXXX4671: "使用Python完成公司名称和地址的模糊匹配", pages 1, Retrieved from the Internet <URL:https://blog.csdn.net/t15600624671/article/details/74612804> * |
李瑶;周仕洵;: "搜索引擎关键词的选择方法分析", 现代国企研究, no. 12, pages 194 * |
高影繁 等: "一种专利与企业相关性测度方法", 情报学报, no. 12, pages 1268 - 1274 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010791A (zh) * | 2021-03-31 | 2021-06-22 | 北京金堤征信服务有限公司 | 搜索结果展示处理方法、装置及计算机可读存储介质 |
CN113836379A (zh) * | 2021-09-26 | 2021-12-24 | 北京百炼智能科技有限公司 | 一种基于客户画像的智能推荐方法和*** |
CN113836379B (zh) * | 2021-09-26 | 2023-08-25 | 北京百炼智能科技有限公司 | 一种基于客户画像的智能推荐方法和*** |
CN114298038A (zh) * | 2022-03-07 | 2022-04-08 | 北京英视睿达科技股份有限公司 | 企业名称的模糊匹配方法、装置、存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111881183A (zh) | 企业名称匹配方法和装置、以及存储介质和电子设备 | |
CN113204621B (zh) | 文档入库、文档检索方法,装置,设备以及存储介质 | |
CN110377356B (zh) | 任务处理方法、装置、***及计算机可读存储介质 | |
KR20190095099A (ko) | 거래 시스템 에러 검출 방법, 장치, 저장 매체 및 컴퓨터 장치 | |
US20130254193A1 (en) | Distance in Contextual Network Graph | |
US20220121668A1 (en) | Method for recommending document, electronic device and storage medium | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
CN107748772B (zh) | 一种商标识别方法及装置 | |
CN113221036B (zh) | 电子票据邮件的处理方法及装置 | |
US8862609B2 (en) | Expanding high level queries | |
CN112395517A (zh) | 房源搜索展示方法、装置及计算机可读存储介质 | |
CN114743012B (zh) | 一种文本识别方法及装置 | |
US9563675B2 (en) | Identifying search matches and altered search results | |
CN112148939A (zh) | 数据处理方法、装置及电子设备 | |
WO2016088217A1 (ja) | 入力装置、フォーム入力方法、記録媒体およびプログラム | |
CN111144122A (zh) | 评价处理方法、装置和计算机***及介质 | |
US20140289636A1 (en) | Information displaying method and apparatus | |
CN111581950B (zh) | 同义名称词的确定方法和同义名称词的知识库的建立方法 | |
CN114048315A (zh) | 确定文档标签的方法、装置、电子设备和存储介质 | |
CN113779362A (zh) | 数据搜索方法及装置 | |
CN113656538A (zh) | 生成正则表达式的方法、装置、计算设备及存储介质 | |
CN113191777A (zh) | 风险识别方法和装置 | |
CN110309103B (zh) | 一种文档打开方法、装置、电子设备和可读存储介质 | |
CN111125322A (zh) | 信息搜索方法和装置、电子设备和存储介质 | |
CN110597967B (zh) | 订单定位方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |