CN111930899A - 一种关键词处理方法及***、关键词搜索方法 - Google Patents

一种关键词处理方法及***、关键词搜索方法 Download PDF

Info

Publication number
CN111930899A
CN111930899A CN202011024683.6A CN202011024683A CN111930899A CN 111930899 A CN111930899 A CN 111930899A CN 202011024683 A CN202011024683 A CN 202011024683A CN 111930899 A CN111930899 A CN 111930899A
Authority
CN
China
Prior art keywords
keyword
keywords
state
updating
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011024683.6A
Other languages
English (en)
Other versions
CN111930899B (zh
Inventor
丁明会
刘龙均
周小辉
许杰
吴桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN202011024683.6A priority Critical patent/CN111930899B/zh
Publication of CN111930899A publication Critical patent/CN111930899A/zh
Application granted granted Critical
Publication of CN111930899B publication Critical patent/CN111930899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种关键词处理方法及***、关键词搜索方法,包括以下步骤:按照关键词的优先级对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。本发明的关键词搜索方法,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。

Description

一种关键词处理方法及***、关键词搜索方法
技术领域
本发明涉及大数据处理技术领域,特别涉及一种关键词处理方法及***、关键词搜索方法。
背景技术
随着大数据技术的发展,关键词数量数以亿计,并且会定时定量更新相关内容。各企业单位会面对大量关键词,要保证各企业单位所搜集采集的大数据为最新的数据,才能开展有效的业务需求,那么就需要及时对大数据进行搜索和采集的管理。
由于关键词的数量非常庞大,传统对关键词的管理方案存在反复搜索、无效搜索等问题,则会导致搜索不及时、搜索遗漏,从而降低了对关键词的搜索或使用效率。因此,如何提高关键词的搜索效率是本研究的重点。本研究由国家重点研发计划资助,课题编号:2019YFC0850103。
发明内容
本发明的目的在于解决传统方案的存在反复搜索、无效搜索导致搜索效率低的问题,提供一种关键词处理方法及***、关键词搜索方法。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
一种关键词处理方法及***、关键词搜索方法,包括以下步骤:
按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;
将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。
本方案对关键词赋予标记字段,形成关键词的更新状态,便于后期使用者能够按照标记字段对关键词的相关内容进行搜索和使用;按照关键词的标记字段对关键词进行扫描,比如将标记字段中的更新时间作为优先级时,则可以根据更新时间的先后,对关键词进行扫描,这样可以保证对关键词进行扫描时,不出现搜索遗漏的问题,同时也可以提高搜索效率,也可以使用其他的标记字段作为优先级对关键词进行扫描;对关键词进行搜索后,将得到的状态结果返回关键词库,进行相当于标记的处理,可以避免对关键词的反复搜索,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。
所述对关键词库中的关键词被赋予标记字段后,将关键词转换为结构数据;所述结构数据包括关键词字段名、数据类型、描述、备注;形成的所述更新状态包括关键词的入库时间、更新时间、更新失败时间。
本方案对关键词赋予的标记字段,以及形成的更新状态可以为后续使用者进行搜索或使用时提供便利,并且更新状态中的入库时间、更新时间、更新失败时间还可以作为一种对关键词更新状态的标记处理,根据关键词的更新状态,就可以知道该关键词是否进行过搜索,以保证关键词搜索不反复进行。
所述对关键词库中的关键词赋予标记字段的步骤之前,还包括步骤:获取原始数据,对获取的原始数据进行预处理,过滤无效数据,补充缺失字段的数据;将进行预处理后的数据作为关键词加入关键词库。
本方案为建立关键词库的步骤,入库的关键词都要经过预处理,避免对无效数据进行搜索,进而降低搜索成本。
所述将消息队列中的关键词发送至业务端进行搜索,得到状态结果的步骤,包括:
按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果;所述搜索正常的状态结果包括关键词内容已更新或关键词内容未更新。
所述将状态结果返回关键词库,以更新关键词的更新状态的步骤,包括:
若状态结果为搜索正常,则该关键词在关键词库中的更新状态进行更新,包括该关键词的更新时间;
若状态结果为搜索异常,则将搜索异常的状态结果返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间;
若状态结果为超时未返回,则提高超时未返回的状态结果的关键词优先级,对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间,不再对该关键词进行搜索。
一种关键词搜索方法,包括:
按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,并将状态结果返回关键词库。
一种关键词处理***,包括:
关键词库,用于存储关键词,以及关键词对应的标记字段和更新状态;
词库服务器,用于对关键词库中的关键词赋予标记字段,并形成关键词的更新状态,以及按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;
消息队列,用于存放词库服务器扫描的关键词;
业务端,用于对消息列表中的关键词进行搜索,并将得到的状态结果返回关键词库,以更新关键词的更新状态。
所述词库服务器用于对关键词赋予标记字段,将关键词转换为结构数据,所述结构数据包括关键词字段名、数据类型、描述、备注;以及形成的更新状态包括关键词的入库时间、更新时间、更新失败时间。
还包括关键词预处理模块,用于获取原始数据,并对获取的原始数据进行预处理后作为关键词加入关键词库;所述预处理包括过滤无效的数据、补充缺失字段的数据。
所述业务端根据关键词的标记字段对消息列表中的关键词进行搜索后得到的状态结果包括:搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,所述搜索正常的状态结果包括关键词内容已更新或关键内容未更新。
若业务端对关键词进行搜索后,状态结果为搜索正常,则将搜索正常的状态结果返回关键词库,词库服务器对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新时间;
若业务端对关键词进行搜索后,状态结果为搜索异常,则将搜索异常的状态结果返回关键词库,词库服务器对该关键词的状态结果进行异常排查,并对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间;
若业务端对关键词进行搜索后,状态结果为超时未返回,则将超时未返回的状态结果返回关键词库,词库服务器提高该关键词的优先级,业务端对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则词库服务器对该关键词的状态结果进行异常排查,并对该关键词在关键词库中的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间,且不再将该关键词发送到业务端进行搜索。
与现有技术相比,本发明的有益效果:
本发明的关键词搜索方法,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明提升关键词搜索效率的方法流程图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本发明通过下述技术方案实现,如图1所示,一种关键词处理方法,包括以下步骤:
步骤S1:对关键词库中的关键词赋予标记字段,并形成关键词的更新状态。
首先获取大量的原始数据,对获取的这些原始数据进行预处理,预处理包括过滤掉无效的数据,补充缺失字段的数据等。比如现获取的原始数据如表1所示:
A有限公司,,91420*******FJJ90L
B有限公司,湖北,9142112
C有限公司,湖北,91422*******FJ3Q8Q
张三
表1
从表1中获取的原始数据可以看出,第一条数据缺失归属地,第二条数据的机构代码错误,第四条数据无效。因此要对获取的原始数据进行预处理,预处理后的数据如表2所示:
A有限公司,湖北,91420*******FJJ90L
B有限公司,湖北,
C有限公司,湖北,91422*******FJ3Q8Q
表2
对大量的原始数据进行预处理后,作为大量的关键词加入关键词库,然后对关键词赋予标记字段,将关键词转换为结构数据。比如对某一企业名称为“D劳务有限责任公司”的关键词赋予标记字段后,则形成了如表3所示的结构数据:
字段名 数据类型 描述 备注
region_code integer 区域代码,如:540102 区分省份
enterprise_status byte 登记状态,如:1(存续) 区分登记状态
enterprise_type short 企业类型,如:1130(有限责任公司) 区分且有类型
company_name text 公司名,如:D劳务有限责任公司
company_creditcode keyword 统一社会信用代码,如:91540*******F6CJ4J
company_regno keyword 注册号,如:542*****00322
_id text 唯一ID,标记关键词唯一性
enabled boolean 关键词使用标志。True/False:激活/禁用
seed_from byte 关键词来源。如:9(CC蔓延) 区分关键词来源
seed_crawler join 文档类型 父文档-子文档关系是一对多的关系。一个关键词可以被多个爬虫使用,因此可以拥有多个子文档。
crawler_id keyword 爬虫ID,如:qyxx_data__sichuan 爬虫唯一ID,bbd_table__bbd_type
create_time date 爬虫和关键词关联时间
lastest_inqueue_time date 关键词灌入时间
lastest_update_time date 关键词对应信息更新时间
lastest_nc_time date 关键词无搜索结果时间
latest_dpfail_time date 关键词对应数据清洗入库失败时间  
表3
根据形成的结构数据可以进一步形成该关键词的更新状态,比如该关键词的更新状态可以包括该关键词的入库时间(关键词灌入时间)、更新时间(关键词对应信息更新时间)、更新失败时间(关键词无搜索结果时间)。那么使用者根据关键词的标记字段或更新状态,即可对关键词的内容进行搜索或使用。
步骤S2:按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列。
由于关键词库中的关键词数量非常的庞大,业务端无法做到一次就完成所有关键词的搜索,因此可以对关键词设置优先级,按照关键词的优先级进行搜索,可以将关键词的某一标记字段作为优先级,比如将更新时间作为优先级时,则可以按照关键词的更新时间依次对所有关键词进行扫描,这样就不会遗漏关键词。
假设按照关键词的优先级一次可以扫描一万个关键词,但一万个关键词的数量还是比较庞大,因此又从扫描的这一万个关键词中提取部分发送至消息队列。消息队列是属于业务端的一个功能模块,由于其容量有限,所以按照设定可以提取容量范围内的关键词放入消息队列进行后续的搜索。
步骤S3:将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。
根据关键词的标记字段优先级对消息队列中的关键词依次或同时在业务端进行搜索,比如以机构代码作为优先级进行搜索,若该标记字段缺失,则会用公司名称在百度百科或工商行政网等网站上进行搜索。搜索的目的是为了经过搜索后得知该关键词在关键词库中的信息是否是最新的,以及对更新了的关键词打一个标记,这个标记就是该关键词的更新状态,比如该关键词的更新时间等。
进行关键词的搜索后,会存在搜索正常、搜索异常以及超时未返回三种状态结果,其中搜索正常的状态结果是该关键词从网站返回结果,无论结果和历史结果对比有无更新。比如某企业A的名称作为关键词进行搜索时,业务端得到有无搜索结果,词库服务器获取反馈后相应地对该关键词的更新状态进行更新,比如对该关键词的搜索发生在2020年6月21日15点21分,则将该关键词的更新时间改为2020年6月21日15点21分,以达到对更新的关键词打一个标记的目的。
但并不是对所有的关键词进行搜索时都能返回该关键词的相应内容,比如返回的结果为“error”时,则为搜索异常的状态结果,得不到任何的相应内容。此时则需要将搜索异常的状态结果返回关键词进行异常排查,并对该关键词在关键词库中的更新状态进行更新,比如本次搜索发生在2020年8月21日16点40分,则将该关键词的更新失败时间记录为2020年8月21日16点40分,以达到对更新的关键词打一个标记的目的。
如果搜索后的状态结果为超时未返回,则提高该关键词的优先级,对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间,不再对该关键词进行搜索。
本方案不对状态结果为搜索异常的关键词进行怎样的异常排查进行具体限定和保护,依据各使用者所属的技术可以进行不同的异常排查方式。
基于上述处理方法,本方案还提出一种关键词搜索方法,包括:按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,所述搜索正常的状态结果包括关键词内容已更新或关键词内容未更新,并将状态结果返回关键词库。
基于上述处理、搜索方法,本方案还提出一种关键词处理***,包括:
爬取模块,用于获取原始数据,并对获取的原始数据进行预处理后作为关键词加入关键词库;所述预处理包括过滤无效的数据、补充缺失字段的数据;
关键词库,用于存储关键词,以及关键词对应的标记字段和更新状态;
词库服务器,用于对关键词库中的关键词赋予标记字段,并形成关键词的更新状态,以及按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;
消息队列,用于存放词库服务器扫描的关键词;
业务端,用于对消息列表中的关键词进行搜索,并将得到的状态结果返回关键词库,以更新关键词的更新状态。
更进一步地,所述词库服务器用于对关键词赋予标记字段,将关键词转换为结构数据,所述结构数据包括关键词字段名、数据类型、描述、备注;以及形成的更新状态包括关键词的入库时间、更新时间、更新失败时间。
所述业务端根据关键词的标记字段对消息列表中的关键词进行搜索后得到的状态结果包括:搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,所述搜索正常的状态结果包括关键词内容已更新或关键内容未更新。
若业务端对关键词进行搜索后,状态结果为搜索正常,则将搜索正常的状态结果返回关键词库,词库服务器对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新时间;
若业务端对关键词进行搜索后,状态结果为搜索异常,则将搜索异常的状态结果返回关键词库,词库服务器对该关键词的状态结果进行异常排查,并对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间;
若业务端对关键词进行搜索后,状态结果为超时未返回,则将超时未返回的状态结果返回关键词库,词库服务器提高该关键词的优先级,业务端对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则词库服务器对该关键词的状态结果进行异常排查,并对该关键词在关键词库中的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间,且不再将该关键词发送到业务端进行搜索。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种关键词处理方法,其特征在于:包括以下步骤:
按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;
将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。
2.根据权利要求1所述的一种关键词处理方法,其特征在于:所述对关键词库中的关键词被赋予标记字段后,将关键词转换为结构数据;所述结构数据包括关键词字段名、数据类型、描述、备注;形成的所述更新状态包括关键词的入库时间、更新时间、更新失败时间。
3.根据权利要求1所述的一种关键词处理方法,其特征在于:所述对关键词库中的关键词赋予标记字段的步骤之前,还包括步骤:获取原始数据,对获取的原始数据进行预处理,过滤无效数据,补充缺失字段的数据;将进行预处理后的数据作为关键词加入关键词库。
4.根据权利要求2所述的一种关键词处理方法,其特征在于:所述将消息队列中的关键词发送至业务端进行搜索,得到状态结果的步骤,包括:
按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果;所述搜索正常的状态结果包括关键词内容已更新或关键词内容未更新。
5.根据权利要求4所述的一种关键词处理方法,其特征在于:所述将状态结果返回关键词库,以更新关键词的更新状态的步骤,包括:
若状态结果为搜索正常,则该关键词在关键词库中的更新状态进行更新,包括该关键词的更新时间;
若状态结果为搜索异常,则将搜索异常的状态结果返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间;
若状态结果为超时未返回,则提高超时未返回的状态结果的关键词优先级,对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间,不再对该关键词进行搜索。
6.一种关键词搜索方法,其特征在于:包括:
按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,并将状态结果返回关键词库。
7.一种关键词处理***,其特征在于:包括:
关键词库,用于存储关键词,以及关键词对应的标记字段和更新状态;
词库服务器,用于对关键词库中的关键词赋予标记字段,并形成关键词的更新状态,以及按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;
消息队列,用于存放词库服务器扫描的关键词;
业务端,用于对消息列表中的关键词进行搜索,并将得到的状态结果返回关键词库,以更新关键词的更新状态。
8.根据权利要求7所述的一种关键词处理***,其特征在于:所述词库服务器用于对关键词赋予标记字段,将关键词转换为结构数据,所述结构数据包括关键词字段名、数据类型、描述、备注;以及形成的更新状态包括关键词的入库时间、更新时间、更新失败时间。
9.根据权利要求8所述的一种关键词处理***,其特征在于:还包括爬取模块,用于获取原始数据,并对获取的原始数据进行预处理后作为关键词加入关键词库;所述预处理包括过滤无效的数据、补充缺失字段的数据。
10.根据权利要求9所述的一种关键词处理***,其特征在于:所述业务端根据关键词的标记字段对消息列表中的关键词进行搜索后得到的状态结果包括:搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,所述搜索正常的状态结果包括关键词内容已更新或关键内容未更新。
CN202011024683.6A 2020-09-25 2020-09-25 一种关键词处理方法及***、关键词搜索方法 Active CN111930899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024683.6A CN111930899B (zh) 2020-09-25 2020-09-25 一种关键词处理方法及***、关键词搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024683.6A CN111930899B (zh) 2020-09-25 2020-09-25 一种关键词处理方法及***、关键词搜索方法

Publications (2)

Publication Number Publication Date
CN111930899A true CN111930899A (zh) 2020-11-13
CN111930899B CN111930899B (zh) 2021-04-09

Family

ID=73334783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024683.6A Active CN111930899B (zh) 2020-09-25 2020-09-25 一种关键词处理方法及***、关键词搜索方法

Country Status (1)

Country Link
CN (1) CN111930899B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342866A (zh) * 2021-06-22 2021-09-03 广州华多网络科技有限公司 关键词更新方法、装置、计算机设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1498379A (zh) * 2001-03-21 2004-05-19 因特国风网络软件有限公司 个人及商业的网络名片***及方法
CN101192221A (zh) * 2006-11-27 2008-06-04 北京三星通信技术研究有限公司 黄页搜索方法和黄页***
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端
CN103064852A (zh) * 2011-10-20 2013-04-24 阿里巴巴集团控股有限公司 网站统计信息处理方法及***
CN103841123A (zh) * 2012-11-20 2014-06-04 中国电信股份有限公司 号码信息获取方法和获取***、云端号码信息***
CN106021439A (zh) * 2016-05-16 2016-10-12 腾讯科技(深圳)有限公司 一种对通信号码的处理方法及装置
CN106708821A (zh) * 2015-07-21 2017-05-24 广州市本真网络科技有限公司 基于用户个性化购物行为进行商品推荐的方法
CN107463616A (zh) * 2017-07-03 2017-12-12 上海凡响网络科技有限公司 一种企业信息分析方法及***
CN107609921A (zh) * 2017-09-30 2018-01-19 金蝶软件(中国)有限公司 一种数据处理方法及服务器
CN107657057A (zh) * 2017-10-19 2018-02-02 河北省科学院应用数学研究所 一种企业征信信息融合图形化方法
CN108062326A (zh) * 2016-11-08 2018-05-22 北京国双科技有限公司 一种数据信息的更新记录方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1498379A (zh) * 2001-03-21 2004-05-19 因特国风网络软件有限公司 个人及商业的网络名片***及方法
CN101192221A (zh) * 2006-11-27 2008-06-04 北京三星通信技术研究有限公司 黄页搜索方法和黄页***
CN101853308A (zh) * 2010-06-11 2010-10-06 中兴通讯股份有限公司 一种个性化元搜索的方法及其应用终端
CN103064852A (zh) * 2011-10-20 2013-04-24 阿里巴巴集团控股有限公司 网站统计信息处理方法及***
CN103841123A (zh) * 2012-11-20 2014-06-04 中国电信股份有限公司 号码信息获取方法和获取***、云端号码信息***
CN106708821A (zh) * 2015-07-21 2017-05-24 广州市本真网络科技有限公司 基于用户个性化购物行为进行商品推荐的方法
CN106021439A (zh) * 2016-05-16 2016-10-12 腾讯科技(深圳)有限公司 一种对通信号码的处理方法及装置
CN108062326A (zh) * 2016-11-08 2018-05-22 北京国双科技有限公司 一种数据信息的更新记录方法及装置
CN107463616A (zh) * 2017-07-03 2017-12-12 上海凡响网络科技有限公司 一种企业信息分析方法及***
CN107609921A (zh) * 2017-09-30 2018-01-19 金蝶软件(中国)有限公司 一种数据处理方法及服务器
CN107657057A (zh) * 2017-10-19 2018-02-02 河北省科学院应用数学研究所 一种企业征信信息融合图形化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342866A (zh) * 2021-06-22 2021-09-03 广州华多网络科技有限公司 关键词更新方法、装置、计算机设备及存储介质
CN113342866B (zh) * 2021-06-22 2022-06-21 广州华多网络科技有限公司 关键词更新方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111930899B (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CA2610208C (en) Learning facts from semi-structured text
US20040230566A1 (en) Web-based customized information retrieval and delivery method and system
US8812515B1 (en) Processing contact information
Zhang et al. Attribute reduction theory and approach to concept lattice
CN102521734B (zh) 在基于对话的电子邮件***中显示扩展的消息
JP2718881B2 (ja) トークン識別システム
US20020052928A1 (en) Computer method and apparatus for collecting people and organization information from Web sites
CN103678494A (zh) 客户端同步服务端数据的方法及装置
US20080147588A1 (en) Method for discovering data artifacts in an on-line data object
US20080147641A1 (en) Method for prioritizing search results retrieved in response to a computerized search query
US20110093434A1 (en) Method and system for searching documents in local area network
CN103190123A (zh) 用于分发发布的消息的方法和装置
CN111191111A (zh) 内容推荐方法、装置及存储介质
CN111930899B (zh) 一种关键词处理方法及***、关键词搜索方法
EP2778978A1 (en) Scoring of interrelated message elements
CN115687787A (zh) 产业政策目标群画像构建方法、***及存储介质
US20090164430A1 (en) System and method for acquiring contact information
CN107291938B (zh) 订单查询***及方法
CN109145092B (zh) 一种数据库更新、智能问答管理方法、装置及其设备
CN116303628B (zh) 基于Elasticsearch的告警数据查询方法、***及设备
CN116127047B (zh) 企业信息库的建立方法与装置
US20170242836A1 (en) Architecture, system and method for storing files and data in organized grid format
CN108595450B (zh) 一种埋点数据库构建方法、埋点数据库及埋点查询方法
US8805820B1 (en) Systems and methods for facilitating searches involving multiple indexes
Brauner et al. An Instance-based Approach for Matching Export Schemas of Geographical Database Web Services.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant