CN103530347A - 一种基于大数据挖掘的互联网资源质量评估方法及*** - Google Patents

一种基于大数据挖掘的互联网资源质量评估方法及*** Download PDF

Info

Publication number
CN103530347A
CN103530347A CN201310467352.3A CN201310467352A CN103530347A CN 103530347 A CN103530347 A CN 103530347A CN 201310467352 A CN201310467352 A CN 201310467352A CN 103530347 A CN103530347 A CN 103530347A
Authority
CN
China
Prior art keywords
data
quality
index
internet resources
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310467352.3A
Other languages
English (en)
Other versions
CN103530347B (zh
Inventor
刘岩松
徐信信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING NETEAST TECHNOLOGIES Co Ltd
Original Assignee
BEIJING NETEAST TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING NETEAST TECHNOLOGIES Co Ltd filed Critical BEIJING NETEAST TECHNOLOGIES Co Ltd
Priority to CN201310467352.3A priority Critical patent/CN103530347B/zh
Publication of CN103530347A publication Critical patent/CN103530347A/zh
Application granted granted Critical
Publication of CN103530347B publication Critical patent/CN103530347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于大数据挖掘的互联网资源质量评估方法及***,所述方法包含:步骤101)采集互联网数据,采用抽样或随机的方式得到海量样本数据;步骤102)通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;步骤103)使用K-Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数;步骤104)依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型;步骤105)基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果。本发明的技术方案可以为网络运营商和ICP运营商提高用户感知质量提供数据决策支持完善和健全的质量评分模型,使得最终数据的质量分数更加准确。

Description

一种基于大数据挖掘的互联网资源质量评估方法及***
技术领域
本发明属于互联网质量分析领域,具体涉及一种基于大数据挖掘的互联网资源质量评估方法及***。
背景技术
目前,大多数移动运营商和ICP厂商为了解决因互联网资源数量多且复杂而带来的无法确定其数据质量情况的问题,大部分采用抽取少量样本数据进行分析其质量情况的好坏,并且只能给出资源的质量的等级或专家预测的分数,不能给出一个合理的精确的分数,其分析结果并不能真正反应其资源的质量情况,也有一部分厂商采用基于大量进行的数据挖掘,但是其处理周期较长、效率低、成本高、复杂度高,如果过程中有失误和纰漏将重新进行处理,大大增加了处理周期和成本。
发明内容
本发明的目的在于,解决因互联网资源数据量多且复杂而带来的无法确定其数据质量情况问题,从而提供一种基于大数据挖掘的互联网资源质量评估方法。
为实现上述目的,本发明提供了一种基于大数据挖掘的互联网资源质量评估方法,所述方法包含:
步骤101)采集互联网数据,采用抽样或随机的方式得到海量样本数据;
步骤102)通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;
步骤103)使用K-Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数,所述指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
步骤104)依据得到的及格值和刻度进行网络资源质量评估;
其中,所述DNS解析时间、TCP建链时间、第一字节时间以及剩余时间均以秒为单位。
上述步骤102)进一步包含:
步骤102-1)依据互联网资源质量评估相关指标项,选取所需的数据,并将选取的数据整合成用于数据挖掘的数据集,所述相关指标包含DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
步骤102-2)基于数据集通过清理和归约操作,生成供挖掘核心使用的目标数据。
上述步骤103)进一步包含:
步骤103-1)从n个数据对象中,任意选择k个对象作为初始聚类中心;而对于所剩下其它数据对象,根据剩余数据对象与这些初始聚类中心的相似度,分别将剩余数据对象中的每一个数据对象分配至与数据对象最相似的某个初始聚类中心中;
步骤103-2)计算每个所获新聚类的聚类中心,不断重复这一过程直到标准测度函数开始收敛为止,得到及格值和刻度值,所述及格值为标准测度函数开始收敛为止所对应的聚类中心的重心点,所述刻度值为标准测度函数开始收敛为止所对应的聚类中心的半径与某一设定值的商,所述设定值的取值范围为:0-100;
步骤103-3)基于得到的及格值和刻度值得到各指标的分数,公式为:
各指标的分数=阈值-(指标项-及格值)/刻度;
其中,指标项的取值为对互联网资源进行质量评估而采集的实际的各指标项的数值大小,该指标项的数值大小是由专门的互联网资源质量探测***采集获得,所述指标项包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;所述阈值的大小与计算指标分数时采用的分制相关,具体为该阈值为满分的百分之六十,即当采用百分制时该处的阈值为60,当采用150分值时该处固定值为90。
上述技术方案中,数据对象与聚类中心的相似度通过数据对象与聚类中心的距离进行衡量;所述新聚类的聚类中心是指该聚类中心所包含的所有数据对象的均值。
上述标准测度函数采用均方差。
上述步骤104)进一步包含:
步骤104-1)依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型,并设定质量评估模型中各指标的权重值;
步骤104-2)基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果。
上述步骤104-1)采用如下质量评估模型得出互联网资源质量的评分:
最终得分=DNS解析分数S1*DNS解析权重W1+TCP建链分数S2*TCP建链权重W2+第一字节S3*第一字节权重W3+剩余字节分数S4*剩余字节权重W4;
其中,DNS解析权重S1、TCP建链权重W2、第一字节权重W3和剩余字节权重W4是设置的各指标的权重值,这些权重值均是个百分数,且四个权重值之和为百分之一百。
为了实现上述方法,本发明还提供了一种基于大数据挖掘的互联网资源数据质量评估***,其特征在于,所述***包含:
获取样本数据的模块,用于采集互联网数据,得到样本数据;
样本数据预处理模块,用于通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;
指标分数获取模块,用于使用K-Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数,所述指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
质量评估模型设计模块,用于依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型,所述相关指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;
评估结果计算输出模块,用于基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果;
其中,所述DNS解析时间、TCP建链时间、第一字节时间以及剩余时间均以秒为单位。
上述样本数据预处理模块进一步包含:数据集获取子模块,用于依据互联网资源质量评估指标相关性,从样本数据中选取所需的数据,并将选取的数据整合成用于数据挖掘的数据集;
目标数据获取子模块,用于基于数据集通过清理和归约操作,生成供挖掘核心使用的目标数据。
上述指标分数获取模块进一步包含:
初始聚类中心及新聚类生成子模块,用于从海量样本数据中,任意选择k个对象作为初始聚类中心;而对于所剩下其它数据对象,根据剩余数据对象与这些初始聚类中心的相似度,分别将剩余数据对象中的每一个数据对象分配至与数据对象最相似的初始聚类中心中,得到各初始聚类对应的新聚类;
及格值和刻度值获取子模块,用于计算每个所获新聚类的聚类中心,不断重复这一过程直到标准测度函数开始收敛为止,得到及格值和刻度值,所述及格值为标准测度函数开始收敛为止所对应的某个新聚类的聚类中心的重心点,所述刻度值为标准测度函数开始收敛为止所对应的某个新聚类的聚类中心的半径与某一固定值的商,所述固定值的取值范围为:0-100;
指标分数获取子模块,用于基于得到的及格值和刻度值得到各指标的分数,公式为:
各指标的分数=阈值-(指标项-及格值)/刻度;
其中,指标项的取值为各指标项的数值,该数值是由对互联网资源进行质量拨测得来,所述指标项包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;所述阈值的大小与计算指标分数时采用的分制相关,具体为该阈值为满分的的百分之六十,即当采用百分制时该处的阈值为60,当采用150分值时该处固定值为90。
与现有技术相比,本发明的技术优势在于:本发明技术方案充分利用了基于大数据的数据学习和挖掘以及数据建模技术,能够更加快速高效的对海量样本数据进行数据挖掘,完善和健全的质量评分模型使得最终数据的质量分数更加准确,为移动运营商和ICP厂商提高用户感知质量提供数据决策支持。总之本发明的技术方案可以有效解决互联网资源大量数据确定其质量情况问题。
附图说明
图1本发明提供基于大数据挖掘的互联网资源质量评估方法的流程图。
具体实施方式
下面结合实施例对本发明的技术方案进行详细阐述。
如图1所示,本发明提供了一种缓解互联网资源无法确定其质量的方法,该方法用于互联网资源大量数据的情况给出其数据的质量评分,所述方法包含:
步骤101)准备大量的原始样本数据,至少五百万条数据;
步骤102)通过数据挖掘,对样本数据去除数据噪点,使数据具有平华性;
步骤103)使用K-Means算法得出数据的及格值和刻度,从而确定数据的各指标分数;
步骤104)确定其质量评分模型;
步骤105)通过质量评分模型确定互联网资源的质量评分。
实施例
以某省某电信运营商互联网资源管理平台为例:
首先,对该省所关注的重点网站的大约1000W域名进行质量情况的探测,获得大约1000万的采样数据,其次,对采样数据进行数据挖掘去除噪点,使得数据更具有平滑性,再次,使用K-Means算法结合数据质量模型获得域名质量相关的指标的刻度和及格值,最后,使用质量评分方法和评分模型获得域名的最终质量分数,该运营商使用该专利后,可以很精确的获得该省的域名质量情况,为该运营商后续的进行资源引入和资源调度提供数据支持,大大的提升了本省用户的感知质量,为该运营商节省了大量的成本的同时,也获得更高的用户满意度。
综上所述,本发明采用以上方法后,可以对互联网上的任意网站或域名的质量情况进行评估,并能给出具体的质量分数,为网络运营商和ICP运营商提高用户感知质量提供数据决策支持,本发明充分利用了基于大数据的数据学习和挖掘以及数据建模技术,能够更加快速高效的对海量样本数据进行数据挖掘,完善和健全的质量评分模型使得最终数据的质量分数更加准确。
以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于大数据挖掘的互联网资源质量评估方法,所述方法包含:
步骤101)采集互联网数据,采用抽样或随机的方式得到海量样本数据;
步骤102)通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;
步骤103)使用K-Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数,所述指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
步骤104)依据得到的及格值和刻度进行网络资源质量评估;
其中,所述DNS解析时间、TCP建链时间、第一字节时间以及剩余时间均以秒为单位。
2.根据权利要求1所述的基于大数据挖掘的互联网资源质量评估方法,其特征在于,所述步骤102)进一步包含:
步骤102-1)依据互联网资源质量评估相关指标项,选取所需的数据,并将选取的数据整合成用于数据挖掘的数据集,所述相关指标包含DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
步骤102-2)基于数据集通过清理和归约操作,生成供挖掘核心使用的目标数据。
3.根据权利要求1所述的基于大数据挖掘的互联网资源质量评估方法,其特征在于,所述步骤103)进一步包含:
步骤103-1)从n个数据对象中,任意选择k个对象作为初始聚类中心;而对于所剩下其它数据对象,根据剩余数据对象与这些初始聚类中心的相似度,分别将剩余数据对象中的每一个数据对象分配至与数据对象最相似的某个初始聚类中心中;
步骤103-2)计算每个所获新聚类的聚类中心,不断重复这一过程直到标准测度函数开始收敛为止,得到及格值和刻度值,所述及格值为标准测度函数开始收敛为止所对应的聚类中心的重心点,所述刻度值为标准测度函数开始收敛为止所对应的聚类中心的半径与某一设定值的商,所述设定值的取值范围为:0-100;
步骤103-3)基于得到的及格值和刻度值得到各指标的分数,公式为:
各指标的分数=阈值-(指标项-及格值)/刻度;
其中,指标项的取值为对互联网资源进行质量评估而采集的实际的各指标项的数值大小,该指标项的数值大小是由专门的互联网资源质量探测***采集获得,所述指标项包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;所述阈值的大小与计算指标分数时采用的分制相关,具体为该阈值为满分的百分之六十,即当采用百分制时该处的阈值为60,当采用150分值时该处固定值为90。
4.根据权利要求3所述的基于大数据挖掘的互联网资源质量评估方法,其特征在于,
数据对象与聚类中心的相似度通过数据对象与聚类中心的距离进行衡量;
所述新聚类的聚类中心是指该聚类中心所包含的所有数据对象的均值。
5.根据权利要求3所述的基于大数据挖掘的互联网资源质量评估方法,其特征在于,所述标准测度函数采用均方差。
6.根据权利要求1所述的直观显示互联网资源质量评分的方法,其特征在于,所述步骤104)进一步包含:
步骤104-1)依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型,并设定质量评估模型中各指标的权重值;
步骤104-2)基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果。
7.根据权利要求6所述的直观显示互联网资源质量评分的方法,其特征在于,所述步骤104-1)采用如下质量评估模型得出互联网资源质量的评分:
最终得分=DNS解析分数S1*DNS解析权重W1+TCP建链分数S2*TCP建链权重W2+第一字节S3*第一字节权重W3+剩余字节分数S4*剩余字节权重W4;
其中,DNS解析权重S1、TCP建链权重W2、第一字节权重W3和剩余字节权重W4是设置的各指标的权重值,这些权重值均是个百分数,且四个权重值之和为百分之一百。
8.一种基于大数据挖掘的互联网资源数据质量评估***,其特征在于,所述***包含:
获取样本数据的模块,用于采集互联网数据,得到样本数据;
样本数据预处理模块,用于通过数据挖掘去除样本数据的噪声点,使样本数据具有平滑性;
指标分数获取模块,用于使用K-Means算法得出样本数据的及格值和刻度,从而确定样本数据的若干指标的分数,所述指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余时间;
质量评估模型设计模块,用于依据互联网资源质量评估的相关指标,确定互联网资源的质量评估模型,所述相关指标包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;
评估结果计算输出模块,用于基于得到的各指标的分数和质量评估模型,确定互联网资源质量的评估结果;
其中,所述DNS解析时间、TCP建链时间、第一字节时间以及剩余时间均以秒为单位。
9.根据权利要求8所述的基于大数据挖掘的互联网资源数据质量评估***,其特征在于,所述样本数据预处理模块进一步包含:数据集获取子模块,用于依据互联网资源质量评估指标相关性,从样本数据中选取所需的数据,并将选取的数据整合成用于数据挖掘的数据集;
目标数据获取子模块,用于基于数据集通过清理和归约操作,生成供挖掘核心使用的目标数据。
10.根据权利要求8所述的基于大数据挖掘的互联网资源数据质量评估***,其特征在于,所述指标分数获取模块进一步包含:
初始聚类中心及新聚类生成子模块,用于从海量样本数据中,任意选择k个对象作为初始聚类中心;而对于所剩下其它数据对象,根据剩余数据对象与这些初始聚类中心的相似度,分别将剩余数据对象中的每一个数据对象分配至与数据对象最相似的初始聚类中心中,得到各初始聚类对应的新聚类;
及格值和刻度值获取子模块,用于计算每个所获新聚类的聚类中心,不断重复这一过程直到标准测度函数开始收敛为止,得到及格值和刻度值,所述及格值为标准测度函数开始收敛为止所对应的某个新聚类的聚类中心的重心点,所述刻度值为标准测度函数开始收敛为止所对应的某个新聚类的聚类中心的半径与某一固定值的商,所述固定值的取值范围为:0-100;
指标分数获取子模块,用于基于得到的及格值和刻度值得到各指标的分数,公式为:
各指标的分数=阈值-(指标项-及格值)/刻度;
其中,指标项的取值为各指标项的数值,该数值是由对互联网资源进行质量拨测得来,所述指标项包含:DNS解析时间、TCP建链时间、第一字节时间和剩余字节时间;所述阈值的大小与计算指标分数时采用的分制相关,具体为该阈值为满分的的百分之六十,即当采用百分制时该处的阈值为60,当采用150分值时该处固定值为90。
CN201310467352.3A 2013-10-09 2013-10-09 一种基于大数据挖掘的互联网资源质量评估方法及*** Active CN103530347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310467352.3A CN103530347B (zh) 2013-10-09 2013-10-09 一种基于大数据挖掘的互联网资源质量评估方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310467352.3A CN103530347B (zh) 2013-10-09 2013-10-09 一种基于大数据挖掘的互联网资源质量评估方法及***

Publications (2)

Publication Number Publication Date
CN103530347A true CN103530347A (zh) 2014-01-22
CN103530347B CN103530347B (zh) 2016-09-14

Family

ID=49932356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310467352.3A Active CN103530347B (zh) 2013-10-09 2013-10-09 一种基于大数据挖掘的互联网资源质量评估方法及***

Country Status (1)

Country Link
CN (1) CN103530347B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301171A (zh) * 2014-09-11 2015-01-21 赛尔网络有限公司 一种基于dns权威服务器的网络性能测量方法及***
CN104778528A (zh) * 2014-12-29 2015-07-15 武汉邮电科学研究院 利用大数据获取智慧城市评估指标的方法及***
CN105376096A (zh) * 2015-11-26 2016-03-02 中国互联网络信息中心 一种域名解析数据质量评估反馈和数据优化方法及***
CN105787663A (zh) * 2016-02-26 2016-07-20 江苏大学 一种基于数据挖掘技术的手持移动终端评估方法及***
CN106971107A (zh) * 2017-03-01 2017-07-21 北京工业大学 一种数据交易的安全定级方法
CN107633257A (zh) * 2017-08-15 2018-01-26 上海数据交易中心有限公司 数据质量评估方法及装置、计算机可读存储介质、终端
CN108665148A (zh) * 2018-04-18 2018-10-16 腾讯科技(深圳)有限公司 一种电子资源质量评价方法、装置和存储介质
CN109299062A (zh) * 2018-07-02 2019-02-01 北京市天元网络技术股份有限公司 一种面向文献类数字资源元数据的质量评价方法及***
CN109428759A (zh) * 2017-09-01 2019-03-05 ***通信集团广西有限公司 一种网络质量评估方法及装置
CN109728950A (zh) * 2018-12-27 2019-05-07 ***通信集团江苏有限公司 网络质量优化方法、装置、设备及计算机存储介质
CN110011847A (zh) * 2019-03-29 2019-07-12 广州大学 一种传感云环境下的数据源质量评估方法
CN111310784A (zh) * 2020-01-14 2020-06-19 支付宝(杭州)信息技术有限公司 资源数据的处理方法及装置
CN114430402A (zh) * 2020-10-15 2022-05-03 ***通信集团浙江有限公司 网络域名流量调度方法、装置及计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102572924A (zh) * 2012-04-06 2012-07-11 北京西塔网络科技股份有限公司 一种移动互联网网络质量评估的方法及***
CN102937960A (zh) * 2012-09-06 2013-02-20 北京邮电大学 突发事件热点话题的识别与评估装置和方法
CN103368979A (zh) * 2013-08-08 2013-10-23 电子科技大学 一种基于改进K-means算法的网络安全性验证装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102572924A (zh) * 2012-04-06 2012-07-11 北京西塔网络科技股份有限公司 一种移动互联网网络质量评估的方法及***
CN102937960A (zh) * 2012-09-06 2013-02-20 北京邮电大学 突发事件热点话题的识别与评估装置和方法
CN103368979A (zh) * 2013-08-08 2013-10-23 电子科技大学 一种基于改进K-means算法的网络安全性验证装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301171A (zh) * 2014-09-11 2015-01-21 赛尔网络有限公司 一种基于dns权威服务器的网络性能测量方法及***
CN104301171B (zh) * 2014-09-11 2018-06-26 赛尔网络有限公司 一种基于dns权威服务器的网络性能测量方法及***
CN104778528A (zh) * 2014-12-29 2015-07-15 武汉邮电科学研究院 利用大数据获取智慧城市评估指标的方法及***
CN105376096B (zh) * 2015-11-26 2019-02-01 中国互联网络信息中心 一种域名解析数据质量评估反馈和数据优化方法及***
CN105376096A (zh) * 2015-11-26 2016-03-02 中国互联网络信息中心 一种域名解析数据质量评估反馈和数据优化方法及***
CN105787663A (zh) * 2016-02-26 2016-07-20 江苏大学 一种基于数据挖掘技术的手持移动终端评估方法及***
CN106971107A (zh) * 2017-03-01 2017-07-21 北京工业大学 一种数据交易的安全定级方法
CN106971107B (zh) * 2017-03-01 2021-02-05 北京工业大学 一种数据交易的安全定级方法
CN107633257A (zh) * 2017-08-15 2018-01-26 上海数据交易中心有限公司 数据质量评估方法及装置、计算机可读存储介质、终端
CN107633257B (zh) * 2017-08-15 2020-04-17 上海数据交易中心有限公司 数据质量评估方法及装置、计算机可读存储介质、终端
CN109428759A (zh) * 2017-09-01 2019-03-05 ***通信集团广西有限公司 一种网络质量评估方法及装置
CN108665148A (zh) * 2018-04-18 2018-10-16 腾讯科技(深圳)有限公司 一种电子资源质量评价方法、装置和存储介质
CN108665148B (zh) * 2018-04-18 2022-02-22 腾讯科技(深圳)有限公司 一种电子资源质量评价方法、装置和存储介质
CN109299062A (zh) * 2018-07-02 2019-02-01 北京市天元网络技术股份有限公司 一种面向文献类数字资源元数据的质量评价方法及***
CN109728950A (zh) * 2018-12-27 2019-05-07 ***通信集团江苏有限公司 网络质量优化方法、装置、设备及计算机存储介质
CN109728950B (zh) * 2018-12-27 2021-11-23 ***通信集团江苏有限公司 网络质量优化方法、装置、设备及计算机存储介质
CN110011847A (zh) * 2019-03-29 2019-07-12 广州大学 一种传感云环境下的数据源质量评估方法
CN110011847B (zh) * 2019-03-29 2022-03-25 广州大学 一种传感云环境下的数据源质量评估方法
CN111310784A (zh) * 2020-01-14 2020-06-19 支付宝(杭州)信息技术有限公司 资源数据的处理方法及装置
CN114430402A (zh) * 2020-10-15 2022-05-03 ***通信集团浙江有限公司 网络域名流量调度方法、装置及计算设备
CN114430402B (zh) * 2020-10-15 2023-11-10 ***通信集团浙江有限公司 网络域名流量调度方法、装置及计算设备

Also Published As

Publication number Publication date
CN103530347B (zh) 2016-09-14

Similar Documents

Publication Publication Date Title
CN103530347A (zh) 一种基于大数据挖掘的互联网资源质量评估方法及***
CN106803799B (zh) 一种性能测试方法和装置
CN104965784B (zh) 自动测试方法及装置
CN104572449A (zh) 一种基于用例库的自动化测试方法
CN112291706A (zh) 一种基于大数据和人工智能的网络优化方法
CN112380131B (zh) 模块测试方法、装置及电子设备
CN101957845B (zh) 一种在线应用***及其实现方法
CN103559303A (zh) 一种对数据挖掘算法的评估与选择方法
CN107844914B (zh) 基于集团管理的风险管控***和实现方法
CN103577660B (zh) 灰度实验***和方法
US20150222717A1 (en) Apparatus and method for updating ip geographic information
CN111476296A (zh) 样本生成方法、分类模型训练方法、识别方法及对应装置
CN103838754A (zh) 信息搜索装置及方法
CN108491226A (zh) 基于集群缩放的Spark配置参数自动调优方法
CN106022640B (zh) 电量指数核对***及方法
CN106651408B (zh) 一种数据分析方法及装置
CN103136440A (zh) 数据处理方法和装置
WO2020220438A1 (zh) 一种针对虚拟机不同类型的业务并发量预测方法
CN102833085B (zh) 基于海量用户行为数据的通讯网络报文分类***及方法
CN107194529B (zh) 基于挖掘技术的配电网可靠性经济效益分析方法及装置
CN104915430A (zh) 一种基于MapReduce的约束关系粗糙集规则获取方法
CN111241145A (zh) 一种基于大数据的自愈规则挖掘方法及装置
CN105608638B (zh) 一种判定智能终端与电能表的表码数据同步状态的方法及其***
CN104516956B (zh) 一种网站信息增量爬取方法
CN106980989A (zh) 基于用户行为特性分析的商户推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and System for Evaluating the Quality of Internet Resources Based on Big Data Mining

Effective date of registration: 20230322

Granted publication date: 20160914

Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch

Pledgor: BEIJING NETEAST TECHNOLOGIES Co.,Ltd.

Registration number: Y2023990000170

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230427

Granted publication date: 20160914

Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch

Pledgor: BEIJING NETEAST TECHNOLOGIES Co.,Ltd.

Registration number: Y2023990000170

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and System for Evaluating the Quality of Internet Resources Based on Big Data Mining

Effective date of registration: 20230427

Granted publication date: 20160914

Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch

Pledgor: BEIJING NETEAST TECHNOLOGIES Co.,Ltd.

Registration number: Y2023990000240

PE01 Entry into force of the registration of the contract for pledge of patent right