CN108038084A - 一种有效分类的信息处理*** - Google Patents

一种有效分类的信息处理*** Download PDF

Info

Publication number
CN108038084A
CN108038084A CN201711297054.9A CN201711297054A CN108038084A CN 108038084 A CN108038084 A CN 108038084A CN 201711297054 A CN201711297054 A CN 201711297054A CN 108038084 A CN108038084 A CN 108038084A
Authority
CN
China
Prior art keywords
module
fitting function
information processing
processing system
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711297054.9A
Other languages
English (en)
Inventor
徐娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Valley Information Technology Co Ltd
Original Assignee
Chengdu Valley Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Valley Information Technology Co Ltd filed Critical Chengdu Valley Information Technology Co Ltd
Priority to CN201711297054.9A priority Critical patent/CN108038084A/zh
Publication of CN108038084A publication Critical patent/CN108038084A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了本发明一种有效分类的信息处理***,包括:用于对数据进行线性回归拟合产生拟合函数的拟合模块;用于根据拟合函数和数据得出经验风险的经验模块;用于设置正则化项的正则化模块;用于将正则化项和经验风险求和得到结构风险的结构模块;用于根据结构风险对拟合函数进行修正的修正模块。所述正则化项采用多维函数。所述拟合函数采用高阶多项式。所述高阶多项式的项数为五个及以上。所述修正模块得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。本发明一种有效分类的信息处理***,通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。

Description

一种有效分类的信息处理***
技术领域
本发明涉及计算机技术领域,具体涉及一种有效分类的信息处理***。
背景技术
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。
然而现有的数据信息分析方法中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果。
发明内容
本发明所要解决的技术问题是现有的数据信息分析方法中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果,目的在于提供一种有效分类的信息处理***,解决上述问题。
本发明通过下述技术方案实现:
一种有效分类的信息处理***,包括:用于对数据进行线性回归拟合产生拟合函数的拟合模块;用于根据拟合函数和数据得出经验风险的经验模块;用于设置正则化项的正则化模块;用于将正则化项和经验风险求和得到结构风险的结构模块;用于根据结构风险对拟合函数进行修正的修正模块。
现有技术中,由于无法对数据中所有的项目进行准确确认,所以得出的分析结果中,非常容易出现过拟合,即将不同类的相似项归为一类,影响数据分析结果。本发明应用时,先对数据进行线性回归拟合产生拟合函数;再根据拟合函数和数据得出经验风险;然后设置正则化项;再然后将正则化项和经验风险求和得到结构风险;再然后根据结构风险对拟合函数进行修正。本发明通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
进一步的,所述正则化项采用多维函数。
进一步的,所述拟合函数采用高阶多项式。
进一步的,所述高阶多项式的项数为五个及以上。
进一步的,所述修正模块得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明一种有效分类的信息处理***,通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明***结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
如图1所示,本发明一种有效分类的信息处理***,包括:用于对数据进行线性回归拟合产生拟合函数的拟合模块;用于根据拟合函数和数据得出经验风险的经验模块;用于设置正则化项的正则化模块;用于将正则化项和经验风险求和得到结构风险的结构模块;用于根据结构风险对拟合函数进行修正的修正模块。所述正则化项采用多维函数。所述拟合函数采用高阶多项式。所述高阶多项式的项数为五个及以上。所述修正模块得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。
本实施例实施时时,先对数据进行线性回归拟合产生拟合函数;再根据拟合函数和数据得出经验风险;然后设置正则化项;再然后将正则化项和经验风险求和得到结构风险;再然后根据结构风险对拟合函数进行修正。本发明通过引入正则项,规避影响因子比较小的项目,从而使得不同类的相似项不会被归为一类,提高了分析结果的精度。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种有效分类的信息处理***,其特征在于,包括:
用于对数据进行线性回归拟合产生拟合函数的拟合模块;
用于根据拟合函数和数据得出经验风险的经验模块;
用于设置正则化项的正则化模块;
用于将正则化项和经验风险求和得到结构风险的结构模块;
用于根据结构风险对拟合函数进行修正的修正模块。
2.根据权利要求1所述的一种有效分类的信息处理***,其特征在于,所述正则化项采用多维函数。
3.根据权利要求1所述的一种有效分类的信息处理***,其特征在于,所述拟合函数采用高阶多项式。
4.根据权利要求3所述的一种有效分类的信息处理***,其特征在于,所述高阶多项式的项数为五个及以上。
5.根据权利要求1所述的一种有效分类的信息处理***,其特征在于,所述修正模块得出结构风险的L1范数,并根据L1范数对拟合函数进行修正。
CN201711297054.9A 2017-12-08 2017-12-08 一种有效分类的信息处理*** Pending CN108038084A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711297054.9A CN108038084A (zh) 2017-12-08 2017-12-08 一种有效分类的信息处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711297054.9A CN108038084A (zh) 2017-12-08 2017-12-08 一种有效分类的信息处理***

Publications (1)

Publication Number Publication Date
CN108038084A true CN108038084A (zh) 2018-05-15

Family

ID=62101698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711297054.9A Pending CN108038084A (zh) 2017-12-08 2017-12-08 一种有效分类的信息处理***

Country Status (1)

Country Link
CN (1) CN108038084A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240468A1 (en) * 2008-03-20 2009-09-24 Yi Tony Torng Risk-based design and maintenance systems and methods
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN102708381A (zh) * 2012-05-09 2012-10-03 江南大学 融合最小二乘向量机回归学习思想的改进极限学习机
CN103295031A (zh) * 2013-04-15 2013-09-11 浙江大学 一种基于正则风险最小化的图像目标计数方法
CN103959291A (zh) * 2011-04-20 2014-07-30 诺沃—诺迪斯克有限公司 基于具有自适应选择的核和正则化参数的正则化网络的葡萄糖预测器
CN106093782A (zh) * 2016-06-03 2016-11-09 哈尔滨工业大学 动态建模的最小二乘支持向量机soc估计方法
CN107239477A (zh) * 2016-07-27 2017-10-10 中国石油大学(华东) 一种融合空间相关性的地理数据支持向量回归方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240468A1 (en) * 2008-03-20 2009-09-24 Yi Tony Torng Risk-based design and maintenance systems and methods
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN103959291A (zh) * 2011-04-20 2014-07-30 诺沃—诺迪斯克有限公司 基于具有自适应选择的核和正则化参数的正则化网络的葡萄糖预测器
CN102708381A (zh) * 2012-05-09 2012-10-03 江南大学 融合最小二乘向量机回归学习思想的改进极限学习机
CN103295031A (zh) * 2013-04-15 2013-09-11 浙江大学 一种基于正则风险最小化的图像目标计数方法
CN106093782A (zh) * 2016-06-03 2016-11-09 哈尔滨工业大学 动态建模的最小二乘支持向量机soc估计方法
CN107239477A (zh) * 2016-07-27 2017-10-10 中国石油大学(华东) 一种融合空间相关性的地理数据支持向量回归方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘江林: "《向量空间模型的稀疏文本分类》", 《内蒙古师范大学学报(自然科学汉文版)》 *

Similar Documents

Publication Publication Date Title
Zhang et al. An empirical analysis of the impact of digital economy on manufacturing green and low-carbon transformation under the dual-carbon background in China
CN106339439A (zh) 一种大数据分析方法
WO2015065852A3 (en) User information classification method and apparatus, and user group information acquistion method and apparatus
CN105701223A (zh) 基于Spark Streaming的财经信息情感趋势分析方法
CN109471965A (zh) 一种基于大数据的网络舆情数据采集、处理方法及监测平台
CN105912525A (zh) 基于主题特征的半监督学习情感分类方法
Atzmueller et al. Homophily at academic conferences
DE102021006293A1 (de) Bestimmung digitaler Personas unter Verwendung datengetriebener Analytik
CN106227776A (zh) 一种支撑智慧金融的数据预处理方法和装置
CN108038084A (zh) 一种有效分类的信息处理***
Zhang et al. Two weak solutions for perturbed non-local fractional equations
CN107992450A (zh) 基于正则化的信息分析方法
CN107102984A (zh) 一种藏语微博情感倾向性分析方法和***
CN103716234B (zh) 一种定位报文内存泄露的方法
Li et al. A novel data augmentation method for improving the accuracy of insulator health diagnosis
CN109325585A (zh) 基于张量环分解的长短期记忆网络稀疏连接方法
CN104516956B (zh) 一种网站信息增量爬取方法
Soesanti Design and development of web-based information system for the batik industry
CN108763400B (zh) 基于对象行为和主题偏好的对象划分方法及装置
Li et al. Special section on big data and service computing
CN105512323A (zh) 一种基于领域特征和隐语义分析的科技资源推荐方法
CN104331472A (zh) 分词训练数据的构造方法和装置
CN105824878A (zh) 基于支持向量机回归模型的产品推荐方法
Liang et al. Demonstration of object location, classification, and characterization by developed deep learning dust ablation trail analysis code package using plasma jets
Yu et al. An empirical study of virtual social networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515