`

保序回归

阅读更多

保序回归(英文:Isotonic regression)在数值分析中指的是在保序约束下搜索一个加权 w 的最小二乘 y 以拟合变量 x,它是一个二次规划问题

 



 

python的实现版本:http://scikit-learn.org/stable/auto_examples/plot_isotonic_regression.html#example-plot-isotonic-regression-py

 

spark中的实现版本:https://spark.apache.org/docs/1.4.1/mllib-isotonic-regression.html

 

给个简单的例子:

 

问题描述:给定一个无序数字序列y,通过修改每个元素的值得到一个非递减序列 y‘ ,问如何使y和 y’ 误差(该处取平方差)最小?

保序回归法:从该序列y的首元素往后观察,一旦出现乱序现象停止该轮观察,从该乱序元素开始逐个吸收紧跟在后面的元素组成一个子序列sub_y,直到子序列sub_y所有元素的平均值小于或等于下一个待吸收的元素。

举例:

原始序列:<9, 10, 14>

结果序列:<9, 10, 14>

分析:从9往后观察,到最后的元素14都未发现乱序情况,不用处理。

原始序列:<9, 14, 10>

结果序列:<9, 12, 12>

分析:从9往后观察,观察到14时发生乱序(14>10),停止该轮观察转入吸收元素处理,吸收元素10后子序列为<14, 10>,取该序列所有元素的平均值得12,故用序列<12, 12>替代<14, 10>。吸收10后已经到了最后的元素,处理操作完成。

 

原始序列:<14, 9, 10,  15>

结果序列:<11, 11, 11, 15>

分析:从14往后观察,观察到9时发生乱序(14>9),停止该轮观察转入吸收元素处理,吸收元素9后子序列为<14, 9>。求该序列所有元素的平均值得12.5,由于12.5大于下个带吸收的元素10,所以再吸收10,得序列<14, 9, 10>。求该序列所有元素的平均值得11,由于11小于下个带吸收的元素15,所以停止吸收操作,用序列<11, 11, 11>替代<14, 9, 10>。

 

例子来源:http://blog.csdn.net/fsz521/article/details/7706250

  • 大小: 3.3 KB
0
2
分享到:
评论

相关推荐

    数据回归-保序回归的算法及应用.pdf

    数据回归-保序回归的算法及应用.pdf

    多面体逼近在保序回归问题中的应用 (2009年)

    研究了多面体最佳逼近算法在保序回归中的应用。对于多种广义保序回归及多维保序回归问题的求解,给出了较已往便捷精确的算法;并解决了含两个独立变量的保序回归的算法问题。

    spark ml 算法原理剖析以及具体的源码实现分析

    保序回归 聚类 k-means||算法 GMM(高斯混合模型) PIC(快速迭代聚类) LDA(隐式狄利克雷分布) 二分k-means算法 流式k-means算法 最优化算法 梯度下降算法 拟牛顿法 NNLS(非负最小二乘) 带权最小二乘 迭代再加权...

    IOI国家集训队论文集1999-2019

    + [序](#序) + [系](#系) + [物理问题](#物理问题) + [编码与译码](#编码与译码) + [对策问题](#对策问题) * [优化](#优化-2) + [算法优化](#算法优化) + [程序优化](#程序优化) + [语言](#语言) * [策略]...

    保序调整对线性回归影响的试验分析 (2012年)

    采用数学试验方法模拟随机变量,考察满足序关系的变量关于自变量的线性回归,研究并对比在这种情况下直接应用最小二乘线性回归与先对观察到的因变量使用PAVA算法进行保序调整再应用最小二乘线性回归的优劣。...

    IOI2018中国国家候选队论文集正式版

    《后缀树结点数》命题报告及一类区间问题的优化 陈江伦 11 浅谈保序回归问题 高睿泉 23 《Fim 4》命题报告 吴瑾昭 34 解决树上连通块问题的一些技巧和工具 任轩笛 45 《Jellyfish》命题报告及拓展探究 梁晏成 58 ...

    7个回归分析方法思维导图.png

    • 如果因变量的值是定序变量,则称它为序逻辑回归 • 如果因变量是多类的话,则称它为多元逻辑回归 3. 多项式回归(Polynomial Regression) 对于一个回归方程,如果自变量的指数大于1,那么它就是...

    多个正态总体均值与标准差比在简单树序约束下的最大似然估计 (2008年)

    考虑k( k&gt;3) 个正态总体均值与标准差( 均值和标准差均未知) 之比在简单树序约束下最大似然估计的求解问题, 应用保序回归理论给出了计算均值和标准差最大似然估计的迭代算法, 并证明了所给迭代算法是收敛的, 给出了k=...

    用STAF+Selenium实现并行的自动化测试框架

     Agile中的自动化测试  Agile是一种以人为核心、迭代、循序渐进的开发方法。它的目标就是尽早、持续地交付有价值的软件。随着Agile越发成熟,越来越多的团队开始尝试采用这种开发模式。  在Agile中,软件项目的...

    数据分析.doc

    2、回归分析 回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到 一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序 列的趋势特征、数据序列的预测以及...

    机器学习、深度学习、人工智能三步走,人工智能必须知道的几种深度学习算法.pdf

    机器学习、深度学习、⼈⼯智能三步⾛,⼈⼯智能必须知道的 ⼏种深度学习算法 序 序 声明:以下是博主精⼼整理的机器学习和AI系列⽂章,博主后续会不断更新该领域的知识: 有需要的⼩伙伴赶紧订阅吧。 ⼈⼯智能的浪潮...

    游戏数据分析.pdf

    数据训练集和测试集划分标准以0.8和0.2进⾏随机抽样,保证数据的⽆序抽取。划分代码如下: 其中处理数据的⽅法有随机森林,决策树、逻辑斯蒂回归, 模型精确度⽤AUC进⾏衡量,得到混淆矩阵,得出召回率,对⽐进⾏...

    声控机器人教学设计.doc

    " " 第二课时 "学习过程 "教师与学生活动 "设计意图 " "一、编写程"师:机器人搭好了,想要运行,仅仅有流" " "序 "程图是不够的,我们还需要将它转化成程" " " "序,那么我们今天学习声控机器人的程序" " " "该...

    基于大数据云平台的电力能源大数据采集与应用研究.pdf

    为明确某台区未来一段时 间负荷情况,电力企业应使用线性回归分析方式进 行研究。由表3可发现,PM2.5、气温、降雨量将对 公变台区负荷产生较大影响。 本次研究中使用带动量梯度下降 BP 神经网络 算法、灰色模型等...

    电子商务设计师真题06年和07年

    学果否 生他与信的这息确门将意其见之保45..存前 对若,在于一无系有门效统效课成不成程绩会绩的文处,所件理系有中这统,些将效并成其的将绩保平详。存时细 在成情课绩况程和提成考交绩试给文成教件绩务中都处。已...

    asp.net知识库

    XCodeFactory3.0完全攻略--序 XCodeFactory3.0完全攻略--基本思想 XCodeFactory3.0完全攻略--简单示例 XCodeFactory3.0完全攻略--IDBAccesser XCodeFactory2.0完全手册(中) XCodeFactory2.0完全手册(上)...

    计算机二级公共基础知识

    1. 算法的基本概念 利用计算机算法为计算机解题的过程实际上是在实施某种算法。 (1)算法的基本特征 算法一般具有4个基本特征:可行性、确定性、有穷性、拥有足够的情报。 (2)算法的基本运算和操作 ...

Global site tag (gtag.js) - Google Analytics