专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
网信内蒙古  ·  解读2024年全国数据资源调查情况 ·  11 小时前  
网信内蒙古  ·  解读2024年全国数据资源调查情况 ·  11 小时前  
人工智能与大数据技术  ·  AI编程新王Claude ... ·  4 天前  
人工智能与大数据技术  ·  15亿美元AI独角兽崩塌,全是印度程序员冒充 ... ·  3 天前  
51好读  ›  专栏  ›  大数据文摘

不要小看线性回归!

大数据文摘  · 公众号  · 大数据  · 2025-04-25 12:48

正文

请到「今天看啥」查看全文


而不是这样的:
(方差不恒定时的图像,线性回归失效)


02 多项式回归


在线性回归中,我们假设目标变量是特征的线性函数。

但在实际问题中,目标往往和特征之间关系更为复杂。刚意识到这一点时,很多人可能会觉得棘手,仿佛我们需要去找到某个函数 f,使得 y = f(x) + 噪声。

不过,如果仔细想想线性回归的原理,就会发现现实世界很多规律其实都是连续的,这类函数往往可以用多项式很好地逼近(感兴趣的同学可以去查查 Weierstrass 逼近定理或 Stone-Weierstrass 定理)。

线性函数其实只是一次多项式而已,所以多项式回归可以看作是一种自然的推广。模型形式大致如下:
如果你在初步分析数据时,发现目标与输入的关系是弯曲的、非线性的,那么多项式回归或许值得一试。比如下图:

(x³-x 曲线的数据拟合示意图)

03 广义线性回归


多项式回归改变的是等式右侧的函数形式,那左侧呢?如果不是目标变量本身,而是它的某个函数和输入的线性组合有关呢?也就是说,模型变成了:






请到「今天看啥」查看全文