机器学习：LR和SVM对比-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

机器学习：LR和SVM对比

阅读量：4060 次

发布时间：2019-05-25

本文共 610 字，大约阅读时间需要 2 分钟。

LR：logistics regression

SVM：support vector machine

不同：

损失函数不同

LR，交叉熵损失函数，也有叫log损失

J(theta) = - 1/m [ sum y* log{ h(x) } + (1 - y) * log{ 1 - h(x) } ]

SVM，hinge loss

[Z]+ = { z, z > 0 ; 0, z <= 0 }

L(w, b ,a) = 1/2*||W||^2 - sum{ a*(y*(wt*x + b) - 1 ) }

不同的loss function代表了不同的假设前提

代表不同分类原理

SVM最后分界线只受支持向量上样本影响，逻辑回归分界线受所有样本影响（所以，逻辑回归在做不平衡数据时，要先对数据做平衡）

LR基于分类概率，SVM基于分类距离
（SVM依赖数据表达的距离，所以要对数据做标准化（normalization）；LR要做平衡）

归一化优点在于，加快收敛速度（模型太扁不利于梯度下降），提升模型精度
（归一化是否对模型影响，要看模型是否有伸缩不变性）
伸缩不变性：各个维度进行不均匀伸缩后，最优解与原来不等价，则不具有伸缩不变形，例如SVM。
对于SVM，若不归一化，不同的维度带有不同的量纲，同样加10所代表的意义不一样，且会影响梯度下降。

SVM自带正则化，LR需要正则化

LR对异常值敏感，SVM对异常值不敏感

转载地址：http://quwji.baihongyu.com/

你可能感兴趣的文章

Java大数据：Hbase分布式存储入门

Java大数据：全文搜索引擎Elasticsearch入门

大数据学习：Hadoop入门学习书单

大数据学习：Spark SQL入门简介

大数据学习：Spark RDD操作入门

大数据框架：Spark 生态实时流计算

大数据入门：Hive和Hbase区别对比

大数据入门：ZooKeeper工作原理

大数据入门：Zookeeper结构体系

大数据入门：Spark RDD基础概念

大数据入门：SparkCore开发调优原则

大数据入门：Java和Scala编程对比

大数据入门：Scala函数式编程

C++报错：引发了未经处理的异常:写入访问权限冲突， p 是 0xCCCCCCCC

【数据结构周周练】002顺序表与链表

C++报错：C4700：使用了非初始化的局部变量

【数据结构周周练】003顺序栈与链栈

【数据结构周周练】006队列基本操作-顺序结构及链式结构实现

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-19 23:32:07 当前IP: 18.119.29.70 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我