博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习:LR和SVM对比
阅读量:4060 次
发布时间:2019-05-25

本文共 610 字,大约阅读时间需要 2 分钟。

LR:logistics regression

SVM:support vector machine

不同:

  • 损失函数不同

LR,交叉熵损失函数,也有叫log损失

J(theta) = - 1/m [ sum y* log{ h(x) } + (1 - y) * log{ 1 - h(x) } ]

SVM,hinge loss

[Z]+ = { z, z > 0 ; 0, z <= 0 }
L(w, b ,a) = 1/2*||W||^2 - sum{ a*(y*(wt*x + b) - 1 ) }

不同的loss function代表了不同的假设前提

代表不同分类原理

  • SVM最后分界线只受支持向量上样本影响,逻辑回归分界线受所有样本影响(所以,逻辑回归在做不平衡数据时,要先对数据做平衡)

  • LR基于分类概率,SVM基于分类距离

    (SVM依赖数据表达的距离,所以要对数据做标准化(normalization);LR要做平衡)

    归一化优点在于,加快收敛速度(模型太扁不利于梯度下降),提升模型精度

    (归一化是否对模型影响,要看模型是否有伸缩不变性)
    伸缩不变性:各个维度进行不均匀伸缩后,最优解与原来不等价,则不具有伸缩不变形,例如SVM。
    对于SVM,若不归一化,不同的维度带有不同的量纲,同样加10所代表的意义不一样,且会影响梯度下降。

  • SVM自带正则化,LR需要正则化

  • LR对异常值敏感,SVM对异常值不敏感

转载地址:http://quwji.baihongyu.com/

你可能感兴趣的文章
Java IO
查看>>
Java NIO
查看>>
Java大数据:Hbase分布式存储入门
查看>>
Java大数据:全文搜索引擎Elasticsearch入门
查看>>
大数据学习:Hadoop入门学习书单
查看>>
大数据学习:Spark SQL入门简介
查看>>
大数据学习:Spark RDD操作入门
查看>>
大数据框架:Spark 生态实时流计算
查看>>
大数据入门:Hive和Hbase区别对比
查看>>
大数据入门:ZooKeeper工作原理
查看>>
大数据入门:Zookeeper结构体系
查看>>
大数据入门:Spark RDD基础概念
查看>>
大数据入门:SparkCore开发调优原则
查看>>
大数据入门:Java和Scala编程对比
查看>>
大数据入门:Scala函数式编程
查看>>
C++报错:引发了未经处理的异常:写入访问权限冲突, p 是 0xCCCCCCCC
查看>>
【数据结构周周练】002顺序表与链表
查看>>
C++报错:C4700:使用了非初始化的局部变量
查看>>
【数据结构周周练】003顺序栈与链栈
查看>>
【数据结构周周练】006队列基本操作-顺序结构及链式结构实现
查看>>