×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
利用SHAP解释Xgboost模型
Xgboost相对于线性模型在进行预测时往往有更好的精度,但是同时也失去了线性模型的可解释性。所以Xgboost通常被认为是黑箱模型。 2017年,Lundberg和Lee的论文提…
star2017
博客
1年前
541
0
怎么写好一份数据分析报告?
来自http://blog.sina.com.cn/s/blog_66f6d3da01018lo7.html 分析报告的输出是是你整个分析过程的成果,是评定一个产品、一个运营事件的…
star2017
博客
1年前
7078
0
【机器学习】确定最佳聚类数目的10种方法
from: https://www.cnblogs.com/think90/p/7133753.html 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就…
star2017
博客
1年前
5723
0
决策树的剪枝理论
剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。 决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前…
star2017
博客
1年前
5860
0
异常检测
本文作者: 袁宵 本文链接: https://yuanxiaosc.github.io/2019/08/05/异常检测/ 异常检测 异常检测 百度百科 异常检测(Anomaly d…
star2017
博客
1年前
7633
0
定价策略和价格研究方法
作者:汪梅子 研究定价有什么作用吗? 有人认为价格只是数字,有价意味着有收入。对商家而言,利用消费者对价格的非理性认知,可以将价格作为一种有力的竞争工具。定价手法和生活中常见的X….
star2017
博客
1年前
505
0
iPhone6s销量数据分析:同样的数据,不同的结论。
iPhone6s销量呈现下滑:苹果的低潮或来临 文/王新喜 尽管此前苹果公布了iPhone上市一个月销量1300万部的销量情况,但据各方数据显示iPhone6s的销量情况却不容乐观…
star2017
博客
1年前
7330
0
机器学习常见算法分类汇总
作者: 王萌 来自:http://www.ctocio.com/hotnews/15919.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少…
star2017
博客
1年前
9013
0
机器学习中的范数规则化之L0、L1与L2范数
from http://c.m.163.com/news/a/C6JLPICN05118CTM.html?spss=newsapp&spsw=1 今天我们聊聊机器学习中出现…
star2017
博客
1年前
8789
0
建议收藏!10种Python聚类算法完整操作示例
来源 | 海豚数据科学实验室 聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有…
star2017
博客
1年前
711
0
数据分析师成长体系漫谈—数据埋点
作者【analysis-lion】 序 说起数据埋点,对于大多数的数据分析师来说并不陌生,并且可能在很多人的认知中,埋点的工作是由产品经理来完成的。那么为什么笔者认为数据埋点是分析…
star2017
博客
1年前
143
0
RealTimeScoring在IBMSPSSModeler的中实现和运用
目前数据挖掘技术越来越受到大企业的关注和使用,企业所储存的海量用户数据信息蕴藏着丰富的内容,但是缺乏足够高效的工具来挖掘、管理和利用这些资源。本文试图通过一个保险理赔欺诈的模拟用例…
star2017
博客
1年前
5865
0
Python机器学习案例-使用集成学习进行客户流失预测
目录 1. 概述 1.1 背景 1.2 数据说明 1.3 目的 2. 正文 2.1 加载数据 2.2 数据清洗 2.3 特征工程 2.4 建模 2.4.1 逻辑斯蒂回…
star2017
博客
1年前
7187
0
怎么可能做到90%客户留存?让愤怒小鸟再飞一会儿!
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:张溪梦 链接:http://zhuanlan.zhihu.com/growingio/20272663…
star2017
博客
1年前
924
0
决策树算法介绍及应用
from http://www.ibm.com/developerworks/cn/analytics/library/ba-1507-decisiontree-algorithm…
star2017
博客
1年前
5341
0
Streamlit实战twitter情感分析
Streamlit是一个出色的机器学习工具开发库,这个教程将学习 如何使用streamlit和flair开发一个twitter微博情感分析的应用。 相关链接:Streamlit开发…
star2017
博客
1年前
519
0
数据分析师成长体系漫谈–数仓模型设计
analysis-lion 序 看到标题,可能很多小伙伴都会疑惑,为什么笔者把数仓模型设计也纳入了数据分析师的成长体系之中,因为可能大多数公司会有单独的数仓部门,分析师只需要通过数…
star2017
博客
1年前
1187
0
PMML标准介绍及其在数据挖掘任务中的应用
1. 背景 随着电子信息和计算机技术的快速发展,人类产生和搜集数据的能力获得了长足的发展。从商务、科学技术和政府部门等各行业的事务处理的计算机化,到消费数码产品、出版物和商品条码的…
star2017
博客
1年前
5906
0
标准化归一化
感觉很多时候这两个概念没有明确的区分,大家在用的时候也是混着用的。 其实,在英语中他们都属于feature scaling(特征缩放)scale:比例、数值范围 feature s…
star2017
博客
1年前
7102
0
什么是bootstrap?
Bootstrap又称自展法,是用小样本估计总体值的一种非参数方法,在进化和生态学研究中应用十分广泛。例如进化树分化节点的自展支持率等。 Bootstrap的思想,是生成一系列bo…
star2017
博客
1年前
238
0
1
...
244
245
246
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到