×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 数据挖掘 共 648 个结果.
数据挖掘化功大法(3)——谈谈支持度和置信度
支持度,简单的字面理解就是支持的程度,一般以百分比表示。生活中常见的使用场合有投票、竞选、民意调查等,比如某校高一三班进行班委竞选,该班级共有学生50名,在班长一职的竞选中,张三得到40票。那么就可以说在该班班长竞选中,张三的支持度是:40/50*100%=80%。 该名词还常出现在数据挖掘的关联分析中,常跟 置信度(或可信性)一起出现。 如:某超市中有10…
star2017
1年前
5875
0
数据挖掘化功大法(2)——挖掘模式
数据模式包括:特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。 任务可以分为两类:描述性和预测性数据。 数据特征化:汇总所研究类的数据。 数据区分:将目标类一个或多个可比较类进行比较。 频繁模式挖掘、关联和相关性: 频繁模式(Frequent Pattern)是频繁出现在数据集中的模式(如项集,子序列和子结构)。频繁模式一般可以…
star2017
1年前
5695
0
大嘴巴漫谈数据挖掘——经典案例赏析
本次分享会以产品为核心,按照产品发展的过程,依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成熟期、产品衰退期这8个产品发展的必经阶段所必须做的数据挖掘工作。针对产品每一阶段的不同特点,分享了数据挖掘的核心技能,并指出了每一阶段数据挖掘需要避免的坑。
star2017
1年前
5231
0
趣味数据挖掘系列12:数据挖掘中的趣味哲学
想用趣味的方式给《趣味数据挖掘系列》做一个哲学的总结,哲学常较深奥,深则难得有趣。因为选题含原生态冲突,写起来就费思量。拟借用一个交通肇事频率分析的例子,又百语千言,颇难开头。硬着头皮Try,还是从故事讲起,很久很久以前,It was long long ago…
star2017
1年前
5744
0
趣味数据挖掘系列11:十大算法展辉煌历史,十大问题引锦绣前程
这篇突出资料性,先说三十年的十大算法,看数据挖掘的史上辉煌,再叙七年前提出的十大问题,证数据挖掘专家不是砖家;
star2017
1年前
5336
0
趣味数据挖掘系列10:基因表达式编程
在本系列之九的末尾提到,基因表达式编程GEP(Gene Expression Programming)是一种数据挖掘工具,是进化计算家族中较新的成员。
star2017
1年前
5278
0
大嘴巴漫谈数据挖掘:用户体验不可缺,定性研究建指标
通常,用户使用产品前,鉴于对产品的认知和了解以及过往其他类似产品的使用经验,会对产品体验有所期望。当用户使用产品后,体验高于期望时,满意度会较高,反之则会较低。 简单地说,用户体验就是用户使用某个产品或者服务过程中的主观感受。良好的用户体验能够有效提升产品运营的质量,有利于维持用户黏性,提高用户忠诚度。 产品成熟阶段,用户体验评测主要用来评价、监测当前指定产…
star2017
1年前
5746
0
用户画像三个层次的认知与实践
个人对用户画像的理解是三个层次,可以说是三个步骤吧,从群体用户的问卷调研、数据分析到具象的个性描述,再到抽象应用
star2017
1年前
4602
0
应用数据挖掘进行客户关系管理
客户关系管理的目标是缩减销售周期和销售成本、增加收人、寻找扩展业务所需的新的市场和渠道、以及提高客户的价值、满意度、赢利性和忠实度。
star2017
1年前
5894
0
数据科学极简史(一)
数据科学家如何变得性感的故事,大致也就是作为成熟学科的统计学如何与新兴学科计算机科学发生关系的故事。“数据科学”这个术语的出现较晚近,用来指代一个需要解读大量数据的职业。但解读数据这件事的历史很长,它已经被科学家、统计学家、图书馆员、计算机科学家以及其他人士讨论多年。下文的时间线追溯“数据科学”一词的演化,以及它的应用、对它进行定义的尝试和一些相关的术语。 …
star2017
1年前
9136
0
面试干货!21个必知数据科学面试题和答案part2(12-21)
摘要:这里是第二部分,就从我给大家准备的“特别提问”开始吧。作者Gregory Piatetsky,KDnuggets. 特别提问:解释什么是过拟合,你如何控制它 这个问题不是20问里面的,但是可能是最关键的一问来帮助你分辨真假数据科学家! 回答者:GregoryPiatetsky 过拟合是指(机器)学习到了因偶然造成并且不能被后续研究复制的的虚假结果。 我…
star2017
1年前
9272
0
大数据科学工具包(万余字介绍几百种工具,经典收藏版!)
前言:数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率模型、统计学、机器学习、数据仓库、可视化等。在实际应用中,数据科学包括数据的收集、清洗、分析、可视化以及数据应用整个迭代过程,最终帮助组织制定正确的发展决策数据科学的从业者称为数据科学家。数据科学家有其独特的基本思路与常用工具,秦陇纪全面梳理数据分析师和数据科学家使用的工具包,包括…
star2017
1年前
6872
0
美团的推荐算法实践
前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。 解决信息过载有几种手段:一种是搜索,当用户有了明确的信息需求意图后…
star2017
1年前
7750
0
面试干货!21个必知数据科学面试题和答案part1(1-11)
摘要:KDnuggets编辑给你“20个问题来分辨真假数据科学家”的答案,包括什么是正则化、我们崇拜的数据科学家、模型验证等等。 作者:Gregory Piatetsky, KDnuggets. 最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。 但是这些问题并没有提供答案,所以KDnuggets的小…
star2017
1年前
7180
0
数据挖掘和统计学专业术语大盘点
一、数据挖掘术语 【算法】指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。 【属性】也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。 【个体】是关于一个单元的测量值的集合――例如一个人的身高、体重、年龄等等;它也被称作“记录”、 或 者“行”(每一行通常代表一个记录,每一列代表一个变量)。 【置信度】在形如“如果买了A和B,…
star2017
1年前
5610
0
数据挖掘过程中经常犯的11个错误
数据挖掘过程中绝不能犯这11大错误。
star2017
1年前
5600
0
数据挖掘大牛,用程序算法做人生选择
每年一到要找工作的时候,我就能收到很多人给我发来的邮件,总是问我怎么选择他们的offer,去腾讯还是去豆瓣,去外企还是去国内的企业,去创业还是去考研,来北京还是回老家,该不该去创新工场?该不该去tho
star2017
1年前
4378
0
电商数据挖掘之关联算法2:牛奶可以搭配哪些商品
牛奶可以搭配哪些商品?
star2017
1年前
4530
0
电商数据挖掘之关联算法1:“啤酒+尿布”的关联规则是怎么来的?
“啤酒+尿布”的关联规则是怎么来的?
star2017
1年前
5698
0
以“上大学分析”为例体验什么是数据挖掘
下面我们将通过具体的例子来学习什么是数据挖掘。
star2017
1年前
9748
0
1
...
7
8
9
...
33
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
SpringBoot2实践系列(六):集成监控模块Actuator详解
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到