×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
数据收集及数据分析工具介绍
我们介绍几种重要的数据分析工具。
star2017
博客
1年前
7584
0
智能营销增益(UpliftModeling)模型——pylift库的使用(二)
由于Uplift模型还未被广泛使用,业界对于该技术的定义混乱,每个领域甚至每个公司都会有自己的魔改版本,甚至连该方法的名称都没有得到统一&…
star2017
博客
1年前
323
0
R语言利用igraph和networkD3包快速入门做出炫酷的社交网络图等几类图
1、igraph包绘制社交关系图(也有叫知识图谱的) 绘图的快速入门技巧是三步: 1、看数据源和数据类型,这个一定要弄清楚。 2、掌握基本的绘图函数或者直接借用别人的代码,加上第一…
star2017
博客
1年前
500
0
大数据案例,顺丰科技架构升级之路!
转自 |刘潭仁,顺丰科技架构委员会负责人 顺丰作为物流龙头,公司在2018年面临业务多元化、快速发展的诉求和技术架构工具、平台落后的冲突。在2018-2021年期间,顺丰通过联动业…
star2017
博客
1年前
179
0
pySparkDataFrame入门
DataFrame是一种不可变的分布式数据集,这种数据被组织成指定的列,类似于关系数据库中的表。Spark DataFrame与Python pandas 中的DataFrame类…
star2017
博客
1年前
4175
0
怎样分析AB测试结果?
怎样分析AB测试结果? AB测试结果分析包括统计学分析和业务分析两个部分。 统计学分析 统计学分析是为了确定AB测试结果在统计学角度是否可信。分析时我们首先关注A、B版本对用户行为…
star2017
博客
1年前
169
0
非统计专业?5分钟搞懂如何计算A/B测试样本量
本文3000字,阅读时间5分钟。欢迎关注公众号:米妮老师 做A/B实验需要多少样本? 计算样本量,是A/B测试面试的必考问题之一。今天不讲数学,不讲公式,帮助大家正确理解:1)为何…
star2017
博客
1年前
465
0
XGBoost、LightGBM、Catboost对比
本文主要参考Battle of the Boosting Algos: LGB, XGB, Catboost,结果与原文有出入。 文章目录 1. 对比标准 1.1 数据集 1.2 …
star2017
博客
1年前
518
0
MLflow使用方法
1. MLflow介绍 直接copy官网上的介绍: MLflow is an open source platform for managing the end-to-end ma…
star2017
博客
1年前
171
0
一文全览机器学习建模流程(Python代码)
随着人工智能时代的到来,机器学习已成为解决问题的关键工具。我们接下来会详细介绍机器学习如何应用到实际问题,并概括机器学习应用的一般流程。 1.1 明确问题 明确业务问题是机器学习的…
star2017
博客
1年前
172
0
DBSCAN聚类
DBSCAN聚类算法 基本概念:基于密度的带有噪声点的聚类算法(Desity-Based Spatial Clustering of Applications with Noise…
star2017
博客
1年前
1110
0
百度数据联邦平台及其应用研究
[图片] 分享嘉宾:刘吉博士 百度 资深研究员 编辑整理:Hoh Xil 出品平台:DataFunTalk 导读: 本文由百度资深研究员刘吉博士分享,主题为百度数据联邦平台及其应用研究。主要内容包括:① 数据联邦平台的架构;② 基于数据联邦平台的应用研究;③ 联邦学习;④ 可解释性。 01 数据联邦 ....
star2017
博客
1年前
410
0
Impala 在腾讯金融大数据场景中的应用
[图片] 分享嘉宾:邓威 腾讯 高级工程师 编辑整理:汪宸妃 武汉大学 出品平台:DataFunTalk 导读: 在腾讯金融场景,我们每天都会产生大量的数据,为了提升分析的交互性,让决策更加敏捷,我们引入了Impala来解决我们的分析需求。所以,本文将和大家分享Impala在腾讯金融大数据场景中的应 ....
star2017
博客
1年前
8472
0
Bilibili 基于 Flink 的优化与实践
[图片] 分享嘉宾:周晖栋 bilibili 编辑整理:宋灵城 贝壳找房/东南大学 出品平台:DataFunTalk 导读: 本文主要介绍Flink实时计算在bilibili的优化,将从以下四个方面展开:① Flink-connector稳定性优化;② Flink sql优化;③ Flink-run ....
star2017
博客
1年前
8562
0
从技术到体验:vivo 机器翻译落地实践
[图片] 分享嘉宾:李方圆 vivo 机器翻译组负责人 编辑整理:甘雨鑫 上海财经大学 出品平台:DataFunTalk 导读: 无论是在工作还是生活中,人们每天都离不开手机。研究表明,截止2020年底,人均使用手机的时长已经高达6-7小时。其实,手机上的很多应用都蕴含着大量的翻译需求。例如:看美剧 ....
star2017
博客
1年前
10034
0
58 技术 | 广义多目标算法探索实践
[图片] 分享嘉宾:周建斌 58同城 算法高级架构师 编辑整理:吴雪松 小米 出品平台:DataFunTalk 导读: 58部落是面向58同城同镇用户的内容社区,主要产品形态为PGC、UGC的信息流,样式丰富。基于业务和背景,如何提升定义信息流价值内容占比,提升点击率、留存率、互动率等多个目标?今天 ....
star2017
博客
1年前
10226
0
贝壳找房 | 人机耦合在贝壳新居住服务的应用
[图片] 分享嘉宾:陈开江 贝壳找房 算法架构师 编辑整理:刘贝尔 匈牙利佩奇大学 出品平台:DataFunTalk 导读: 在人工智能应用高速发展的现代服务业,实现机器对人的辅助与一定程度上的替代,即人机耦合 ( Human Machine Coupling ),是文明进步的趋势。而在衣食住行等与 ....
star2017
博客
1年前
9575
0
阿里小蜜多模态知识图谱的构建及应用
[图片] 分享嘉宾:徐国海 阿里巴巴 编辑整理:monk 国家管网 出品平台:DataFunTalk 导读: 本文由阿里巴巴达摩院阿里小蜜团队带来,介绍其在知识图谱方面一年多以来的一些工作进展。主要内容包括:① 知识图谱的简介;② 领域知识图谱的构建及应用;③ 多模态知识图谱的构建及应用;④ Tak ....
star2017
博客
1年前
8063
0
来也 | 自监督学习在计算机视觉中的应用
[图片] 文章作者:摄影师王同学 编辑整理:刘桐烔 导读: 在机器学习中,我们最常遇到的一个难题就是:缺少优质的标注数据。自监督学习让我们能够没有大规模标注数据也能获得优质的表征,它利用数据自身的关系来做为标注样本进行训练并且优化预定义的 pretext 任务。来也科技作为一家优秀的 RPA + A ....
star2017
博客
1年前
6994
0
灵数科技 | 图在异常流量识别中的应用和演进
[图片] 分享嘉宾:胡一然 极验 高级算法工程师 编辑整理:王彦磊 灵数科技 出品平台:DataFunTalk 导读: 近几年图建模的研究一直保持很高的热度,每年的论文产出量是非常高的,在业界一些知名的技术团队也都在寻求图相关算法与自身业务相结合的探索,所以说不管是在学术界还是在业界,各行业实际都在 ....
star2017
博客
1年前
1998
0
1
...
224
225
226
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到