×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
网易数帆数据中台逻辑数据湖的实践
[图片] 导读: 本文将介绍过去15年中,网易大数据团队在应对不断涌现的新需求、新痛点的过程中,逐渐形成的一套逻辑数据湖落地方法。内容分为五部分: 关于网易数帆 为什么做逻辑数据湖 怎么做逻辑数据湖 未来规划 精彩问答 01 关于网易数帆 网易数帆是从网易杭州研究院孵化出来的。网易杭研的重要职责是公 ....
star2017
博客
1年前
564
0
什么是NPS?
一、什么是NPS? NPS的中文是净推荐值,是评估用户口碑的一种方式。评估用户/客户向朋友、其他人推荐公司的产品或服务的可能性的指标。 NPS概念属于用户口碑、用户体验评估的范畴。…
star2017
博客
1年前
191
0
决策树–Decisiontree
什么是决策树? 决策树学习的 3 个步骤 3 种典型的决策树算法 决策树的优缺点 决策树是一种逻辑简单的机器学习算法,它是一种树形结构,所以叫决策树。 本文将介绍决策树的基本概念、…
star2017
博客
1年前
3707
0
GDBT模型、XGBoost和LightGBM之间的区别与联系
GBDT提升树与XGBoost树 相比于经典的GBDT,xgboost做了一些改进,从而在效果和性能上有明显的提升,在这里,通过整理了一些资料,总结了一下: 第一,GBDT将目标函…
star2017
博客
1年前
285
0
用Python进行系统聚类分析
在进行机器学习时,我们往往要对数据进行聚类分析,聚类,说白了就是把相似的样品点/数据点进行归类,相似度高的样品点会放在一起,这样一个样本就会被分成几类。而聚类分析也有很多种方法,比…
star2017
博客
1年前
173
0
阿里|关于技术能力的思考和总结
[图片] 朱春茂(知明) 阿里开发者 稿 技术人成长的悖论 在程序员界有一个悖论持续在困惑着很多技术人:在写代码的人的困惑是一直写代码是不是会丧失竞争力,会不会被后面年轻的更能加班写代码的人汰换。典型代表就是工作5年左右的核心技术骨干,此时正处于编码正嗨但也开始着手规划下一个职业发展阶段的时候;没在 ....
star2017
博客
1年前
1541
0
阿里 10 年沉淀|那些技术实战中的架构设计方法
[图片] 作者: 朱春茂(知明) 稿 上周我写的一篇文章《关于技术能力的思考和总结》引起了大家的关注,好多读者的评论“以写代想、以想促真、以讲验真”,大家的感受很深刻,基于上次的文章,这篇文章我其实更想跟大家聊聊一些常用的思考方法,思考问题的方式对了,往往可以帮助大家少走弯路。 常用思考方法 [图片 ....
star2017
博客
1年前
1277
0
网易云音乐|服务启动过程性能波动的分析与解决方案
[图片] 题图 作者:浩然 1. 前言 本文仅分享自己在工作中遇到的问题时的解决方案和思路,以及排查的过程。重点还是分享排查的思路,知识点其实已经挺老了。如有疑问或描述不妥,欢迎赐教。 2. 问题表象 在工程启动的时候,系统的请求会有一波超时,从监控来看,JVM 的GC(G1) 波动较大,CPU波动 ....
star2017
博客
1年前
1425
0
EXCEL规划求解的简明教程
在知乎上查了查EXCEL规划求解的文章,的确有一些很好的应用实例,但我就有点纳闷了,EXCEL的规划求解模块难道不是用来求解运筹学问题的专业工具吗?怎么没有一篇文章提及这一点呢? …
star2017
博客
1年前
94
0
实时数据湖在字节跳动的实践
[图片] 分享嘉宾:杨诗旻 字节跳动数据平台 编辑整理:田长远 出品平台:DataFunTalk 导读: 今天分享的主题是实时数据湖在字节跳动的实践,将围绕下面四点展开: 对实时数据湖的解读 在落地实时数据湖的过程中遇到的一些挑战和应对方式 结合场景介绍实时数据湖在字节内部的一些实践案例 数据湖发展 ....
star2017
博客
1年前
1223
0
十种聚类算法的完整Python操作示例
聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好…
star2017
博客
1年前
612
0
华为史佳欣:基于知识图谱的复杂问题推理问答
[图片] 分享嘉宾:史佳欣博士 华为云计算公司 编辑整理:姚顺鹏 北京公瑾 出品平台:DataFunTalk 导读: 知识图谱在现有的实际业务中存在着各种各样的应用,问答是其中一个非常重要的应用,本文主要关注如何解决基于知识图谱的复杂问题,该任务又称为推理问答。 本文的介绍会围绕下面四点展开: KB ....
star2017
博客
1年前
1270
0
Pandas教程|超好用的Groupby用法详解
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根…
star2017
博客
1年前
342
0
机器学习算法和架构在MLOps框架下的工程实践
本文主要介绍机器学习(以下简写为ML)算法和架构在MLOps框架下的工程实践。
star2017
博客
1年前
4932
0
用Minitab进行过程能力分析:非正态(拟合其他分布法)
对于过程能力分析,通过之前的文章我们知道在计算能力指标之前需要确认一些前提条件是否满足要求(独立,正态,MSA合格,稳定),今天我们继续延续之前的话题来讨论非正态数据如何做过程能力分析。
star2017
博客
1年前
374
0
一文详解医疗机构数据治理六大核心环节
近几年来,医疗机构的数字化进程明显加快,机构内的信息系统越来越多、电子病历不断普及、各方面业务的数字化基本实现……与之相伴随而来的,是海量待挖掘应用的数据。
star2017
博客
1年前
986
0
Disruptor 在网易云音乐特征服务中的应用
作者:章北海 网易云音乐稿 我们的线上特征数据服务DataService,为了解决使用线程池模型导致机器cpu利用率不高,长尾请求延迟不线性(p99、p999出现J型曲线)的问题。在利用Disruptor替换线程池之后取得不错的性能结果。本文主要是简单的介绍一下对Disruptor的个人理解以及落地 ....
star2017
博客
1年前
660
0
实时增量学习在云音乐直播推荐系统中的工程实践
作者:易云天 网易云音乐稿 1 背景 在云音乐早期机器学习推荐场景中,大多数是以离线机器学习为主,模型是天级别(T+1)更新的。随着用户、主播、ugc内容等变动频繁,以及外部环境发生突变如产品形态、热点爆点等情况下,离线方式存在严重的滞后性,而模型实时化能从全局快速捕捉变化,提高流量转化效率,减少流 ....
star2017
博客
1年前
2602
0
自动化知识图谱表示学习:从三元组到子图
[图片] 分享嘉宾:张永祺博士 第四范式 编辑整理:吴祺尧 出品平台:DataFunTalk 导读: 知识图谱是一种特殊的图结构,它包含了语义信息与图结构信息。它可以被应用在多个领域,如QA问答系统、推荐系统、新药发现、股市预测等。现在无论是学术界还是工业界都陆续提出了自己的知识图谱构建平台。第四范 ....
star2017
博客
1年前
5072
0
如何提升推荐系统的可解释性?京东智能推荐卖点技术全解析!
[图片] 分享嘉宾:郭晓洁博士 京东硅谷研究院 编辑整理:廖媛媛 美的集团 出品平台:DataFunTalk 导读: 京东智能商客之推荐卖点是基于NLP的产品,目前已广泛地助力和赋能于京东商城的各个平台。今天和大家分享一下自然语言处理如何在工业界落地实现。主要围绕以下5个方面展开: 推荐卖点技术背景 ....
star2017
博客
1年前
5028
0
1
...
53
54
55
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
SpringBoot2实践系列(六):集成监控模块Actuator详解
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到