×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据 共 539 个结果.
赵海源:峰值超 2 亿 / 秒,Kafka 在美团数据平台的实践
[图片] 分享嘉宾:赵海源 美团 流存储工程师 编辑整理:刘明 慕华信息科技 出品平台:DataFunTalk 导读: 本文将介绍Kafka在美团数据平台的实践,主要内容包括:① Kafka在美团数据平台的发展现状和面临的挑战,主要是海量数据下如何保证读写延迟的问题,以及大规模的集群管理与优化;② ....
star2017
1年前
5464
0
丁香园 | 电商搜索的语义理解问题
丁香园大数据 稿 今天我们来聊一聊大数据时代的电商搜索问题,随着电商的普及,越来越多人开始在网上购物,电商搜索的目的在于如何从海量的商品当中找到用户需要的商品。目前,绝大多数的商品召回和排序都是基于embedding,如何构建商品向量、如何解决搜索词与商品名称之间的语义鸿沟问题、如何解决店铺特征稀疏 ....
star2017
1年前
6743
0
美团 Flink 大作业部署与状态稳定性优化实践
摘要 :本篇内容整理自美团数据平台工程师冯斐、王非凡在 Flink Forward Asia 2021 生产实践专场的演讲。主要内容包括: 一、相关背景 [图片] 美团 Flink 的应用场景覆盖了社区定义的三种场景: 应用比较多的是数据管道场景,比如数仓 ODS 层数据的实时接入,或跨数据源的实时 ....
star2017
1年前
5207
0
百度爱番番 | 大规模异构数据的线索列表进化之路
导读:「以客户为中心,技术为产品服务」是爱番番线索管家团队一贯遵循的原则。技术架构规划首先应该围绕业务诉求展开,用合理的技术赋能产品,产品在不断的演进中又对技术提出更高的标准和要求。作为爱番番PV最高的页面,本文将详细介绍线索列表如何从快速交付的刀耕火种原始状态,逐步走向“高可用、高质量、高体验“的 ....
star2017
1年前
4750
0
机器学习选股模型的可解释性分析
在这篇文章中,我们参考partial dependence的理念,尝试从以下三个角度去分析机器学习模型的预测机制…
star2017
1年前
5860
0
大数据时代:十大最热门的大数据技术
随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。
star2017
1年前
6218
0
A/B测试系统设计
1、 什么是A/B测试 A/B 测试,简单来说,就是为同一个目标制定两个方案,让一部分用户使用 A 方案,另一部分用户使用 B 方案,记录下用户的使用情况,看哪个方案的效果更好,以便全面推广。 A/B 测试在有的公司又称为小流量测试或者灰度发布,原因: 一是为了统计新功能的效果; 二是为了在全流量上线前修复可能出现的BUG。 虽然在业务上的含义有所差异,但是…
star2017
1年前
5032
0
收藏!52个实用的数据可视化工具!
您的图表将在HTML5的框架下使用强大的JavaScript库D3.js创建图表。D3.js是开源工具,使用数据驱动的方式创建漂亮的网页。Chartkick是一个图表绘制工具,特点是UI美观、使用简单,并且支…
star2017
1年前
4939
0
如何学习数据库系统知识?
如何学习数据库系统知识。在这个之外的学习途径,我首先推荐看斯坦福大学的数据库系统实现这本书是数据库系统实现里面的经典的经典了。
star2017
1年前
5207
0
数据驱动决策的13种思维方式
“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,将来你一定能用上!~
star2017
1年前
5337
0
万字长文 | 理想汽车:从 Hadoop 到云原生的演进与思考
云原生架构下,基于 Hadoop 技术栈搭建数据平台应该如何改造? 理想汽车大数据平台涉及的组件多, 在从 Hadoop 到云原生演进的过程中边探索,边实践,积累了不少一手经验;同时,他们率先在对象存储上使用 JuiceFS,实现平台级文件共享、跨平台使用海量数据等场景。 作者简介: 聂磊,理想汽车 ....
star2017
1年前
3482
0
刘石伟:字节跳动埋点数据流建设与治理实践
[图片] 分享嘉宾:刘石伟 字节跳动 编辑整理:Rissy 易显智能科技 出品平台:DataFunTalk 导读: 埋点数据是数据分析、推荐、运营的基础,低延时、稳定、高效的埋点数据流对提高用户体验有着非常重要的作用。而随着流量的增大,埋点的增多,在大流量场景下,埋点数据流的建设和治理也面临不同的挑 ....
star2017
1年前
3861
0
网易严选流量数据体系建设
严选技术 稿 当今是流量为王时代,严选作为电商,流量建设就显得尤为重要。流量数据建设比业务数据困难,因为其数据源本身是一些半结构化的数据,没有分析维度的概念,而且流量的数据杂、脏、乱,对数据的检验、整合、治理的难度就会更大,本文从整个流量链路阐述,由于篇幅原因,部分不做详细介绍。 1. 埋点体系建设 ....
star2017
1年前
4408
0
网易严选流量数据体系演进(上篇)
网易技术 稿 在互联网场景,无论是构建广告、搜索推荐、投放、用户触达等场景,其实都是围绕着用户行为流量进行各种人工或智能策略的流量调控分发或是人群运营。在这些精细智能化运营的背后,对流量数据的丰富性、时效性和灵活性提出巨大的挑战。 本文主要分享了在网易严选电商流量数据建设,一套覆盖全链路、通用场景归 ....
star2017
1年前
3910
0
网易|数据治理体系演进简介
网易技术 稿 网易内部如严选、云音乐、传媒等数据团队对数据内容体系的治理思路都是将治理规范融入到开发过程中,将治理的动作提前,这其实就是“开发治理一体化”;事后依赖数据资产健康评估和治理工具进行数据的治理,建立事前加事后的数据治理体系。 随着网易数帆商业化的发展,遇到很多金融及大型国企客户,我们发现 ....
star2017
1年前
3528
0
虎牙大数据平台的成本把控和 SLA 技术实践经验
[图片] 分享嘉宾:陈仕明 虎牙直播 计算平台负责人 编辑整理:韩城 新浪微博 出品平台:DataFunTalk 导读: 大家好,非常高兴能够通过直播的形式跟大家进行技术交流,这次分享的议题主要是数据平台在成本和用户服务SLA两个方向的技术交流。有些同学看到这两个方向,可能会有疑问,因为过往在行业里 ....
star2017
1年前
3580
0
中国移动大数据能力在保险领域的实践
分享嘉宾:杨仕荣 招商局仁和人寿 编辑整理:苏丽萍 彩讯股份 导读: 大家好,我是招商局仁和人寿保险股份有限公司互联网事业部的杨仕荣。招商仁和人寿于2017年成立,近五年与中国移动在大数据领域开展了不少应用探索。 今天的分享围绕下面三点展开: 保险业大数据应用情况 招商仁和与中移动已开展的大数据应用 ....
star2017
1年前
3399
0
快看漫画构建数据治理闭环的逻辑与实践
[图片] 分享嘉宾:屈世超 快看 数据开发负责人 编辑整理:许友昌 浙大中控 出品平台:DataFunTalk 导读: 快看在过去经历了业务线以及每个业务线数据体量的极速扩张,我们的数据部门也因此在数据建设和治理方面面临了很多的问题和挑战,过去一年我们进行了闭环的数据治理实践,总结了一些经验,这次很 ....
star2017
1年前
3333
0
数据仓库为什么要分层,各层的作用是什么
数据的整个生命周期能够清晰明确被设计者和使用者感知到。
star2017
1年前
3383
0
"什么是大数据? 数据的“5V”特性都有哪些?"
'什么是大数据? 数据的“5V”特性都有哪些?'
star2017
1年前
3638
0
1
...
8
9
10
...
27
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
SpringBoot2实践系列(六):集成监控模块Actuator详解
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到