×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
从日志统计到大数据分析(四)——秦天下
转眼到了2011年初,我感觉团队放在网页相关性部门,不利于发展。我的想法是要把团队面向全公司服务,甚至成为像NLP(自然语言处理)部门在厂长心中的地位。但网页相关性部门的上司觉得先服务好本部门就够了。我和基础架构部的一个经理(最早在百度负责维护和开发Hadoop团队的负责人,在他完成了Hadoop在全百度的推广之后,改为负责一个分布式存储团队了)商量了一下,…
star2017
博客
1年前
3764
0
从日志统计到大数据分析(五)——楚汉争霸
痛定思痛,我们觉得主要问题出在数据源上。百度有上百条业务线(有一定业务规模的),牵涉到数千个日志模块,每个模块的日志格式都是不一样的。甚至就连Web Server这层,有用Apache的,有用Lighttpd的,也有用Nginx的,用的软件版本可能还是不同的。日志格式五花八门,输出的是非结构化的文本字符串,比如Nginx一条日志: 219.136.113.4…
star2017
博客
1年前
3782
0
从日志统计到大数据分析(八)——五代
在上一篇的最后,我把数据处理分成五个阶段,分别是数据采集、数据传输、数据建模/存储、数据统计/分析/挖掘、数据可视化/反馈。这篇主要讲解第一个环节数据采集相关的内容。 如果看过前面几篇,就会体会到我对数据源的重视程度是超乎想象的,认为数据源整好了,数据处理就搞定了一半。如果源头没有整好,后续用再复杂的算法,也不能解决数据缺失和错误所带来的问题,并且会花费许多…
star2017
博客
1年前
4236
0
写给数据分析新手的几点建议
几点想法,分享给刚入门的数据分析师,也跟经验丰富的数据分析师做下探讨。 1.数据是有立场的,立场决定解读 数据对于业务来讲,是KPI的衡量标杆,也是行动指南。但一旦涉及到立场和方向性的东西,必然有利益触发点的问题。比如同样的一次活动的网站转化率是1.2%,是好还是坏?这是做数据分析第一步要进行的定位,也就是我们所说的下结论。好坏的区分在于比较,如何比较呢?我…
star2017
博客
1年前
3551
0
游戏数据分析:日活跃与核心用户挖掘
究竟什么是活跃?
star2017
博客
1年前
453
0
拥有敏捷数据交付平台(DataMaster)是怎样一种体验?
DataMaster划分为六个中心,分别为采集交换中心、取数操作中心、数据开发中心、敏捷挖掘中心、数据开放中心及运营管理中心。
star2017
博客
1年前
2807
0
大数据如何为电子签名提供更好的解决方案?
大数据通过提供各种更好的电子签名解决方案,主要改善行业和数字证券。
star2017
博客
1年前
490
0
淘宝云梯分布式计算平台整体架构
以下是淘宝云梯分布式计算平台的整体架构,由数据分析网整理自网络资料,供大家学习参考。
star2017
博客
1年前
2768
0
数据仓库的基本架构
数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用。
star2017
博客
1年前
7739
0
优酷背后的大数据秘密
在本文中优酷数据中台的数据技术专家门德亮分享了优酷从Hadoop迁移到阿里云MaxCompute后对业务及平台的价值。
star2017
博客
1年前
2218
0
如何进行有效的大数据处理、分析?
大数据和分析法的质量,不如分析的目的来得重要。最有趣的紧张态势和争论,始终围绕着组织是否会因使用分析法而获得最大报酬,以使既有的流程行为(process behavior)更完善,或者改变公司人员的行为。
star2017
博客
1年前
6399
0
揭秘程序员大佬十二时辰:夜间灵感喷涌,甚至全年无休
作为一名程序员,你的效率什么时候最高?
star2017
博客
1年前
3824
0
股票交易实时分析系统的架构与算法
【摘要】如果能在一台服务器上应用人工智能和机器学习算法处理每天的股票交易,而自己则在夏威夷的海滩上享受生活,那将是多么惬意呀。虽然股票价格的变化受多种因素的影响,世上也没有免费的午餐,但是有些公司依然能够借助于开源的机器学习算法和数据分析平台得到“更好、更健康、更便宜的午餐”。本文搜集并整理了一些如何实现实时股票分析系统的资料,从架构和算法两个层面给出了一种…
star2017
博客
1年前
702
0
大话Hadoop1.0、Hadoop2.0与Yarn平台
一篇关于Hadoop1.0、Hadoop2.0与Yarn的博文,从整体上把握三者之间的联系
star2017
博客
1年前
8245
0
如何正确理解商业智能BI的价值?
商业智能 BI ( Business Intelligence) 简单来说就是一套由数据仓库、查询报表、数据分析等组成的数据类技术解决方案,将企业中不同业务系统( ERP、CRM、OA、BPM 等,包括自己开发的业务系统软件)中的数据进行有效的整合,并利用合适的查询和分析工具快速并且准确的为企业提供报表展现与分析,为企业提供决策支持
star2017
博客
1年前
8829
0
构建一个商业智能BI分析平台应该重点关注什么?
商业智能 BI 分析平台构建重点
star2017
博客
1年前
8895
0
2021国内外主流BI系统
从国内企业使用情况来看,BI工具的应用国外产品,包括SAP BO、Oracle BIEE、Cognos、MSTR、Qlikview、Tableau等等,国内工具以FineBI、亿信华辰ABI、永洪BI为主。
star2017
博客
1年前
1464
0
企业BI应用案例分享,BI的价值体现在哪里?
BI能够带给企业的价值:让每一次决定、每一个管理细节、每一层战略规划都有数据支撑。
star2017
博客
1年前
3446
0
机器学习从入门到放弃之决策树算法
决策树故名思意是用于基于条件来做决策的,而它运行的逻辑相比一些复杂的算法更容易理解,只需按条件遍历树就可以了,需要花点心思的是理解如何建立决策树。
star2017
博客
1年前
10781
0
专业大数据公司:Hadoop与MapR的稳中求变
最近出炉了不少关于科技产业中各种预测,综合一下各厂商的观点,我们将对2013年度的大数据发展预测进行综述,再加上我们的意见,有些可能会是十分有趣的。 Hadoop的2013 让我们从Hadoop开始吧。作为大数据技术的典型代表,相信你一点也不会对有许多公司的预测仅仅专注于Hadoop而感到意外。MapR首席执行官John Schroeder预测称,“硬件将针…
star2017
博客
1年前
1085
0
1
...
261
262
263
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到