×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
淘系技术|基于特征全埋点的精排 ODL 实践总结
阅谦 淘系技术 稿 前言背景 淘宝内的每平每屋频道是每平每屋业务获取C端流量并进行内容分发从而建立用户家居、生活方式心智场的主要阵地。在每平每屋频道中,内容主要以场景搭配为主,内容内挂载了多个商品锚点,点击商品锚点可以跳转到商品的详情页。 [图片] 一直以来,我们结合业务特点利用算法技术提升用户浏览 ....
star2017
博客
1年前
5121
0
百度|客户画像赋能百度推广生态实践
[图片] 航宇 稿 导读:百度推广是一个典型2B、2C结合的商业场景:一方面百度推广为客户(广告主)服务,为其提供易用的广告平台(广告投放系统、商机/订单系统等等),并获取优质的内容和服务能力;另一方面百度推广将客户的这些服务能力通过广告的形式提供给用户(网民),满足其娱乐/教育/购物等个性化需求, ....
star2017
博客
1年前
973
0
58 同城 | 周彤:房价预估,房产价格体系中的算法实践
[图片] 分享嘉宾:周彤 58同城 资深算法工程师 编辑整理:王华村 SMG 出品平台:DataFunTalk 导读: 本次分享中来自58同城的算法工程师周彤,主要介绍如何利用58平台已有的房源价格等特征信息,完成估价等环节。主要包括以下几方面: 房产价格体系 均价计算 房源估价 01 房产价格体系 ....
star2017
博客
1年前
6362
0
郭人通:向量数据库及 Embedding 流水线
[图片] 分享嘉宾:郭人通博士 Zilliz 合伙人&研发总监 编辑整理:梁胜文 中科院计算所 出品平台:DataFunTalk 导读: 随着移动设备与应用的繁荣发展,非结构化数据例如图像、视频、音频等呈现爆炸式增长。针对海量的非结构化数据进行分析与检索成为企业关注的焦点。相比于结构化数据, ....
star2017
博客
1年前
898
0
pycaret模型分析
1、解释模型 解释复杂模型在机器学习中至关重要。 模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。 在PyCaret中解释模型就像编写interpret_model一样简…
star2017
博客
1年前
384
0
10种Python聚类算法完整操作示例
聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好…
star2017
博客
1年前
905
0
推荐系统老司机的十条经验
一年一度的ACM Recsys会议在9月份已经胜利闭幕,留下一堆slides和tutorials等着我们去学习。 翻看今年的各种分享,其中老司机Xavier Amatriain(曾…
star2017
博客
1年前
2770
0
网易新闻推荐工程优化 - 特征算子篇
希孟 网易 稿 https://www.6aiq.com/article/1647651329252 从2019年年中起,我们针对网易新闻个性化推荐的系统架构做了更新迭代,涉及的工作包括特征/样本的平台化、pCTR推理服务的性能优化、大规模分布式训练的探索,以及目前正在进行的推荐中台化改造等。 我们 ....
star2017
博客
1年前
3278
0
Apache Flink 在斗鱼的应用与实践
作者: 夏畅@斗鱼 稿 摘要:本文整理自斗鱼实时计算负责人夏畅在 Flink Forward Asia 2021 行业实践专场的分享。 一、背景介绍 斗鱼成立于 2014 年,是一家致力于为所有人带来欢乐的,弹幕式直播分享平台。在斗鱼,实时计算发展得并不算早。 2018 年前后,为了满足一些近实时数 ....
star2017
博客
1年前
1519
0
大数据就业方向了解一下
随着大数据在国内的发展,大数据相关人才却出现了供不应求的状况,大数据分析师更是被媒体称为“未来最具发展潜力的职业之一”。那么,大数据的就业方向有哪些呢?我们该如何择业呢?
star2017
博客
1年前
5280
0
开源时间序列数据集整理
UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理等诸多领域,目前全量数据有128种。该项目提供了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全…
star2017
博客
1年前
1200
0
Google 技术 | 蓝昶:谷歌分布式机器学习优化实践
[图片] 分享嘉宾:蓝昶博士 Google 编辑整理:何文婷 字节跳动 出品平台:DataFunTalk 导读: 随着机器学习模型和数据规模的增长,大规模分布式机器学习训练的性能越来越成为公有云用户关注的问题。本文将介绍谷歌云 Vertex AI 平台在分布式机器学习训练性能优化方面做的一系列工作。 ....
star2017
博客
1年前
5116
0
GARYMARCUS:深度学习走进死胡同了?
人工智能真正的前路究竟在何方?
star2017
博客
1年前
4232
0
在R中使用LIME解释机器学习模型
本文为大家介绍如何在R中使用LIME来解释机器学习模型,并提供了相关代码。
star2017
博客
1年前
5238
0
网易新闻推荐工程优化 - 特征平台篇
稿 作者:希孟 从2019年年中起,我们针对网易新闻个性化推荐的系统架构做了更新迭代,涉及的工作包括特征/样本的平台化、pCTR推理服务的性能优化、大规模分布式训练的探索,以及目前正在进行的推荐中台化改造等。 我们梳理了之前的部分工作,并将涉及特征、推理、训练的部分做了一个系列文章,希望和大家多多交 ....
star2017
博客
1年前
392
0
玩转数据图表、数据可视化的一些小技巧
数据可视化实际上就是为了更好的传达信息,透过繁杂的数据通过图表等方式清晰,有效的传达信息,且还要注意采用的表达方式不会分散用户的注意。
star2017
博客
1年前
5507
0
腾讯技术 | 深入解读腾讯云微搭低代码的技术架构!
腾讯 谢艳祥 稿 导语 | 本文将带大家深入聊聊微搭的技术架构,快来了解微搭是如何安全、稳定、可靠地支撑商业级应用从搭建到发布上线的。 腾讯云微搭低代码是高效、高性能的企业级低代码平台。帮助开发者快速搭建支持多种业务场景的小程序、H5、PC WEB应用,通过简单的拖拉拽操作,而不用编写复杂的代码,实 ....
star2017
博客
1年前
193
0
阿里技术 | 如何从容应对软件复杂性
[图片] 作 者 | 無涯 软件的复杂性,是一个很泛的概念。 但是一直都是开发过程中的一个难题,本文旨在探讨如何去从容应对复杂性。 一 软件的熵增、构造定律 1 熵增定律 熵的概念最早起源于物理学,热力学第二定律(又称“熵增定律”),表明了在自然过程中,一个孤立的系统总是从最初的集中、有序的排列状态 ....
star2017
博客
1年前
1779
0
优秀的数据可视化,原来是这样做的!
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
star2017
博客
1年前
2885
0
贝壳找房智能投放技术实践
[图片] 分享嘉宾:王志勇 贝壳 架构师 编辑整理:戴稚晖 陆金所 出品平台:DataFunTalk 导读: 贝壳从房产领域的产业互联网角度介绍智能广告投放的挑战、实践和思考。房产互联网是典型的高价值、长周期转化领域,本次分享重点介绍了贝壳CVR转化率预估模型在延时反馈问题上的实战经验;贝壳设计了一 ....
star2017
博客
1年前
6072
0
1
...
62
63
64
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
SpringBoot2实践系列(六):集成监控模块Actuator详解
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到