博客

淘系技术｜基于特征全埋点的精排 ODL 实践总结

阅谦淘系技术稿前言背景淘宝内的每平每屋频道是每平每屋业务获取C端流量并进行内容分发从而建立用户家居、生活方式心智场的主要阵地。在每平每屋频道中，内容主要以场景搭配为主，内容内挂载了多个商品锚点，点击商品锚点可以跳转到商品的详情页。 [图片] 一直以来，我们结合业务特点利用算法技术提升用户浏览 ....

star2017
博客
1年前
5121
0

百度｜客户画像赋能百度推广生态实践

[图片] 航宇稿导读：百度推广是一个典型2B、2C结合的商业场景：一方面百度推广为客户（广告主）服务，为其提供易用的广告平台（广告投放系统、商机/订单系统等等），并获取优质的内容和服务能力；另一方面百度推广将客户的这些服务能力通过广告的形式提供给用户（网民），满足其娱乐/教育/购物等个性化需求， ....

star2017
博客
1年前
973
0

58 同城 | 周彤：房价预估，房产价格体系中的算法实践

[图片] 分享嘉宾：周彤 58同城资深算法工程师编辑整理：王华村 SMG 出品平台：DataFunTalk 导读：本次分享中来自58同城的算法工程师周彤，主要介绍如何利用58平台已有的房源价格等特征信息，完成估价等环节。主要包括以下几方面：房产价格体系均价计算房源估价 01 房产价格体系 ....

star2017
博客
1年前
6362
0

郭人通：向量数据库及 Embedding 流水线

[图片] 分享嘉宾：郭人通博士 Zilliz 合伙人&研发总监编辑整理：梁胜文中科院计算所出品平台：DataFunTalk 导读：随着移动设备与应用的繁荣发展，非结构化数据例如图像、视频、音频等呈现爆炸式增长。针对海量的非结构化数据进行分析与检索成为企业关注的焦点。相比于结构化数据， ....

star2017
博客
1年前
898
0

pycaret模型分析

1、解释模型解释复杂模型在机器学习中至关重要。模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。在PyCaret中解释模型就像编写interpret_model一样简…

star2017
博客
1年前
384
0

10种Python聚类算法完整操作示例

聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术，用于发现数据中的有趣模式，例如基于其行为的客户群。有许多聚类算法可供选择，对于所有情况，没有单一的最佳聚类算法。相反，最好…

star2017
博客
1年前
905
0

网易新闻推荐工程优化 - 特征算子篇

希孟网易稿 https://www.6aiq.com/article/1647651329252 从2019年年中起，我们针对网易新闻个性化推荐的系统架构做了更新迭代，涉及的工作包括特征/样本的平台化、pCTR推理服务的性能优化、大规模分布式训练的探索，以及目前正在进行的推荐中台化改造等。我们 ....

star2017
博客
1年前
3278
0

Apache Flink 在斗鱼的应用与实践

作者：夏畅@斗鱼稿摘要：本文整理自斗鱼实时计算负责人夏畅在 Flink Forward Asia 2021 行业实践专场的分享。一、背景介绍斗鱼成立于 2014 年，是一家致力于为所有人带来欢乐的，弹幕式直播分享平台。在斗鱼，实时计算发展得并不算早。 2018 年前后，为了满足一些近实时数 ....

star2017
博客
1年前
1519
0

大数据就业方向了解一下

随着大数据在国内的发展，大数据相关人才却出现了供不应求的状况，大数据分析师更是被媒体称为“未来最具发展潜力的职业之一”。那么，大数据的就业方向有哪些呢？我们该如何择业呢？

star2017
博客
1年前
5280
0

开源时间序列数据集整理

UCR时间序列数据集是时序领域的“Imagnet”，涵盖医疗/电力/地理等诸多领域，目前全量数据有128种。该项目提供了一个非常全面的数据获取渠道，包含各个细分领域的数据库资源，自然科学和社会科学的覆盖都很全…

star2017
博客
1年前
1200
0

Google 技术 | 蓝昶：谷歌分布式机器学习优化实践

[图片] 分享嘉宾：蓝昶博士 Google 编辑整理：何文婷字节跳动出品平台：DataFunTalk 导读：随着机器学习模型和数据规模的增长，大规模分布式机器学习训练的性能越来越成为公有云用户关注的问题。本文将介绍谷歌云 Vertex AI 平台在分布式机器学习训练性能优化方面做的一系列工作。 ....

star2017
博客
1年前
5116
0

GARYMARCUS：深度学习走进死胡同了？

人工智能真正的前路究竟在何方？

star2017
博客
1年前
4232
0

在R中使用LIME解释机器学习模型

本文为大家介绍如何在R中使用LIME来解释机器学习模型，并提供了相关代码。

star2017
博客
1年前
5238
0

网易新闻推荐工程优化 - 特征平台篇

稿作者：希孟从2019年年中起，我们针对网易新闻个性化推荐的系统架构做了更新迭代，涉及的工作包括特征/样本的平台化、pCTR推理服务的性能优化、大规模分布式训练的探索，以及目前正在进行的推荐中台化改造等。我们梳理了之前的部分工作，并将涉及特征、推理、训练的部分做了一个系列文章，希望和大家多多交 ....

star2017
博客
1年前
392
0

玩转数据图表、数据可视化的一些小技巧

数据可视化实际上就是为了更好的传达信息，透过繁杂的数据通过图表等方式清晰，有效的传达信息，且还要注意采用的表达方式不会分散用户的注意。

star2017
博客
1年前
5507
0

腾讯技术｜深入解读腾讯云微搭低代码的技术架构！

腾讯谢艳祥稿导语 | 本文将带大家深入聊聊微搭的技术架构，快来了解微搭是如何安全、稳定、可靠地支撑商业级应用从搭建到发布上线的。腾讯云微搭低代码是高效、高性能的企业级低代码平台。帮助开发者快速搭建支持多种业务场景的小程序、H5、PC WEB应用，通过简单的拖拉拽操作，而不用编写复杂的代码，实 ....

star2017
博客
1年前
193
0

阿里技术 | 如何从容应对软件复杂性

[图片] 作者 | 無涯软件的复杂性，是一个很泛的概念。但是一直都是开发过程中的一个难题，本文旨在探讨如何去从容应对复杂性。一软件的熵增、构造定律 1 熵增定律熵的概念最早起源于物理学，热力学第二定律（又称“熵增定律”），表明了在自然过程中，一个孤立的系统总是从最初的集中、有序的排列状态 ....

star2017
博客
1年前
1779
0

优秀的数据可视化，原来是这样做的！

工作中我们可能会接触到很多业务数据，需要在总结汇报中展示呈现，俗话说“字不如表，表不如图”，那么如何缩短数据与用户的距离？让用户一眼Get到重点？让老板赞同你的汇报方案呢？

star2017
博客
1年前
2885
0

贝壳找房智能投放技术实践

[图片] 分享嘉宾：王志勇贝壳架构师编辑整理：戴稚晖陆金所出品平台：DataFunTalk 导读：贝壳从房产领域的产业互联网角度介绍智能广告投放的挑战、实践和思考。房产互联网是典型的高价值、长周期转化领域，本次分享重点介绍了贝壳CVR转化率预估模型在延时反馈问题上的实战经验；贝壳设计了一 ....

star2017
博客
1年前
6072
0