日万亿量级请求Twitter机器学习平

“在数据爆炸的时代,机器学习是有效挖掘信息的途径,怎样顺势而为设计与搭建大规模机器学习平台?本文整理自Twitter机器学习平台组负责人郭晓江在ArchSummit深圳的演讲。帮助大家了解Twitter机器学习的发展历史与变迁以及超大规模(日万亿量级请求)的在线机器学习系统的设计。老司机简介

四年前加入Twitter,先后供职于广告组和机器学习平台组。在广告组,设计和构建了adsranking后端平台,之后从无到有领导团队搭建了Twitter的机器学习平台,应用在广告推荐,timelineranking,反欺诈等多个产品中,是每年几十亿美元的营收与内容推荐背后的核心。本科毕业于清华电子工程系,硕士毕业于斯坦福电子工程系。

如果我们将数据比作一座金矿,机器学习就是挖掘金矿的工具。俗话说:顺势而为。那么机器学习在近些年来也是发展越来越好,应用越来越广,我认为主要得益于以下几个趋势:

1、DataAvailability

我们可以获得的数据量越来越大,一会在下一张slide中也会讲到如果数据量越大,我们模型的质量会有显著提高;

2、ComputationPower越来越强

比如最近出现的云计算、GPU、TPU等等。在上世纪九十年代其实神经网络的理论就已经有了,也就是深度学习的这些理论已经有了,但是当时并没有火起来,甚至一度被学术界认为这是一个没有前途的方向,就是因为当时这个







































北京最好白癜风医院哪家好
太原治疗白癜风医院



转载请注明:http://www.nydjfy.com/jbjj/1558.html