商务服务
360数据平台副总监王景正独家解析:大数据平台从0到1的演进历程,深度解构QDAS以及...
2024-10-31 21:31

在大数据的风口,起飞的为什么是360?这也许是很多人的疑问,作为大数据业界的弄潮儿,360大数据平台是如何演进的,QDAS是缘何诞生,以及再次变革的原因又是什么?

360数据平台副总监王景正独家解析:大数据平台从0到1的演进历程,深度解构QDAS以及...

5月31日晚,360大数据中心数据平台副总监、360技术委员会大数据分委会主席王景正分享了360大数据平台的演进之路。

以下是【重点】整理分享:

为什么要做大数据平台?

360大数据平台可以说是我一手带领构建起来,QDAS对应的单词意思是奇虎数据分析系统。

事实上,大公司会面临这样的问题:当业务飞速发展的时候,往往会忙于做业务而不重视底层平台的发展,底层也没有时间思考如何构建平台化、产品化的东西。而对于开发人员来说,一直在做重复的工作而没有得到成长和认可。最终的结果是公司产能出现问题,包括准确性和效率方面。

360也一样。由于内部环境很复杂,业务线非常多(安全杀毒、游戏、快视频、浏览器等),如果把一个App算作一个业务的话,公司业务多达数百个,而这些业务团队的需求点又存在差异性。更为致命的是:业务线各自为战,所上传数据完全不统一不规范,甚至没有人知道上传的格式。

在过去很长一段时间里,这些问题苦于没有合适的切入点而一直搁置没有被解决。直到最近3、4年的时间我们的大数据平台才慢慢做起来。

QDAS诞生的原因

开始的时候提出了几种解决方案。

譬如整理数据字典统一规范化公司数据,但是这并不现实,互联网公司的特点是变化快:业务发展变化快,人员变动也快。

因为业务需要不断调整将导致数据规范化难以统一, 而即便数据上传规范,但是当人员流动,新入职的产品经理可能难以理解或是不认同之前的数据,这时候的结果就是:重建。

……

最终我们得出了解决方案:从重业务轻平台的无平台阶段到试图建立一个公司内部的类友盟的平台,也就是QDAS,主要解决的是效率问题。

2015年5月份,我一手推进了QDAS的搭建,当时并不要求做得大而全,目的在于能够让这套系统可以先run起来。

在开发大数据平台之前,我们把公司内部使用者分为4类:

在QDAS阶段,我们主要统一了3个内容:

统一数据采集方案:

前期开会要求统一数据(软性的手段最后没有达到预期的效果)

后期SDK+JS(通过技术手段做硬性要求)

统一云计算

统一预置报表+自定义报表

第一个版本我们预置了70张报表。解决的是高层、开发、运营人员和小部分产品经理的需求。其中自定义事件报表是产品经理使用最高的。

上图是QDAS第一版本的主骨架,由5个部分组成。包括SDK、大数据计算(后台)、QDAS(当时仅作为报表的称呼)、开发者信息管理平台(系统入口,具备实时调试功能)、云控平台(保持访问者和SDK之间的通讯关系。360有一个用户隐私管理部,采集用户信息的时候需要先求得批准)。

各系统之前相生相克、自然集成。譬如想要使用QDAS, 第一步要到开发者信息管理平台注册并下载SDK,下载配置完成后经过云控平台进行数据采集,再将获得的数据在大数据计算里运行,最后把计算结果导出到QDAS报表里。此外,各系统均具备升级和扩展能力,可以衍生很多新的东西。

再给大家看一下QDAS计算框架示意,在这个框架里面,自定义事件、事件漏斗和页面访问路径都是产品经理重点关注的的部分。

自定义事件:用户对每个事件设置唯一时间ID,在QDAS上录入相关规则,大数据平台会进行盲算。让产品经理对自己关心的事件进行埋点。

事件漏斗:从第一个事件到第二个事件的转化率和留存情况

此外,我们目前还在做用户分袂,把流失和留存的人保存成2个用户群体,做相应的数据统计和比较:如两个群体之间的行为差异、属性差异等。

变革和利器纳新

去年我们做过一个关于QDAS的用户使用情况调查统计,如上图所示,左边是以前的用户使用情况,结果发现我们投入精力最大耗费计算资源最多的预置报表用的人却很少,80%的访问者都在用自定义事件,也就是说使用的人大多数都是产品经理。

因此,我们决定把设计精力改造成与用户实际需求想匹配。去年发布的新的数据产品(OLAP、无埋点、A/B测试等)也是为了解决这些问题。

OLAP是我们在做QDAS+时推出的一系列数据产品之一。

和之前一张框架相比,新增了OLAP数据处理、结果缓存和OLAP单独展示报表。其中结果缓存主要是为了提升用户体验,将用户反复看的报表进行结果缓存。

OLAP的特性

思考和展望

有一些做大数据平台的朋友容易陷入一种在被动的做支撑的境地,做好一个平台、维护平台、为了不出错、被动等别人的需求……这种状态很难把平台做得出色。

如何判断数据产品好还是不好,我的答案是:

“数据产品的目的,就是让人更快地形成决策,越是能让用户快速决策的产品,价值也就越高”

从无到有,从人肉支撑到平台搭建

QDAS就是让效率提升,构建规范且自动化的基础平台

OLAP就是回归本源,做用户想要的平台,为用户创造价值。

未来,我们希望以大数据之力,驱动增长

Tips:关于无埋点

这是一个有价值但具有局限性的东西,当开展创新型业务需要数据验证想法时,无埋点确实可以帮助到产品经理。不过我们也必须清醒地认识它的局限所在,因此,我们目前的数据采集还是以代码埋点为主,无埋点为辅助。

关于无埋点数据收集中可以避免的一个坑:如果通过无埋点采集一个长页面中进入下一页的按钮点击量时,一定要注意这个页面是否有存在2个按钮,如果是,那么圈选时一定要把2个都选上,否则最后出来的数据会少很多。

    以上就是本篇文章【360数据平台副总监王景正独家解析:大数据平台从0到1的演进历程,深度解构QDAS以及...】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/3333.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多   
最新新闻
云南网络营销软件哪个好?权威推荐助您快速选择
在数字化时代,网络营销软件成为了许多企业实现营销目标的重要工具。然而,市面上网络营销软件琳琅满目,选择一个适合自己的并不
宫崎骏的时代结束了
在《你想活出怎样的人生》之前,宫崎骏一直是著名的退休诈骗犯。七次退休又七次复出,年过八旬,创作欲还是旺盛到令人害怕。然而
个人大数据信用查询平台哪个更准确一些?蘑菇画像个人大数据信用报告查询平台更好用
个人大数据信用查询平台哪个更准确一些?蘑菇画像个人大数据信用报告查询平台更好用,个人大数据信用查询平台市面上还是比较多的
小红书关键词热度查询!国风大潮下,品牌怎么玩出花样、玩出水平?
国风,是当下年轻人钟爱的潮流。汉服穿搭、文物手办、国潮仿妆……频频出圈。“民族的就是世界的”,国风的影响力可谓深远,一说
app推广接单发布平台哪个好?怎么领取任务赚钱?
最近几年,随着互联网的快速发展,利用网络兼职的赚钱方式也呈现越来越火,非常受大众欢迎的趋势。而且其种类也非常多:微商、社
【可打印】文学常识常考100题汇总,初中生练一练!(部编版初中语文)
关注本公众号,私信发送数字:2493,领取电子打印版文学常识1、成语“万事俱备,只欠东风”是根据《三国演义》________ (战役)
“迎旅发大会 游美丽望城”望城首届文旅短视频大赛,最高3万奖励等你来拿!
湘江水浩浩奔腾,流淌沧桑巨变。铜官窑静穆肃然,在这里诉说着望城的厚重历史,流传着“君生我未生,我生君已老”凄美爱情故事;落日
mysql导入大txt文件怎么打开_mysql怎么导入txt文件?
有时候我们在使用mysql数据库的时候,想导入txt文本文档,要怎么操作呢?下面本篇文章就来给大家介绍一下方法
寸头抖音短视频教程_人开始衰老的迹象是什么
岁月不饶人,我才50出头,可是许多衰老迹象已经越来越明显,惹得中医闺蜜笑话这样的我。1、觉得右后背和肩膀疼,出现“五十肩”
什么是网站页脚:以及最佳页脚设计示例
主体内容外,网站还包括页眉和页脚,用于帮助访问者的特定目的。由于我们认为网站页脚设计同样重要,我们整理了10个最佳免费网站
本企业新闻

点击拨打: