如何用数据去决定资源的使用和获得产出最大化

前言
“什么互联网营销大神、牛人、达人。其实人家都是数据分析/挖据高手!” — 蔡维东

分享者的个人介绍
Gordon是最早期开始接触搜索营销、网站分析的一批人之一,2000年在国外开始IT/互联网行业。到中国后,先后在阿里巴巴、携程等大型互联网企业带领SEM、SEO、网站分析、运营、产品等团队。

本次分享的内容
大家好,我是Gordon Choi,今天很高兴为大家进行分享。
我们先来点轻松的,大家来看图:

如何用数据决定资源使用和获得产出最大化001

我不知道大家平时在工作中,生活中是怎么用数据的。但是在工作中,如果不看数据就去做决定,那只是一个发表意见的人,这个叫做opinion,如果在工作中经常用opinion,而不是数据,就很难在互联网环境的企业里去说服开发给你干点事,或者让产品经理说服开发去拿开发资源。

如何用数据决定资源使用和获得产出最大化002

上图有一个处于右下角的角色,上面有很多高层,该如何说服上面的高层区分配资源来支持这个idea,在大型互联网企业肯定是个难点。高层各有各的考虑和想法,结果很有可能是,决策者最终否定了这个idea,或者这个idea还未到决策者的时候就被否定了。

如果互联网企业的老板是从传统行业转型而来,他们很有可能不理解网站数据分析师角色是什么,他们很可能会认为数据分析师是算命的。什么是算命的?可能是一些科幻美剧(比如,Harry Potter)里一个人对着一只水晶球,替你问你的未来是什么。当然,数据分析师不可能是算命师。

如何用数据决定资源使用和获得产出最大化003

如果经常去猜测而不真正去看数据,那会造成什么问题呢。有可能一个产品经理已经为一个电商网站设计好一套完整的用户转化流程,从选择商品到走到完成订单支付通通齐全。结果一个用户进来说,“我只是想找个洗手间,可是找不到呢”。原来她是个免费用户嘛。没去从数据去理解,我们就不会知道用户真正想要什么。

如何用数据决定资源使用和获得产出最大化004

这个图是个理想状态。通过数据驱动,产生想法(idea),并把idea最终执行和实现出来,再不断按照三角形循环重复。这就是个数据驱动的优化过程。

如何用数据决定资源使用和获得产出最大化005

但一般很多企业像更像第二张图。

不基于任何数据提出一个想法(Idea),或者是看到行业排名第一的互联网公司的想法是怎样,就去直接拷贝。有时候是猜对的,但有时候结果会很糟糕,执行下来并不知道会有什么结果。

正确的做法是需要用数据驱动决策。

接下来我们看一个案例,看在SEM中如何用数据驱动决策。

如何用数据决定资源使用和获得产出最大化006

案例是一个搜索引擎SEM广告的投放计划,你可以在上图中看到预算,消费,产出等指标。

这个是一个理想状态的数据报告,你可以看到两个标红的箭头,消费按照预算预估,所以预算和消费是一样的,产出的比例是按照历史数据中以前投放过的产出比例计算的。利润是按照图里的黄色部分公式计算出来的。

如何用数据决定资源使用和获得产出最大化007

案例很简单,并不需要涉及到大数据,只需要用到一个常用的二八原理(Pareto)。我们用两成的时间去产出八成的效益。

如何用数据决定资源使用和获得产出最大化008

图中是实际情况投放出来的结果,5个广告计划中,有些广告计划的预算和消费最后是不一样的,为什么会不一样呢,因为实际投放后,某些广告计划里的关键词由于检索量或点击量没有我们预想的足够,所以会消耗不掉预算。

我们当时是需要做效果营销,我们的绩效考核和奖金都是与利润直接挂钩的,所以做广告投放的时候就必须拼命的把利润做出最大化。有几个方法可以把利润做到最大:

1.把消费做到级低。就是被用户点到广告的次数几乎没有白费的,这时就会达到很高的转化率,可能10%,即每10次广告点击里就要转化一次,比如卖掉一台手机。

2.把产出做到级高。总有某些商品利润很高,我们会尝试把利润高的商品多卖几件。

3.把预算移到对的地方。广告计划ABCDE中,如果你发现广告计划A的ROI最大,就尽量把更多的预算都花到A里。但不一定A都能把预算花得出去,比如说A里有一些关键词搜索量相对低,展现量也比较低,所以你看到实际的情况是A的消费并没有达到预算。

如何用数据决定资源使用和获得产出最大化009

图中我们换个排序方式,把广告计划按照ROI从高到低排序,所以ROI最高的就是广告计划D,其次是广告计划A。排序之后,我们就知道应该把更高的预算放到哪个广告计划中。

如何用数据决定资源使用和获得产出最大化010

图中显示我们在预算上做了调整,比如说把ROI表现最好的广告计划(D和A)的预算调整到高于100(现在甚至150了),另外两个表现不好的C和E的预算被调到低于100(80和20),我们可能甚至也不愿意它们花到80和20,因为它们利润已经是负的了。

优化一轮后总消费从350增加到390,多花了40块。但总利润从20提升到了160,共增长了140块,这就是一个SEM快速优化调整的方式。

如何用数据决定资源使用和获得产出最大化011

在哪里用到了二八原理呢?从图里我们可以看到SEM推广账号的结构(比如一个百度推广帐号),第一层是SEM账号,第二层是广告计划。我们刚刚在优化的就在第二层做的调整,我们花了20%的时间去做80%的事情,就是二八。

把这个做完了,下一步主要的就是第四层(level 4),需要花大量的时间(所谓的80%的时间)。

国内的大电商SEM账号里通常会有至少几十万关键词甚至100万关键词。我们以前做Google的SEM时,一个电商会需要把SEM广告投放到多个国家,所以每个电商很容易就会有至少100万个关键词要管理/优化。每个优化师管理至少7个这样的电商账号,所有的优化师都很容易很快就能完成第二层的优化(二八),而消耗上最时间的优化工作都是在第四层。

如何用数据决定资源使用和获得产出最大化012

刚刚说的SEM广告优化方法其实可以套用到更高的管理级别。比如你是一个大型电商网站的营销负责人(Chief Marketing Officer / CMO),你掌握着所有营销预算,你部门会有营销人员和营销预算,你就可以按照这个方法把预算分配到各个的渠道,再把营销人员分配到不同项目上去。

所以在一个电商网站里的营销部门,可以把每一个人的预算(和消费),产出和利润都数据化。当然并不是每一个人都有广告预算,比如设计师的预算可以等于他的工资,或者他的加班费也算作预算。

很久以前我在国外上班的时候的那个公司也是类型这种结构,当时我还不是最上面的Marketing Director。我们大家会贪好玩,会在结果没出来之前,猜测部门里谁的产出最高,谁的产出最低,我们都开着玩笑说是Marketing Director产出最低,因为他不做任何具体事情,他的职能最多是个做跨部门沟通的纯沟通角色。

如何用数据决定资源使用和获得产出最大化013

互联网甲方公司里有很多部门,比如在营销部门里,有SEM,SEO,运营,产品经理等很多角色,一个员工最先做SEO,需要跟产品经理争取开发资源,做了两年SEO后,又做一年SEM,又做了运营,然后做了两年产品经理,或者像现在更多情况。或者一个员工一开始只做PC端网站,后来又做了移动H5网站,再后来有做了APP,那么这个员工了知识面就很广了。

为什么要知识的广度呢,这不是因为一件事情做腻了。其实在同一个公司里一直做一个岗位时,当你做SEM的时候你不知道产品经理的痛苦,当你做产品经理的时候你不知道SEO的痛苦,你做开发的时候你不知道产品经理痛苦,等等。你做的事情广了,你会发现你是个什么都懂一些的人,你的技能里总有一、两项能达到8分9分,剩下的几项可能会有4分到6分。或者说是事情都懂多了后,无论是做跨职能的事,做跨部门的沟通;或者当企业有需要一位能够胜任多职能工作的人的时候,或者管理不同角色的人员,你都能够胜任,并且可以适合不同类型的企业,这样就能站得稳了。

一般我们说到网络营销干得好的人,我们会认为他们是一些大神,大牛,高手、等等。在他们营销成功的背后到底是什么呢?其实他们都是数据挖掘,数据分析的高手,他们把数据挖出来之后,加上他们对数据的理解/分析能力,他们能够判断用多少预算会得出多少结果,用多少IT资源,或者接下来会发生什么事情。

做营销如果你把数据挖掘的能力,数据分析的能力练到很强,你就是营销高手,数据高手。通过把自己的数据挖掘能力,数据分析能力变强这条路是走得通的,很多营销人实际上都是搞数据的。

如何用数据决定资源使用和获得产出最大化014

Google Analytics(GA)是目前使用最多的免费网站分析工具,如果你想获取网站内部用户行为数据,可以安装一个Google Analytics。需要把一段JS代码添加到你的网站上。国内一直有很多电商网站都在用它。

这个工具我用的比较早,Google在05年底的时候发布了它,06年我就开始把它装在我的博客上。我的GA ID是6位数的,你可以看到国内有使用GA的电商网站中,它们的GA ID大部分都是8位数的。

Q&A问答环节
问题1. 我想提问一个问题如何挖掘用户行为包括站内搜索关键字和站外关键字如何分析用户所感兴趣内容

答:挖掘用户行为,网站的点击流就是一个重要数据,分为:每个用户的点击流,和每“类/组”用户的点击流。

信息内容网站与电商的优化点不同,电商的你要用户尽快完成订单,支付,离开(或者再买第二次)信息内容网站你要他多浏览。

网站每张网页,都有一个“价值”,比如商品卖掉值300块,商品详情可以被分配到X%(of 300), 列表页,类目页也可以算出各自的值用用户点击流的数据得出“值”,以后按每张网页的“值”去判断重要性(优先级/资源分配)。

问题2:哪一些H5页面独特的功能,值得额外做追踪的?

答:可以关注网页加载速度,H5网站每类网页都可以优化下载速度。可以关注服务器端的数据,和前端的数据。起码有15个大类可以优化。

问题3:老师你好,零基础如何学?

答:
a. 有几个方法:最好进去互联网/电商/大型信息内容网站/app企业里上班,尽量在获取
b. 找大牛(不过大牛都好忙的… 你们要理解,大牛也是人,也有老婆孩子,要上班加班,大家都为了要吃饭嘛呵呵)
c.参加一些大牛的培训项目,最好是那种给你“功课”的,给你方法,要你去研究。你研究后写完后把功课发给大牛,大牛还会替你看看的,给个打分之类的(这样感觉不错嘛,呵呵
d.自荐去替大牛做点项目(可能大牛会教你拉个数据报告之类的,但你已经跟着大牛了,有机会学习他的想法,比好多人都要开心啊呵呵,我从前很跟着过大牛人…)
e. 多看书。少看微信上太碎片化信息(真的)呵呵

问题4:移动监测和pc监测的方法差异和由此带来的数据差异是什么?

答:H5/PC站没区别网站通过JavaScript或服务器log记录用户数据,或者两者一起用,判断用户用cookie。APP通过SDK记录用户数据,判断用户用设备上OS/软件配置的ID。

产生的问题很多,当中包括:多屏的时候,比如一个人用PC浏览器,用手机浏览器,用手机app方案同一个电商,会很容易在数据里被认为是3个人。

问题5:什么样的数据选择hbase?什么样的数据选择hive?

答:hbase优势是拉小量,但比较real-time的数据,速度会比较快。Hive是适合处理大量数据,但并非real-time数据。他们应该可以是互补关系。

问题6:您好,请问如何从根源上去保证数据的有效性,比如说,加大数据的精准性和可用性。有很多数据,在长时间之后,都是冗余的。我是一名没有基础的新手,但是对大数据很感兴趣,我想知道一个大概的学习方向。

答:需要看什么,其实主要看你的角色。大老板偏关注”预算“,”产出“,”利润“的数据。大老板关系今年跟去年同比,这季度跟上季度同比,等。多年前的可能就暂时无用了。

过程数据(能从过程中看出一些大中小问题)是干活的使用。过程嘛,干活的看看上周的,上几个月的就足够了。

本周、本月、本季度、本年”产出“数据,尤其同比、环比,是manager给每个负责不同广告渠道/产品频道干活的人员,作为判断表现业绩的。

后续联系方式:我的个人二维码,扫我的二维码可以加微信。

蔡维东微信

本次分享后还有相关问题的,或者对初学/入门互联网数据分析师的职业方向想有进一步的了解/讨论,欢迎加入我们群里。

互联网数据分析我微信群