逸客:数据交换的7项基础能力

DATACN.NET注:如下为逸客(阿里妈妈资深专家,真名:毛波)分享内容。

一、六方面看数据交换面临的问题

1.从消费者角度来说,目前消费者个人信息保护还不规范。不管大家是否愿意,网上还是线下,政府各个部门,还是银行,甚至包括保险公司留下的信息,数据都是在不断流转。

所以,从消费者角度来说对隐私担忧和信息保护的规则诉求是非常实际的问题。消费者通过提供这些个人隐私和信息都是希望得到个性化服务。比如消费者在淘宝上面去注册,在微博,微信注册留下个人信息都是希望得到这个网站或者app提供的服务。但是,实际上信息在后台流转,这些信息流转时消费者担心安全问题。

2.从媒体角度来看,包括移动端,PC端,电视端等考虑的问题是什么?他们希望流量和资源价值最大化。媒体数据不可以跨屏打通,比如优酷每天的用户几个亿,但是在PC和移动端还是需要串起来。我早上在电脑上看了视频,一会儿路上用手机看,他们很难把我匹配起来,或者只有登录的时候才能匹配上。

但是,去看优酷的时候大部分人并没有真正登录。所以,很难打通PC端和移动端。另外一些有帐号体系的,比如说,微博微信也很难打通。这样对于媒体来说,很难全面了解用户。因为优酷是做视频的,他知道看哪些视频,但用户在其他地方有什么动作他不知道,他其实又想知道,这就是个矛盾。

3.不少数据加工方缺少数据,也就是缺少需求对象,加工出来的东西也需要找需求方,同时缺少加工环境。当然,这个加工环境和数据是匹配的。不少数据加工方自认为有很多算法和模型,实际上缺少应用环境。

4.很多第一方数据提供方,这个角色包括一些本身是媒体或者品牌方,自己有一些数据,他们面临的问题之一是数据孤岛的问题,自己的数据比较单一,但是不可以连接,很难360度了解一个人。同时,自己的数据加工能力不强,相对于专业数据管理公司来讲差很多。当然,还包括对数据的存储,处理、分析等等方面都不专业。

5.第三方数据提供方。他通过不同的角色、关系以及其他的服务,可能变相拿到很多数据。他们往往缺少数据变现方法,拓展起来很难。同时,很难有效增值,因为对数据理解不到位,只有数据连接才能实现指数级别增值。其次,数据应用渠道缺失,流动性差,就像是死数据,价值体现就非常有限。

6.数据需求方。首先,消费者还原很难,很难了解消费者,现在大品牌有非常强的诉求。比如宝洁这种企业非常希望了解他的消费者,除了买宝洁哪些商品以外,周末去哪里玩儿,住在哪些小区,爱逛哪些商场等信息都是品牌商想要了解的。他们也愿意获得这些信息,但是现在很难。

另外,缺少专业服务。虽然宝洁这样的大品牌商有一些技术公司去帮助它解决,但是,同样也会面临一些新问题,之前更多是用调研方式去做,但调研这种模式很难获得全面的信息,尤其是现在的个性化时代,抽取5万或者10万样本想获得几千万消费者的需求很难。

二、数据交换的标的物

谈到数据交易,实际上大家是在做数据交换,只是数据交换的标的物不同而已。细分如下:

1. 跟数据交换。你有10万数据,我有10万数据,我们俩各有20万数据,碰到的主要问题是归属权问题。但其实对于10万用户我可以用5个标签刻画,他可以有10个标签刻画。我们俩是不是对等呢?我认为现在应该搁置归属权,强调使用权,大家先使用起来。

2. 数据和服务。用服务作为数据的标的物目前是用的比较多的。比如,品牌商有10万数据。但是,他只知道买了该品牌的洗发水或者洗衣液,但不知道10万人到底长什么样子,包括年龄多大,职业是什么,购买力到底多强等等,这时他把数据上传就可以换取对用户的画像,这是一种服务;另外一种是,在如今的多屏互动年代,我把PC端用户和移动端的行为数据进行上传,把双方匹配起来,这也是一种服务。但是,这种模式对用户数据量的要求很高,需要把用户串起来才可以提供这个服务。

3. 数据和权益也是可以去交换。最典型的例子是,我是全球通用户,去首都机场就可以进VIP休息室,背后是数据和权益交换,或者某个公司的金卡会员去买某品牌商的东西时可以打折,或者获得专享商品等等。这些都是数据和权益的交换。现在更常见的做法是两个商家通过打通底层数据,可以发现有些人在双方都消费很高,这种交叉匹配可以为消费者提供更多的权益。

4. 数据和钱直接交换。现在用的比较多的就是这种模式,比如气象数据是公共服务数据,公共数据应该不应该付费?还是应该免费开放出来?

三、数据交换的基础能力

进行数据交换应该具备一些什么基础能力?我们认为需要以下基础能力:

第一,交换肯定得有交换场所,所以,应该有一个安全的接入和存储环境。

第二,需要有ID Mapping的能力把数据匹配起来。

第三,需要一个安全、开放、大规模数据加工的环境。很多数据格式不规则,信息也是乱七八糟的。这就需要有整理加工的环境。而且,这个加工的角色不一定是数据拥有者,可能是第三方平台这个地方只授权给一些专业的加工者,它帮助整理后进行交换或者交易。

第四,数据价值评估体系。一般的商品价值评估从两个层面进行,第一成本估价,我获得的产品成本是10万,我可能卖100万,别人卖150万;第二需求估价,这个产品就我家独一份,10个人来买我就是1000块钱,1000个人来买就定100块钱。但是,数据如何估价与商品定价不同,因为给了别人以后我自己没有损失,我还是可以同样给别人。

第五,数据交换需要有一个市场促进流动,这时就需要一个供需市场,类似于股票市场,有越来越多股民交易股票的时候,这个市场流动起来就会活跃。

第六,消费者触达的渠道,如果这个交换市场可以触达很多消费者,这样的他自己就可以越交换越多,变成一个自循环的体系。

最后,全域大数据平台支撑。可以从0开始做,但是很难。如果一开始有一个非常好的基础数据,这个时候再加进些外面零散数据就会比较好。

四、数据管理平台达摩盘介绍

阿里达摩盘
阿里妈妈的数据交换应用平台——达摩盘分三个部分:数据资产、数据加工和数据应用。左边是数据资产或者数据接入管理,右面是数据应用,我们希望不只是管理交换还可以打通一些应用渠道,下面是数据加工,中间是技术能力,可以把人群实现画像洞察。当然,提供标签去圈选人群,最好有应用效果的一些评估,另外两个是权限管理和API开放。

现在在数据资产管理层面基于阿里大数据平台启动,在本身自己有很多数据基础之外,在构建数据联盟。数据联盟又分两部分,第一部分是阿里有很多关联公司,就是高德、优酷等,还包括跟气象局进行了气象数据合作,以及第三方的一些零散数据。

另外,我们在跟一些品牌商做第一方数据,我们在这个方面更多是以服务换数据,数据换服务模式做,传上来以后帮用户做消费者360度画像,享受这个服务过程当中是把一些数据传到数据交换平台上来。

在数据应用部分,一些渠道有自己的营销系统,包括钻石展位,直通车等等。商家可以在数据不出云的环境下享受这些服务,这在很大层面上可以规避掉数据安全和隐私的问题。因为我们的数据都是在公有云平台上,消费者的物理数据没有流动,只是在用服务的方式去提供。另外一边是媒体,我们为很多媒体做个性化服务,包括我们自有的以及一些合作媒体。

在数据加工方面分几类。第一类是大盘数据加工,这种加工基于平台去做,因为所涉及到的数据量很大,需要很强的计算基础,包括云计算相关技术;第二类是开放算法平台,让第三方,包括独立软件公司或者一些算法很牛的个人参与,进行加工数据的抽样,不需要用全量数据加工,用部分数据进行建模。还有很大一部分力量是达人,通过开放给他一些基础表,只需要他按照兴趣点信息去组合,组合完以后形成他对于人群的刻画,这部分也非常有价值。比如化妆品达人,对化妆品产品适合的人群画像,这些人本来在微博或者微信上面有很多粉丝,他去推荐一个产品的时候就有粉丝效应。

You may also like...