本来想自己总结一下关于数据分析的一些东西,包括漏斗分析、存留分析、用户粘性、用户价值(如rfm)和用户画像分析等方面的内容。但是网上资料十分多,自知肯定没有那些资深大牛写得好,而且自己写东西时间有限,想多总结一些关于模型和统计方面的东西。所以还是直接引用别人表述的比较清晰的文章吧,在此基础上加入一些自己的理解和注释。
本文大部分内容取自数据分析(5):用户画像分析法,并在此基础上加入看了一些自己的理解和看法
一、什么是用户画像?
用户画像是通过对用户各类特征进行标识,通过标识给用户贴上各类标签,再通过标签把用户分为不同的群体,以便对不同的群体分别进行产品/运营运作。(注:往往这些用户画像标签放在数据仓库中,使用t+n离线计算就行,用的时候直接掉用,不需要每次实时计算,对应不同业务,每个业务可以设计一张画像宽表,也可以从中间层关联提取)
二、标签都有哪些?
这里呢我们把标签分为四大类:
第一类:基础属性
像年龄、性别、生日、星座、教育、身高、收入、职业等。(这些一般在填写信息和注册时就会得到)
第二类:社会关系
婚姻、有无女孩、有无男孩、家里是否有老人、性取向等。(注:一些关系是显性的,比如婚姻等,但还有一些关系是隐形的,比如人群编好的相似度等隐性关系,隐性关系我们往往需要通过建模得到)
第三类:行为特征
行为特征又分为两块儿:
- 基本行为:
注册时间、来源渠道、最近一次活跃的时间、最近一次支付的时间。(可以理解为用户都会经历的行为,其中行为指标可以是具体的,比如注册时间。也可以是统计特征,比如近一周的登录次数等) - 业务行为:
是否买过特惠商品、是否曾获优秀学员,这些标识都会对产品的后期运营有所帮助。(可以理解为用户的独特个体行为,通长这些特征是稀疏的,这类特征往往不太适合建立复杂建模,但是对于分析和定向运营有一定帮助)
第四类:业务相关
这一类跟其他类不太一样,就像第三类中的业务行为,它是通过业务行为产生出来的特征,而业务相关呢,它是积累了其他的业务不会去记录的一些数据,比如运动健身类的产品。
它会涉及到:胖瘦高矮、体脂率、BMI、在练胸或者练臀、日均10000步、收藏了多少份健身计划等等。(根据具体业务确立特征,对用户分群和建立数据壁垒等方面均有一定作用)
三、标签从哪儿来?
第一:直接填写
通过产品的一些特殊的步骤,让用户直接填写,比如注册页面,下图是某陌生人社交产品,通过用户注册让用户去填写年龄和性别。(注:信息填写过多虽然有利于画像的精确建立,但是产品的体验会下降,需要权衡两者的关系,使用A/Btest等方式确定合适的填写信息)
还有一些是运用借地打地的手段,比如一些电商、外卖类的产品和地图类的产品,首先是让用户填写地址,其次是让用户选择标签,表面上是提供一个工具,事实上让用户帮助产品获取结构化的工具,让系统知道,用户作为一个个体,他的家、公司、学校在什么地方。
还有一些像装修类的产品,看上去是一个便捷的功能,平台方通过这个功能可以收集到大量跟业务相关的详情信息。
随着用户的自我保护意识越来越强,而且呢用户又非常的懒,莫名其妙填一些信息用户也比较反感。那就有了第二种获取标签的途径。
第二:通过用户自己的已有特征推导
当然,这种方式的成本比较高,没有让用户直接填写来的简单方便,一般的产品不会经常去这样做,它适用的场景有以下几种(个人认为一些场景的画像预测是十分必要的,比如在在推荐领域,我们总会碰到事前预测,此时利用预测的画像数据时必要的。又比如在风控领域中,我们通常会进行信息一致性校验,如果用户填写信息(比如有房)与我们的预测画像信息(无房)不一致,则此用户需要格外注意。):
(1)做活动时
相信大家都有做活动的经验,我们在做活动时会筛选一批用户出来做定向推广,比如说年龄、地区、新老用户。
举个栗子:你是某电商平台的产品经理,现在要做一个推广活动,面向的用户群体为在消费能力强的上海女性。现在需要向这个群体的用户去宣传这个活动,那怎么做?
首先,区分出来性别,即男、女。
用户如果没有填写性别,我们可以从他买过的东西去推,比如说买过女士衣服+化妆品。
其次,推算出在上海的用户。
假设大部分人买东西是给自己买,收货地址是上海市的,我们可以推算出此用户是上海市的。
最后,验证消费能力是否强。
消费能力如果从她历史消费的总金额推算,感觉有点不合理,但它也能验证一部分,我们可以再加一些条件,比如购买过进口的小商品,比如牙膏,一般消费能力不强的用户,很少会花将近百元去买一支进口的牙膏。
上面是通过用户的业务特征做的推断。
但是,不是所有的用户都发生过以上的行为,通过以上业务行为筛选之后,可以给部分用户打上标签,还有一部分用户她没有标签,所以,我们再做进一步的推导。
- 性别:除了通过从购买的商品推导以后,还可以通过她使用的是手机是否为美图手机;
- 地区:可以用常用IP进行推导;
- 消费能力:可以用使用的手机为最新款且价格在5000元以上的用户。
当然,这里面肯定会有误判,但是,就算是有误判我们也认了,因为很难做到百分百精准。
(2)简单的个性化运营
比如说首页的某个推广模块,面对不同的用户群体推广不同的内容。
(3)业务分析
在做业务分析时,需要把用户拆分成不同的群体,看在业务中的表现情况,比如是否领取七天/15天的会员卡。
(4)用户研究
如果有用户标签的基础,做用户研究的童鞋的研究效果会更加的精准。
如果通过前面两种方式已经把80%的用户打标签了,还剩下的20%怎么办?这里我们就会运用到第三种推导方式:
第三:通过用户身边的人推断
首先,通过距离:基于某些属性,周围的人都具备,用户大概率也具备。
其次,是通过行为:通过协同过滤,找到行为相似的目标用户。
注:现在流行的图计算技术可以很好的解决这个问题,但对算力的要求比较大
比如说,刚才我们通过买过女士衣服和化妆品的用户打上了女性的标签,但是这种方式有局限性,可能有些用户本身就不在你的平台上买衣服和化妆品,这里我们可以通过这种用户的其他行为,比如说买了卫生巾或者其他的女性用品,然后通过她购买的商品,再找到跟她购买过相似商品的用户打上女性用户的标签。
说在最后:
第三种的精确度是最低的(但是个人感觉这部分现在应用非常多,尤其是推荐领域),但是在一些场景中,不需要精确度那么高,当然,我们也可以通过此类用户的后期行为,迭代这些标签。至少我们通过这三种方式把所有的用户都分了群。
以上就是本篇文章【数据分析系列:用户分群和画像分析】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/7704.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多