业界动态
数据分析系列:用户分群和画像分析
2024-11-01 00:30

本来想自己总结一下关于数据分析的一些东西,包括漏斗分析、存留分析、用户粘性、用户价值(如rfm)和用户画像分析等方面的内容。但是网上资料十分多,自知肯定没有那些资深大牛写得好,而且自己写东西时间有限,想多总结一些关于模型和统计方面的东西。所以还是直接引用别人表述的比较清晰的文章吧,在此基础上加入一些自己的理解和注释。

数据分析系列:用户分群和画像分析

本文大部分内容取自数据分析(5:用户画像分析法,并在此基础上加入看了一些自己的理解和看法

一、什么是用户画像

用户画像是通过对用户各类特征进行标识,通过标识给用户贴上各类标签,再通过标签把用户分为不同的群体,以便对不同的群体分别进行产品/运营运作。:往往这些用户画像标签放在数据仓库中,使用t+n离线计算就行,用的时候直接掉用,不需要每次实时计算,对应不同业务,每个业务可以设计一张画像宽表,也可以从中间层关联提取
在这里插入图片描述

二、标签都有哪些

这里呢我们把标签分为四大类
第一类:基础属性
像年龄、性别、生日、星座、教育、身高、收入、职业等。这些一般在填写信息和注册时就会得到

第二类:社会关系
婚姻、有无女孩、有无男孩、家里是否有老人、性取向等。:一些关系是显性的,比如婚姻等,但还有一些关系是隐形的,比如人群编好的相似度等隐性关系,隐性关系我们往往需要通过建模得到

第三类:行为特征
行为特征又分为两块儿

  1. 基本行为
    注册时间、来源渠道、最近一次活跃的时间、最近一次支付的时间。可以理解为用户都会经历的行为,其中行为指标可以是具体的,比如注册时间。也可以是统计特征,比如近一周的登录次数等
  2. 业务行为
    是否买过特惠商品、是否曾获优秀学员,这些标识都会对产品的后期运营有所帮助。可以理解为用户的独特个体行为,通长这些特征是稀疏的,这类特征往往不太适合建立复杂建模,但是对于分析和定向运营有一定帮助

第四类:业务相关
这一类跟其他类不太一样,就像第三类中的业务行为,它是通过业务行为产生出来的特征,而业务相关呢,它是积累了其他的业务不会去记录的一些数据,比如运动健身类的产品。
它会涉及到:胖瘦高矮、体脂率、BMI、在练胸或者练臀、日均10000步、收藏了多少份健身计划等等。根据具体业务确立特征,对用户分群和建立数据壁垒等方面均有一定作用

三、标签从哪儿来

第一:直接填写
通过产品的一些特殊的步骤,让用户直接填写,比如注册页面,下图是某陌生人社交产品,通过用户注册让用户去填写年龄和性别。:信息填写过多虽然有利于画像的精确建立,但是产品的体验会下降,需要权衡两者的关系,使用A/Btest等方式确定合适的填写信息
在这里插入图片描述
在这里插入图片描述
还有一些是运用借地打地的手段,比如一些电商、外卖类的产品和地图类的产品,首先是让用户填写地址,其次是让用户选择标签,表面上是提供一个工具,事实上让用户帮助产品获取结构化的工具,让系统知道,用户作为一个个体,他的家、公司、学校在什么地方。
在这里插入图片描述
还有一些像装修类的产品,看上去是一个便捷的功能,平台方通过这个功能可以收集到大量跟业务相关的详情信息。
在这里插入图片描述
随着用户的自我保护意识越来越强,而且呢用户又非常的懒,莫名其妙填一些信息用户也比较反感。那就有了第二种获取标签的途径。

第二:通过用户自己的已有特征推导
当然,这种方式的成本比较高,没有让用户直接填写来的简单方便,一般的产品不会经常去这样做,它适用的场景有以下几种个人认为一些场景的画像预测是十分必要的,比如在在推荐领域,我们总会碰到事前预测,此时利用预测的画像数据时必要的。又比如在风控领域中,我们通常会进行信息一致性校验,如果用户填写信息(比如有房)与我们的预测画像信息(无房)不一致,则此用户需要格外注意。

(1)做活动时

相信大家都有做活动的经验,我们在做活动时会筛选一批用户出来做定向推广,比如说年龄、地区、新老用户。

举个栗子:你是某电商平台的产品经理,现在要做一个推广活动,面向的用户群体为在消费能力强的上海女性。现在需要向这个群体的用户去宣传这个活动,那怎么做

首先,区分出来性别,即男、女。

用户如果没有填写性别,我们可以从他买过的东西去推,比如说买过女士衣服+化妆品。

其次,推算出在上海的用户。

假设大部分人买东西是给自己买,收货地址是上海市的,我们可以推算出此用户是上海市的。

最后,验证消费能力是否强。

消费能力如果从她历史消费的总金额推算,感觉有点不合理,但它也能验证一部分,我们可以再加一些条件,比如购买过进口的小商品,比如牙膏,一般消费能力不强的用户,很少会花将近百元去买一支进口的牙膏。
在这里插入图片描述
上面是通过用户的业务特征做的推断。

但是,不是所有的用户都发生过以上的行为,通过以上业务行为筛选之后,可以给部分用户打上标签,还有一部分用户她没有标签,所以,我们再做进一步的推导。

  • 性别:除了通过从购买的商品推导以后,还可以通过她使用的是手机是否为美图手机
  • 地区:可以用常用IP进行推导
  • 消费能力:可以用使用的手机为最新款且价格在5000元以上的用户。

当然,这里面肯定会有误判,但是,就算是有误判我们也认了,因为很难做到百分百精准。
在这里插入图片描述
(2)简单的个性化运营

比如说首页的某个推广模块,面对不同的用户群体推广不同的内容。

(3)业务分析

在做业务分析时,需要把用户拆分成不同的群体,看在业务中的表现情况,比如是否领取七天/15天的会员卡。

(4)用户研究

如果有用户标签的基础,做用户研究的童鞋的研究效果会更加的精准。

如果通过前面两种方式已经把80%的用户打标签了,还剩下的20%怎么办?这里我们就会运用到第三种推导方式

第三:通过用户身边的人推断
首先,通过距离:基于某些属性,周围的人都具备,用户大概率也具备。
其次,是通过行为:通过协同过滤,找到行为相似的目标用户。
:现在流行的图计算技术可以很好的解决这个问题,但对算力的要求比较大

比如说,刚才我们通过买过女士衣服和化妆品的用户打上了女性的标签,但是这种方式有局限性,可能有些用户本身就不在你的平台上买衣服和化妆品,这里我们可以通过这种用户的其他行为,比如说买了卫生巾或者其他的女性用品,然后通过她购买的商品,再找到跟她购买过相似商品的用户打上女性用户的标签。

说在最后

第三种的精确度是最低的但是个人感觉这部分现在应用非常多,尤其是推荐领域,但是在一些场景中,不需要精确度那么高,当然,我们也可以通过此类用户的后期行为,迭代这些标签。至少我们通过这三种方式把所有的用户都分了群。

    以上就是本篇文章【数据分析系列:用户分群和画像分析】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/7704.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多   
最新新闻
“撒旦”人血鞋?碰瓷新疆棉花的耐克,又开始喊冤了?
继主动碰瓷新疆棉花把自己搞得股价大跌之后耐克秉承着“no zuo no die”的精神又开始暗搓搓搞“阴间操作”限量发售含人血的“撒
tiktok怎么搭建外网 详细教程及步骤
TikTok怎么搭建外网(详细教程及步骤)TikTok是一款非常流行的短视频社交应用程序,它在全球范围内拥有数亿用户。在使用TikTok的
《以案释法》步数越多,收益越高?别被“走路也能赚钱”的理财广告忽悠了
  走路也能赚到钱的理财  “丑的人还在睡觉,美的人已经跑出一杯星巴克了。”2016年的一天,一个女孩晒出的朋友圈截图引起了
如何用生意参谋算出同行店铺真实销售额
怎么经过生意顾问算出同行店肆实在销售额?大多数在淘宝天猫工作过的人都知道,他们的背景显现了同行商铺的买卖数据,这被称为买
一款最近比较火的网站统计分析系统,易分析具有什么样的功能呢?
一、产品简介北京普艾斯科技有限公司成立于2009年,服务客户1000+,包括电商、金融、保险、政务服务等行业。私有化部署,全渠道
向佐快乐大本营2024年精彩回顾:四年时光共欢笑
张大大谢娜力捧下的综艺新星张大大一位在娱乐圈中颇具人气的主持人他的成名之路离不开谢娜的提携回顾张大大的成名之路可以说谢娜
PingTools app
《PingTools app》是一款非常好用的实用工具软件,软件内拥有丰富的功能,包含了包括浏览器扫描等。使用非常简单,直接下载安装
抖音能看到谁搜索过自己吗?
尊敬的用户,您好。针对抖音平台是否能够查看谁搜索过自己的问题,我们需要做一些详细说明。首先,根据我们了解到的情况,在抖音
什么是人工智能“语料库”?为什么每个人都在谈论它?
编者按:比尔盖茨(Bill Gates)、Reddit 首席执行官和其他科技领袖越来越多地谈论“语料库”,现在是时候了解它是“何方神圣”
LED行业词语中英对应
1、led 灯具构成英文led 球泡灯:led bulbLed 贴片灯珠:SMD LEDLed驱动电源:led driver隔离电源:isolated driver非隔离电源:
本企业新闻

点击拨打: