热门推荐
实战案例,手把手教你用 Python 构建电商用户画像
2024-10-31 20:08

大家好,本文以真实案为例手把手教你搭建电商系统的用户画像。

实战案例,手把手教你用 Python 构建电商用户画像

先来看该电商用户画像用到的标签。

数据内容包括user_id(用户身份)、item_id(商品)、IDbehavior_type(用户行为类型,包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示)、user_geohash(地理位置)、item_category(品类ID,即商品所属的品类)、Time(用户行为发生的时间,其中user_id和item_id因为涉及隐私,做了脱敏处理,显示的是数字编号。

下面是具体的代码实现过程。

本示例除了用到numpy、pandas、matplotlib,还用到其他一些模块。

参数说明如下。

  • %matplotlib inline 一个魔法函数,由于%matplotlib inline的存在,当输入plt.plot()后,不必再输入plt.show(),图像将自动显示出来。

  • datetime 用来显示时间的模块。

此处使用Pandas的read_csv方法读取数据文件,由于数据集太大,为了提高运行效率,使用sample函数随机抽取20%的数据。

Dataframe.sample()是Pandas中的函数,Dataframe是一种数据格式,代指df_orginal。frac(fraction)是抽取多少数据,random_state是随机数种子,目的是保证每次随机抽取的数据一样,防止执行命令时使用不一样的数据。

结果如图1所示。
图片

图1 数据预处理结果

  • pd.Dataframe() 其中数据填充的是users,列名为user_id。

结果如图2所示。

图片

图2 制作好的用户ID

之后分析后的内容都会放置在此表中,相当于建立了一个空白表,将自己分析后的结论一一加入。

1)对用户浏览时间段进行分析

选取出各用户浏览次数最多的时段,看看用户到底在什么时间浏览商品比较多。

结果如图3所示。

图片

图3 用户浏览时间段

  • groupby([‘key1’,‘key2’]) 多列聚合,分组键为列名。

  • reset_index() 默认drop=False,可以获得新的index,原来的index变成数据列保留下来,第一列会添加计数的数字,不会使用数据中的index。

  • rename() 进行重命名,此处将item_id替换成hour_counts,inplace为是否原地填充。

  • pd.merge() 将两个表合并在一起,横向合并,on代表通过某个主键,how指左合并,每行一一对应。

  • loc函数 通过行索引Index中的具体值来取指定数据。

  • aggregate函数 groupby分组之后会返回多个子数据帧,该函数可以实现数据聚合,可以得到每个子数据帧的某些列的某些信息。

  • lambda函数 可以定义一个匿名函数,lambda [arg1[, arg2, … argN]]: expression,其中参数是函数的输入,是可选的,后面的表达式则为输出,此处和join()函数一起用,其中每个x值能被“,”隔开;使用类似的代码可以生成浏览活跃时间段,此处就不再赘述。

2)关于类目的用户行为。

根据不同的用户行为,如浏览、收藏等,分别导出数据进行分析。

用户浏览最多的类目如图4所示。

图片

图4 浏览最多的类目

收藏、加购和购买最多的类目生成逻辑相同,重复操作后结果如图5所示。

图片

图5 关于类目的用户行为

从整理的数据中可以看出,浏览、加购物车、收藏、购买之前其实不一定存在明显的必然关系,我们还需要进一步分析得到一些规律。

3)近30天用户行为分析。

近30天购买次数

近30天加购次数

近30天活跃天数

结果如图6所示。

图片

图6 近30天用户行为

近30天用户行为分析属于中长期的用户行为,我们可以依此判断是否需要调整营销策略,类似可以得到短期的7天用户行为分析,观察中短期或一个小周期内,用户的行为是何种情况。

4)最后一次行为距今天数。

分析上次和本次用户行为的时间差值可以实现精确推荐分析,下面我们来看看具体如何实现。

上次浏览距今天数

  • datetime.strptime(‘2014-12-19’,’%Y-%m-%d’)-x).days 该部分属于lambda中的函数表达式部分,即计算规则,此处最后取相减后的天数总和。

  • apply() 格式为apply(func,*args,**kwargs),当一个函数的参数存在于一个元组或者一个字典中时,可间接调用这个函数,并将元组或者字典中的参数按照顺序传递给该函数,返回值就是func函数的返回值。相当于循环遍历,起到处理每一条数据的效果。

类似可以生成上次加购、购买距今天数,分析得到用户的活跃情况,如图7所示,如果长时间没有活跃,则需要推送一些内容,或者发放优惠券刺激用户。

图片

图7 最后一次行为距今天情况统计

5)最近两次购买间隔天数。

用购买间隔数分析用户的购买频率,方便确定用户的消费活跃等级,精准制定营销方式。结果如图8所示。

图片

图8 最近两次购买间隔天数统计

6)是否浏览未下单。

  • | 在Python语句中表示或,&表示且。

  • pd.pivot_table() 透视表功能,df_browse_buy为data块,values可以对需要的计算数据进行筛选,aggfunc参数可以设置我们对数据聚合时进行的函数操作。

  • fillna 会填充NaN数据,返回填充后的结果,inplace=True代表原地填充。

结果如图9所示。

图片

图9 是否浏览未下单情况统计

针对浏览未下单的用户要加大推广力度,可以增加优惠券的发放次数,促进购物。

7)是否加购未下单。

结果如图10所示。

图片

图10 是否加购未下单情况统计

制定营销策略时,要重点注意这部分人群,因为加购未下单的购买转化率是最大的,有成功下单、最大潜力的客户就在这里。

1)是否复购用户

结果如图11所示。

图片

图11 是否复购用户统计

2)访问活跃度

结果如图12所示。

图片

图12 30天内访问次数与访问人数的关系

  • value_counts() 查看表格某列中有多少个不同值,并计算每个不同值在该列中有多少重复值。

  • sort_index() 按照某一列的大小进行排序,ascending=False是按照从大到小排序。

  • plt.figure(figsize=(a,b)) 创建画板,figsize代表宽为a,高为b的图形,单位为英寸。

  • plt.ylabel 设置y轴,fontsize是字体大小。

  • plt.xlabel 设置x轴。

通过图12可以看出,访问次数多的用户比访问次数少的用户数量多,且以15次左右为拐点,因此定义访问次数小于等于16次的用户为低活跃用户,访问次数大于16次的用户定义为高活跃用户,此定义只是从用户的角度出发,工作中当从业务角度定义。访问次数多的访客比访问次数少的访客数量多,与绝大多数的产品访问规律相反,从侧面反映了用户黏性之强。

3)购买活跃度

结果如图13所示。

图片

图13 30天内购买次数与购买人数的关系

由图13可知,14次左右是个拐点,因此定义购买次数小于等于14次的用户为低活跃用户,大于14次的用户为高活跃用户。

4)购买的品类是否单一

结果如图14所示。

图片

图14 购买品类单一情况统计

了解用户购买的品类有利于构建用户群体行为,比如该群体统一对化妆品消费占比巨大,则该用户群体的主要特征标签之一就是化妆品。

5)用户价值分组(RFM模型

结果如图15所示。

图片

图15 最后购买行为距今天数与购买人数的关系

使用RFM模型分析

结果如图16所示。

图片

图16 RFM模型分析结果

  • str.cat() 是指将两个独立的字符串拼接,此处将

  • ’buy_active_level‘和’buy_days_level’ 拼接。如果要在两个合并的列中间加一个分隔符号,可在cat括号内加:sep=’-’,用-连接合并内容。

将buy_active_level和buy_days_level组合,形成“高高”或者“高低”等。将两个重要指标合并后,每个user_id进入不同的分类组。RFM模型是衡量客户价值和客户创利能力的重要工具和手段,其中,R(recently):最近一次消费;F(Frequently:消费频率;M(Monetary:消费金额。

对最后输出的用户群体制定不同的营销策略。针对重要价值客户要予以关注并维护;针对重要深耕用户,予以相应的价格刺激,如折扣和捆绑销售等增加用户的购买频率,提高黏性;针对重要唤回用户,要在特定时间点进行刺激,比如进行产品卖点刺激、品牌灌输等,不断加强他们对品牌的认可,提高忠诚度;针对流失客户,在此例中,因其数量占三分之一左右,需进一步分析得出流失原因。

推荐文章
  • 上瘾了,最近又给公司撸了一个可视化大屏(附源码)
  • 如此优雅,4款 Python 自动数据分析神器真香啊
  • 梳理半月有余,精心准备了17张知识思维导图,这次要讲清统计学
  • 年终汇总:20份可视化大屏模板,直接套用真香(文末附源码)

欢迎转载、收藏、有所收获点赞支持一下

在这里插入图片描述

    以上就是本篇文章【实战案例,手把手教你用 Python 构建电商用户画像】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/quote/1110.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多