最新动态
小红书数据分析平台 小红书数据分析怎么做
2024-10-31 20:35


小红书数据分析平台 小红书数据分析怎么做


文章目录

  • 一、项目背景
  • 二、数据预处理
  • 1、查看数据
  • 2、数据清洗
  • 2.1对达人列表进行清洗
  • 2.2对涨分榜进行清洗
  • 2.3对MCN列表进行清洗
  • 2.4对定性变量(分类变量)进行处理
  • 3、表格处理
  • 3.1合并达人列表和涨粉榜
  • 三、分析与数据可视化
  • 1、对达人列表进行相关性分析
  • 2、达人账号指标可视化
  • 2.1笔记报价与签约mcn公司
  • 2.2达人账号标签选择
  • 2.3赞藏总数与认证信息
  • 四、总结


本项目对小红书一个月的达人列表、MCN签约列表和涨粉榜三表进行分析,通过Tableau数据可视化和相关性分析探究小红书达人账号的运营情况。
明确问题:
分析影响达人账号获得点赞收藏和笔记报价的主要指标有哪些;
分析哪类标签博主在小红书发展趋势较好,为新账号提供发展方向;
分析签约MCN公司对运营较好的达人账号的影响,为未签约的博主提供建议。

1、查看数据

小红书数据分析平台 小红书数据分析怎么做_python

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_02

小红书数据分析平台 小红书数据分析怎么做_python_03

小红书数据分析平台 小红书数据分析怎么做_数据分析_04

2、数据清洗

检查数据集完整性,对空白值进行删除或填空。

2.1对达人列表进行清洗

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_05


可见达人列表没有重复值,认证信息和签约MCN字段缺失值过半,删除缺失值会导致数据量大幅度减少,所以采用填充方法处理缺失值:

(1)对“地域”、“简介”、“认证信息”、“签约MCN”、“达人标签”、“更新时间”这类文本字段的缺失值填充“未设置”;

(2)因“赞藏总数”只缺失一个,缺失值较少,对此填充”0“;

(3)因报价差距偏大,平均值易受影响,所以用中位数填充“视频笔记报价”和“图文笔记报价”字段的缺失值。

小红书数据分析平台 小红书数据分析怎么做_缺失值_06

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_07

2.2对涨分榜进行清洗

小红书数据分析平台 小红书数据分析怎么做_缺失值_08


可见涨分榜数据完整,没有缺失值

2.3对MCN列表进行清洗

小红书数据分析平台 小红书数据分析怎么做_缺失值_09


同理达人列表:

(1)对“机构公司”、“简介”、“小红书号”、“TOP3达人”这类文本字段缺失值填充“未设置”;

(2)对“达人粉丝总数”这类数值型字段缺失值填充“0”。

小红书数据分析平台 小红书数据分析怎么做_缺失值_10

2.4对定性变量(分类变量)进行处理

定量变量之间能直接计算相关系数进行相关性分析,但为更好地分析定性变量与定量变量之间的相关性,此处需要把定性变量转换为虚拟变量(哑变量),即从分类变量转化为数值型数据,可与定性变量计算相关系数。

小红书数据分析平台 小红书数据分析怎么做_信息可视化_11

小红书数据分析平台 小红书数据分析怎么做_信息可视化_12

小红书数据分析平台 小红书数据分析怎么做_数据分析_13

3、表格处理

3.1合并达人列表和涨粉榜

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_14

1、对达人列表进行相关性分析

小红书数据分析平台 小红书数据分析怎么做_数据分析_15

小红书数据分析平台 小红书数据分析怎么做_缺失值_16


相关系数r的判定条件为:|r|<= 0.3 不存在线性相关;0.3<=|r|<= 0.5 低度线性关系;0.5<=|r|<= 0.8 显著线性关系;|r| > 0.8 高度线性关系。由相关矩阵可知,达人账号的赞藏总数与粉丝数存在线性相关关系,与其他字段也存在一定的相关,其中相关度前五的指标分别为粉丝数 、商业笔记数、视频笔记报价 、分类达人标签_已设置、分类认证信息_已认证 。

小红书数据分析平台 小红书数据分析怎么做_缺失值_17

达人账号的视频笔记报价相关度前三的指标分别为分类签约MCN_已签约 、图文笔记报价 、赞藏总数 、商业笔记数 、分类达人标签_已设置 。

2、达人账号指标可视化

运用Tableau进行数据可视化

2.1笔记报价与签约mcn公司

小红书数据分析平台 小红书数据分析怎么做_数据分析_18

二咖传媒和仙梓文化达人的笔记报价较高。

小红书数据分析平台 小红书数据分析怎么做_缺失值_19

在众多MCN公司中,侵尘文化、众灿互动、告趣和仙梓文化是发展较好的

2.2达人账号标签选择

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_20


多数达人账号会打上美妆个护、美食、搞笑、时尚和运动健身等标签,这些领域在小红书平台上较受欢迎。

2.3赞藏总数与认证信息

小红书数据分析平台 小红书数据分析怎么做_小红书数据分析平台_21

美妆、美食、时尚博主和演员的赞藏总数比较多,其中演员的粉丝数最多,所以演员的赞藏总数可能是明星效应导致的。

    以上就是本篇文章【小红书数据分析平台 小红书数据分析怎么做】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/quote/1887.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多