基于您提供的数据,可以从以下几个维度进行分析:
引流效率(短视频引流占比与销售额的相关性):
头部效应(TOP3直播的引流人次占比):
类目特征(高引流占比直播的带货类目分布):
粉丝体量(粉丝数与引流能力的关系):
计算相关系数:
import pandas as pd
# 假设数据已经导入到一个DataFrame df中
correlation = df['短视频引流占比'].corr(df['销售额'])
print(f"相关性:{correlation}")
头部效应分析:
top3_total_views = df.sort_values(by='短视频引流人次', ascending=False).head(3)['短视频引流人次'].sum()
total_views = df['短视频引流人次'].sum()
print(f"TOP3直播的总引流占比:{top3_total_views / total_views * 100:.2f}%")
类目特征分析:
category_distribution = df.groupby('商品类别')['短视频引流人次'].sum().reset_index()
print(category_distribution)
粉丝体量分析:
def get_fan_size_category(fans_count):
if fans_count < 1000:
return '小号'
elif fans_count < 5000:
return '中号'
else:
return '大号'
df['粉丝体量'] = df['粉丝数'].apply(get_fan_size_category)
fan_size_analysis = df.groupby('粉丝体量')['短视频引流人次'].mean().reset_index()
print(fan_size_analysis)
以上分析数据来源:互联岛