根据提供的数据,我们可以从以下几个维度进行分析:
引流效率
import pandas as pd
from scipy.stats import pearsonr
# 示例数据
data = {'引流占比': [0.1, 0.2, ...], '销售额': [50000, 60000, ...]}
df = pd.DataFrame(data)
corr_coef, _ = pearsonr(df['引流占比'], df['销售额'])
print("皮尔森相关系数:", corr_coef)
头部效应
# 假设我们已经有了引流数据df
top3_df = df.nlargest(3, '引流占比')
total引流人数 = top3_df['引流人数'].sum()
top3销售额 = top3_df['销售额'].sum()
print("TOP3直播引流人数占比:", total引流人数 / df['引流人数'].sum())
print("TOP3直播销售额占比:", top3销售额 / df['销售额'].sum())
类目特征
# 假设我们已经有了类别数据cat_data
category_distribution = cat_data.groupby('类别').size()
print("各分类销售分布:", category_distribution)
粉丝体量
# 假设我们已经有了粉丝数据fan_data
fan_levels = [low, mid, high]
for level in fan_levels:
group_df = df[df['粉丝数'] >= level]
avg引流效率 = group_df['引流人数'].mean() / group_df['粉丝数'].mean()
print(f"粉丝量级{level}的平均引流效率:", avg引流效率)
以上分析数据来源:互联岛