根据你提供的表格数据,我们可以进行以下核心分析:
计算TOP3引流占比
top_3 = df.sort_values(by='引流人数', ascending=False).head(3)
total引流人数 = df['引流人数'].sum()
top_3引流人数总和 = top_3['引流人数'].sum()
top_3引流比例 = (top_3引流人数总和 / 总引流人数) * 100
print(f"TOP3直播的引流占比为: {top_3引流比例:.2f}%")
分析高引流类目
high引流直播间 = df.sort_values(by='引流人数', ascending=False).head(10)
top_categories = high引流直播间['带货类别'].value_counts(normalize=True) * 100
print(top_categories)
计算粉丝数与引流关系
fans_vs引流人数散点图 = sns.scatterplot(x='粉丝数', y='引流人数', data=df)
plt.xlabel('粉丝数')
plt.ylabel('引流人数')
plt.title('粉丝数 vs 引流人数散点图')
plt.show()
计算短视频引流占比与销售额相关性
sns.scatterplot(x='短视频引流占比', y='销售额', data=df)
plt.xlabel('短视频引流占比')
plt.ylabel('销售额')
plt.title('短视频引流占比 vs 销售额散点图')
plt.show()
以上分析数据来源:互联岛