基于提供的数据,我们可以从以下几个方面进行分析:
数据准备:
数据分析工具选择:
具体分析步骤:
import pandas as pd
# 假设df是一个包含所有直播间数据的DataFrame
df['引流占比'] = df['短视频引流人数'] / df['总引流人数']
df['销售额'] = df['实际销售额']
# 绘制散点图并进行回归分析
scatter_plot(df, '引流占比', '销售额')
regression_analysis(df, '引流占比', '销售额')
top3_df = df.nlargest(3, '总引流人数')
total引流总人数 = df['总引流人数'].sum()
头部引流人次占比 = top3_df['总引流人数'].sum() / total引流总人数
print(f'前三大直播间引流总人数占比: {头部引流人次占比:.2%}')
category_distribution = df.groupby('主要带货类目')['短视频引流占比'].mean().sort_values(ascending=False)
print('按引流占比排序的带货类别:')
print(category_distribution)
df['粉丝数与引流人次比'] = df['总引流人数'] / df['主播人数']
correlation, _ = pearsonr(df['粉丝数与引流人次比'], df['短视频引流占比'])
print(f'粉丝数与引流能力相关性:{correlation:.2f}')
以上分析数据来源:互联岛