根据您提供的数据,我们可以从以下几个方面进行核心分析:
具体步骤如下:
计算各项指标
短视频引流人数 / 总引流人数数据可视化
统计分析
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import pearsonr, ttest_ind
# 假设数据已经加载到df中
data = {
'直播间名称': ['直播间1', '直播间2', ...],
'销售额(元)': [10000, 8000, ...],
'短视频引流人数': [500, 300, ...],
'总引流人数': [6000, 4500, ...],
'粉丝数': [5万, 7万, ...]
}
df = pd.DataFrame(data)
# 计算各项指标
df['短视频引流占比'] = df['短视频引流人数'] / df['总引流人数']
top3_indices = df.nlargest(3, '短视频引流人数').index
top3引流占比 = df.loc[top3_indices, '短视频引流人数'].sum() / df['短视频引流人数'].sum()
# 绘制散点图
sns.scatterplot(x='短视频引流占比', y='销售额(元)', data=df)
plt.title('短视频引流占比与销售额的关系')
plt.show()
# 计算皮尔逊相关系数
correlation, p_value = pearsonr(df['短视频引流占比'], df['销售额(元)'])
print(f'皮尔逊相关系数:{correlation}, P值:{p_value}')
# 绘制柱状图
top3_indices = df.nlargest(3, '短视频引流人数').index
plt.bar(df.loc[top3_indices, '直播间名称'], df.loc[top3_indices, '短视频引流人数'])
plt.title('TOP3直播的引流人次')
plt.xlabel('直播间名称')
plt.ylabel('引流人次')
plt.show()
# 绘制散点图展示粉丝数量与短视频引流人数的相关性
sns.scatterplot(x='粉丝数', y='短视频引流人数', data=df)
plt.title('粉丝数与短视频引流人数的关系')
plt.show()
以上分析数据来源:互联岛