根据提供的数据,我们可以从以下几个维度进行详细分析:
import pandas as pd
# 假设数据存储在DataFrame df中,包含以下列:'直播间名称', '短视频引流占比', '总引流量', '销售额'
df = pd.read_csv('live_data.csv')
# 计算每个直播间短视频的引流占比和对应的销售额
df['短视频引流占比'] = (df['短视频引流量'] / df['总引流量']) * 100
# 绘制折线图,分析短视频引流占比与销售额的关系
import matplotlib.pyplot as plt
plt.plot(df['直播间名称'], df['短视频引流占比'], label='短视频引流占比')
plt.plot(df['直播间名称'], df['销售额'], label='销售额')
plt.legend()
plt.show()
# 计算相关系数
correlation = df[['短视频引流占比', '销售额']].corr().iloc[0, 1]
print(f'相关系数:{correlation}')
# 排序找到前三个直播间
top_3_df = df.sort_values(by='总引流量', ascending=False).head(3)
# 计算TOP3直播的引流人次占比
top_3_total_flow = top_3_df['总引流量'].sum()
total_flow = df['总引流量'].sum()
top_3_ratio = (top_3_total_flow / total_flow) * 100
print(f'TOP3直播间引流人次占比:{top_3_ratio:.2f}%')
# 假设数据中包含'带货类别'
df['带货类别'] = df['带货类别'].fillna('未知')
# 分析不同带货类目的引流情况
category_distribution = df.groupby(['带货类别', '短视频引流占比']).size().reset_index(name='count')
print(category_distribution)
import seaborn as sns
sns.barplot(x='带货类别', y='短视频引流占比', data=category_distribution)
plt.show()
# 计算每个直播间粉丝数量与其引流效果之间的关系
df['粉丝数量'] = df['总引流量'] / 10 # 假设每10个访问量对应一个粉丝
sns.scatterplot(x='粉丝数量', y='短视频引流占比', data=df)
plt.show()
以上分析数据来源:互联岛