根据您提供的数据,我们可以从以下几个核心维度进行分析:
计算每个直播间视频引流比例:
[ \text{视频引流比} = \frac{\text{通过视频引入的用户数}}{\text{总用户数}} ]
统计每个直播间的销售额与视频引流的比例关系,找出显著相关性的区间。
计算前三个直播间(依据引流人数排序)的引流总和占所有引流人数的比例:
[ \text{TOP3引流比例} = \frac{\sum\limits_{i=1}^{3}\text{第(i)个直播间的引流人数}}{\sum\limits_{i=1}^{50}\text{第(i)个直播间的引流人数}} ]
分析前三个直播间占总引流人数的比例:
如果TOP3直播间的人流占比超过50%,说明头部效应显著。
统计各直播间的带货类别(如食品、美妆、服装等)。
筛选出引流比最高的直播间,并分析其带货类目。
绘制粉丝数量与视频引流比例的散点图。
分析是否存在明显的线性关系或规律:
import pandas as pd
# 假设数据已经存储在一个DataFrame中
data = pd.read_csv('livestream_data.csv')
# 计算各直播间视频引入用户数占比
def calculate_video_ratio(row):
total_users = row['总用户数']
video_users = row['通过视频引入的用户数']
return (video_users / total_users) if total_users != 0 else 0
data['视频引流比'] = data.apply(calculate_video_ratio, axis=1)
# 排序并取前三名
top3_data = data.nlargest(3, '通过视频引入的用户数')
# 总人数与TOP3总人数
total_users = data['通过视频引入的用户数'].sum()
top3_total_users = top3_data['通过视频引入的用户数'].sum()
# 计算比例
top3_ratio = (top3_total_users / total_users) * 100
# 假设'带货类别'列已经存在
grouped_data = data.groupby('带货类别')['视频引流比'].mean()
high引流直播间 = grouped_data.nlargest(5)
import matplotlib.pyplot as plt
# 绘制粉丝数量与视频引流比例的散点图
plt.scatter(data['总用户数'], data['视频引流比'])
plt.xlabel('总用户数')
plt.ylabel('视频引流比')
plt.show()
以上分析数据来源:互联岛