基于您提供的数据,我们可以从以下几个核心维度进行分析:
引流效率(短视频引流占比与销售额的相关性):
头部效应(TOP3直播的引流人次占比):
类目特征(高引流占比直播的带货类目分布):
粉丝体量(粉丝数与引流能力的关系):
# 假设有一个数据框df包含以下列:'live_id', 'short_video引流', '销售额'
import pandas as pd
# 示例数据(实际应替换为真实数据)
data = {
'live_id': [i for i in range(1, 51)],
'short_video引流': [20000, 30000, 40000, ..., 10000],
'销售额': [50000, 60000, 70000, ..., 80000]
}
df = pd.DataFrame(data)
# 计算每个直播间的引流效率
df['引流效率'] = df['短视频引流'] / df['销售额']
# 找出销售额最高的三个直播间并计算它们的引流占比
top3_sales_indices = df.nlargest(3, '销售额').index
top3_video_ratio = df.loc[top3_sales_indices, '短视频引流'].sum() / df['short_video引流'].sum()
print("引流效率分析:", df[['live_id', 'short_video引流', '销售额', '引流效率']].head())
print("TOP3直播的引流占比:", top3_video_ratio)
# 计算前三个最高引流直播间引流总人次占所有引流总人次的比例
total_video = df['short_video引流'].sum()
top3_video_total = df.nlargest(3, 'short_video引流')['short_video引流'].sum()
print("头部直播的引流占比:", top3_video_total / total_video)
# 假设有一个额外的数据框df_categories包含以下列:'live_id', '类目'
data_categories = {
'live_id': [i for i in range(1, 51)],
'类目': ['服装', '教育', '电子产品', ..., '图书']
}
categories_df = pd.DataFrame(data_categories)
# 合并两个数据框
merged_df = pd.merge(df, categories_df, on='live_id')
# 分析各类目的引流比例
category_grouped = merged_df.groupby('类目')['short_video引流'].mean()
print("各类目平均引流情况:", category_grouped)
# 假设有一个额外的数据框df_fans包含以下列:'live_id', '粉丝数'
data_fans = {
'live_id': [i for i in range(1, 51)],
'粉丝数': [20000, 30000, 40000, ..., 80000]
}
fans_df = pd.DataFrame(data_fans)
# 合并所有数据框
merged_df_all = pd.merge(merged_df, fans_df, on='live_id')
# 按粉丝数分组分析引流能力
grouped_by_fans = merged_df_all.groupby('粉丝数')['short_video引流'].mean()
print("不同粉丝量级的直播间平均引流情况:", grouped_by_fans)
以上分析数据来源:互联岛