根据提供的数据,我们可以从以下几个方面进行核心分析:
import pandas as pd
import numpy as np
from scipy.stats import pearsonr
# 假设df是包含所有直播数据的DataFrame,包括'短视频引流占比', '销售额'
df['引流量'] = df.apply(lambda row: (row['短视频引流占比'] * 100) / sum(df['短视频引流占比']), axis=1)
correlation, p_value = pearsonr(df['引流量'], df['销售额'])
print(f"引流量与销售额相关系数:{correlation}")
# 筛选TOP3
top_3_df = df.nlargest(3, '引流量')
total引流 = df['引流量'].sum()
top_3引流占比 = (top_3_df['引流量'].sum() / total引流) * 100
print(f"Top3直播占总引流的百分比:{top_3引流占比:.2f}%")
# 统计各直播间带货类目的分布
category_distribution = df['带货类目'].value_counts(normalize=True) * 100
print("各类目在直播间的比例:\n", category_distribution)
def categorize_followers(followers):
if followers < 100000:
return '小于10万'
elif 100000 <= followers < 500000:
return '10-50万'
else:
return '大于50万'
df['粉丝量级'] = df.apply(lambda row: categorize_followers(row['粉丝数']), axis=1)
# 比较不同粉丝量级的直播间引流效果
grouped_data = df.groupby('粉丝量级')['引流量'].mean()
print("各粉丝量级平均引流量:\n", grouped_data)
引流效率:
头部效应:
类目特征:
粉丝体量:
以上分析数据来源:互联岛