根据提供的数据,我们可以从以下几个核心维度进行详细分析:
引流效率
头部效应
类目特征
粉丝体量
pearsonr()或spearmanr())来计算短视频引流占比与销售额之间的相关系数。import pandas as pd
# 假设df为包含所有直播间数据的数据框
data = {
'live_id': [1, 2, 3, ...],
'video_referral_ratio': [0.25, 0.30, 0.45, ...],
'sales_amount': [1000, 800, 900, ...],
'fan_count': [10k, 20k, 30k, ...]
}
df = pd.DataFrame(data)
# 计算相关系数
correlation = df['video_referral_ratio'].corr(df['sales_amount'])
print(f"相关性: {correlation}")
# 分类汇总直播间商品类别
category_counts = df.groupby('category')['live_id'].count()
top_categories = category_counts.sort_values(ascending=False).head(10)
print("高引流的直播间的前10大品类:", top_categories)
# 回归分析(假设使用简单线性回归)
from sklearn.linear_model import LinearRegression
X = df[['fan_count']]
y = df['video_referral_ratio']
model = LinearRegression().fit(X, y)
r2_score = model.score(X, y)
print(f"R^2 score: {r2_score}")
以上分析数据来源:互联岛