基于您提供的数据,我们可以从以下几个维度进行核心分析:
引流效率:
头部效应:
类目特征:
粉丝体量:
计算短视频引流占比和销售额的相关性
import pandas as pd
# 假设 df 为包含数据的 DataFrame
correlation = df['短视频引流比例'].corr(df['销售额'])
print(f"短视频引流比例与销售额的相关系数:{correlation}")
计算TOP3直播间的引流人次占比
top_3 = df.nlargest(3, '总人数')
top_3['引流人次占比'] = (top_3['短视频引流人数'] / top_3['总人数']).round(4)
print(top_3[['直播间名称', '引流人次占比']])
识别带货类目分布情况
# 假设‘带货类目’字段为带货的商品类别
category_distribution = df.groupby('带货类目')['总人数'].sum()
print(category_distribution)
粉丝体量与引流能力的关系
fan_vs_traffic = df[['粉丝数', '短视频引流人数']]
# 可以用散点图或回归分析来直观展示二者关系
import seaborn as sns
import matplotlib.pyplot as plt
sns.scatterplot(x='粉丝数', y='短视频引流人数', data=fan_vs_traffic)
plt.show()
from sklearn.linear_model import LinearRegression
model = LinearRegression()
X = fan_vs_traffic['粉丝数'].values.reshape(-1, 1)
Y = fan_vs_traffic['短视频引流人数']
model.fit(X, Y)
print(f"回归系数:{model.coef_}, 截距:{model.intercept_}")
通过上述分析,您可以获得以下结论:
以上分析数据来源:互联岛