基于提供的数据,我们可以从以下维度进行深入分析:
数据整理与清洗:
计算关键指标:
绘制图表:
统计分析:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 假设数据存储在一个DataFrame中
data = pd.read_csv('直播数据分析.csv')
# 计算短视频引流占比
data['短视频引流占比'] = data['短视频引流量'] / (data['短视频引流量'] + data['其他引流量'])
# 绘制散点图
sns.scatterplot(x='短视频引流占比', y='销售额(万元)', hue='直播间名称', data=data)
plt.title('短视频引流占比 vs 销售额')
plt.show()
# 计算TOP3直播的引流人次占比
top3 = data.nlargest(3, '短视频引流量')
total_traffic = data['短视频引流量'].sum()
top3_traffic_ratio = top3['短视频引流量'].sum() / total_traffic * 100
print(f'TOP3直播间引流人数占比:{top3_traffic_ratio:.2f}%')
# 分析不同类目的引流效果
category_sales = data.groupby('带货类目')['销售额(万元)'].sum()
sns.barplot(x=category_sales.index, y=category_sales.values)
plt.title('不同带货类别的销售额')
plt.show()
# 举例回归分析
from sklearn.linear_model import LinearRegression
fan_groups = [10**4, 5*10**4, 10**5]
for fan_group in fan_groups:
group_data = data[data['粉丝数'] < fan_group * (i+1)]
model = LinearRegression()
X = group_data[['短视频引流占比']]
y = group_data['销售额(万元)']
model.fit(X, y)
print(f'粉丝数<{fan_group}万的直播间:')
print(f'R^2: {model.score(X, y)}')
以上分析数据来源:互联岛