根据提供的数据,我们可以从以下几个维度进行核心分析:
短视频引流占比与销售额的相关性
TOP3直播的引流人次占比
高引流占比直播的带货类目分布
粉丝数与引流能力的关系
import pandas as pd
from scipy.stats import pearsonr
import seaborn as sns
import matplotlib.pyplot as plt
# 假设df是包含所有数据的DataFrame
correlation, _ = pearsonr(df['短视频引流占比'], df['销售额'])
print(f'相关系数: {correlation}')
sns.scatterplot(x='短视频引流占比', y='销售额', data=df)
plt.title('短视频引流占比与销售额的关系')
plt.show()
top3 = df.nlargest(3, '短视频引流占比')
total_views = df['引流人数'].sum()
top3_views = top3['引流人数'].sum()
print(f'TOP3引流人次占比: {top3_views / total_views * 100}%')
category_df = df.groupby('带货类目')['短视频引流占比'].mean().reset_index()
sns.barplot(x='带货类目', y='短视频引流占比', data=category_df)
plt.title('不同类别的引流效率分析')
plt.xticks(rotation=45)
plt.show()
df['粉丝分组'] = pd.cut(df['粉丝数'], bins=[0, 10e4, 50e4, 100e4], labels=['<10万', '10-50万', '50-100万'])
grouped_df = df.groupby('粉丝分组')['短视频引流占比'].mean().reset_index()
sns.barplot(x='粉丝分组', y='短视频引流占比', data=grouped_df)
plt.title('不同粉丝体量的引流效率分析')
plt.show()
以上分析数据来源:互联岛