基于你提供的数据,我们可以从以下几个维度进行分析:
我们可以通过计算销售额和短视频引流占比之间的皮尔逊相关系数来衡量它们之间的关系。
假设我们有以下两列数据:销售额 和 短视频引流占比,可以使用统计软件或手动计算。
import numpy as np
from scipy.stats import pearsonr
# 示例数据
sales = [8769, 12.6e4, ...] # 假设这里有所有样本的销售额
video_conversion_rate = [0.2349, 0.4111, ...] # 同样是假设的数据
correlation, p_value = pearsonr(sales, video_conversion_rate)
print("Correlation coefficient:", correlation)
找出引流人数最多的三个直播间,并计算其总的引流人数占全部引流人数的比例。
# 假设我们已经有了 `total_video_views` 和 `top_3_views`
total_video_views = 1000000 # 总的视频观看量
top_3_views = [50000, 45000, 40000] # TOP3的引流人数
top_3_total = sum(top_3_views)
total_video_views_percentage = (top_3_total / total_video_views) * 100
print("Top 3 live streams account for", total_video_views_percentage, "% of the total video views.")
检查各直播间的内容,看哪些类目的直播在视频引流方面表现更好。
# 假设我们有 `category` 列来表示各个直播间的类别
categories = ['科技', '教育', '娱乐', ...] # 每个直播间对应一个类别
high_conversion_categories = []
for category, rate in zip(categories, video_conversion_rate):
if rate > 0.3: # 假设我们设定阈值为30%
high_conversion_categories.append(category)
print("Categories with high conversion rates:", high_conversion_categories)
绘制散点图,观察粉丝数量和短视频引流占比之间的关系。
import matplotlib.pyplot as plt
# 假设我们已经有了 `fans_count` 和 `video_conversion_rate`
fans_count = [1000, 5000, ...]
plt.scatter(fans_count, video_conversion_rate)
plt.xlabel("Fans Count")
plt.ylabel("Video Conversion Rate")
plt.title("Relationship between Fans Count and Video Conversion Rate")
plt.show()
通过上述分析,我们可以得出以下结论:
以上分析数据来源:互联岛