帕累托法则,也称为80/20法则,是由意大利经济学家维尔弗雷多·帕累托提出的。它指出在许多情况下,大约80%的效益来自于20%的原因。这个原则在很多领域都有应用,包括商业、经济、社会问题等。
在数据分析中,帕累托法则可以用来识别和专注于最具影响力的因素。以下是帕累托分析的基本步骤:
数据收集:首先,收集相关数据,确定你的分析目标。
数据排序:将数据按照某个特定的标准(如销售额、成本、频率等)进行排序。
计算总和:计算所有项目的总和。
确定累积百分比:对于每个项目,计算累积百分比。这可以通过将每个项目的值除以总和,然后乘以100来实现。
识别关键因素:识别累积百分比达到80%的那些关键因素(原因)。这通常意味着这些因素是最重要的贡献者。
分析和决策:根据帕累托分析的结果,分析关键因素对整体效益的影响,并做出相应的决策
任务:计算下面Excel表格中用活用户的贡献度
在中输入提示词:
你是一个编程专家,要完成一个脚本编写的任务,具体步骤如下:
读取Excel文件”F:AI自媒体内容AI行业数据分析中文翻译.xlsx”,
用绘制一个柱状图:
从A列“热门bot名称”中提取数据作为标签,用于X轴;
从E列“月活用户占比”中提取数据作为大小,用于Y轴;
设置图表的标题为“Poe平台前50个bots月活用户贡献度分析”;
在相同的图表上绘制累积比例曲线,颜色为红色,使用次y轴,次y轴的刻度是从0到1,中间间隔0.1,数据来自于E列,在累积比例曲线上要显示累积比例的数值;
设置默认字体为”,文件路径为:C:\Fonts.ttf
保存图片到文件夹“F:AI自媒体内容AI行业数据分析”,图片标题为:贡献度;
显示图片;
注意:每一步都输出信息到屏幕
源代码:
as pd
. as plt
from
设置默认字体
= r’C:\Fonts.ttf’
= .(fname=)
plt.[‘font.’] = ”
读取Excel文件
= r’F:AI自媒体内容AI行业数据分析中文翻译.xlsx’
df = pd.()
提取数据
= df[‘热门bot名称’]
sizes = df[‘月活用户占比’]
计算累积比例
= sizes.() / sizes.sum()
绘制柱状图
fig, ax1 = plt.()
ax1.bar(, sizes, color=’b’)
ax1.(‘热门bot名称’)
ax1.(‘月活用户占比’, color=’b’)
ax1.(axis=’y’, =’b’)
设置次y轴
ax2 = ax1.twinx()
ax2.plot(, , color=’r’)
ax2.(0, 1)
ax2.([i / 10 for i in range(0, 11)])
ax2.(‘累积比例’, color=’r’)
ax2.(axis=’y’, =’r’)
在累积比例曲线上添加文本注释
for i, (label, ) in (zip(, )):
ax2.(f'{:.2f}’, (label, ), =” “, =(0,10), ha=”)
设置图表标题
plt.title(‘Poe平台前50个bots月活用户贡献度分析’)
保存图片
= r’F:AI自媒体内容AI行业数据分析贡献度.png’
plt.()
显示图片
plt.show()
print(“图表绘制完成,图片已保存到:”, )
323AI导航网发布