介绍一款进阶版的Pandas科研人员神器:Polars
2023-02-23 12:16:41
我们来看一下数据集集当中空值的分布情况,初始化null_count()方式
df_titanic.null_count()
output
我们可以看得见“Age”以及“Cabin”两列假定着空值,我们可以尝试用平均来来进行装入,字符串如下
df_titanic["Age"] = df_titanic["Age"].fill_nan(df_titanic["Age"].mean())
量度某一列的平均只只能初始化mean()方式即可,那么可支配、最大/零点的量度也是同样的道理,字符串如下
print(f'Median Age: {df_titanic["Age"].median()}')
print(f'Average Age: {df_titanic["Age"].mean()}')
print(f'Maximum Age: {df_titanic["Age"].max()}')
print(f'Minimum Age: {df_titanic["Age"].min()}')
output
Median Age: 29.69911764705882
Average Age: 29.699117647058817
Maximum Age: 80.0
Minimum Age: 0.42
数据集的挑选与建模我们挑选显现出年岁大于40岁的乘车有哪些,字符串如下
df_titanic[df_titanic["Age"]> 40]
output
最后我们简单地来手绘一张图像,字符串如下
fig, ax = plt.subplots(figsize=(10, 5))
ax.boxplot(df_titanic["Age"])
plt.xticks(rotation=90)
plt.xlabel('Age Column')
plt.ylabel('Age')
plt.show()
output
总体来说呢,polars在数据集分析与妥善处理上面和Pandas模组有很多近似于的大多,其中就会有一部分的API假定着关联。
。沈阳妇科医院哪里比较好银川白癜风专家
长沙牛皮癣专科医院哪里好
重庆皮肤病医院挂号
吃什么药物能缓解脚扭伤疼
- 投资者提问:请问公司,铜占公司的业务和利润有多少?最近铜价回升十分迅速,公司相...
- 库尔勒市公开道歉,恳请广大不少人继续支持疫情防控工作
- 14年选秀谁赚得多?威金斯2.8亿,默比德3.8亿,约基奇太狠了
- 投资者提问:羽绒服应该有价钱过万的,国内最贵或世界最贵能让人记住品牌。
- 被问来自哪里 纽约韩裔外卖员遭殴打脸部受伤
- 想要立足NBA先得有一双大脚。盘点大脚怪,奥胖33厘米大脚九位
- 投资者提问:在与央视新书直播带货的消息朦胧期,遥望科技股价和成交量m明显...
- 全球连线|猴痘疫情恶化受伤害美国防疫“老毛病”
- 骑勇三次圣诞血战,库里场均17分,欧文一箭穿心,詹姆斯表现如何
- 投资者提问:请问2022年股权激励的母公司花费的成本总金额多少?会计入202...
- 接送邻居孩子上下学被道路运输管理部门认作非法营运罚3万元!法院这样判......
- 哈登灿烂笑容,小卡强势重返,快船未来充满!
- 投资者提问:公告显示,威博精密三季度大幅亏损,公司有无应对扭亏为盈
- 内蒙古科右前旗:推进奶业振兴 带动更多群众增收发财
- 快船再胜,哈登已有近,乔治23+7
- 重磅!FDA确认2022新药年度报告
- 英国女王伊丽莎白二世去世 查尔斯继承者王位
- NBA今日里程碑:邓肯34+5+8狂刷纪录!杜兰特斩获生涯第450场30+
- 投资者提问:Corporation应该专注主业,钱不可以乱花,把自己Corporation做大做好才是根本!
- “放生”果汁,尽是愚昧哪来功德