您好,欢迎来到六九路网。
搜索
您的当前位置:首页数据分析pandas之DataFrame.describe()用法概述

数据分析pandas之DataFrame.describe()用法概述

来源:六九路网
数据分析pandas之DataFrame.describe()⽤法概述

DataFrame.describe(percentiles=None, include=None, exclude=None)

其物理意义在于观察这⼀系列数据的范围。⼤⼩、波动趋势等等,便于判断后续对数据采取哪类模型更合适。

基础数据:

# 时间

dates = pd.date_range('20200115', periods=7)# dn表格每个维度

df = pd.DataFrame(np.random.randn(7,5),index=dates,columns=list('ABCDa'))

df.to_excel(r'D:\\⾃动化\\web\est\\DataTest1.xls',sheet_name='Sheet1') #数据输出⾄Excel

1.第⼀个percentiles,这个参数可以设定数值型特征的统计量,默认是[.25, .5, .75],也就是返回25%,50%,75%数据量时的数字,但是这个可以修改的,df['Parch'].describe(percentiles=[.2,.75, .8])默认有5

2.第⼆个参数:include,这个参数默认是只计算数值型特征的统计量,当输⼊include=['O'],会计算离散型变量的统计特征,,举个例⼦如下:

df.describe(include=‘O’) df.describe(include=[‘O’]) 缺图

df.describe(include=‘all’)

此外传参数是‘all’的时候会把数值型和离散型特征的统计都进⾏显⽰。

3.第三个参数的设计就更贴⼼了,第⼆个参数是你可以指定选那些,第三个参数就是你可以指定不选哪些,⼈性化设计。这个参数默认不丢弃任何列,相当于⽆影响。

综述,⽆法取指定⾏数,⽐如只取Min⾏

print(df.describe().iloc[3]) 暂时只能⽤这种⽅式

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 69lv.com 版权所有 湘ICP备2023021910号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务