索引
其中许多方法或其变体可用于包含索引(Series / DataFrame)的对象,并且最有可能在直接调用这些方法之前使用这些方法或变体.
Index:不可变的ndarray实现有序的可切片集.
属性
Index.values:将基础数据作为ndarray返回
Index.is_monotonic:is_monotonic_increasing的别名(不建议使用)
Index.is_monotonic_increasing:如果索引是单调递增(仅等于或增加)值,则返回。
Index.is_monotonic_decreasing:如果索引是单调递减(仅等于或递减)值,则返回。
Index.is_unique:如果索引具有唯一值,则返回
Index.has_duplicates:
Index.hasnans:如果我有任何nans,我会回来; 实现各种性能加速
Index.dtype:返回基础数据的dtype对象
Index.dtype_str:返回基础数据的dtype str
Index.inferred_type:返回从值推断出的类型的字符串
Index.is_all_dates:
Index.shape:返回基础数据形状的元组
Index.name:
Index.names:
Index.nbytes:返回基础数据中的字节数
Index.ndim:根据定义1,返回基础数据的维数
Index.size:返回基础数据中的元素数量
Index.empty:
Index.strides:返回基础数据的步幅
Index.itemsize:返回基础数据项的dtype的大小
Index.base:如果共享基础数据的内存,则返回基础对象
Index.T:返回转置,根据定义自我
Index.memory_usage([deep]):内存使用值
修改和计算
Index.all(*args, **kwargs):返回是否所有元素都为True。
Index.any(*args, **kwargs):返回任何元素是否为True。
Index.argmin([axis]):返回最小参数索引器的ndarray
Index.argmax([axis]):返回最大参数索引器的ndarray
Index.copy([name, deep, dtype]):制作此对象的副本。
Index.delete(loc):删除已传递位置(-s)的新索引
Index.drop(labels[, errors]):删除已传递标签列表的新索引
Index.drop_duplicates([keep]):返回索引,删除重复值。
Index.duplicated([keep]):指示重复的索引值。
Index.equals(other):确定两个Index对象是否包含相同的元素。
Index.factorize([sort, na_sentinel]):将对象编码为枚举类型或分类变量。
Index.identical(other):与equals类似,但检查其他可比属性是否相等
Index.insert(loc, item):使新索引在位置插入新项目。
Index.is_(other):更灵活,更快速的检查,is但通过视图工作
Index.is_boolean():
Index.is_categorical():检查索引是否包含分类数据。
Index.is_floating():
Index.is_integer():
Index.is_interval():
Index.is_lexsorted_for_tuple(tup):
Index.is_mixed():
Index.is_numeric():
Index.is_object():
Index.min():返回索引的最小值。
Index.max():返回索引的最大值。
Index.reindex(target[, method, level, …]):使用目标值创建索引(根据需要移动/添加/删除值)
Index.rename(name[, inplace]):在索引上设置新名称。
Index.repeat(repeats, *args, **kwargs):重复索引的元素。
Index.where(cond[, other]):版本0.19.0中的新功能。
Index.take(indices[, axis, allow_fill, …]):返回索引选择的值的新索引
Index.putmask(mask, value):返回使用掩码设置的值的新索引
Index.set_names(names[, level, inplace]):在索引上设置新名称。
Index.unique([level]):返回索引中的唯一值。
Index.nunique([dropna]):返回对象中唯一元素的数量。
Index.value_counts([normalize, sort, …]):返回包含唯一值计数的对象。
缺少值
Index.fillna([value, downcast]):使用指定值填充NA / NaN值
Index.dropna([how]):返回没有NA / NaN值的索引
Index.isna():检测缺失值。
Index.notna():检测现有(非缺失)值
转换
Index.astype(dtype[, copy]):使用强制转换为dtypes的值创建索引。
Index.item():将基础数据的第一个元素作为python标量返回
Index.map(mapper[, na_action]):使用输入对应(字典,系列或函数)映射值。
Index.ravel([order]):返回基础数据的扁平值的ndarray
Index.tolist():返回值列表。
Index.to_native_types([slicer]):格式化self的指定值并返回它们。
Index.to_series([index, name]):创建一个索引和值等于索引键的系列,该索引键对map用于根据索引返回索引器
Index.to_frame([index]):使用包含索引的列创建DataFrame。
排序
Index.argsort(*args, **kwargs):返回将对索引进行排序的整数指标
Index.searchsorted(value[, side, sorter]):查找应插入元素以维护顺序的索引
Index.sort_values([return_indexer, ascending]):返回索引的排序副本
特定时间的操作
Index.shift([periods, freq]):按所需的时间频率增量数移动索引.
组合/ 加入/ 设置操作
Index.append(other):一起附加索引选项的集合
Index.join(other[, how, level, …]):这是一种内部非公开方法
Index.intersection(other):形成两个Index对象的交集。
Index.union(other):如果可能,形成两个Index对象的联合和排序。
Index.difference(other):返回包含索引中不在其他元素中的元素的新索引。
Index.symmetric_difference(other[, result_name]):计算两个Index对象的对称差异
选择
Index.asof(label):对于排序索引,返回最新标签,包括传递的标签。
Index.asof_locs(where, mask):其中:timestamps数组mask:数据不是NA的布尔数组
Index.contains(key):如果此键在索引中,则返回布尔值
Index.get_duplicates():(DEPRECATED)提取重复的索引元素。
Index.get_indexer(target[, method, limit, …]):给定当前索引计算新索引的索引器和掩码。
Index.get_indexer_for(target, **kwargs):即使在非唯一时也保证返回索引器这将调整到get_indexer或get_indexer_nonunique
Index.get_indexer_non_unique(target):给定当前索引计算新索引的索引器和掩码。
Index.get_level_values(level):返回请求级别的值索引,等于索引的长度。
Index.get_loc(key[, method, tolerance]):获取所请求标签的整数位置,切片或布尔掩码。
Index.get_slice_bound(label, side, kind):计算与给定标签对应的切片边界。
Index.get_value(series, key):从1维ndarray快速查找值。
Index.get_values():将索引数据作为num返回。
Index.set_value(arr, key, value):从1维ndarray快速查找值。
Index.isin(values[, level]):返回一个布尔数组,其中索引值为value。
Index.slice_indexer([start, end, step, kind]):对于有序或唯一索引,请计算输入标签和步骤的切片索引器。
Index.slice_locs([start, end, step, kind]):计算输入标签的切片位置。
Numeric Index
RangeIndex:不可变指数实现单调整数范围。
Int64Index:不可变的ndarray实现有序的可切片集。
UInt64Index:不可变的ndarray实现有序的可切片集。
Float64Index:不可变的ndarray实现有序的可切片集。
RangeIndex.from_range(data[, name, dtype]):从范围(py3)或xrange(py2)对象创建RangeIndex
分类
CategoricalIndex:不可变索引实现有序的可切片集
分类组件
Ca(*args, …):重命名类别。
Ca(*args, …):重新排序new_categories中指定的类别。
Ca(*args, **kwargs):添加新类别。
Ca(*args, …):删除指定的类别。
Ca(…):删除未使用的类别。
Ca(*args, **kwargs):将类别设置为指定的new_categories。
Ca(*args, **kwargs):设置要排序的分类
Ca(*args, **kwargs):将Categorical设置为无序
Ca(mapper):使用输入对应(字典,系列或函数)映射值。
IntervalIndex
IntervalIndex:不可变索引实现有序的可切片集.
IntervalIndex Components
In(left, right[, …]):从定义左边界和右边界的两个数组构造。
In(data[, closed, …]):从元组的列表/数组构造IntervalIndex
In(breaks[, closed, …]):从一组拆分构造一个IntervalIndex
In(key):返回一个布尔值,指示键是否在索引中
In:将IntervalIndex中每个Interval的左端点作为索引返回
In:将IntervalIndex中每个Interval的右端点作为索引返回
In:将IntervalIndex中每个Interval的中点作为索引返回
In:是否在左侧,右侧,两者或两者都关闭间隔
In:返回一个索引,其中的条目表示IntervalIndex中每个Interval的长度
In:将IntervalIndex的数据作为Interval对象的numpy数组返回(使用dtype ='object')
In:如果IntervalIndex不重叠(没有间隔共享点)并且是单调递增或单调递减,则返回True,否则返回False
In(key[, method]):获取所请求标签的整数位置,切片或布尔掩码。
In(target[, method, …]):给定当前索引计算新索引的索引器和掩码。
多指标
MultiIndex:用于pandas对象的多级或分层索引对象
IndexSlice:创建一个对象以更轻松地执行多索引切片
MultiIndex 构造函数
Mul(arrays[, sortorder, …]):将数组转换为MultiIndex
Mul(tuples[, sortorder, …]):将元组列表转换为MultiIndex
Mul(iterables[, …]):从多个迭代的笛卡尔积中创建一个MultiIndex
MultiIndex 属性
Mul:MultiIndex中的级别名称
Mul:
Mul:
Mul:此MultiIndex中的整数级别。
Mul:每个级别长度的元组。
MultiIndex 组件
Mul(levels[, level, …]):在MultiIndex上设置新级别。
Mul(labels[, level, …]):在MultiIndex上设置新标签。
Mul(n_repeat[, n_shuffle]):返回重新整形的MultiIndex以符合n_repeat和n_shuffle给出的形状。
Mul([index]):使用MultiIndex的级别作为列创建DataFrame。
Mul():如果标签按字典顺序排序,则返回True
Mul([level, ascending, …]):按要求的级别对MultiIndex进行排序。
Mul([level]):已删除请求级别的返回索引。
Mul([i, j]):交换等级i与等级j。
Mul(order):使用输入顺序重新排列级别。
Mul():从当前删除未使用的级别创建一个新的MultiIndex,这意味着它们不会在标签中表示
Mul([level]):返回索引中的唯一值。
MultiIndex 选择
Mul(key[, method]):获取标签或标签元组的位置作为整数,切片或布尔掩码。
Mul(target[, method, …]):给定当前索引计算新索引的索引器和掩码。
Mul(level):返回请求级别的标签值向量,等于索引的长度
DatetimeIndex
DatetimeIndex:datetime64数据的不可变ndarray,内部表示为int64,可以装入Timestamp对象,这些对象是datetime的子类,并携带元数据,如频率信息.
选择时间/日期组件
Da:日期时间
Da:月份为1月= 1,12月= 12
Da:日期时间的日子
Da:日期时间
Da:日期时间的分钟
Da:日期时间的秒数
Da:日期时间的微秒
Da:日期时间的纳秒
Da:返回numpy数组的python da对象(即没有时区信息的Timestamps的日期部分)。
Da:返回da的numpy数组。
Daofyear:一年中的序数日
Da:一年中的一周序数
Da:一年中的一周序数
Daofweek:星期一= 0,星期日= 6的星期几
Daday:星期一= 0,星期日= 6的星期几
Da:日期的四分之一
Da:
Da:如果已设置,则返回频率对象,否则返回None
Dastr:如果设置了频率对象,则将其作为字符串返回,否则为None
Da:逻辑指示是否每月的第一天(由频率定义)
Da:指示日期是否是该月的最后一天。
Da:指示日期是否是一个季度的第一天。
Da:指示日期是否是一个季度的最后一天。
Da:指明日期是否是一年的第一天。
Da:指明日期是一年中的最后一天。
Da:布尔指示符,如果日期属于闰年。
Da:尝试返回表示由infer_freq生成的频率猜测的字符串
选择
Da(time[,asof]):返回特定时刻的索引值的索引位置(例如,
Da(... [,...]):返回值的特定时间之间的值的索引位置(例如,9:00-9:30AM)。
特定时间的操作
Da():将时间转换为午夜。
Da(date_format):使用指定的date_format转换为Index。
Da([freq]):将时间戳记录到最近出现的频率
Da_convert(tz):将tz-aware DatetimeIndex从一个时区转换为另一个时区。
Da_localize(tz[, ambiguous, …]):将tz-naive DatetimeIndex本地化为tz-aware DatetimeIndex。
Da(freq, *args, **kwargs):将数据舍入到指定的频率。
Da(freq):将数据置于指定的频率。
Da(freq):将数据ceil到指定的频率。
Da_name([locale]):返回具有指定语言环境的DateTimeIndex的月份名称。
Da_name([locale]):返回具有指定语言环境的DateTimeIndex的日期名称。
转换
Da([freq]):以特定频率转换为PeriodIndex。
Dadelta(freq):计算索引值与指定频率下转换为periodIndex的索引之间差异的TimedeltaIndex。
Da():返回DatetimeIndex作为datime对象的对象ndarray
Da([keep_tz, index, name]):创建一个索引和值等于索引键的系列,该索引键对map用于根据索引返回索引器
Da([index]):使用包含索引的列创建DataFrame。
TimedeltaIndex
TimedeltaIndex:timedelta64数据的不可变ndarray,内部表示为int64,可以装入timedelta对象
ConversionComponents
Timedel:每个元素的天数。
Timedel:每个元素的秒数(> = 0且小于1天)。
Timedel:每个元素的微秒数(> = 0且小于1秒)。
Timedel:每个元素的纳秒数(> = 0且小于1微秒)。
Timedel:返回Timedeltas的组件(天,小时,分钟,秒,毫秒,微秒,纳秒)的数据帧。
Timedel:尝试返回表示由infer_freq生成的频率猜测的字符串。
转换
Timedel():返回TimedeltaIndex作为dadelta对象的对象ndarray
Timedel([index, name]):创建一个索引和值等于索引键的系列,该索引键对map用于根据索引返回索引器
Timedel(freq, *args, **kwargs):将数据舍入到指定的频率。
Timedel(freq):将数据置于指定的频率。
Timedel(freq):将数据ceil到指定的频率。
Timedel([index]):使用包含索引的列创建DataFrame。
PeriodIndex
PeriodIndex:不可变的ndarray持有序数值,表示特定的时间段,如特定的年,季度,月等
属性
PeriodIndex.day:这段时期
PeriodIndex.dayofweek:星期一= 0,星期日= 6的星期几
PeriodIndex.dayofyear:一年中的序数日
PeriodIndex.days_in_month:本月的天数
PeriodIndex.daysinmonth:本月的天数
PeriodIndex.end_time:
PeriodIndex.freq:如果已设置,则返回频率对象,否则返回None
PeriodIndex.freqstr:如果设置了频率对象,则将其作为字符串返回,否则为None
PeriodIndex.hour:这段时间
PeriodIndex.is_leap_year:逻辑指示日期是否属于闰年
PeriodIndex.minute:这段时间的一分钟
PeriodIndex.month:月份为1月= 1,12月= 12
PeriodIndex.quarter:日期的四分之一
PeriodIndex.qyear:
PeriodIndex.second:第二个时期
PeriodIndex.start_time:
PeriodIndex.week:一年中的一周序数
PeriodIndex.weekday:星期一= 0,星期日= 6的星期几
PeriodIndex.weekofyear:一年中的一周序数
PeriodIndex.year:这一年的一年
Methods
PeriodIndex.asfreq([freq, how]):将PeriodIndex转换为指定的频率freq。
PeriodIndex.strftime(date_format):使用指定的date_format转换为Index。
PeriodIndex.to_timestamp([freq, how]):转换为DatetimeIndex
PeriodIndex.tz_convert(tz):将tz-aware DatetimeIndex从一个时区转换为另一个时区(使用pytz / dateutil)
PeriodIndex.tz_localize(tz[, ambiguous]):将tz-naive DatetimeIndex本地化为给定时区(using pytz/dateutil),或从tz-aware DatetimeIndex中删除时区
标量
Period
Period:代表一段时间
属性
Period.day:获取某个时段所在月份的某一天。
Period.dayofweek:返回星期几。
Period.dayofyear:返回一年中的某一天。
Period.days_in_month:获取此期间所在月份的总天数。
Period.daysinmonth:获取该期间所在月份的总天数。
Period.end_time:
Period.freq:
Period.freqstr:
Period.hour:获取期间的小时组成部分。
Period.is_leap_year:
Period.minute:获取期间的小时部分。
Period.month:
Period.ordinal:
Period.quarter:
Period.qyear:
Period.second:获取期间的第二个组成部分。
Period.start_time:获取期间开始的时间戳。
Period.week:获取给定期间的一年中的一周。
Period.weekday:
Period.weekofyear:
Period.year:
方法
Period.asfreq:将周期转换为所需频率,在间隔的开始或结束时
Period.now:
Period.strftime:返回的字符串表示形式Period,具体取决于所选的fmt。
Period.to_timestamp:将Period的Timestamp表示返回到Period的指定末尾(how)的目标频率
时间戳
Timestamp:Pandas 替换 for datime
方法
Time:将tz-aware Timestamp转换为另一个时区。
Time:返回一个新的时间戳,该时间戳已通过此决议
Time(date, time):date,time - > datetime,具有相同的日期和时间字段
Time:返回ctime()样式字符串。
Time:返回具有相同年,月和日的日期对象。
Time:返回具有指定语言环境的时间戳的日期名称。
Time:返回(自我)。
Time:返回一个覆盖此分辨率的新时间戳
Time:
Timestr:
Time(ordinal[, freq, tz]):传递了序数,翻译并转换为ts音符:根据定义,序数本身不能有任何tz信息
Time(ts):timestamp [,tz] - > tz来自POSIX时间戳的本地时间。
Time:返回包含ISO年份,周数和工作日的3元组。
Time:
Time:返回日期所代表的星期几。
Time:返回具有指定语言环境的时间戳的月份名称。
Time:将时间戳标准化为午夜,保留tz信息。
Time([tz]):返回表示tz本地当前时间的新Timestamp对象。
Time:实现da,处理纳秒
Time:将时间戳舍入为指定的分辨率
Time:format - > strftime()样式字符串。
Time:string,format - >从字符串解析的新日期时间(如())。
Time:同时返回时间对象但是tzinfo = None。
Timestamp:将POSIX时间戳返回为float。
Timetuple:返回时间元组,与()兼容。
Timetz:同时返回时间对象和tzinfo。
Time:返回具有'ns'精度的num对象
Time:将TimeStamp转换为Julian日期。
Time:返回此时间戳为观察值的时段。
Time:将Timestamp对象转换为本机Python datetime对象。
Time(cls[, tz]):返回当地时区的当前时间。
Time:返回预感格里高利序数。
Time:将tz-aware Timestamp转换为另一个时区。
Time:将天真时间戳转换为本地时区,或从tz感知时间戳中删除时区。
Time:返回(个体经营)。
Time(ts):从POSIX时间戳构造一个天真的UTC日期时间。
Time():返回表示UTC日期和时间的新时间戳。
Time:返回(个体经营)。
Time:返回UTC时间元组,与()兼容。
Time:返回日期所代表的星期几。
间隔
Interval:不可变对象实现Interval,有界切片状间隔.
属性
In:是否在左侧,右侧,两侧或两者都关闭间隔
In_left:检查左侧是否关闭间隔。
In_right:检查右侧是否关闭间隔。
In:左边界限
In:返回Interval的长度
In:返回间隔的中点
In:检查左侧是否打开间隔。
In:检查右侧是否打开间隔。
In:右边界限
Timedelta
Timedelta:表示持续时间,两个日期或时间之间的差异
属性
Timedel:返回我自己的numpy timedelta64数组视图
Timedel:返回与NamedTuple类似的组件
Timedel:天数。
Timedel:以纳秒(ns)为单位返回timedelta,以获得内部兼容性。
Timedel:
Timedel:
Timedel:
Timedel:微秒数(> = 0且小于1秒)。
Timedel:
Timedel:返回纳秒数(n),其中0 <= n <1微秒。
Timedel:返回表示我们拥有的最低分辨率的字符串
Timedel:秒数(> = 0且不到1天)。
Timedel:
Timedel:数组视图compat
方法
Timedel:返回一个新的Timedelta以此决议
Timedel:返回一个新的Timedelta,落在这个分辨率上
Timedel:将Timedelta格式化为ISO 8601持续时间P[n]Y[n]M[n]DT[n]H[n]M[n]S,其中[n]s由值替换。
Timedel:将Timedelta四舍五入到指定的分辨率
Timedel:返回一个实际的dadelta对象注释:如果有的话,我们将失去纳秒分辨率
Timedel:返回具有'ns'精度的num对象
Timedel:timedelta的总持续时间,以秒为单位(以ns精度计)
频率
to_offset(freq):从字符串或元组表示或dadelta对象返回DateOffset对象
窗口
滚动物体被返回.rolling电话:(),(),等扩展对象通过返回.expanding的呼叫:(),(),等EWM对象通过返回.ewm的呼叫:(),(),等.
标准移动窗口函数
Rolling.count():窗口内任何非NaN观测值的滚动计数。
Rolling.sum(*args, **kwargs):计算给定DataFrame或Series的滚动总和。
Rolling.mean(*args, **kwargs):计算值的滚动平均值。
Rolling.median(**kwargs):计算滚动中位数。
Rolling.var([ddof]):计算无偏滚动方差。
Rolling.std([ddof]):计算滚动标准偏差。
Rolling.min(*args, **kwargs):计算滚动最小值。
Rolling.max(*args, **kwargs):滚动最大值
Rolling.corr([other, pairwise]):滚动样本相关性
Rolling.cov([other, pairwise, ddof]):滚动样本协方差
Rolling.skew(**kwargs):无偏见的滚动偏度
Rolling.kurt(**kwargs):计算无偏滚动峰度。
Rolling.apply(func[, raw, args, kwargs]):滚动功能适用
Rolling.aggregate(arg, *args, **kwargs):使用指定轴上的一个或多个操作进行聚合。
Rolling.quantile(quantile[, interpolation]):滚动分位数。
Window.mean(*args, **kwargs):计算值的窗口均值。
Window.sum(*args, **kwargs):计算给定DataFrame或Series的窗口总和。
标准扩展窗口函数
Ex(**kwargs):窗口内任何非NaN观测值的扩展计数。
Ex(*args, **kwargs):计算给定DataFrame或Series的扩展和。
Ex(*args, **kwargs):计算值的扩展平均值。
Ex(**kwargs):计算扩展中位数。
Ex([ddof]):计算无偏扩展方差。
Ex([ddof]):计算扩展标准偏差。
Ex(*args, **kwargs):计算扩展的最小值。
Ex(*args, **kwargs):扩大最大化
Ex([other, pairwise]):扩大样本相关性
Ex([other, pairwise, ddof]):扩展样本协方差
Ex(**kwargs):不偏不倚地扩大偏斜
Ex(**kwargs):计算无偏扩张峰度。
Ex(func[, raw, args, kwargs]):扩展功能适用
Ex(arg, *args, **kwargs):使用指定轴上的一个或多个操作进行聚合。
Ex(quantile[, interpolation]):扩大分位数。
指数加权移动窗口函数
EWM.mean(*args, **kwargs):指数加权移动平均线
EWM.std([bias]):指数加权移动stddev
EWM.var([bias]):指数加权移动方差
EWM.corr([other, pairwise]):指数加权样本相关
EWM.cov([other, pairwise, bias]):指数加权样本协方差
GroupBy
GroupBy objects are returned by groupby calls: (), (), etc.
索引, 迭代
Grou():Groupby迭代器
Grou:dict {组名 - >组标签}
Grou:dict {组名 - >组索引}
Grou(name[, obj]):从提供名称的组构造NDFrame
Grouper([key, level, freq, axis, sort]):Grouper允许用户为目标对象指定groupby指令
功能应用
Grou(func, *args, **kwargs):func 分组应用功能并将结果组合在一起.
Grou(func, *args, **kwargs):
Grou(func, *args, **kwargs):
Grou(func, *args, **kwargs):将func带有参数的函数应用于此GroupBy对象并返回函数的结果.
计算/ 描述性统计
Grou([skipna]):如果组中的所有值都是真实的,则返回True,否则返回False
Grou([skipna]):如果组中的任何值是真实的,则返回True,否则返回False
Grou([limit]):向后填充值
Grou():计算组的计数,不包括缺失值
Grou([ascending]):将每个组中的每个项目编号从0到该组的长度 - 1。
Grou([limit]):向前填充值
Grou(**kwargs):首先计算组值
Grou([n]):返回每组的前n行。
Grou(**kwargs):计算最后一组值
Grou(**kwargs):计算组值的最大值
Grou(*args, **kwargs):计算组的平均值,不包括缺失值
Grou(**kwargs):计算组的中位数,排除缺失值
Grou(**kwargs):计算组值的最小值
Grou([ascending]):将每个组的编号从0到组的数量 - 1。
Grou(n[, dropna]):如果n是int,则从每个组中取第n行;如果n是int列表,则从行的子集获取。
Grou():计算值的总和,不包括缺失值对于多个分组,结果索引将是MultiIndex
Grou(**kwargs):计算组值的产品
Grou([method, ascending, na_option, …]):提供每个组中的值的等级。
Grou([periods, fill_method, …]):计算每个值的pct_change到组中的上一个条目
Grou():计算组大小
Grou([ddof]):计算组平均值的标准误差,排除缺失值
Grou([ddof]):计算组的标准偏差,不包括缺失值
Grou(**kwargs):计算组值的总和
Grou([ddof]):计算组的方差,排除缺失值
Grou([n]):返回每组的最后n行
以下方法在两个对象SeriesGroupBy和 DataFrameGroupBy对象中都可用,但可能略有不同,通常是因为DataFrameGroupBy版本通常允许指定axis参数,并且通常是指示是否将应用程序限制为特定数据类型的列的参数.
Da(arg, *args, **kwargs):使用指定轴上的一个或多个操作进行聚合。
DataFrameGrou([skipna]):如果组中的所有值都是真实的,则返回True,否则返回False
DataFrameGrou([skipna]):如果组中的任何值是真实的,则返回True,否则返回False
DataFrameGrou([limit]):向后填充值
Da:计算列的成对相关性,不包括NA / null值
DataFrameGrou():计算组的计数,不包括缺失值
Da:计算列的成对协方差,不包括NA / null值。
Da([axis]):每组累积最大值
Da([axis]):每组累积最小值
Da([axis]):每组的累积产品
Da([axis]):每组的累计金额
Da(**kwargs):生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括NaN值。
Da:第一个离散的元素差异。
DataFrameGrou([limit]):向前填充值
Da:使用指定的方法填充NA / NaN值
Da(func[, dropna]):返回DataFrame的副本,不包括不满足func指定的布尔标准的组中的元素。
Da:制作DataFrame的直方图。
Da:返回请求轴上第一次出现最大值的索引。
Da:返回首次出现最小请求轴的索引。
Da:返回请求轴的值的平均绝对偏差
DataFrameGrou([periods, …]):计算每个值的pct_change到组中的上一个条目
Da:实现groupby对象的.plot属性的类
Da:在请求的轴上返回给定分位数的值,即la num。
DataFrameGrou([method, ascending, …]):提供每个组中的值的等级。
Da(rule, *args, **kwargs):使用TimeGrouper时提供重新采样返回附加了重新采样器的新石斑鱼
Da([periods, freq, axis]):按周期观察移动每组
DataFrameGrou():计算组大小
Da:返回请求轴的无偏偏差,由N-1归一化
Da:沿轴返回给定位置索引中的元素。
Da:如果可用,使用索引的频率来移动时间索引。
以下方法仅适用于SeriesGroupBy对象.
Serie:返回最大的n个元素。
Serie:返回最小的n个元素。
Serie([dropna]):返回组中唯一元素的数量
Serie:返回Series对象的唯一值。
Serie([normalize,...]):
Serie:如果对象中的值是monotonic_increasing,则返回布尔值
Serie:如果对象中的值是monotonic_decreasing,则返回布尔值
以下方法仅适用于DataFrameGroupBy对象.
Dawith:计算两个DataFrame对象的行或列之间的成对关联.
Da([subplots, column, …]):从DataFrameGroupBy数据制作箱形图.
重新采样
重新采样对象由resample调用返回: (), ().
索引, 迭代
Re():Groupby迭代器
Re:dict {组名 - >组标签}
Re:dict {组名 - >组索引}
Re(name[, obj]):从提供名称的组构造NDFrame
功能应用
Re(arg, *args, **kwargs):使用指定轴上的一个或多个操作进行聚合。
Re(arg, *args, **kwargs):使用指定轴上的一个或多个操作进行聚合。
Re(arg, *args, **kwargs):调用函数在每个组上生成类似索引的Series,并返回带有转换值的Series
Re(func, *args, **kwargs):将func带有参数的函数应用于此Resampler对象并返回函数的结果。
上采样
Re([limit]):向前填充值
Re([limit]):向后填充重新采样数据中的新缺失值。
Re([limit]):向后填充重新采样数据中的新缺失值。
Re([limit]):向前填充值
Re([limit]):从中心开始用最近邻居填充值
Re(method[, limit]):填写上采样引入的缺失值。
Re([fill_value]):返回新频率的值,基本上是一个reindex
Re([method, axis, limit, …]):根据不同的方法插值。
计算/ 描述性统计
Re([_method]):计算组的计数,不包括缺失值
Re([_method]):返回组中唯一元素的数量
Re([_method]):首先计算组值
Re([_method]):计算最后一组值
Re([_method]):计算组值的最大值
Re([_method]):计算组的平均值,不包括缺失值
Re([_method]):计算组的中位数,排除缺失值
Re([_method]):计算组值的最小值
Re([_method]):计算值的总和,不包括缺失值对于多个分组,结果索引将是MultiIndex
Re([_method, min_count]):计算组值的产品
Re():计算组大小
Re([_method]):计算组平均值的标准误差,排除缺失值
Re([ddof]):计算组的标准偏差,不包括缺失值
Re([_method, min_count]):计算组值的总和
Re([ddof]):计算组的方差,排除缺失值
Style
Styler objects are returned by .
Styler 构造函数
Styler(data[, precision, table_styles, …]):根据HTML和CSS的数据帮助设置DataFrame或Series的样式.
S(searchpath, name):用于创建Styler具有自定义模板和Jinja环境的子类的工厂函数.
Styler 属性
S
S
S
风格应用
S(func[, axis, subset]):按列,按行或按行应用函数,使用结果更新HTML表示。
Smap(func[, subset]):元素应用函数,使用结果更新HTML表示。
S(cond, value[, other, subset]):元素应用函数,使用根据函数的返回值选择的样式更新HTML表示。
S(formatter[, subset]):格式化单元格的文本显示值。
S(precision):设置用于渲染的精度。
S(table_styles):在Styler上设置表格样式。
S(attributes):设置表属性。
S(caption):在样式器上设置标题
S([subset]):用于设置一个或多个非数据相关属性或每个单元的便捷方法。
S(uuid):为Styler设置uuid。
S():“重置”样式器,删除任何以前应用的样式。
内置样式
S([subset, color, axis]):通过着色背景突出显示最大值
S([subset, color, axis]):通过着色背景突出显示最小值
S([null_color]):null_color为缺失值着色背景。
S([cmap, low, …]):根据每列(可选行)中的数据为渐变中的背景着色。
S([subset, axis, color, width, align]):将背景颜色设置color为每列中的值。
样式导出和导入
S(**kwargs):将构建的样式呈现为HTML
S():导出要应用于当前Styler的样式。
S(styles):在当前Styler上设置样式,可能使用样式S。
S(excel_writer[, sheet_name, …]):将Styler写入Excel工作表
绘图
模块中包含以下函数。
andrews_curves(frame, class_column[, ax, …]):生成安德鲁斯曲线的matplotlib图,用于可视化多元数据的聚类。
bootstrap_plot(series[, fig, size, samples]):关于均值,中位数和中位数统计的Bootstrap图。
deregister_matplotlib_converters():删除pandas的格式化程序和转换器
lag_plot(series[, lag, ax]):时间序列的滞后图。
parallel_coordinates(frame, class_column[, …]):平行坐标绘图。
radviz(frame, class_column[, ax, color, …]):在2D中绘制多维数据集。
register_matplotlib_converters([explicit]):使用matplotlib注册Pandas格式化程序和转换器
scatter_matrix(frame[, alpha, figsize, ax, …]):绘制散点图矩阵。
一般实用功能
使用选项
describe_option(pat[, _print_desc]):打印一个或多个已注册选项的说明。
reset_option(pat):将一个或多个选项重置为其默认值。
get_option(pat):检索指定选项的值。
set_option(pat, value):设置指定选项的值。
option_context(*args):上下文管理器临时设置with语句上下文中的选项。
测试功能
(left, right[, …]):检查左右DataFrame是否相等。
(left, right[, …]):检查左右系列是否相等。
(left, right[, …]):检查左右索引是否相等。
例外 and 警告
errors.DtypeWarning:从文件中读取列中的不同dtypes时出现警告。
errors.EmptyDataError:遇到空数据或标头时,在(由C和Python引擎引发)中抛出的异常。
errors.OutOfBoundsDatetime:
errors.ParserError:中遇到的错误引发的异常。
errors.ParserWarning:读取不使用默认“c”解析器的文件时引发警告。
errors.PerformanceWarning:出现可能的性能影响时发出警告。
errors.UnsortedIndexError:尝试获取MultiIndex切片时出错,并且索引尚未被lexsorted。
errors.UnsupportedFunctionCall:尝试在pandas对象上调用numpy函数时引发异常,但该对象不支持该函数,例如
数据类型相关功能
a(to_union[, …]):结合列表类似类别,联合类别。
a:有效地推断传递的val或类似列表的数组的类型。
a(dtype):将输入转换为仅pandas的dtype对象或numpy dtype对象。
Dtype内省
a(arr_or_dtype):检查提供的数组或dtype是否为布尔dtype。
a(arr_or_dtype):检查类似数组或dtype是否属于Categorical dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为复杂的dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为datetime64 dtype。
a(arr_or_dtype):检查数组类型或dtype是否为datetime64 dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为datetime64 [ns] dtype。
a(arr_or_dtype):检查数组类型或dtype是否为DatetimeTZDtype dtype。
a(arr):检查类似数组是否是pandas扩展类实例。
a(arr_or_dtype):检查提供的数组或dtype是否为float dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为int64 dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为整数dtype。
a(arr_or_dtype):检查数组类型或dtype是否为Interval dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为数字dtype。
a(arr_or_dtype):检查数组类型或dtype是否为对象dtype。
a(arr_or_dtype):检查数组类型或dtype是否为Period dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为带符号整数dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为字符串dtype。
a(arr_or_dtype):检查数组类型或dtype是否属于timedelta64 dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为timedelta64 [ns] dtype。
a(arr_or_dtype):检查提供的数组或dtype是否为无符号整数dtype。
a(arr):检查数组是否是pandas稀疏数组。
可迭代的内省
a(obj):检查对象是否像dict一样。
a(obj):检查对象是否是类文件对象。
a(obj):检查对象是否类似于列表。
a(obj):检查对象是否是命名元组。
a(obj):检查对象是否是迭代器。
标量内省
a:
a(arr):检查类似数组是否是分类实例。
a:
a(arr):检查类似数组是否与日期时间数组一样,其dtype中包含时区组件。
a:
a(obj):如果hash(obj)成功则返回True,否则返回False。
a:
a:
a(obj):检查对象是否为数字。
a(arr):检查类似数组是否是一个周期性索引。
a(obj):检查对象是否是正则表达式模式实例。
a_compilable(obj):检查对象是否可以编译为正则表达式模式实例。
a:如果给定值是标量,则返回True。
扩展
这些主要用于寻求扩展pandas对象的库作者.
a(name):在DataFrame对象上注册自定义访问器。
a(name):在Series对象上注册自定义访问器。
a(name):在Index对象上注册自定义访问器。
a:自定义数据类型,与ExtensionArray配对。
a:自定义1-D数组类型的抽象基类。
Grou([skipna]):如果组中的所有值都是真实的,则返回True,否则返回False
Grou([skipna]):如果组中的任何值是真实的,则返回True,否则返回False
Grou([limit]):向后填充值
Grou():计算组的计数,不包括缺失值
Grou([ascending]):将每个组中的每个项目编号从0到该组的长度 - 1。
Grou([limit]):向前填充值
Grou(**kwargs):首先计算组值
Grou([n]):返回每组的前n行。
Grou(**kwargs):计算最后一组值
Grou(**kwargs):计算组值的最大值
Grou(*args, **kwargs):计算组的平均值,不包括缺失值
Grou(**kwargs):计算组的中位数,排除缺失值
Grou(**kwargs):计算组值的最小值
Grou([ascending]):将每个组的编号从0到组的数量 - 1。
Grou(n[, dropna]):如果n是int,则从每个组中取第n行;如果n是int列表,则从行的子集获取。
Grou():计算值的总和,不包括缺失值对于多个分组,结果索引将是MultiIndex
Grou(**kwargs):计算组值的产品
Grou([method, ascending, na_option, …]):提供每个组中的值的等级。
Grou([periods, fill_method, …]):计算每个值的pct_change到组中的上一个条目
Grou():计算组大小
Grou([ddof]):计算组平均值的标准误差,排除缺失值
Grou([ddof]):计算组的标准偏差,不包括缺失值
Grou(**kwargs):计算组值的总和
Grou([ddof]):计算组的方差,排除缺失值
Grou([n]):返回每组的最后n行