〈pandas如何分割数据〉pandas 分割列!

在数据分析中，通常需要把连续的数据离散化或拆分成多个区间（bin），这就需要用到cut()或qcut()函数。

一，cut函数

把值切分成离散的区间，有三种切分方式，第一种方式是制定区间的数量，把连续值平均切分；第二种方式是以标量值序列指定各个区间的边界值；第三种方式是以IntervalIndex 精确指定各个区间，区间之间不允许重叠。

(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

参数注释：

x：array-like
bins：如果是整数，表示切分区间的数量；如果是整数序列（从小到大），表示通过元素指定各个区间的边界；如果是IntervalIndex，表示精确指定各个区间。
right：是否包含区间的右边界
labels：为每一个区间指定一个标签
retbins：是否返回bins（切分的区间的边界）
precision：指定区间标签（bin label）的精度，通常是对浮点数标签来说，指定小数点后的位数
include_lowest：指定第一个区间是否包含最低值

cut函数返回的是Categorical的对象，这是一个array-like对象，表示每一个x元素所在的区间。

1，Categorical类型

Categorical类型是指对list-like对象进行分类，返回值包括两部分，第一部分是列表，表示对原始list-like中各个元素进行分类之后的类标签，第二部分是类别信息。

举个例子，返回值第一部分是一个列表，元素是1,2,3表示各个分类。第二部分是Categories信息，共分为3类，类标签的类型是int64，类别（bins）是[1,2,3]。

>>> ([1, 2, 3, 1, 2, 3]) [1, 2, 3, 1, 2, 3] Categories (3, int64): [1, 2, 3]

2，指定切分区间的数量

把ages列表平均划分为4个区间，返回的结果中，第一部分是区间的标签，这是由左开右闭的区间构成的列表；第二部分是元素的数量（Length），第三部分是分类信息，有4个分类，最后返回bins数组。

>>> ages=[20,22,25,27,21,23,37,31,61,45,41,32]
>>> cats=(x=ages,bins=4,precision =0,retbins=True)
>>> cats
([, 30.0], , 30.0], , 30.0], , 30.0], , 30.0], ..., , 40.0], , 61.0], , 51.0], , 51.0], , 40.0]]
Length: 12
Categories (4, interval[float64]): [, 30.0] < , 40.0] < , 51.0] < , 61.0]], array([19.959, 30.25 , 40.5 , 50.75 , 61. ]))

2，指定切分区间的边界

对ages列表进行划分，区间的边界由bins列表来指定

>>> ages=[20,22,25,27,21,23,37,31,61,45,41,32] >>> bins=[18,25,35,60,100] >>> cats = (ages,bins,right=True) >>> cats [(18, 25], (18, 25], (18, 25], (25, 35], (18, 25], ..., (25, 35], (60, 100], (35, 60], (35, 60], (25, 35]] Length: 12 Categories (4, interval[int64]): [(18, 25] < (25, 35] < (35, 60] < (60, 100]] >>>

3，指定区分的区间

通过from_breaks()函数来制定IntervalIndex，精确制定区间的边界，用于对连续的数据进行切分：

>>> ages = [20,22,25,27,21,23,37,31,61,45,41,32] >>> breaks = ([18,25,35,60,100]) >>> breaks IntervalIndex([(18, 25], (25, 35], (35, 60], (60, 100]], closed='right', dtype='interval[int64]') >>> (x=ages,bins=breaks) [(18, 25], (18, 25], (18, 25], (25, 35], (18, 25], ..., (25, 35], (60, 100], (35, 60], (35, 60], (25, 35]] Length: 12 Categories (4, interval[int64]): [(18, 25] < (25, 35] < (35, 60] < (60, 100]]

二，qcut函数

qcut()函数也是用于切分的函数，q是Quantile（分位数）的意思，基于分位数对连续数据进行切分。基于排序或分位数，把变量分散到大小相等的桶（bucket）中。

例如，10个分位数的1000个值将产生一个分类对象，指示每个数据点的分位数隶属关系。

For example 1000 values for 10 quantiles would produce a Categorical object indicating quantile membership for each data point.

(x, q, labels=None, retbins=False, precision=3)

参数注释：

x：一维数组，或序列
q：分位数的个数（10是指10分位数，4是指4分位数），或者制定分位数的序列

举个例子，指定分位数的序列，q=[0,0.2,0.9,1] 表示把从(0, 0.2]的分位数作为一个区间，把, 0.9]的分位数作为一个区间，把]的分位数作为一个区间：

>>> ages=[20,22,25,27,21,23,37,31,61,45,41,32] >>> (x=ages,q=[0,0.5,0.9,1],precision=0) [, 29.0], , 29.0], , 29.0], , 29.0], ...,, 61.0], , 45.0], , 45.0]] Length: 12 Categories (3, interval[float64]): [, 29.0] < , 45.0] < , 61.0]]

“pandas如何分割数据,pandas,分割列,pandas如何修改数据,pandas,分割数据,pandas如何保存数据”边界阅读

pandas如何分割数据库

pandas如何分割数据库相关介绍,此系列文章收录在公众号中：数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python"，即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 Py

pandas如何分割数据——pandas 分割列

pandas如何分割数据,pandas 分割列,pandas如何修改数据相关介绍,介绍在处理连续的数值数据时，将数据分箱成多个桶进行进一步分析通常是很有帮助的。这里有几个不同的术语，包括装桶、离散分箱、离散化或量子化。Pandas使用cut和qcut函数支持这些方法。本文将简要描

pandas如何分割数据库

pandas如何分割数据库相关介绍,转发本文并私信我"Python"，即可获得Python资料以及各种心得(持续更新的) 经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发

(pandas如何分割数据)如何用pandas读取数据

pandas如何分割数据,如何用pandas读取数据,pandas如何修改数据相关介绍,此系列文章收录在公众号中：数据大宇宙 > 数据处理 >E-pd 转发本文并私信我"python"，即可获得Python资料以及更多系列文章(持续更新的) 经常听别人说 Py

“小米9如何找出布朗熊“小米手机布朗熊口令

小米9如何找出布朗熊,小米手机布朗熊口令,小米手机布朗熊相关介绍,昨天4月1日，是一年一度的愚人节。而小米在这特殊的日子你召开了一场名为"爱信不信"的小米9周年米粉节中国区总裁直面会。在直面会上王川一口气发布了众多新品，当然本着"愚人节

OPP手机如何限制下载

OPP手机如何限制下载相关介绍,分享生活小妙招，共享科技新生活！大家好，欢迎来到今天的知识分享！我是你们的好朋友小俊！我们在使用智能手机的时候，经常会发现我们明明没有安装下载软件但是手机却“自动”偷偷帮我们安装了一大堆“全家桶”导

如何把跳跃平台钱充到300里

如何把跳跃平台钱充到300里相关介绍,8月17日，由上海跳跃网络研发发行的二次元MOBA手游《300大作战》首发上线。自7月初开始，游戏就开启了大规模的宣发动作，从红蓝大作战引出学园祭庆典活动，同时在8月1日宣布与《爱情公寓》跨界联动并将

如何把Excel表转到CAD里,cad文字怎么转到excel

如何把Excel表转到CAD里,cad文字怎么转到excel,如何把cad表格转到excel相关介绍,有时候我们需要将Excel和Cad进行转换，很多人都不知道怎么操作，所以今天给你们带来Excel表格转换成Cad的具体操作步骤介绍哦。 Excel系列软件最新版本下载 Excel2013 立即下载 E

责任编辑: 鲁达

“pandas如何分割数据,pandas,分割列,pandas如何修改数据,pandas,分割数据,pandas如何保存数据”边界阅读