pandas.apply() 是 Pandas 库中的一个函数,用于在 DataFrame 或 Series 上应用自定义函数。这个函数可以沿着指定的轴(行或列)逐行或逐列地应用函数,从而实现对数据的定制化操作。
参数:
func(必需):这是要应用的函数,可以是一个 Python 函数、lambda 函数或可调用对象。这个函数将应用于 Series 或 DataFrame 的每个元素或行/列,具体取决于 axis 参数的设置。
axis(可选):指定函数应用的轴方向。有两个选项:
axis=0(默认值):将函数应用于每一列,即按列方向操作。
axis=1:将函数应用于每一行,即按行方向操作。
raw(可选):一个布尔值,用于控制是否将数据以 NumPy 数组的形式传递给函数。有两个选项:
raw=False(默认值):表示将数据以 Series 或 DataFrame 的形式传递给函数。raw=True:表示数据以 NumPy 数组形式传递给函数,这在某些情况下可能提高性能。
result_type(可选):指定函数的返回类型。有两个选项:
expand(默认值):如果函数返回的是 Series,则将其扩展为 DataFrame。reduce:如果函数返回的是标量(如一个数字),则返回一个标量;如果返回的是 Series,则返回一个 Series。
args(可选):一个元组,包含传递给函数的额外参数。这可以用来向函数传递额外的参数wps免费版的下载地址是什么。
**kwds(可选):关键字参数,用于传递给函数的额外关键字参数。
pandas.map() 是 Pandas 库中的一个方法,主要用于对 Series 中的每个元素应用一个函数或一个字典,将每个元素映射到另一个值上。它可以用于进行元素级的转换,从而创建新的 Series。
参数:
arg(必需):这是映射函数、字典或其它可映射对象,用于将 Series 中的元素映射到新的值。可以是以下几种类型:
一个函数:将应用于 Series 中的每个元素,函数的返回值将作为新的值。一个字典:将 Series 中的值与字典中的键进行匹配,并将对应的值用作新的值。一个 Series 或其它可映射的 Pandas 对象:将 Series 中的值与可映射对象中的索引或标签匹配,并将对应的值用作新的值。 na_action (可选):指定对于 Series 中的缺失值如何处理。有两个选项:
ignore(默认值):忽略缺失值,不进行映射,将缺失值保留不变。raise:如果 wps 的官网最新的下载网址 Series 中存在缺失值,则引发异常。电脑版wps的下载网址是什么
作用是对元素级的数据(单元格数据)进行处理,能处理的是字符串。
计算每个字符串的长度
str.lower():将字符串转换为小写
str.upper():将字符串转换为大写
替换字符串中的子字符串
str.strip():删除字符串两侧的空格
str.lstrip():删除字符串左侧的空格
str.rstrip():删除字符串右侧的空格
拆分字符串为列表
str.startswith():检查字符串是否以特定前缀开头
str.endswith():检查字符串是否以特定后缀开头
用于计算字符串中非空元素的方法
groupby() 是 Pandas 中一个方法,用于将数据按照一个或多个列的值分组,然后对每个分组应用聚合函数。
参数:
by(必需):指定分组的列名或列名的列表。可以是单个列名的字符串,也可以是列名的列表,以按多列分组。这是 groupby() 方法的关键参数。axis(可选):指定分组的轴方向,有两个选项:官网wps的下载地址在哪
axis=0(默认值):按行分组。axis=1:按列分组官网wps最新的下载网址在哪里。 level(可选):如果输入 DataFrame 包含多层索引,则可以指定要分组的索引级别。as_index(可选):默认情况下,groupby() 结果的分组键会成为结果 DataFrame 的索引。设置 as_index=False 可以防止这种情况发生,分组键将保留为列而不是索引。sort(可选):默认情况下,分组键会根据分组键的值进行排序。设置 sort=False 可以禁用排序,可能提高性能。
pivot_table() 是 Pandas 中用于创建数据透视表的方法。数据透视表是一种用于总结和聚合数据的强大工具,可以根据一个或多个列对数据进行重新排列,以便更容易进行分析。
参数:
data(必需):要创建数据透视表的 DataFrame。values(必需):要聚合的列名或列名的列表。这是要计算统计量的列。index(可选):一个或多个列名,用于作为数据透视表的行索引(行标签)。columns(可选):一个或多个列名,用于作为数据透视表的列索引(列标签)。aggfunc(可选):要应用于 values 中列的聚合函数,可以是内置聚合函数(例如 ‘sum’、‘mean’、‘count’ wps免费版的下载入口的方法 等)或自定义函数。默认情况下,使用 ‘mean’。fill_value(可选):替代结果表中的缺失值。margins(可选):添加边际汇总,生成汇总统计 wps免费版的下载网址信息。dropna(可选):默认情况下,如果所有条目都是wps官网的下载的网站 NaN,则删除相应的行。设置为 False 可以保留包含 NaN 值的行官网wps office的免费版的下载地方是什么(wps最新首页2024)。
记录学习过程,欢迎讨论交流,尊重原创,转载请注明出处~