aopstudio 的个人博客   >   标签墙   >   numpy 标签

Pandas用Series构建DataFrame:到底是行还是列?

2025-08-19

在数据分析的世界里,pandas.DataFrame 是最常用的数据结构之一。然而,许多初学者甚至中级用户都会遇到一个常见的困惑:为什么在构造DataFrame时,有时候 Series 变成一列,有时候却变成一行?为什么Pandas的Series底层由NumPy数组提供支撑,但是NumPy ndarray和 Pandas DataFrame在行和列的定义上有时候看起来是“反过来的”?

本文将系统梳理 DataFrame 的构造逻辑,揭示其背后的设计哲学,并强调一个至关重要的概念:样本 vs. 特征。掌握这些原则,你将不再被“按行还是按列”所困扰。

深入理解 NumPy 中的 `axis`:维度、形状与操作的逻辑

2025-08-18

在使用 NumPy 进行数据处理和科学计算时,axis 参数是一个无处不在却又常常令人困惑的概念。无论是求和、拼接、排序还是分割,axis 都在背后决定着操作的方向。理解 axis 的本质,是掌握 NumPy 多维数组操作的关键。

本文将从维度(ndim)形状(shape)axis 的关系入手,系统梳理 axis 在不同函数中的行为模式,帮助你彻底掌握这一核心概念。