df 是 pandas 库中 dataframe 的缩写,一个表格状的数据结构,用于存储和操作数据。其特点包括:由行和列组成,类似二维数组。可包含不同类型的数据,如数字、文本和布尔值。具有行和列标签,用于轻松访问数据。支持索引、slicing、合并和聚合等数据处理操作。
Python 中的 df 是什么?
df 是 Pandas 库中 DataFrame 的缩写。DataFrame 是一个表格状的数据结构,用于存储和操作数据。
DataFrame 的主要特点:
- 由行和列组成,类似于二维数组。
- 可以包含不同类型的数据,如数字、文本和布尔值。
- 具有行和列标签,用于轻松访问特定数据。
- 支持各种数据处理操作,如索引、 slicing、合并和聚合。
用途:
DataFrame 广泛用于数据分析、数据清理和数据可视化中。它们可用于:
- 导入和加载数据
- 探索和可视化数据
- 执行数据清洗操作
- 进行数据分析和建模
使用:
要定义一个 DataFrame,可以使用 pd.DataFrame() 函数,其中 pd 是 Pandas 模块的导入别名。
import pandas as pd
# 从字典创建 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 30, 40]}
df = pd.DataFrame(data)
# 从列表创建 DataFrame
data = [['Alice', 20], ['Bob', 30], ['Charlie', 40]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
访问数据:
可以通过行或列标签访问 DataFrame 中的数据。
- 行:使用 loc 或 iloc 方法。
- 列:使用 [] 或 .column_name 语法。
例如:
# 获取特定行的值
name = df.loc[0, 'Name']
# 获取特定列的值
age = df['Age']
总之,df 是 Python Pandas 库中 DataFrame 的缩写。它是一个表格状的数据结构,用于存储和操作数据,广泛用于数据分析和处理任务。