首页 > 编程笔记 > Python笔记 阅读:18

NumPy数据类型大全(附带实例)

NumPy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。

下表列举了常用的 NumPy 的基本类型:

表:常用的 NumPy 的基本类型
名称 描述
bool_ 布尔型数据类型(True 或者 False)
int_ 默认的整数类型(类似于 C 语言中的 long、int32 或 int64)
intc 与 C 的 int 类型一样,一般是 int32 或 int64
intp 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64)
int8 字节(-128~127)
int16 整数(-32768~32767)
int32 整数(-2147483648~2147483647)
int64 整数(-9223372036854775808~9223372036854775807)
uint8 无符号整数(0~255)
uint16 无符号整数(0~65535)
uint32 无符号整数(0~4294967295)
uint64 无符号整数(0~18446744073709551615)
float float64 类型的简写
float16 半精度浮点数,包括 1 个符号位、5 个指数位、10 个尾数位
float32 单精度浮点数,包括 1 个符号位、8 个指数位、23 个尾数位
float64 双精度浮点数,包括 1 个符号位、11 个指数位、52 个尾数位
complex_ complex128 类型的简写,即 128 位复数
complex64 复数,表示双 32 位浮点数(实数部分和虚数部分)
complex128 复数,表示双 64 位浮点数(实数部分和虚数部分)

NumPy 的数值类型实际上是 dtype 对象的实例,并对应唯一的字符,包括 np.bool_、np.int32、np.float32 等。Dtype 不仅可以描述数据的类型(int、float、Python 对象等)、大小、字节顺序(小端或大端)等,还可以描述与数组对应的内存区域是如何使用的。

具体来说,它描述了数据的以下几个方面:
字节顺序是通过对数据类型预先设定 < 或 > 来决定的:
dtype 对象是使用以下语法构造的:
numpy.dtype(object, align, copy)
其中,参数 object 表示要转换为的数据类型对象;align 如果为 True,则填充字段使其类似 C 的结构体;copy 表示复制 dtype 对象,如果为 False,则是对内置数据类型对象的引用。

比如使用标量类型:
dt = np.dtype(np.int32)
print(dt)
输出结果为:

int32


又如,int8、int16、int32、int64 四种数据类型可以使用字符串'i1'、'i2'、'i4'、'i8'来代替:
dt = np.dtype('i4')
print(dt)
输出结果为:

int32

i 表示 int,4 表示 4 字节,int32 正好是 int 类型,且为 4 字节。

同样地,dtype('f') 中的 f 也可以代表 float32,将示例中的 dtype('i4') 上面换成 dtype('f'),输出就是 float32。

下面实例展示结构化数据类型的使用。
1) 类型字段和对应的实际类型将被创建:
dt = np.dtype([('age',np.int8)])
print(dt)
输出结果为:

[('age', 'i1')]


2) 再将数据类型应用于 ndarray 对象:
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print(a)
输出结果为:

[(10,) (20,) (30,)]

10、20 和 30 分别表示 10 岁、20 岁和 30 岁。

3) 类型字段名还可以用于存取实际的 age 列:
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print(a['age'])
输出结果为:

[10 20 30]


下面的示例定义一个结构化数据类型 student,包含字符串字段 name、整数字段 age 及浮点字段 marks,并将这个 dtype 应用到 ndarray 对象,代码如下:
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print(student)
输出结果为:

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')]


将数据类型 student 应用于 ndarray 对象:
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print(a)
输出结果为:

[(b'abc', 21, 50.) (b'xyz', 18, 75.)]


值得注意的是,每个内建类型都有唯一定义它的字符代码,如下表所示:

表:内建类型的字符
字符 对应类型
b 布尔型
i 有符号整型
u 无符号整型
f 浮点型
c 复数浮点型
m timedelta(时间间隔)
M datetime(日期时间)
O Python 对象
S, a 字符串
U Unicode
V 原始数据

相关文章