
Python 基本数据类型
本文介绍 Python 的核心数据类型与变量赋值机制,重点说明可变与不可变类型划分及 Number、String、List、Tuple、Set、Dictionary 的基本特性。
Python 基本数据类型
Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。
在 Python 中,变量就是变量,它没有类型,我们所说的"类型"是变量所指的内存中对象的类型。
等号(=)用来给变量赋值。
等号(=)运算符左边是一个变量名,等号(=)运算符右边是存储在变量中的值。例如:
1 | #!/usr/bin/python3 |
执行以上程序会输出如下结果:
1 | 100 |
多个变量赋值
Python允许同时为多个变量赋值。例如:
1 | a = b = c = 1 |
以上实例,程序创建了一个整型对象,值为 1,从后向前赋值,三个变量被赋予相同的数值。
我们也可以为多个对象指定多个变量。例如:
1 | a, b, c = 1, 2, "hzaucoi2507" |
以上实例,程序将两个整型对象 1 和 2 的分配给变量 a 和 b,字符串对象 "hzaucoi2507" 分配给变量 c。
我们可以通过 type() 函数查看变量的类型:
1 | # 变量定义 |
标准数据类型
Python 中常见的数据类型有:
- Number(数字)
- String(字符串)
- bool(布尔类型)
- List(列表)
- Tuple(元组)
- Set(集合)
- Dictionary(字典)
Python 的六个标准数据类型中:
- 不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);
- 可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。
此外,还有一些高级的数据类型,如: 字节数组类型(bytes)。
Number(数字)
Python 支持 int、float、bool、complex(复数)。
在Python里,只有一种整数类型 int,表示为长整型,没有 Python 2 中的 Long。
像大多数语言一样,数值类型的赋值和计算都是很直观的。
内置的 type() 函数可以用来查询变量所指的对象类型。
1 | a, b, c, d = 20, 5.5, True, 4+3j |
此外,还可以用 isinstance() 来判断:
1 | a = 111 |
isinstance() 和 type() 的区别在于:
type()不会认为子类是一种父类类型。isinstance()会认为子类是一种父类类型。
1 | class A: |
注意:Python 中,
bool是int的子类,True和False可以和数字相加,True==1、False==0会返回 **True**,但可以通过is来判断类型。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 issubclass(bool, int)
True
True==1
True
False==0
True
True+1
2
False+1
1
1 is True
<python-input-12>:1: SyntaxWarning: "is" with 'int' literal. Did you mean "=="?
1 is True
False
0 is False
<python-input-13>:1: SyntaxWarning: "is" with 'int' literal. Did you mean "=="?
0 is False
False为什么会出现
SyntaxWarning警告?Python 检测到我们在用
is比较一个字面量整数(如1)和True,这通常是代码错误(因为is比较的是身份,而不是值)。Python 建议我们使用
==来比较值是否相等,除非我们确实想检查是否是同一个对象。在 Python 2 中没有布尔型,它用数字
0表示False,用1表示True。
当我们指定一个值时,Number 对象就会被创建:
1 | var1 = 1 |
我们也可以使用del语句删除一些对象引用。
del 语句的语法是:
1 | del var1[, var2[, var3[...., varN]]] |
我们可以通过使用 del 语句删除单个或多个对象。例如:
1 | del var |
数值运算
1 | 5 + 4 # 加法 |
注意:
- Python可以同时为多个变量赋值,如
a, b = 1, 2。 - 一个变量可以通过赋值指向不同类型的对象。
- 数值的除法包含两个运算符:
/返回一个浮点数,//返回一个整数。 - 在混合计算时,Python会把整型转换成为浮点数。
数值类型实例
int |
float |
complex |
|---|---|---|
10 |
0.0 |
3.14j |
100 |
15.20 |
45.j |
-786 |
-21.9 |
9.322e-36j |
080 |
32.3e+18 |
.876j |
-0490 |
-90. |
-.6545+0J |
-0x260 |
-32.54e100 |
3e+26J |
0x69 |
70.2E-12 |
4.53e-7j |
Python 还支持复数,复数由实数部分和虚数部分构成,可以用 a + bj或者 complex(a,b) 表示, 复数的实部 a 和虚部 b 都是浮点型。
String(字符串)
Python中的字符串用单引号 ' 或双引号 " 括起来,同时使用反斜杠 \ 转义特殊字符。
字符串的截取的语法格式如下:
1 | 变量[头下标:尾下标] |
索引值以 0 为开始值,-1 为从末尾的开始位置。
加号 + 是字符串的连接符, 星号 * 表示复制当前字符串,与之结合的数字为复制的次数。实例如下:
1 | #!/usr/bin/python3 |
执行以上程序会输出如下结果:
1 | hzaucoi |
Python 使用反斜杠 \ 转义特殊字符,如果你不想让反斜杠发生转义,可以在字符串前面添加一个 r,表示原始字符串:
1 | print('hzau\ncoi') |
另外,反斜杠(\)可以作为续行符,表示下一行是上一行的延续。也可以使用 """...""" 或者 '''...''' 跨越多行。
注意,Python 没有单独的字符类型,一个字符就是长度为1的字符串。
1 | word = 'Python' |
与 C 字符串不同的是,Python 字符串不能被改变。向一个索引位置赋值,比如 word[0] = 'm' 会导致错误。
注意:
- 反斜杠可以用来转义,使用
r可以让反斜杠不发生转义。 - 字符串可以用
+运算符连接在一起,用*运算符重复。 - Python中的字符串有两种索引方式,从左往右以
0开始,从右往左以-1开始。 - Python中的字符串不能改变。
bool(布尔类型)
布尔类型即 True 或 False。
在 Python 中,True 和 False 都是关键字,表示布尔值。
布尔类型可以用来控制程序的流程,比如判断某个条件是否成立,或者在某个条件满足时执行某段代码。
布尔类型特点:
- 布尔类型只有两个值:
True和False。 bool是int的子类,因此布尔值可以被看作整数来使用,其中True等价于1。- 布尔类型可以和其他数据类型进行比较,比如数字、字符串等。在比较时,Python 会将
True视为1,False视为0。 - 布尔类型可以和逻辑运算符一起使用,包括
and、or和not。这些运算符可以用来组合多个布尔表达式,生成一个新的布尔值。 - 布尔类型也可以被转换成其他数据类型,比如整数、浮点数和字符串。在转换时,
True会被转换成1,False会被转换成0。 - 可以使用
bool()函数将其他类型的值转换为布尔值。以下值在转换为布尔值时为False:None、False、零 (0、0.0、0j)、空序列(如''、()、[])和空映射(如{})。其他所有值转换为布尔值时均为True。
1 | # 布尔类型的值和类型 |
注意: 在 Python 中,所有非零的数字和非空的字符串、列表、元组等数据类型都被视为 True,只有 0、空字符串、空列表、空元组等被视为 False。因此,在进行布尔类型转换时,需要注意数据类型的真假性。
List(列表)
List(列表) 是 Python 中使用最频繁的数据类型。
列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。
列表是写在方括号 [] 之间、用逗号分隔开的元素列表。
和字符串一样,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。
列表截取的语法格式如下:
1 | 变量[头下标:尾下标] |
索引值以 0 为开始值,-1 为从末尾的开始位置。
加号 + 是列表连接运算符,星号 * 是重复操作。如下实例:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | ['abcd', 786, 2.23, 'hzaucoi', 70.2] |
与Python字符串不一样的是,列表中的元素是可以改变的:
1 | a = [1, 2, 3, 4, 5, 6] |
List 内置了有很多方法,例如 append()、pop() 等等,这在后面会讲到。
注意:
- 列表写在方括号之间,元素用逗号隔开。
- 和字符串一样,列表可以被索引和切片。
- 列表可以使用
+操作符进行拼接。 - 列表中的元素是可以改变的。
Python 列表截取可以接收第三个参数,参数作用是截取的步长。
特殊地,如果第三个参数为负数,则表示逆向读取,以下实例用于逆向读取以达到翻转字符串的效果:
1 | def reverseWords(input): |
输出结果为:
1 | hzaucoi like I |
Tuple(元组)
元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组写在小括号 () 里,元素之间用逗号隔开。
元组中的元素类型也可以不相同:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | ('abcd', 786, 2.23, 'hzaucoi', 70.2) |
元组与字符串类似,可以被索引且下标索引从0开始,-1 为从末尾开始的位置。也可以进行截取(看上面,这里不再赘述)。
其实,可以把字符串看作一种特殊的元组。
1 | tup = (1, 2, 3, 4, 5, 6) |
虽然tuple的元素不可改变,但它可以包含可变的对象,比如list列表。
构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:
1 | tup1 = () # 空元组 |
如果我们想创建只有一个元素的元组,需要注意在元素后面添加,,以区分它是一个元组而不是一个普通的值,这是因为在没有,的情况下,Python会将()解释为数学运算中的括号,而不是元组的表示。
如果不添加,,如下所示,它将被解释为一个普通的值而不是元组:
1 | not_a_tuple = (42) |
这样的话,not_a_tuple 将是整数类型而不是元组类型。
string、list 和 tuple 都属于 sequence(序列)。
注意:
- 与字符串一样,元组的元素不能修改。
- 元组也可以被索引和切片,方法一样。
- 注意构造包含 0 或 1 个元素的元组的特殊语法规则。
- 元组也可以使用
+操作符进行拼接。
Set(集合)
Python 中的集合(Set)是一种无序、可变的数据类型,用于存储唯一的元素。
集合中的元素不会重复,并且可以进行交集、并集、差集等常见的集合操作。
在 Python 中,集合使用大括号 {} 表示,元素之间用逗号 , 分隔。
另外,也可以使用 set() 函数创建集合。
注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
创建格式:
1 | parame = {value01,value02,...} |
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | {'Zhihu', 'Baidu', 'Taobao', 'hzaucoi', 'Google', 'Facebook'} |
Dictionary(字典)
字典(dictionary)是Python中另一个非常有用的内置数据类型。
列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。
键(key)必须使用不可变类型。
在同一个字典中,键(key)必须是唯一的。
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 1 - HZAU |
构造函数 dict() 可以直接从键值对序列中构建字典如下:
1 | dict([('hzaucoi2507', 1), ('Google', 2), ('Taobao', 3)]) |
注:代码{x: x**2 for x in (2, 4, 6)} 使用的是字典中的推导式,后续会讲解。
另外,字典类型也有一些内置的函数,例如 clear()、keys()、values() 等,后续会讲解。
注意:
- 字典是一种映射类型,它的元素是键值对。
- 字典的关键字必须为不可变类型,且不能重复。
- 创建空字典使用
{ }。
bytes 类型
在 Python 中,bytes 类型表示的是不可变的二进制序列(byte sequence)。
与字符串类型不同的是,bytes 类型中的元素是整数值(0 到 255 之间的整数),而不是 Unicode 字符。
bytes 类型通常用于处理二进制数据,比如图像文件、音频文件、视频文件等等。在网络编程中,也经常使用 bytes 类型来传输二进制数据。
创建 bytes 对象的方式有多种,最常见的方式是使用 b 前缀:
此外,也可以使用 bytes() 函数将其他类型的对象转换为 bytes 类型。bytes() 函数的第一个参数是要转换的对象,第二个参数是编码方式,如果省略第二个参数,则默认使用 UTF-8 编码:
1 | x = bytes("hello", encoding="utf-8") |
与字符串类型类似,bytes 类型也支持许多操作和方法,如切片、拼接、查找、替换等等。同时,由于 bytes 类型是不可变的,因此在进行修改操作时需要创建一个新的 bytes 对象。例如:
1 | x = b"hello" |
需要注意的是,bytes 类型中的元素是整数值,因此在进行比较操作时需要使用相应的整数值。例如:
1 | x = b"hello" |
其中 ord() 函数用于将字符转换为相应的整数值。
Python数据类型转换
有时候,我们需要对数据内置的类型进行转换,数据类型的转换,我们只需要将数据类型作为函数名即可,后续会具体介绍。
以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象,表示转换的值。
| 函数 | 描述 |
|---|---|
int(x [,base]) |
将x转换为一个整数 |
float(x) |
将x转换到一个浮点数 |
complex(real [,imag]) |
创建一个复数 |
str(x) |
将对象 x 转换为字符串 |
repr(x) |
将对象 x 转换为表达式字符串 |
eval(str) |
用来计算在字符串中的有效Python表达式,并返回一个对象 |
tuple(s) |
将序列 s 转换为一个元组 |
list(s) |
将序列 s 转换为一个列表 |
set(s) |
转换为可变集合 |
dict(d) |
创建一个字典。d 必须是一个 (key, value)元组序列。 |
frozenset(s) |
转换为不可变集合 |
chr(x) |
将一个整数转换为一个字符 |
ord(x) |
将一个字符转换为它的整数值 |
hex(x) |
将一个整数转换为一个十六进制字符串 |
oct(x) |
将一个整数转换为一个八进制字符串 |
