Việc ép kiểu dữ liệu trong Python đóng vai trò quan trọng trong quá trình xử lý và biến đổi thông tin. Quá trình này cho phép bạn chuyển đổi dữ liệu từ một kiểu nhất định sang kiểu khác, điều này có thể hữu ích trong nhiều trường hợp, ví dụ như thực hiện phép tính với số liệu dạng chuỗi, hoặc chuẩn hóa định dạng dữ liệu. Để hiểu rõ hơn về các phương pháp ép kiểu dữ liệu khác nhau trong Python và cách áp dụng chúng, hãy cùng theo dõi bài viết này.
Ép kiểu dữ liệu trong Python là gì?
Ép kiểu dữ liệu trong Python là quá trình chuyển đổi một đối tượng từ kiểu dữ liệu này sang một kiểu dữ liệu khác. Python hỗ trợ hai loại ép kiểu:
- Ép kiểu ngầm định (implicit)
- Ép kiểu tường minh (explicit).
Python có nhiều kiểu dữ liệu khác nhau như số (numbers), chuỗi (sequences), ánh xạ (mappings),… Có những lúc, bạn có dữ liệu ở một kiểu nhất định, nhưng lại cần sử dụng ở một kiểu khác. Ví dụ, người dùng nhập liệu vào một chuỗi, nhưng bạn muốn sử dụng giá trị đó như một số. Cơ chế ép kiểu của Python giúp bạn thực hiện được điều này.
Ép kiểu ngầm định trong Python
Ép kiểu ngầm định (implicit type casting) xảy ra khi trình biên dịch hoặc trình thông dịch của một ngôn ngữ lập trình tự động chuyển đổi một đối tượng từ kiểu dữ liệu này sang kiểu dữ liệu khác. Python là một ngôn ngữ có kiểu dữ liệu mạnh (strongly typed). Điều này có nghĩa là Python không cho phép chuyển đổi kiểu tự động giữa các kiểu dữ liệu không liên quan đến nhau.
Ví dụ, một chuỗi ký tự không thể tự động chuyển đổi thành một kiểu số bất kỳ. Tuy nhiên, một số nguyên có thể được tự động chuyển thành một số thực. Ngược lại, một số ngôn ngữ như JavaScript là ngôn ngữ có kiểu dữ liệu yếu (weakly typed), khi đó, một số nguyên có thể tự động được chuyển thành một chuỗi ký tự để thực hiện phép ghép chuỗi.
Lưu ý: Yêu cầu bộ nhớ của mỗi kiểu dữ liệu là khác nhau. Ví dụ, một đối tượng số nguyên trong Python chiếm 4 byte bộ nhớ, trong khi một đối tượng số thực cần 8 byte vì có thêm phần thập phân. Do đó, trình thông dịch của Python không tự động chuyển đổi một số thực thành số nguyên, bởi vì điều này sẽ gây mất dữ liệu (mất đi phần thập phân). Mặt khác, một số nguyên có thể dễ dàng được chuyển thành số thực bằng cách thêm phần thập phân bằng 0.
Việc ép kiểu ngầm định từ số nguyên sang số thực thường xảy ra khi thực hiện bất kỳ phép toán số học nào trên các toán hạng là số nguyên và số thực.
Ví dụ chúng ta có một biến số nguyên và một biến số thực:
a = 10 # Đối tượng số nguyên
b = 10.5 # Đối tượng số thực
Để thực hiện phép cộng giữa a và b, số 10 (đối tượng số nguyên) sẽ được nâng cấp lên thành 10.0 (một số thực). Lúc này, 10.0 vẫn có giá trị tương đương với giá trị số trước đó, nhưng đã là một số thực. Sau đó, phép cộng giữa hai số thực được thực hiện.
c = a + b
print (c)
Kết quả được in ra màn hình:
20.5
Trong ép kiểu ngầm định, một đối tượng Python có kích thước byte nhỏ hơn sẽ được nâng cấp lên để phù hợp với kích thước byte lớn hơn của đối tượng khác trong cùng một phép toán. Ví dụ, một đối tượng Boolean (True/False
) sẽ được nâng cấp thành số nguyên trước (True = 1
, False = 0
), sau đó mới có thể được chuyển thành số thực, trước khi cộng với một đối tượng số thực. Trong ví dụ dưới đây, chúng ta thử cộng một đối tượng Boolean với một số thực:
a = True
b = 10.5
c = a + b
print (c)
Chương trình này sẽ in ra kết quả sau:
11.5
Ép kiểu tường minh trong Python
Như đã đề cập trước đó, ép kiểu ngầm định thường chỉ áp dụng cho việc chuyển đổi từ số nguyên (int) sang số thực (float). Để thực hiện các chuyển đổi khác như từ chuỗi (string) sang số nguyên, bạn cần sử dụng các hàm có sẵn của Python như int(), float(), và str(). Đây được gọi là ép kiểu tường minh
Hàm int() trong Python
Hàm int()
là một hàm tích hợp sẵn của Python, được dùng để chuyển đổi một giá trị sang kiểu số nguyên. Cụ thể:
- Nếu đối số là một số nguyên (integer literal), hàm sẽ trả về một đối tượng số nguyên.
- Nếu đối số là một số thực (float), hàm sẽ trả về một số nguyên bằng cách loại bỏ phần thập phân (chỉ lấy phần nguyên).
- Nếu đối số là một chuỗi (string), hàm sẽ chuyển chuỗi đó thành số nguyên nếu chuỗi chứa một giá trị số nguyên hợp lệ.
Việc sử dụng hàm int()
với đối số là một số nguyên tương đương với việc khai báo trực tiếp một biến số nguyên. Ví dụ:
a = int(10)
print(a) # Output: 10
Hoàn toàn giống với:
a = 10
print(a) # Output: 10
print(type(a)) # Output:
Nếu đối số truyền vào hàm int()
là một số thực hoặc một biểu thức có kết quả là số thực, hàm sẽ trả về một số nguyên bằng cách loại bỏ phần thập phân. Ví dụ:
a = int(10.5) # Chuyển số thực thành số nguyên
print(a) # Output: 10
a = int(2*3.14) # Biểu thức cho kết quả số thực sau đó chuyển về số nguyên
print(a) # Output: 6
print(type(a)) # Output: <class 'int'>
Hàm int()
cũng trả về giá trị số nguyên 1 nếu đối số truyền vào là một giá trị Boolean True. Ví dụ
a = int(True)
print(a) # Output: 1
print(type(a)) # Output: <class 'int'>
Chuyển đổi chuỗi thành số nguyên
Hàm int()
trong Python được sử dụng để chuyển đổi một đối tượng chuỗi thành một số nguyên, nhưng chỉ khi chuỗi đó chứa một biểu diễn hợp lệ của một số nguyên. Ví dụ:
a = int("100")
print(a) # Kết quả: 100
print(type(a)) # Kết quả: <class 'int'> (kiểu số nguyên)
b = int("10" + "01") # Phép cộng chuỗi "10" và "01" cho ra "1001", sau đó chuyển thành số
print(b) # Kết quả: 1001
print(type(b)) # Kết quả: <class 'int'> (kiểu số nguyên)
Giải thích ví dụ:
-
Ở ví dụ đầu tiên, hàm
int()
đã chuyển chuỗi"100"
thành số nguyên100
và gán cho biếna
. Hàmtype()
cho biết kiểu dữ liệu của biếna
làint
(số nguyên). -
Ví dụ thứ hai thể hiện rằng hàm
int()
cũng hoạt động với kết quả của phép cộng chuỗi. Chuỗi"10"
cộng với chuỗi"01"
cho ra chuỗi"1001"
. Sau đó, chuỗi này được chuyển thành số nguyên1001
.
Lưu ý về lỗi ValueError: Nếu chuỗi truyền vào hàm int() không phải là một biểu diễn số nguyên hợp lệ, Python sẽ báo lỗi ValueError.
Ví dụ về lỗi:
# Báo lỗi do chuỗi "10.5" không phải là số nguyên hợp lệ
try:
a = int("10.5")
except ValueError as e:
print(e) # Kết quả: invalid literal for int() with base 10: '10.5'
# Báo lỗi do chuỗi "Hello World" không phải là số nguyên
try:
a = int("Hello World")
except ValueError as e:
print(e) # Kết quả: invalid literal for int() with base 10: 'Hello World'
Giải thích ví dụ lỗi:
- Trong trường hợp đầu tiên, chuỗi
"10.5"
có chứa dấu thập phân, đây không phải là một biểu diễn số nguyên. Vì vậy, hàmint()
sẽ báo lỗiValueError
với thông báo"invalid literal for int() with base 10: '10.5'"
. - Tương tự, với chuỗi
"Hello World"
, không có phần nào của chuỗi biểu diễn số nguyên, nên lỗiValueError
sẽ được thông báo.
Chuyển đổi từ các hệ cơ số khác – Hàm int()
cũng có thể chuyển đổi các chuỗi biểu diễn số ở hệ nhị phân (binary), bát phân (octal) và thập lục phân (hexadecimal) thành số nguyên. Để làm điều này, bạn cần truyền thêm một tham số base cho hàm, với các giá trị lần lượt là 2
, 8
và 16
. Chuỗi truyền vào cần có định dạng hợp lệ theo hệ cơ số tương ứng. Ví dụ:
# Chuyển chuỗi nhị phân "1010" thành số nguyên (10)
binary_num = int("1010", 2)
print(binary_num) # Kết quả: 10
# Chuyển chuỗi bát phân "12" thành số nguyên (10)
octal_num = int("12", 8)
print(octal_num) # Kết quả: 10
# Chuyển chuỗi thập lục phân "A" thành số nguyên (10)
hex_num = int("A", 16)
print(hex_num) # Kết quả: 10
Giải thích ví dụ:
- Hàm
int()
chuyển số"1010"
từ hệ nhị phân (base=2
) sang số thập phân là 10. - Hàm
int()
chuyển số"12"
từ hệ bát phân (base=8
) sang số thập phân là 10. - Hàm
int()
chuyển số"A"
từ hệ thập lục phân (base=16
) sang số thập phân là 10.
Chuyển đổi chuỗi nhị phân thành số
Một chuỗi nhị phân chỉ chứa các ký tự 1
và 0
. Cơ số của hệ nhị phân là 2
. Để chuyển chuỗi nhị phân thành số nguyên, chúng ta dùng hàm int() của Python và chỉ định cơ số là 2
.
a = int("110011", 2)
print(a)
Kết quả:
51
Số thập phân tương ứng với số nhị phân 110011 là 51.
Chuyển đổi chuỗi bát phân thành số nguyên
Một chuỗi bát phân chỉ chứa các chữ số từ 0
đến 7
. Cơ số của hệ bát phân là 8. Chúng ta vẫn dùng hàm int()
để chuyển chuỗi bát phân sang số nguyên, và chỉ định cơ số là 8
.
a = int("20", 8)
print(a)
Kết quả:
16
Số thập phân tương ứng với số bát phân 20 là 16.
Chuyển đổi chuỗi thập lục phân thành số nguyên
Một chuỗi thập lục phân chứa các chữ số từ 0
đến 9
và các ký tự A, B, C, D, E, F
(hoặc a, b, c, d, e, f
). Cơ số của hệ thập lục phân là 16
. Chúng ta sử dụng hàm int()
và chỉ định cơ số là 16
.
a = int("2A9", 16)
print(a)
Kết quả:
681
Số thập phân tương ứng với số thập lục phân 2A9
là 681
. Bạn có thể dễ dàng kiểm chứng các phép chuyển đổi này bằng ứng dụng máy tính trên Windows, Ubuntu hoặc điện thoại thông minh.
Chuyển đổi số, số thực và chuỗi thành số nguyên
Dưới đây là ví dụ về việc chuyển đổi số nguyên, số thực và chuỗi thành kiểu số nguyên sử dụng hàm int()
:
a = int(1) # a sẽ có giá trị 1
b = int(2.2) # b sẽ có giá trị 2 (phần thập phân bị bỏ đi)
c = int("3") # c sẽ có giá trị 3
print (a)
print (b)
print (c)
Chương trình sẽ in ra kết quả sau:
1
2
3
Hàm float() trong Python
Hàm float()
là một hàm dựng sẵn trong Python. Chức năng của hàm này là trả về một đối tượng số thực (float) nếu đối số truyền vào là:
- Một số thực (float)
- Một số nguyên (integer)
- Một chuỗi (string) có định dạng số thực hợp lệ.
Khi sử dụng float()
với đối số là một đối tượng float, kết quả tương đương với việc khai báo trực tiếp một đối tượng float.
a = float(9.99)
print(a)
print(type(a))
Kết quả:
9.99
<class ‘float’>
Cách khai báo trên tương đương với:
a = 9.99
print(a)
print(type(a))
Kết quả:
9.99
<class ‘float’>
Nếu tham số đầu vào của hàm float()
là một số nguyên, giá trị trả về sẽ là một số thực với phần thập phân bằng 0
. Ví dụ:
a = float(100)
print(a)
print(type(a))
Kết quả:
100.0
<class ‘float’>
Hàm float()
cũng có thể chuyển đổi một chuỗi thành số thực. Nếu chuỗi đó biểu diễn một số thực hợp lệ, kết quả sẽ là một số thực. Ngược lại, nếu chuỗi không phải là một số thực hợp lệ, hàm sẽ báo lỗi ValueError. Ví dụ:
a = float("9.99")
print(a)
print(type(a))
Kết quả:
9.99
<class ‘float’>
Tuy nhiên, khi ta truyền vào một chuỗi không hợp lệ, chương trình sẽ báo lỗi. Ví dụ:
a = float("1,234.50") # Dấu "," làm cho chuỗi không hợp lệ để ép sang kiểu float
Sẽ xuất hiện lỗi:
ValueError: could not convert string to float: ‘1,234.50’
Khi chuyển đổi một chuỗi sang kiểu float, Python sẽ chấp nhận cả các chuỗi được biểu diễn theo dạng ký pháp khoa học (scientific notation). Điều này rất hữu ích khi bạn làm việc với các số có giá trị rất lớn hoặc rất nhỏ. Ví dụ:
a = float("1.00E4") # chuỗi "1.00E4" (1.00 * 10^4) được chuyển đổi thành số thực
print (a) # Kết quả: 10000.0
print (type(a)) # Kiểu dữ liệu: <class 'float'>
b = float("1.00E-4")# chuỗi "1.00E-4" (1.00 * 10^-4) được chuyển đổi thành số thực
print (b) # Kết quả: 0.0001
print (type(b)) # Kiểu dữ liệu: <class 'float'>
Ngoài ra, bạn cũng có thể dùng float() để chuyển đổi số nguyên hoặc số thực có sẵn sang kiểu float, mặc dù thường thì Python sẽ tự động chuyển đổi khi bạn thực hiện phép tính giữa số nguyên và số thực. Tuy nhiên, việc ép kiểu tường minh đôi khi cần thiết để đảm bảo kiểu dữ liệu đúng như bạn mong muốn. Ví dụ:
a = float(1) # số nguyên 1 được chuyển thành số thực
b = float(2.2) # số thực 2.2 vẫn giữ nguyên là số thực
c = float("3.3") # chuỗi "3.3" được chuyển đổi thành số thực
print (a)
print (b)
print (c)
Đoạn code trên sẽ in ra kết quả như sau:
1.0
2.2
3.3
Hàm str() trong Python
Chúng ta đã tìm hiểu cách Python chuyển đổi một chuỗi (string) thành số nguyên hoặc số thực. Hàm str()
hoạt động theo chiều ngược lại. Hàm này bao quanh một đối tượng số nguyên (integer) hoặc số thực (float) bằng dấu nháy đơn ('
) để trả về một đối tượng kiểu chuỗi (str). Nói một cách tổng quát, hàm str()
trả về biểu diễn dạng chuỗi của bất kỳ đối tượng Python nào. Trong phần này, chúng ta sẽ xem xét các ví dụ khác nhau về việc sử dụng hàm str()
trong Python.
Hàm str()
có ba tham số. Tham số bắt buộc đầu tiên là đối tượng mà bạn muốn lấy biểu diễn chuỗi của nó. Hai tham số còn lại là encoding và errors là tùy chọn.
Chúng ta sẽ thực thi hàm str()
trong Python console để dễ dàng kiểm tra rằng đối tượng trả về là một chuỗi, với các dấu ngoặc kép bao quanh ('
).
Chuyển đổi số nguyên thành chuỗi
Bạn có thể chuyển đổi bất kỳ số nguyên nào thành một chuỗi bằng cách sử dụng hàm str(). Hãy xem ví dụ sau:
a = str(10)
print(a)
print(type(a))
Kết quả đầu ra của đoạn code trên:
10
<class ‘str’>
Chuyển đổi số thực thành chuỗi
Hàm str()
trong Python được dùng để chuyển đổi các đối tượng số thực thành đối tượng chuỗi. Hàm này có thể xử lý cả hai dạng biểu diễn số thực: dạng tiêu chuẩn (có dấu thập phân phân tách phần nguyên và phần thập phân) và dạng ký hiệu khoa học. Ví dụ:
a = str(11.10)
print(a)
print(type(a))
a = str(2/5)
print(a)
print(type(a))
Kết quả:
‘11.1’
<class ‘str’>
‘0.4’
<class ‘str’>
Trong ví dụ thứ hai, biểu thức 2/5 được tính toán trước, sau đó kết quả mới được chuyển thành chuỗi bằng hàm str()
.
Hàm str()
cũng có thể chuyển đổi số thực dạng ký hiệu khoa học (sử dụng E
hoặc e
cùng số mũ dương hoặc âm) thành chuỗi. Ví dụ:
a = str(10E4)
print(a)
print(type(a))
a = str(1.23e-4)
print(a)
print(type(a))
Kết quả:
‘100000.0’
<class ‘str’>
‘0.000123’
<class ‘str’>
Hàm str()
cũng có thể chuyển đổi các kiểu dữ liệu khác như boolean (True/False
), danh sách (list), tuple, và dictionary thành chuỗi. Khi ép kiểu, các giá trị kiểu Boolean, danh sách, tuple, hay từ điển sẽ được đặt trong dấu ngoặc nháy đơn ('
). Ví dụ:
a=str('True')
print(a)
a=str([1,2,3])
print(a)
a=str((1,2,3))
print(a)
a=str({1:100, 2:200, 3:300})
print(a)
Kết quả:
‘True’
‘[1, 2, 3]’
‘(1, 2, 3)’
‘{1: 100, 2: 200, 3: 300}’
Sau đây là ví dụ minh họa cách chuyển đổi số nguyên, số thực, và chuỗi thành kiểu dữ liệu chuỗi:
a = str(1) # a sẽ là "1"
b = str(2.2) # b sẽ là "2.2"
c = str("3.3") # c sẽ là "3.3"
print (a)
print (b)
print (c)
Kết quả:
1
2.2
3.3
Chuyển đổi giữa các kiểu dữ liệu chuỗi trong Python
Trong Python, list, tuple và string là các kiểu dữ liệu dạng chuỗi. Chúng là tập hợp các phần tử có thứ tự và có thể được truy cập thông qua chỉ số (index).
Ta có thể chuyển đổi một chuỗi hoặc tuple thành một đối tượng list bằng cách sử dụng hàm list()
. Tương tự, hàm tuple()
sẽ giúp chuyển đổi một chuỗi hoặc list thành một tuple.
Để hiểu rõ hơn, chúng ta sẽ cùng xem xét cách chuyển đổi qua lại giữa ba kiểu dữ liệu này qua ví dụ dưới đây:.
a = [1, 2, 3, 4, 5] # Đối tượng danh sách
b = (1, 2, 3, 4, 5) # Đối tượng bộ
c = "Hello" # Đối tượng chuỗi
# list() tách từng ký tự trong chuỗi và tạo danh sách
obj = list(c)
print(obj)
# Kết quả: ['H', 'e', 'l', 'l', 'o']
# Dấu ngoặc đơn của bộ được thay bằng dấu ngoặc vuông
obj = list(b)
print(obj)
# Kết quả: [1, 2, 3, 4, 5]
# tuple() tách từng ký tự trong chuỗi và tạo một bộ các ký tự
obj = tuple(c)
print(obj)
# Kết quả: ('H', 'e', 'l', 'l', 'o')
# Dấu ngoặc vuông của danh sách được thay bằng dấu ngoặc đơn
obj = tuple(a)
print(obj)
# Kết quả: (1, 2, 3, 4, 5)
# Hàm str() đặt danh sách và bộ bên trong dấu nháy đơn
obj = str(a)
print(obj)
# Kết quả: '[1, 2, 3, 4, 5]'
obj = str(b)
print(obj)
# Kết quả: '(1, 2, 3, 4, 5)'
Giải thích code:
x = 5
vày = 10
: Hai dòng này khai báo các biến toàn cục có tên x và y, và gán cho x giá trị 5, gán cho y giá trị 10.def tinh_tong():
: Dòng này bắt đầu định nghĩa một hàm có tên tinh_tong.tong = x + y
: Bên trong hàm, chúng ta tạo một biến tong, và gán cho tong tổng của hai biến x và y. Lưu ý, chúng ta sử dụng biến x, y ở đây, mà không hề khai báo ở bên trong hàm tinh_tong vì x, y là các biến toàn cục, các biến có phạm vi toàn cục thì luôn có thể được sử dụng trong bất kỳ hàm nào.return tong
: Câu lệnh này trả về kết quả biến tong sau khi tính toán trong hàm tinh_tong().ket_qua = tinh_tong()
: Chúng ta gọi hàm tinh_tong() và gán giá trị trả về vào biến ket_qua.print("Tổng:", ket_qua)
: In kết quả tổng của biến ket_qua ra màn hình.
Các hàm chuyển đổi kiểu dữ liệu trong Python
Python cung cấp một số hàm tích hợp sẵn (built-in function) để chuyển đổi dữ liệu từ kiểu này sang kiểu khác. Các hàm này sẽ trả về một đối tượng mới, biểu diễn giá trị đã được chuyển đổi.
Dưới đây là danh sách các hàm chuyển đổi kiểu dữ liệu phổ biến trong Python:
Hàm | Mô tả chức năng |
Hàm int() | Chuyển đổi x thành số nguyên. Nếu x là chuỗi, base chỉ định cơ số (hệ số) của chuỗi đó. |
Hàm long() | Chuyển đổi x thành số nguyên lớn (long integer). Nếu x là chuỗi, base chỉ định cơ số. |
Hàm float() | Chuyển đổi x thành số thực (floating-point number). |
Hàm complex() | Tạo ra một số phức. |
Hàm str() | Chuyển đổi đối tượng x thành biểu diễn chuỗi |
Hàm repr() | Chuyển đổi đối tượng x thành chuỗi biểu diễn (có thể dùng để tái tạo lại đối tượng). |
Hàm eval() | Tính toán một chuỗi và trả về một đối tượng. (Lưu ý: Cần cẩn thận khi dùng hàm eval() vì tiềm ẩn rủi ro bảo mật nếu chuỗi đầu vào không đáng tin cậy). |
Hàm tuple() | Chuyển đổi s thành một tuple. |
Hàm list() | Chuyển đổi s thành một list. |
Hàm set() | Chuyển đổi s thành một set. |
Hàm dict() | Tạo một dictionary. d phải là một chuỗi các tuple dạng (key, value). |
Hàm frozenset() | Chuyển đổi s thành một frozen set (set bất biến). |
Hàm chr() | Chuyển đổi một số nguyên thành một ký tự (theo bảng mã ASCII). |
Hàm unichr() | Chuyển đổi một số nguyên thành một ký tự Unicode. |
Hàm ord() | Chuyển đổi một ký tự đơn thành giá trị số nguyên tương ứng của nó. |
Hàm hex() | Chuyển đổi một số nguyên thành một chuỗi hệ thập lục phân (hexadecimal string). |
Hàm oct() | Chuyển đổi một số nguyên thành một chuỗi hệ bát phân (octal string). |
Lời kết
Vậy là chúng ta vừa cùng nhau tìm hiểu chi tiết về các phương pháp ép kiểu dữ liệu trong Python, từ ép kiểu ngầm định đến các hàm ép kiểu tường minh như int()
, float()
, và str()
. Hy vọng những kiến thức này sẽ giúp bạn linh hoạt hơn trong việc xử lý dữ liệu, giải quyết các vấn đề phát sinh và viết code Python hiệu quả hơn.