Python 中的 astype() 函數是什麼
理解 Python 中的 astype()
astype() 函數是 Python 中的一個強大方法,主要用於 pandas 函式庫,用於將 DataFrame 或 Series 中的列或資料集轉換為特定資料型別。它也可在 NumPy 中用於將陣列元素轉換為不同類型。
astype() 的基本用法
astype() 函數用於將 pandas 物件(如 Series 或 DataFrame)或 NumPy 陣列的資料類型轉換為另一種類型。
pandas 的語法:
DataFrame.astype(dtype, copy=True, errors='raise')
NumPy 語法:
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
關鍵參數
1.資料型別
要將資料轉換為的目標資料型態。可以使用以下方式指定:
- 單一型別(例如 float、int、str)。
- 將列名對應到類型的字典(對於 pandas DataFrames)。
2.複製(pandas 和 NumPy)
- 預設:True
- 用途:是否傳回原始資料的副本(如果為True)或就地修改(如果為False)。
3.錯誤(僅限熊貓)
-
選項:
- 'raise'(預設):如果轉換失敗則引發錯誤。
- 'ignore':默默地忽略錯誤。
4.順序(僅限 NumPy)
- 控制輸出數組的記憶體佈局。選項:
- 'C':C-連續順序。
- 'F':Fortran 連續順序。
- 'A':如果輸入是 Fortran 連續的,則使用 Fortran 順序,否則使用 C 順序。
- 'K':符合輸入數組的佈局。
5.鑄造(僅限 NumPy)
- 控制投射行為:
- 'no':不允許轉換。
- 'equiv':僅允許位元組順序更改。
- 「安全」:只允許保留值的強制轉換。
- 'same_kind':僅允許安全強制轉換或某種類型內的強制轉換(例如,float -> int)。
- '不安全':允許任何資料轉換。
6. subok(僅限 NumPy)
- 如果為 True,則傳遞子類別;如果為 False,則傳回的陣列將是基底類別數組。
範例
1. pandas 的基本轉換
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
輸出:
A int64 B float64 dtype: object
2.多列的字典映射
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
輸出:
DataFrame.astype(dtype, copy=True, errors='raise')
3.使用錯誤='忽略'
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
輸出:
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
- 「two」的轉換失敗,但不會引發錯誤。
4.在 NumPy 使用 astype()
A int64 B float64 dtype: object
輸出:
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
5.在 NumPy 中使用casting='safe'進行鑄造
A float64 B int64 dtype: object
輸出:
df = pd.DataFrame({'A': ['1', 'two', '3'], 'B': [1.5, 2.5, 3.5]}) # Attempt conversion with errors='ignore' df['A'] = df['A'].astype(int, errors='ignore') print(df)
6.處理 pandas 中的非數字類型
A B 0 1 1.5 1 two 2.5 2 3 3.5
輸出:
import numpy as np # Example array arr = np.array([1.1, 2.2, 3.3]) # Convert to integer arr_int = arr.astype(int) print(arr_int)
7.使用 astype() 進行記憶體最佳化
代碼:
[1 2 3]
輸出:
最佳化前(原始記憶體使用情況):
arr = np.array([1.1, 2.2, 3.3]) # Attempt an unsafe conversion try: arr_str = arr.astype(str, casting='safe') except TypeError as e: print(e)
最佳化後(最佳化記憶體使用):
Cannot cast array data from dtype('float64') to dtype('<U32') according to the rule 'safe'
說明:
-
原始記憶體使用:
- A 欄位作為 int64 使用 24 個位元組(每個元素 8 個位元組 × 3 個元素)。
- B 欄位作為 float64 使用 24 個位元組(每個元素 8 個位元組 × 3 個元素)。
-
最佳化記憶體使用:
- A 欄位作為 int8 使用 3 個位元組(每個元素 1 個位元組 × 3 個元素)。
- B 欄位作為 float32 使用 12 個位元組(每個元素 4 個位元組 × 3 個元素)。
使用較小的資料類型可以顯著減少記憶體使用量,尤其是在處理大型資料集時。
常見陷阱
- 無效轉換:轉換不相容的類型(例如,當存在非數字值時,將字串轉換為數字類型)。
df = pd.DataFrame({'A': ['2022-01-01', '2023-01-01'], 'B': ['True', 'False']}) # Convert to datetime and boolean df['A'] = pd.to_datetime(df['A']) df['B'] = df['B'].astype(bool) print(df.dtypes)
-
Errors='ignore'靜默錯誤
:謹慎使用,因為它可能會靜默地無法轉換。 -
精度損失
:從高精度類型(例如 float64)轉換為低精度類型(例如 float32)。
進階範例
1.複雜資料型別轉換
A datetime64[ns] B bool dtype: object
輸出:
import pandas as pd # Original DataFrame df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3]}) print("Original memory usage:") print(df.memory_usage()) # Downcast numerical types df['A'] = df['A'].astype('int8') df['B'] = df['B'].astype('float32') print("Optimized memory usage:") print(df.memory_usage())
2.在 NumPy 中使用 astype() 來處理結構化陣列
Index 128 A 24 B 24 dtype: int64
輸出:
DataFrame.astype(dtype, copy=True, errors='raise')
總結
astype() 函數是 pandas 和 NumPy 中資料型別轉換的多功能工具。它允許對轉換行為、記憶體最佳化和錯誤處理進行細粒度控制。正確使用其參數(例如 pandas 中的錯誤和 NumPy 中的轉換)可確保穩健且高效的資料類型轉換。
以上是Python 中的 astype() 函數是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame,提供繪圖、音頻等功能,適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt,Tkinter簡單易用,PyQt功能豐富,適合專業開發。

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

Python更易學且易用,C 則更強大但複雜。 1.Python語法簡潔,適合初學者,動態類型和自動內存管理使其易用,但可能導致運行時錯誤。 2.C 提供低級控制和高級特性,適合高性能應用,但學習門檻高,需手動管理內存和類型安全。

要在有限的時間內最大化學習Python的效率,可以使用Python的datetime、time和schedule模塊。 1.datetime模塊用於記錄和規劃學習時間。 2.time模塊幫助設置學習和休息時間。 3.schedule模塊自動化安排每週學習任務。

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

Python在自動化、腳本編寫和任務管理中表現出色。 1)自動化:通過標準庫如os、shutil實現文件備份。 2)腳本編寫:使用psutil庫監控系統資源。 3)任務管理:利用schedule庫調度任務。 Python的易用性和豐富庫支持使其在這些領域中成為首選工具。
