torcharrow.column¶
- torcharrow.column(data: Optional[Union[Iterable, DType]] = None, dtype: Optional[DType] = None, device: str = '')¶
建立一個 TorchArrow 欄位。在指定的裝置或預設裝置上配置記憶體。
- 參數:
data (類似陣列 或 Iterable) – 定義欄位的內容。
dtype (dtype, 預設為 None) – 強制設定的資料類型。如果為 None,則盡可能自動推斷類型。
device (Device, 預設為 "") – 裝置選擇要從範圍使用的執行階段。TorchArrow 支援多個執行階段(CPU 和 GPU)。如果未提供,則使用 Velox 向量化執行階段。有效值為 “cpu”(Velox)、“gpu”(即將推出)。
範例
使用自動推斷類型建立欄位
>>> import torcharrow as ta >>> s = ta.column([1,2,None,4]) >>> s 0 1 1 2 2 None 3 4 dtype: Int64(nullable=True), length: 4, null_count: 1
建立具有任意資料類型的欄位,這裡是一個不可為 Null 的欄位,其中包含任意長度的不可為 Null 字串列表
>>> sf = ta.column([ ["hello", "world"], ["how", "are", "you"] ], dtype =dt.List(dt.string)) >>> sf.dtype List(item_dtype=String(nullable=False), nullable=False, fixed_size=-1)
建立一個平均氣候資料欄位,每個洲份一個地圖,以城市作為鍵,並包含每年的平均最低和最高溫度
>>> mf = ta.column([ >>> {'helsinki': [-1.3, 21.5], 'moscow': [-4.0,24.3]}, >>> {'algiers':[11.2, 25.2], 'kinshasa':[22.2,26.8]} >>> ]) >>> mf 0 {'helsinki': [-1.3, 21.5], 'moscow': [-4.0, 24.3]} 1 {'algiers': [11.2, 25.2], 'kinshasa': [22.2, 26.8]} dtype: Map(string, List(float64)), length: 2, null_count: 0