私のdfに関する情報:
RangeIndex: 14151145 entries, 0 to 14151144
Data columns (total 4 columns):
id object
idf object
ch object
hr uint8
dtypes: object(3), uint8(1)
memory usage: 337.4+ MB
私のシステムには120GBのメモリがあり、実行すると:
dfp = df.pivot_table(index='id', columns=['idf','ch'],aggfunc='count')
結果のピボットテーブルには10800列あります。
私のメモリ消費量は約35 GBになり、その後メモリエラーが発生します。 空きメモリが多いため、この問題を理解できません。
JupyterNotebookでコードを実行しています。
回答 1 件
関連記事
- インデックスをグループ化せずにパンダのピボットテーブル
- パンダピボットテーブル:列と値の間の階層
- 「年」レベルに折りたたまれたときにExcelピボットテーブルに12月の値を表示する
- ピボットテーブルのフィルターをマージする(Excel)
- 文字列列を使用してSQLテーブルをピボットする構文エラー
- パンダの特定の構造を持つ行から列にデータをピボットする
- ピボットテーブルのクエリの出力をPostgreSQLと組み合わせる
- マクロを実行しているExcelの「メモリ不足」エラーは、メモリが最も多いマシンでのみ発生します
- LaravelSyncユーザー名をピボットテーブルに
- pandasデータフレームを使用してcsvからテーブルにデータをロード中にエラーが発生しました
すべてのデータを一度に処理するのに役立つものは見つかりませんでした。
だから、私のdfをにスライスn ピースw.r.t toID、各IDには複数のサンプルを含めることができます。