簡単なデータセットがあります。
id,question,category,tags,day,quarter,group_id
1,What is your name,Introduction,Introduction,1,3,0
2,What is your name,Introduction,"Introduction, work",1,3,1
ご覧の場合、
tags
で列には、コンマで区切られた複数の入力があります。を使用してワンホットエンコードを試みた場合パンダ
get_dummies
関数私はそれを単一の列として取得します。しかし、各タグの列を作成したかったのです。どうすればできますか?
回答 2 件
あなたは
pivottable
を使用する必要があります パンダのデータフレームメソッドの。 次のコードが役に立つかもしれませんpivot_table(df, values='D', index=['id','question','category','day','quarter','group_id'],columns=['tags'])
関連記事
- TKINTER Treeview GUIで異なる列の複数の行をカウントして表示するにはどうすればよいですか?
- r:各列名の個々のサフィックスに基づいて複数の列名を同時に変更する方法
- タイムスタンプ付きのDataFrame列。複数の異なるタイムゾーンをローカライズする必要があります(AttributeError:datetimelike値を持つdtアクセサーのみを使用できます)
- 1つの列に複数の列の値を組み合わせる
- SQL:複数のテーブルから各IDの各列に使用可能な最適な値を選択するにはどうすればよいですか?
- 複数のCSVファイルを処理し、PowerShellを使用して2つのセミコロン文字を含む単一の列の行を削除します
- 順序が正しくない複数のファイルをマージし、ファイルの名前をLinuxの特定の列に割り当てる方法は?
- rの複数の基準に基づいて列を作成するにはどうすればよいですか?
- PHPで複数の値の列を印刷する方法
- 複数の二名列を1つの列に構造化する
str.get_dummies
が必要だと思う :