bugfix> scala > 投稿

結果のデータフレームに元の配列の値ごとに1行が含まれるように、sparkデータフレーム内で配列をネスト解除するにはどうすればよいですか?

例:

scala> df.show()
+---------+------+
|employees|person|
+---------+------+
|[1, 2, 3]|  Mary|
|[4, 5, 6]|  John|
+---------+------+

期待される結果:

+---------+------+
|employee |person|
+---------+------+
|1        |  Mary|
|2        |  Mary|
|3        |  Mary|
|4        |  John|
|5        |  John|
|6        |  John|
+---------+------+

これは私が試したものです:

df.select($"person", explode($"employees")).show()
+------+---+
|person|col|
+------+---+
|  Mary|  1|
|  Mary|  2|
|  Mary|  3|
|  John|  4|
|  John|  5|
|  John|  6|
+------+---+

結果の展開列に「従業員」という名前を付けるにはどうすればよいですか?