入力
Dataframe
の場合その目的は、自己デカルト積の半分のみを生成することです。デカルト積の結果が対称行列になる場合、ゼロに設定された対角線の上(または下)の上三角部分または下三角部分を計算するだけで十分です。
データフレーム
crossjoin
:
val df3 = df2.crossJoin(df2)
生成します満杯 -私たちは望んでいません。
類似度行列が対角線に沿って1で対称であるとすると、上半分または対角線自体を計算する必要はありません-LOWER DiagO 未満:
最小の計算で結果を取得する方法に関する提案はありますか?
回答 1 件
関連記事
- 行と列の値を使用してデータフレームにデータを追加する
- Spark構造化ストリーミングで静的データフレームを使用するcreateOrReplaceTempView()
- 利用可能なすべてのCPUを使用していないSpark
- 関数を使用して任意の行列nxnの行列式を計算します
- R modelframedefaultのエラー:lmを使用している場合、オブジェクトはマトリックスではありません
- 同じ親から派生した2つのデータフレームを結合する場合、spark DAGはどのように機能しますか?
- キーのデータフレームを使用してDeltaTableから削除する
- コンポジションを使用してパンダのDataFrameをサブクラス化しないようにするにはどうすればよいですか?
- NamedAggを使用して条件付きのPandasDataFrameを集約します
- StaticArraysを使用してマトリックス内のブロックを効率的に埋める
関連した質問
- 任意の関数を使用して、scalaの行のStruct Typeの要素を取得します
- PrefixSpanの後にデータフレームを分割する
- SparkのDataframeを使用して製品ケースクラスにデータをロードする方法
- データフレーム:列名のリストによるGroupBy
- UTCunixtimeを同じタイムゾーンのタイムスタンプにキャストする
- Spark SQL UDFキャスト戻り値
- Spark SQLでDoubleの配列をStringにキャストする
- CollectionAccumulator [(Double、Double)]をSparkdataFrameに変換する方法は?
- Sparkは、存在しない列のフィルタリング/選択を可能にします
- Scalaのデータフレーム内のリスト要素を削除する
以下は完全な答えではありません。最初に完全な
cartesian
を生成します。 製品。しかし、少なくとも出力結果は正しいです。