bugfix> awk > 投稿

入力: 15列のタブ区切り入力ファイル。15列は整数です。

出力: 条件を満たしている行の数。

私のコード:

$ closest-features --closest --no-overlaps --delim '\t' --dist --ec megatrans_enhancers.sorted.bed ../../data/alu_repeats.sorted.bed | awk -v OFS='\t' '{if ($15 <= 1000 || $15 >= -1000) print $0}' | wc -l
1188

||この場合の条件付きは機能していません(ファイル内の行の合計数は1188であり、少なくともいくつかの行が条件を満たさないことがわかっています)。OR条件を削除すると突然機能するためです

$ closest-features --closest --no-overlaps --delim '\t' --dist --ec megatrans_enhancers.sorted.bed ../../data/alu_repeats.sorted.bed | awk -v OFS='\t' '{if ($15 <= 1000) print $0}' | wc -l
926

何が間違っているのかわかりません。何かアドバイス?

Awkコマンドへの入力例:

chr1    378268  378486  chr1-798_Enhancer       17.2    +       chr1    375923  376219  AluY|SINE|Alu-HOMER529  0       +       E:375923        0.044   -2050
chr1    1079471 1079689 chr1-929_Enhancer       14.6    -       chr1    1071271 1071563 AluSx1|SINE|Alu-HOMER1669       0       -       E:1071271       0.13    -7909
chr1    1080259 1080477 chr1-830_Enhancer       16.7    -       chr1    1071271 1071563 AluSx1|SINE|Alu-HOMER1669       0       -       E:1071271       0.13    -8697
chr1    6611744 6611962 chr1-241_Enhancer       46.6    +       chr1    6611431 6611723 AluSc|SINE|Alu-HOMER10257       0       +       E:6611431       0.089   -22
chr1    6959639 6959857 chr1-58_Enhancer        100.1   -       chr1    6966612 6966911 AluSx|SINE|Alu-HOMER11041       0       -       E:6966612       0.137   6756
chr1    6960593 6960811 chr1-202_Enhancer       51.6    -       chr1    6966612 6966911 AluSx|SINE|Alu-HOMER11041       0       -       E:6966612       0.137   5802
chr1    7447888 7448106 chr1-2_Enhancer 181.9   -       chr1    7449489 7449799 AluSz|SINE|Alu-HOMER11879       0       +       E:7449489       0.119   1384
chr1    10752461        10752679        chr1-131_Enhancer       65.4    -       chr1    10752754        10753065        AluSq2|SINE|Alu-HOMER19455      0       +       E:10752754      0.106      76
chr1    12485694        12485912        chr1-353_Enhancer       36.7    +       chr1    12487328        12487634        AluSx3|SINE|Alu-HOMER23581      0       +       E:12487328      0.085      1417
chr1    12486469        12486687        chr1-141_Enhancer       63.6    +       chr1    12487328        12487634        AluSx3|SINE|Alu-HOMER23581      0       +       E:12487328      0.085      642

回答 1 件
  • && を入れてみてください  数字が -1000 より大きくなければならないための条件   1000 よりも小さい 。

    Your_command | awk '$15<=1000 && $15>=-1000{count++} END{print count}'
    
    

    -F"\t" を追加  上記で awk  それへの入力もTABで区切られている場合に備えて。また、 wc -l を使用する必要はありません。   awk の後 。そのためのロジックを書いたので、countという名前の変数を作成し、Input_fileの最後にそれを出力することにより、条件を満たす行のカウントを与えます。

    また、提供されたサンプルの出力は 3 として来ています  私は正しいと信じています。

あなたの答え