bugfix> html > 投稿

1日に2回更新されるテーブルを取得しようとしています。他のウェブサイトでは要素を見つけることができましたが、私が見た方法は私が試したすべてのウェブサイトで機能しないことがわかりました。

この場合、問題は次のとおりです。 にグーグルシート を使用してimportxml、リンクからテーブルへの正しいパスを見つけることができないか、要素を識別できません。

この例のWebサイトは次のとおりです。http://lotopolonia.com/tabel/arhiva/index.php

1。 日付と数字を取得する必要があります。

2。 これらは1日に2回更新され、他のページの一番上に最後の行だけを追加して、私のシートで更新されます。しかし、これは私が最初の問題を解決した後のものです。

w3cのxpathチュートリアルを見て、構文を少し理解しました。 問題は、インスペクターで要素とノードを正しく識別して、必要なデータを取得する方法です。

また、Chrome拡張機能(XPath Helper)をインストールしました。これは、Chromeから得たものよりも優れたXPathを示しています。

私は次を試しました:

=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[@class='second_row']/td[@class='colon2']")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[@class='second_row']/td[*]")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[@class='first_row'][1]/td[*]")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//*[@class='table_01']/table/tbody/tr[@class='first_row'][1]/td[*]")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[3]/td[*]")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[*]/td[*]")
=IMPORTXML("http://lotopolonia.com/tabel/arhiva/index.php","//table[@class='table_01']/tbody/tr[@class='second_row'][1]/child::td[*]")

数式はエラーなしで正常に見えますが、上記のすべてのリクエストで同じ結果が得られます:インポートされたコンテンツは空です

残念ながら、私はアイデアとその要素を解釈する方法を使い果たしました...

どのように進むべきか?

乾杯

回答 1 件
  • この答えはどうですか?私は //table[@class='table_01']/tr[position()>2] を使用しました  xpathとして。 「A1」には http://lotopolonia.com/tabel/arhiva/index.php があります 。

    =IMPORTXML(A1,"//table[@class='table_01']/tr[position()>2]")
    
    

    table[@class='table_01'] を使用する 、テーブルを取得します。

    tr[position()>2] を使用する 、日付と数値を取得します。

    結果: 注意 :

    テーブル全体を取得する場合は、 =IMPORTXML(A1,"//table[@class='table_01']/tr") を使用してください 。

    これがあなたの望むものではなかったら、すみません。

あなたの答え