Вопрос по screen-scraping, php, simple-html-dom – как очистить это с помощью простого HTML DOM [закрыто]

0

Я пытаюсь использовать простой HTML-дом для извлечения элементов из файла, который выглядит следующим образом.

Файл имеет несколько таблиц, которые выглядят одинаковоclass=sometable.Каждая таблица имеет несколько<tr class=sometr>.Тогда внутри каждого трth у которого есть заголовок и тд, у которого есть категория.

Я хочу извлечь все названияclass=title и соответствующий им номер категорииclass=category для всех строк таблицы во всех таблицах. Я загрузил файл в$html, Может кто-нибудь сказать мне, что я должен найти после этого? Я пробовал даже$collection = $html->find('tr'); и сделал vardump на коллекцию, но ничего не получил, так что, похоже, я не правильно выбрал.

<table class="sometable">
  <tbody>
    <tr class="sometr">
      <th><a class="title">Table 1 Title1</a></th>
      <td class="category" id="categ-113"></td>
      <td class="somename">Table 1 Title 1 name</td>
    </tr>
    <tr></tr>
    <tr></tr>                           
  </tbody>
</table>

<table class="sometable">
</table>

<table class="sometable">
</table>

Ваш Ответ

1   ответ
2

Я проверилэто и это работает

$tables = $dom->find('table[@class="sometable"]');

foreach($tables as $table)
{
    $titles = $table->find('a[@class="title"]');
    foreach($titles as $title)
    {
        echo "Link title = " . $title ."<br />";
    }

    $categories = $table->find('td[@class="category"]');
    foreach($categories as $category)
    {
        echo "Category id = " . $category->id ."<br />";
    }

    $titles2 = $table->find('td[@class="somename"]');
    foreach($titles2 as $title2)
    {
        echo "Title2 = " . $title2 ."<br />";
    }

}

Похожие вопросы