scrape данные с simplehtmldom без div после тега

Как я могу добраться до 3-х строк и только извлечь время?

<BR>
<BR>UTC=2016-10-12  15:03:58.042 Wed
<BR> LT=2016-10-12  17:03:58.042 Wed (Summer)
<BR>Country/Timezone=+1d (Berlin,Brussels,Paris) ,UTC=60 min.
<BR>Summertime from 25 Mar 01:00, Wintertime from 25 Oct 01:00 (UTC)

Таким образом, желаемый результат будет: 17: 03: 58.042

Я пытаюсь сделать это с помощью простого html dom

Это отображает весь текст. Я пытаюсь найти правильный селектор, но данные, которые я хочу, находятся не между div. Просто
кто-нибудь знает, как выбрать правильную линию?

<?php
// example of how to use basic selector to retrieve HTML contents
include('simple_html_dom.php');

// get DOM from URL or file
$html = file_get_html('http://10.20.83.1/status.htm');

// extract text from HTML
echo $html->plaintext;
?>

html,web-scraping,simple-html-dom,

0

Ответов: 1


1 принят

1. Извлечение текста.

Возможно, используйте:

// Find all text blocks $es = $html->find('text');

От http://simplehtmldom.sourceforge.net/manual.htm#section_quickstart

NB: Если требуемый текстовый блок всегда второй, вы можете использовать его так:

// Find all text blocks $es = $html->find('text', 2);

2. Проверка или интерпретация даты по формату.

Я однажды написал небольшую функцию php, чтобы угадывать некоторые значения datetime по форматам. Смотрите это: http://pastebin.com/DrYwdU2D

Вы можете использовать регулярное выражение, чтобы сделать то же самое, если хотите: PHP Regex для проверки даты в формате YYYY-MM-DD

Надеюсь, поможет.

HTML, веб-соскоб, простой HTML-дом,
Похожие вопросы