Parsear HTML con PHP
PHP Simple HTML DOM Parser es una librería pensada para manipular código HTML de forma sencilla con PHP. Siguiendo una sintaxis que recuerda a jQuery, permite acceder a tags, modificar elementos HTML o extraer contenido en poquísimas lineas de código.
Veamos un par de ejemplos:
-
Acceder a elementos HTML
// Create DOM from URL or file
$html = file_get_html(‘http://www.google.com/’);// Find all images
foreach($html->find(‘img’) as $element)
echo $element->src . ‘<br>’;// Find all links
foreach($html->find(‘a’) as $element)
echo $element->href . ‘<br>’; -
Modificar elementos HTML
// Create DOM from string
$html = str_get_html(‘<div id=”hello”>Hello</div><div id=”world”>World</div>’);$html->find(‘div’, 1)->class = ‘bar’;
$html->find(‘div[id=hello]‘, 0)->innertext = ‘foo’;
echo $html; // Output: <div id=”hello”>foo</div><div id=”world” class=”bar”>World</div>
-
Extraer contenido
// Dump contents (without tags) from HTML
echo file_get_html(‘http://www.google.com/’)->plaintext;
Simple HTML DOM Parser requiere PHP 5 o superior para su correcto funcionamiento y es capaz de trabajar con HTML no valido.
Web oficial de Simple HTML DOM Parser
Descargar desde sourceforge
Vía sentidoweb
Posts relacionados:

Una respuesta en “Parsear HTML con PHP”
Trackbacks/Pingbacks
[...] Así pues, de cuando en cuando me convierto en un lector más del blog en busca de esos artículos sobre los que escribí tiempo atrás y necesito ahora. Esta vez se trataba de PHP Simple HTML DOM Parser. [...]