Parsear HTML con PHP

PHP Simple HTML DOM Parser es una librería pensada para manipular código HTML de forma sencilla con PHP. Siguiendo una sintaxis que recuerda a jQuery, permite acceder a tags, modificar elementos HTML o extraer contenido en poquísimas lineas de código.

Veamos un par de ejemplos:

  • Acceder a elementos HTML

    // Create DOM from URL or file
    $html = file_get_html(‘http://www.google.com/’);

    // Find all images
    foreach($html->find(‘img’) as $element)
    echo $element->src . ‘<br>’;

    // Find all links
    foreach($html->find(‘a’) as $element)
    echo $element->href . ‘<br>’;

  • Modificar elementos HTML

    // Create DOM from string
    $html = str_get_html(‘<div id=”hello”>Hello</div><div id=”world”>World</div>’);

    $html->find(‘div’, 1)->class = ‘bar’;

    $html->find(‘div[id=hello]‘, 0)->innertext = ‘foo’;

    echo $html; // Output: <div id=”hello”>foo</div><div id=”world” class=”bar”>World</div>

  • Extraer contenido

    // Dump contents (without tags) from HTML
    echo file_get_html(‘http://www.google.com/’)->plaintext;

Simple HTML DOM Parser requiere PHP 5 o superior para su correcto funcionamiento y es capaz de trabajar con HTML no valido.

Web oficial de Simple HTML DOM Parser
Descargar desde sourceforge

Vía sentidoweb

Compartir:
  • Facebook
  • Twitter
  • Meneame
  • Google Bookmarks
  • del.icio.us
  • BarraPunto
  • Bitacoras.com
  • Netvibes
  • MySpace
  • Technorati
  • email
  • PDF

Posts relacionados:

  1. Parseando HTML con PHP, ejemplo real
  2. 10 expresiones regulares para PHP

Una respuesta en “Parsear HTML con PHP”


Trackbacks/Pingbacks

  1. [...] Así pues, de cuando en cuando me convierto en un lector más del blog en busca de esos artículos sobre los que escribí tiempo atrás y necesito ahora. Esta vez se trataba de PHP Simple HTML DOM Parser. [...]

Deja un comentario

You must be logged in to post a comment.