Parseando HTML con PHP, ejemplo real
Los artículos sobre programación que escribo podrían dividirse en dos grupos:
- Artículos sobre librerías que me gustan y uso habitualmente
- Artículos sobre librerías que aún no he usado pero me gustaría probar en próximos proyectos que den pie a ello
Así pues, de cuando en cuando me convierto en un lector más del blog en busca de esos artículos sobre los que escribí tiempo atrás y necesito ahora. Esta vez se trataba de PHP Simple HTML DOM Parser.
Poniéndonos en contexto:
Una de las web que he iniciado recientemente trata sobre metal alternativo y myspace se ha convertido en un herramienta imprescindible a la hora de buscar noticias y fechas de conciertos. Para el tema de las noticias no había problema, el mismo myspace organiza bastante bien las noticias de los grupos de los que eres “amigo”.
Las fechas de giras en cambio eran un poco más sangrantes y no quedaba otra que visitar la ficha de los grupos una por una para dar con las nuevas fechas (esto cuando quieres cubrir más de 200 grupos puede ser un autentico infierno).
La solución:
Ya tenía la url al myspace de cada grupo en base de datos y la solución más obvia pasaba por crear un script que recogiera y parseara automáticamente el html de esta. El resultado: la tabla de conciertos del grupo mostrada directamente en el panel de administración mi página.
El código:
Como ya vimos en su día, el uso de simple HTML Dom Parser es sencillisimo (más aún si estamos familiarizados con jQuery) y bastaron unas pocas líneas para cumplir con el cometido:
$html = file_get_html($url);
$item = $html->find('div#profile_bandschedule', 0)->find("table[bgcolor=#ffffff]",0);
if($item != '')
return '<table><tr><td>'.$item->xmltext().'</td></tr></table>';
else
return '';




