Menu top

Welcome

Syndicate

Places

Categories

Tags

HTMLParse

 En mi trabajo, me llego la oportunidad de moverle un poco a python, pero desgraciadamente tengo muy buenos compañeros programadores, que me lograron quedar mal con python.

EL chiste era de cierta pagina web parsear el html, y sacar el contenido de la pagina. EL html era un codigo muy muy espaguetizado, nada entendible, yo diria que estaba echo con dreamwaver.

Pues bien la solución es utilizar el HTMLParse que trae por default python, pero creo que le hacen falta unos esteroides a este modulo. Por lo que encontre el modulo BeautifulSoup.


Este modulo esta bien chido, puedes pasarle un html, y el te va a pasear los componentes, tablas,divs, span, etc.

#!/usr/bin/python
from BeautifulSoup import BeautifulSoup
s = open('ficha.html').read()
p = BeautifulSoup(s)
divs = p.findall('div')
[print i.renderContent() for i in divs]




Olvidado de debian

Despues de mucho tiempo eh dejado atraz mi sistema debian, muchas cosas eh aprendido con el desde lograr compilar cualquier paquete hasta poder configurar perfectamente varias cosas.

Pero ahora estoy usando un sistema que me gusto mucho debido a la facilidad de construir paquetes. Este sistema es foresight

Pues asi adios debian, Bienvenido foresight.

Estrenando blog

Ahora si ya tengo mi textmotion 1.1 aunque no se tiene aire de algo parecido a un programa  que empieza con word y termina con press, weno esta fue la primera impresion que me dio pero no me dejo de asombrar de lo chingon que esta si fue un gran cambio, con la integracion de meteora, un saludo al xiam y a todo los tm-staff!