Web Scraping with Python
Dans mon blog, il sera question de Web scraping avec Python et BeautifulSoup.
Pour illustrer mon propos, je m'appuierai sur un moteur de recherche que j'ai développé : www.les-bougies.com
Ce moteur scanne une liste de sites marchands spécialisés dans les bougies parfumées et présente à l'utilisateur les produits disponibles. Un robot mett à jour périodiquement les données.
Par exemple, le site Scandles, qui vend diverses marques de bougies parfumées, est scanné chaque jour et ses produits sont listés sur www.les-bougies.com
Je ne m'étendrai pas beaucoup sur le développement du site, qui est relativement classique puisque bâti autour d'un CMS Wordpress mais j'expliquerai comment fonctionne mon robot.
Le 1er article sera une présentation de BeautifulSoup