Bibliothèque PHP pour télécharger le code HTML d’une page Web entièrement chargée, y compris les parties ajoutées par AJAX

Hossein

Bibliothèque PHP pour télécharger le code HTML d’une page Web entièrement chargée, y compris les parties ajoutées par AJAX


J’ai besoin d’un morceau de script PHP (ou fonction) qui peut charger une page Web complète comprenant des parties et des images AJAX, je veux dire en donnant l’URL, elle me renvoie un HTML complet.

Jusqu’à présent, j’ai utilisé « simple_html_dom » et certaines fonctions basées sur Curl mais aucune de celles-ci ne fonctionne pour les pièces AJAX.

Pour que cela fonctionne, la bibliothèque doit probablement simuler un navigateur avec JavaScript, charger la page et attendre que tous les éléments se chargent / se transforment, avant de prendre le HTML.

Il doit être gratuit, idéalement open source.

Huey

Que voulez-vous dire can load a complete web page ? cURL vous renverra facilement tout le contenu HTML. Si vous voulez vraiment faire une copie parfaite avec des scripts et des CSS fonctionnant parfaitement, le moyen le plus simple pourrait simplement être de créer un iframe .

Hossein

Je veux dire un script (ou programme) qui peut simuler un navigateur et envoyer des requêtes javascript et obtenir tout le code html, puis retourner tout le code HTML collecté.

Réponses


 Antony

J’ai utilisé le navigateur sans tête PhantomJS , et c’est génial pour faire ce genre de chose – tout ce qu’un navigateur fait est fourni à un langage de script au lieu d’une interface graphique. Je soupçonne qu’une grande partie de la raison pour laquelle cela fonctionne si bien est qu’il utilise le même moteur JavaScript V8 que Chrome … dommage que ce soit le mauvais langage de script pour vous …

Je remarque que quelqu’un a créé des liaisons PHP avec l’API Phantom dans un package appelé PHP PhantomJS . Je ne l’ai pas utilisé car je n’ai jamais eu besoin de cette fonctionnalité de PHP, mais c’est certainement la voie que je chercherais à suivre si je voulais utiliser un navigateur sans tête dans PHP.


 À M

Pour ce faire, j’utiliserais Snoopy

Snoopy est une classe PHP qui simule un navigateur Web. Il automatise la tâche de récupération du contenu des pages Web et de publication des formulaires, par exemple.

Pour commencer, je voudrais consulter ce guide , dites-moi s’il fonctionne

Antony

Snnopy ressemble à 37 Ko de code PHP bien présenté pour moi? Je n’ai eu qu’un rapide coup d’œil, mais je suis sûr qu’il ne peut pas exécuter JavaScript, malheureusement.

 

#pour, AJAX, ajoutées, bibliothèque, chargée, code, compris, d’une, entièrement, HTML, Le, Les, page?, par, parties, PHP, télécharger, Web, y

 

wiki

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *