Existe-t-il un logiciel PDF capable de rechercher, d’extraire, de sélectionner puis de résumer les annotations / commentaires en fonction d’un critère de recherche?

François Maurice

Existe-t-il un logiciel PDF capable de rechercher, d’extraire, de sélectionner puis de résumer les annotations / commentaires en fonction d’un critère de recherche?


  • Voici la situation : j’ai 700 fichiers pdf dans un dossier (ces fichiers doivent être là!). Chaque fichier contient des dizaines ou des centaines d’annotations / commentaires. Chaque annotation / commentaire a des mots clés pour identifier un projet ou un sujet .

  • Voici le besoin : Pour un projet / sujet donné, rassemblant dans un fichier pdf toutes les annotations / commentaires de tout le pdf dans ce dossier, les annotations / commentaires qui se rapportent à ce projet donné.

  • Détails : Il y a deux opérations ici: 1) trouver / extraire les annotations / commentaires; 2) puis en sélectionnant uniquement les annotations / commentaires trouvés et en les résumant dans un fichier pdf.

  • Voici la question : existe-t-il un logiciel PDF capable de rechercher, d’extraire, de sélectionner puis de résumer les annotations / commentaires en fonction d’un critère de recherche comme mot-clé , par exemple le nom d’un projet ?

  • Mon expérience : j’ai essayé de nombreux logiciels, mais en vain. XChange Editor 6 s’est approché. Il est capable de faire la première opération. Le volet de recherche peut afficher uniquement les annotations / commentaires basés sur une recherche par mot clé donnée à partir de tous les fichiers pdf (la recherche peut être effectuée dans les annotations / commentaires). Ceci est puissant car vous pouvez parcourir les annotations / commentaires trouvés. Mais, comme il n’est pas capable de faire la deuxième opération, c’est-à-dire sélectionner et résumer uniquement les annotations / commentaires trouvés, je dois refaire la recherche chaque fois que je veux travailler sur un projet ou un sujet donné.

Voici une capture d’écran pour aider à comprendre ce que je veux dire:

entrez la description de l'image ici

Comme vous pouvez le voir, j’utilise XChange Editor. Donc, comme je l’ai dit, XChange Editor va à mi-chemin. À gauche, nous voyons le texte en surbrillance en jaune avec le message contextuel ouvert. J’ajoute à la première ligne du message contextuel le code de projet 0025 et une balise de sujet / mot-clé, dans ce cas, la balise est «Frege». Cette ligne est suivie du texte en surbrillance, que XChange a copié automatiquement dans le message contextuel.

À droite, vous voyez le volet de recherche. Le volet de recherche effectue la première opération telle que définie par moi: rechercher / extraire les annotations / commentaires sur la base d’une critique de recherche. Dans ce cas, le critère de recherche est « 0025 », comme vous pouvez le voir dans la section Critères avancés . C’est possible car avec le bouton Options … , je peux spécifier de rechercher uniquement dans les commentaires. Sous les options de recherche, il y a les résultats. Il est vraiment puissant car je peux parcourir chaque commentaire trouvé par le moteur de recherche.

Maintenant, je voudrais rassembler ou résumer ces résultats, ces commentaires, les commentaires qui proviennent de nombreux fichiers pdf (chaque ligne en gras dans la fenêtre de résultat est un fichier pdf), dans un seul fichier pdf. C’est cette deuxième opération que XChange Editor n’est pas en mesure de faire. Et d’ailleurs, aucun des éditeurs de pdf existants que j’ai essayé n’est capable de le faire. Bien sûr, l’éditeur XChange peut résumer les commentaires d’un seul fichier en fonction de critères de tri (type, auteur, date, etc.) mais pas en fonction de critères de recherche (comme « 0025 » dans mon exemple).

Donc, si vous le permettez, je répète ma question:

Existe-t-il un logiciel PDF capable de rechercher, d’extraire, de sélectionner puis de résumer les annotations / commentaires d’un tas de fichiers pdf en fonction d’un critère de recherche , par exemple le nom d’un projet comme « 0025 » dans mon cas? S’il s’agit de solutions payantes, je suis prêt à payer jusqu’à 10 $ / an.

Merci beaucoup,

François

François Maurice

Izzy change de poste. Est-ce légal?

Nicolas Raoul ♦

Oui, sur ce site, tout le monde est le bienvenu pour améliorer les publications des autres, tant que l’esprit de la question est toujours présent et qu’aucune information sur les exigences n’est perdue. Mais dans ce cas particulier, je ne sais pas pourquoi @Izzy a supprimé les informations budgétaires, qui semblaient pertinentes.

Izzy ♦

@NicolasRaoul Je ne l’ai pas supprimé , je l’ai ajouté (faits intégrés des commentaires). C’est François lui-même qui l’a retiré à nouveau. Vous devez donc lui demander pourquoi il l’a fait – comme je suis d’accord avec vous, c’est pertinent. // François: Comme Nicolas l’a dit, nous nous aidons mutuellement à nous améliorer. Les faits doivent être contenus dans le post de question lui-même, car ils se perdent dans les commentaires. A propos de la légalité: Vous avez explicitement accepté de placer votre contenu sous une licence CC, voir tout en bas de cette page;)

Izzy ♦

PS: Izzy a recommencé. Izzy & Nicolas sont des modérateurs ici (comme vous pouvez le voir par le ♦ attaché à leurs pseudos), donc ils prennent un soin particulier à la qualité de ce site – et, comme chaque membre de la communauté ici, essayez d’aider particulièrement les nouveaux arrivants afin que leurs questions aient le meilleures chances de bonnes réponses. C’est pourquoi les détails essentiels doivent être visibles;)

François Maurice

@Izzy et Raoul Désolé, je n’ai pas compris votre façon de faire les choses chez StackExchange. Ce n’est pas une approche standard pour la plupart des forums de discussion. Néanmoins, si vous pouvez m’aider de toute façon.

Réponses


 andselisk

Zotero avec les outils pdftotext (s’installe automatiquement sur demande) peut effectuer une recherche en texte intégral, extraire des annotations, TOC et faire des rapports sur une énorme base de données avec des milliers de PDF.

 

/, #de, #en, annotations, capable, commentaires, critère, d’extraire, d’un, Existe-t-il, fonction, Les, Logiciel, PDF, puis, recherche, rechercher, résumer, sélectionner, un

 

wiki

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *