Programme pour rechercher des répétitions de mots dans des documents texte

Izzy

Programme pour rechercher des répétitions de mots dans des documents texte


Semblable à la question de ComFreeks sur un programme pour rechercher des répétitions de mots dans les documents Word , je recherche la même chose – avec juste une légère différence: cela devrait venir comme un plugin pour LibreOffice / OpenOffice. Le format du document ( .odt , .doc , etc.) ne devrait pas vraiment avoir d’importance, car il est traité de manière transparente par le programme (s’il importe, il devrait au moins prendre en charge .odt ).

Pour vous éviter d’avoir à lire l’autre question pour les exigences, je vais copier-coller à partir de là (licence de site permet: BY-SA signifie que je dois nommer l’auteur (ComFreek) et utiliser la même licence, qui correspond à la fois ), alors c’est parti:

  • Recherchez les répétitions de mots (qui, par exemple, se produisent dans le même paragraphe).
    Plus précisément: ce qui se produit si près l’un de l’autre qu’un enseignant les aurait marqués « répétition » dans un essai que vous avez écrit, ou « blesserait l’œil » du lecteur – qui est généralement « la même phrase / paragraphe » ou « distance » moins de X mots « .
  • Outre les exigences de ComFreeks, il doit fonctionner à partir du programme de bureau sur le document d’origine , donc je n’ai pas besoin de basculer entre les différentes applications pour la correction (et aussi voir immédiatement ce qui ne reste plus à corriger)
  • Les répétitions doivent être autorisées à différer dans le cas où les préfixes, suffixes, déclinaisons ou nombres grammaticaux – par exemple, « autoriser » et « autoriser », « ami » et « amis », « manger » et « mangé » doivent compter comme des paires de répétition
  • Doit prendre en charge la langue allemande (l’anglais serait bien, mais n’est pas vraiment requis)
  • une « liste noire » gérable par l’utilisateur des mots à ignorer (par exemple des articles comme « la ») devrait être incluse. Pas un show-stopper si ce n’est pas le cas, mais pour moi plutôt un « souhait fort ».
  • facultativement, mais vraiment agréable à avoir: la possibilité d ‘ »ignorer cela » pour une paire donnée (donc ce n’est plus marqué comme une répétition jusqu’à ce que je relance la vérification)
  • en option et agréable à avoir: intégrez la fonction « Thésaurus » pour le remplacement des mots. Ceci est d’une importance mineure, car il pourrait également être atteint via des fonctionnalités standard (en mettant le mot en surbrillance et en invoquant le Thésaurus intégré).

Donc, fondamentalement, il devrait fonctionner de manière similaire au correcteur orthographique lorsqu’il est déclenché manuellement (marquer et remplacer), le « vérifier pendant que vous tapez » (erreurs de soulignement), ou les deux.

Étant un plugin / addon pour LibreOffice / OpenOffice, je m’attendrais à ce qu’il ne soit pas dépendant du système d’exploitation – mais s’il l’est, il doit au moins fonctionner sur Linux. Accueil multiplateforme.

Tymric

Avec quelques modifications, cela pourrait faire un beau défi de golf de code

Izzy ♦

Je ne connais pas Code Golf (et comment fonctionne spécifiquement ce site SE) – mais cela ne me dérange pas si vous en avez fait un défi en proposant les résultats comme réponse ici 🙂

user16583

Je n’ai pas de réponse directe, mais cela semble être quelque chose qui pourrait être fait à peu près en utilisant VBA dans le mot, également quelque chose de similaire à ce qu’un traducteur utiliserait, alors peut-être que cela vous aide dans la direction de votre recherche. L’aspect allemand pourrait être délicat pour les suffixes, les déclinaisons, etc., car les noms varient plus entre les cas et les pluriels qu’en anglais.

ComFreek

AuthorSupportTool possède un « outil de répétition de mots ». (Je poste ceci en tant que commentaire, afin que l’ idée ne se perde pas .)

Izzy ♦

@ user16583 bien qu’il y ait quelque chose de similaire à VBA dans LibreOffice / OpenOffice, je ne cherche pas à écrire cela moi-même;) De plus, comme vous l’avez déjà souligné, cela pourrait nécessiter la prise en charge d’un dictionnaire ou similaire; il pourrait utiliser ceux installés pour cela. Merci pour le pointeur; cela pourrait être quelque chose que les addons utilisent probablement.

Réponses


 

#de, #pour, dans, des, documents, mots, Programme, rechercher, répétitions, texte

 

elle.fr

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *