Logiciel de détection de plagarisme local

soandos

Logiciel de détection de plagarisme local


Je recherche un logiciel qui détecte le plagiat et possède les attributs suivants:

  1. Gratuit (comme dans la bière)
  2. Windows (7, 8, 8.1, 2012 Server R2)
  3. Interface de ligne de commande
  4. Donne des extraits de texte correspondants

Bon d’avoir:

  1. Comparaisons à 3 voies (texte en tout, dans des documents par paires, dans un seul document)
  2. Sortie XML

Entièrement disposé à compiler à partir de la source, dans n’importe quel langage raisonnable, ou à utiliser simplement une bibliothèque Python à la place.

Au cas où ce ne serait pas clair, je veux seulement qu’il détecte le plagiat des sources que je lui transmets. Quelqu’un connaît-il des logiciels comme celui-ci?

Steve Barnes

Vous recherchez du plagiat littéraire ou un logiciel et le recherchez-vous à partir de sources spécifiques?

soandos

@SteveBarnes Sources spécifiques (c’est-à-dire les fichiers que je lui transmets)

Réponses


 LetMeSOThat4U

Ceci est un outil qui fait tout cela: http://ssdeep.sourceforge.net

Il est principalement conçu pour la criminalistique informatique – détectant des fichiers similaires, modifiés, modifiés ou tronqués.

Je l’ai utilisé avec succès pour lutter contre le spam en détectant les e-mails qui sont modifiés dans une certaine mesure de léger à significatif par rapport à d’autres e-mails et échantillons de spam.

Je pense que cela conviendra à votre objectif car il a une « sensibilité » ajustable aux changements et il est capable de détecter des fragments similaires, voir ici pour la démonstration:

http://ssdeep.sourceforge.net/usage.html#needles

Avertissement: j’ai utilisé la bibliothèque partagée directement via Python cffi ( https://cffi.readthedocs.org/en/latest/ ), pas l’outil de ligne de commande lui-même, bien que ssdeep ait un utilitaire de ligne de commande. Pourtant, utiliser cffi pour effectuer des appels à la bibliothèque ssdeep était plus puissant que la ligne de commande et très facile aussi.


 Steve Barnes

Je pensais que vous pourriez probablement utiliser Python et le SciPy NLTK pour construire une liste de phrases à partir de chacun de vos textes que vous considérez qu’il pourrait y avoir du plagiat en utilisant tokenizeje suggérerais d’en supprimer la ponctuation et d’en exclure toute avec moins de 5 ou 6 mots et les stocker, éventuellement avec une sorte de références à l’endroit où ils se trouvent dans le texte d’origine.

Vous pouvez ensuite appliquer le même algorithme à vos textes suspects et vérifier les correspondances.

  • Libre aussi bien en bière qu’en oiseau.
  • À peu près n’importe quelle plate-forme sur laquelle Python peut être installé, y compris Windows.
  • Interface de ligne de commande – oui, sauf si vous lui donnez une interface graphique.
  • Les sorties pourraient alors être à peu près tout ce que vous aimez.
  • De vos gentils nantis, vous pouvez ajouter l’un ou les deux.
Lyndon White

Il doit y avoir des solutions autres que le codage manuel. Bien que cela ait la balise de script shell, je n’interpréterais pas cela comme étant ouvert aux bibliothèques + Créez votre propre solution.

Steve Barnes

@Oxinabox l’une des bonnes choses à propos du monde des logiciels libres est que vous pouvez « rouler le vôtre » quand personne d’autre ne fournit « de la cheville » qui convient.

 

#de, détection, local, Logiciel, plagarisme

 

elle.fr

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *