Fonctionnement des statistiques sur memoQ

Sortez vos calculatrices et préparez-vous à faire du calcul mental intensif. Lorsqu’on utilise l’outil d’analyse de notre logiciel TAO favori, le tableau généré n’est pas forcément le plus facile à décrypter. Certes, les pourcentages dans la colonne de gauche nous donnent une indication de l’effort à produire, mais que signifient-ils réellement ? Comment le logiciel calcule-t-il ces pourcentages ?

La réponse en chiffres, en lettres et en images.

1) Règles de comptabilité

Avant d’entrer dans le cœur du sujet, arrêtons-nous quelques instants sur la définition d’un mot pour memoQ. L’aide en ligne du logiciel développé par Kilgray nous explique que les éléments isolés suivants sont considérés comme une unité au cours d’une analyse :

– tout mot qui contient au minimum une lettre
– tout chiffre ou nombre
– tout mot composé à apostrophe ou à trait d’union (aujourd’hui, au-dessus)
– toute expression contenant une barre oblique (on/off)

Vous pouvez demander à memoQ d’intégrer les tags dans les statistiques et de leur donner une valeur (0,5 ; 1 ; 2 pour les plus fous). Je n’ai pas encore travaillé sur des documents riches en tags ou pour lesquels on me demandait de manipuler le contenu desdites étiquettes, mais vous pouvez considérer que la gestion de ces éléments est facturable et ainsi faire gonfler légèrement la note. Pour ce faire, il vous suffit de remplacer la valeur par défaut de « Tag Weight » par celle qui vous convient.

2) Types de valeurs

Étudions à présent les différentes catégories de la colonne de gauche, une par une. Je ne vous ferai pas l’affront de vous expliquer que la première ligne correspond au nombre total de mots pour le document/la zone sélectionnée/le projet entier en fonction de vos préférences.

Prétraduits depuis une version extérieure (X-translated)/double contexte :

La localisation française est beaucoup plus explicite que la dénomination anglaise, source de confusion. Les mots « X-translated » sont des groupes de mots qui apparaissent à l’identique dans une version antérieure du document et pour lequel le contexte est identique. Si vous possédez le projet memoQ ou la mémoire de la version 3 d’un mode d’emploi et que l’on vous demande de traduire la version 3.5, il est probable qu’une grande partie du contenu soit x-translated.
La notion de double contexte est sensiblement proche de la précédente. Les segments qui entrent dans cette catégorie apparaissent dans la mémoire de traduction et sont suivis ET précédés d’un ou plusieurs segments également présents dans la précieuse ressource. Un gage de sécurité non négligeable, si vous voulez mon avis.

Répétitions :

Le cas des répétitions est assez complexe. Les segments en question apparaissent à plusieurs reprises dans le document ou le projet, mais n’ont pas été préalablement enregistrés dans la mémoire de traduction (ils seraient alors considérés comme des 100 %). Lorsque vous traduisez un segment contenant une phrase, une expression ou une référence, et que la validation de celui-ci entraîne une propagation sur le reste du document, la première saisie compte comme un no match ou un fuzzy match (en fonction du contexte, mais nous y reviendrons), tandis que les segments ayant subi une autopropagation sont considérés comme des répétitions. Elles s’appuient toujours sur un segment traduit en amont.

101 % (context match) :

À l’instar du double contexte, les segments 101 % apparaissent dans la mémoire de traduction utilisée pour le projet, tout comme celui qui le précède et celui qui suit. En revanche, le numéro d’identification (ID) est différent dans la ressource (cela a rarement de l’importance, mais méfiez-vous quand même).

100 % :

Le classique, celui qui nous apporte réconfort et bien-être. Votre mémoire ne vous fait pas défaut, vous avez effectivement déjà croisé cette expression. Bien qu’elle soit familière et facilement extractible, vérifiez tout de même que le contexte est adapté ! Il serait fâcheux de traduire le terme valve par-dessus la jambe, n’est-ce pas ?

85-99 % :

Le voyage se poursuit, nous entrons à présent dans la vallée des fuzzy matches. Cette première catégorie est extrêmement proche d’un 100 %, mais il est possible qu’un signe de ponctuation, la casse d’un mot, ou un chiffre soit différent du segment stocké dans la mémoire. Redoublez de vigilance et surveillez les modifications automatiques proposées par l’autosubstitution ou le fragment assembly (que de termes barbares, mon dieu…).

50-85 % :

En dessous de 85 %, je considère que le traducteur doit fournir un certain effort pour assurer la qualité de traduction du segment. Dans la plupart des cas, je dois reformuler partiellement voir complètement la correspondance trouvée par memoQ dans ma ressource, mais je peux m’appuyer sur cette dernière pour garantir une certaine cohérence et consistance entre deux projets/deux documents.

Aucune correspondance (No match) :

Le meilleur pour la fin. Je ne m’arrêterai pas longtemps sur cette catégorie, vous savez ce qu’elle signifie. Sachez juste que « no match » n’est pas toujours synonyme de « nouveaux mots », que vous pouvez potentiellement retrouver une partie de la phase à traduire dans vos ressources à l’aide de l’outil Concordance (Ctrl+K) ô combien utile. En toute logique, vous rencontrerez des no match ayant un pourcentage de correspondance égal à 3 (autant dire, « nul »), et d’autres qui atteignent malheureusement la barre des 45 %.

Vous voyez où je veux en venir.

3) Méthode de calcul du pourcentage de correspondance

Chaque logiciel de traduction assistée par ordinateur propose différentes méthodes de calcul du pourcentage de correspondance. Si l’on en croit l’assistance en ligne de memoQ, la formule utilisée est relativement simple étant donné, qu’elle dépend du nombre de mots à traduire présents dans le segment de la mémoire de traduction le plus proche.

C’est-à-dire qu’un segment de 8 à 10 mots (how convenient) avec un pourcentage de correspondance situé entre 75 et 85 % présente une différence de deux mots par rapport au meilleur segment enregistré dans la mémoire.

D’accord, rangez vos calculatrices. Je vois des tonnes de tags, de signes de ponctuation, de segments contenant une trentaine de termes et de mots composés. Laissons memoQ s’occuper du calcul et concentrons-nous sur l’aspect linguistique de notre tâche.

Des questions ? Besoin d’explications ? Contactez-moi ou laissez un commentaire !