1 | L’étude des processus rédactionnels grâce à la temporalité de l’écriture
1.1. Les processus rédactionnels
1Un des premiers modèles de la production écrite, issu de la psychologie cognitive, est celui de Hayes & Flower (Hayes & Flower, 1980). Ce modèle propose que l’écriture implique trois éléments : l’environnement de la tâche (les consignes de la rédaction et le texte déjà écrit), la mémoire à long terme du scripteur et les processus rédactionnels. Trois processus rédactionnels sont identifiés : la planification, la formulation et la révision ; le passage d’un processus à l’autre est géré par le moniteur. Lors de la phase de planification, le scripteur organise les différentes idées qui émergent. Une fois les idées organisées, elles doivent être transposées dans la langue choisie : c’est l’étape de formulation. Des différences existent dans la délimitation des processus de planification et de formulation (Alamargot & Chanquoy, 2001 ; Olive, 2014) ; toutefois, dans les deux cas le but est de déterminer ce qui va être écrit. Le concept de « révision » a fait l’objet de nombreuses études et modélisations, mais sa définition diffère d’un auteur à l’autre. La difficulté pour définir la révision provient essentiellement des traces laissées par ce processus : parfois la « révision » est associée à une relecture en vue d’évaluer le texte, pouvant conduire à une modification de ce qui a été écrit si cela parait nécessaire (Hayes & Flower, 1980) ; parfois la « révision » consiste en une vérification, même en amont de la production (« révisions internes » selon Lindgren & Sullivan (2006) , « pré-contrôle » selon Kellogg (Kellog, 1996) ; parfois, les auteurs associent systématiquement « révision » et « correction » (« révisions externes » selon Lindgren & Sullivan (2006) , « révision » selon Faigley & Witte (1981) .
2Le modèle de Hayes & Flower a évolué, suite aux nombreuses recherches ayant permis de le compléter, et nous nous appuierons davantage sur le modèle proposé en 2012 (Hayes, 2012). Ce modèle reprend les processus de planification et de formulation (sous les termes proposer et translator), et ajoute le processus de transcription ; la vérification du texte par l’évaluateur (reviser) peut porter sur chacune de ces étapes. En outre, la lecture est considérée comme une ressource, pouvant donc être utile à chacun de ces processus. En effet, Hayes (Hayes, 1995) avait distingué deux modèles de lecture différents : « lire pour comprendre » et « lire pour réviser », ce qui peut être corroboré par le fait que la lecture d’un texte écrit par un tiers ne présente pas les mêmes caractéristiques liées aux mouvements oculaires que la lecture d’un texte qui est en train d’être écrit (Johansson et al., 2012). Pendant une tâche d’écriture, on pourrait en outre ajouter l’activité « lire pour poursuivre le texte ». Dans ce type de lecture, le but n’est pas d’identifier un écart entre sa production et la représentation mentale qui en était faite : il s’agit de s’appuyer sur le texte déjà écrit pour le continuer de manière cohérente, et en utilisant les outils de cohésion adéquats.
3Dans ce travail, sera plus particulièrement posée la question de la gestion temporelle de l’écriture : à quels moments les processus évoqués ci-dessus apparaissent-ils au cours de la production d’un texte, plus particulièrement au sein des unités linguistiques telles que la clause1 ou la phrase?2 Par ailleurs, les retours sur le texte sont-ils seulement les traces d’une vérification du texte, ou sont-ils la trace d’autres processus rédactionnels ?
1.2. Indications laissées par l'écriture enregistrée
4Plusieurs outils peuvent être utilisés pour étudier les processus rédactionnels, tels que les protocoles verbaux et la méthode de la double ou de la triple tâche (Olive, 2002). Dans cette étude, nous avons choisi d’utiliser les données chronométriques. Pour collecter les données chronométriques lors de l’écriture manuscrite, il est possible de recourir à des tablettes graphiques associées à un logiciel d’enregistrement et de traitement des données ; les données enregistrées sont désormais très précises (de l’ordre de la milliseconde). Il est ensuite possible d’établir un alignement entre les données recueillies et la rédaction, notant par exemple la localisation et la durée des pauses. Dans ce paradigme d’étude, la durée des pauses et la vitesse d’écriture sont considérées comme reflétant le cout des processus cognitifs : lorsque la charge cognitive est trop importante, le scripteur ralentit jusqu’à parfois s’arrêter (Schilperoord, 2002).
5L’étude des corrections a fait l’objet de travaux en génétique textuelle, depuis les dernières décennies du XXème siècle (Lebrave, 2002). L’objet d’étude de ces chercheurs est la recomposition du cheminement de l’écriture, grâce à l’analyse des manuscrits. Dans le domaine linguistique, le but est essentiellement de chercher ce qui peut être commun à l’ensemble des scripteurs, renseignant ainsi sur la production écrite de manière générale, ou d’essayer de déterminer des profils de scripteurs. Une des particularités des linguistes est qu’ils ne s’appuient pas uniquement sur des corpus littéraires. Ainsi, des recherches utilisant les outils de la génétique textuelle ont porté sur des corpus d’élèves (e.g. Doquet, 2003 ; Fabre-Cols, 2004), afin de « saisir autant qu'il se peut, c'est-à-dire de façon lacunaire et problématique, les processus qui sont en œuvre dans l'écriture » (Fabre-Cols, 1991). L’accès à des outils d’enregistrement de l’écriture a permis de mettre au premier plan la dimension temporelle de ces révisions. Cette temporalité peut être envisagée de manière relative, lorsque les opérations d’écriture sont reconstruites dans leur succession temporelle : dans ces cas, l’écriture n’est plus reconstituée seulement par les marques graphiques visibles sur le manuscrit, mais également par les informations chronologiques disponibles pour chaque opération (Doquet, 2003). Il peut également s’agir d’une temporalité absolue, si elle est considérée par rapport au début de l’activité d’écriture (Leblay, 2009). Enfin, il est possible d’avoir des indications de durée concernant les séquences de révisions et les pauses précédant ces révisions. Par ailleurs, grâce à ces outils, tous les retours sur le texte ayant laissé une trace graphique sont donc visibles, même s’ils ne sont pas perceptibles sur un manuscrit. Ainsi, il arrive que l’ajout d’une virgule ne soit pas identifiable sur le manuscrit, car elle n’est inscrite en marge ou dans l’interligne, mais qu’elle soit visible grâce à l’écriture enregistrée. Par ailleurs, le scripteur ne fait parfois que repasser sur une lettre ou un signe de ponctuation : c’est ce que nous nommerons dans notre étude « reprises esthétiques », puisque le but n’est pas de modifier le contenu linguistique, mais sans doute d’apporter simplement plus de lisibilité.
1.3. Travail sur la temporalité de l’écriture : interprétation des données
6Il est difficile de mettre directement en relation les données chronométriques avec les différents processus rédactionnels. En effet, pour l’écrit, les pauses ont été définies par Matsuhashi comme des « moments d’inactivité scripturale pendant l’écriture » qui « reflètent le temps pris par les scripteurs pour engager une planification cognitive et prendre des décisions comportementales » (Matsuhashi, 1982 : 270). Le problème est que, notamment à l’écrit, les pauses ne correspondent pas forcément à des moments de planification : elles peuvent également servir à la révision ou à la formulation (Foulin, 1995 ; Schilperoord, 2002), et Olive, Alves & Castro (2009) ont montré qu’aucun de ces processus n’était typique des pauses. On pourrait en outre envisager que la pause longue entre deux phrases serve à intégrer en mémoire à long terme la phrase qui vient d’être écrite [DAI 84]. Par ailleurs, les corrections apportées sur le texte peuvent s’inscrire dans des processus plus larges de relecture, celle-ci pouvant avoir plusieurs fonctions (Fortier & Préfontaine, 1994 ; Hayes, 1995).
7La difficulté est donc de lier un comportement observable, qui peut être décrit par le mouvement de la main (en pause ou en exécution) et la position du regard (au point d’inscription, ou sur le texte déjà écrit), avec un processus rédactionnel (réflexion sur ce qui suit, vérification de ce qui a été écrit). Le Tableau 1 montre bien que cette correspondance est difficile à établir.
1.4. Problématique de recherche
8L’utilisation de la temporalité de l’écriture pour mener des études sur les processus rédactionnels nécessite donc de s’interroger sans cesse sur les indices utilisés, et sur l’interprétation qui en est faite. Des terminologies différentes existent pour désigner ce qui laisse une marque et doit être interprété : « trace », « empreinte », « indice », « signe » (Doquet, 2004 ; Jeanneret, 2010 ; Krämer, 2010 ; Serres, 2002). Dans le cadre de notre étude, nous utiliserons le terme de « trace » pour désigner « un objet inscrit dans une matérialité que nous percevons dans notre environnement extérieur et dotons d’un potentiel de sens particulier » (Jeanneret, 2010 : 61). L’auteur de cette définition ajoute que ce sens est « la capacité dans le présent de faire référence à un passé absent mais postulé » ; cette restriction correspond à ce que nous appellerons « empreinte ». Nous ajouterons que la trace peut servir à renvoyer à « des choses qui arrivent en même temps sans être pour autant visibles en même temps » (Krämer, 2010 : 14) ; il sera alors question d’ « indice ». Ainsi, dans le cadre de notre étude, l’indice et l’empreinte sont tous deux considérés comme la trace d’un évènement, cet évènement étant plus ou moins facile à reconstituer.
9Il faudra donc toujours préciser « de quoi » un élément est la trace. Dans nos textes, nous avons peu d’empreintes. Nous pouvons mentionner les modifications apportées au texte : celles-ci sont l’empreinte d’un retour sur le texte, et d’une modification d’éléments linguistiques. Cependant, nous souhaitons nous interroger sur la manière dont ce type de traces peut également être l’indice d’autres processus rédactionnels. Les données chronométriques, quant à elles, ne constituent que des indices : indice d’une planification ou formulation plus ou moins couteuse, indice d’une relecture. À une autre échelle, nous attendons que les observations quant au cout et à la localisation de ces divers processus rédactionnels soient à leur tour des indices concernant les unités de production de l’écriture d’un texte.
10Dans cette étude, nous travaillerons essentiellement à partir des données relatives aux retours sur le texte, en prenant en compte la temporalité, notre problématique étant de savoir dans quelle mesure ces données peuvent nous renseigner sur la gestion des processus rédactionnels.
- La première hypothèse que nous faisons est que l’étude de la temporalité des corrections fournit des indices quant à l’interaction entre les divers processus rédactionnels : notamment, nous devrions avoir des informations quant au moment où l’orthographe est vérifiée au sein des clauses et des phrases.
- La seconde hypothèse est que les données relatives aux retours sur le texte sont l’indice d’autres processus rédactionnels, et renseignent notamment sur la planification / formulation.
2 | Méthode
2.1. Données collectées
11Les participants étaient 31 étudiants de langue maternelle française. Ils devaient écrire la suite d’une histoire qui soit en cohérence avec le début proposé, dont le titre était L’évasion : il s’agissait de raconter l’histoire de Dimitri, un prisonnier qui tente de s’évader. Un texte, nommé « T31 », s’est particulièrement distingué des autres : de nombreuses corrections ont été apportées, la participante écrivant même dans la marge et à l’extrémité basse de la feuille. Nous avons choisi d’écarter ce texte du corpus, qui comptera donc 30 productions, et d’utiliser « T31 » comme étude de cas.
12Les productions écrites ont été collectées grâce à une tablette graphique Wacom Intuos 3, reliée à un ordinateur. Une feuille de papier était fixée sur la tablette et les scripteurs utilisaient un stylet à bille similaire à un stylo classique, afin de rendre les conditions de production les plus naturelles possibles. Les données, transmises à l’ordinateur, étaient ensuite enregistrées grâce à la version 2 du logiciel Eye & Pen (Chesnet & Alamargot, 2005), qui collectait les données spatiales et chronométriques relatives à la production. Il est ainsi possible de « rejouer le film » de la production ; en outre, le type d’évènement (pause levée, pause appuyée, stylo en mouvement) et la durée de ces évènements sont enregistrés.
2.2. Codage des révisions
13Pour cette étude, nous appelons « révision » toute opération ayant laissé une marque de retour sur le texte déjà écrit, c’est-à-dire sur une séquence autre que celle en cours d’écriture. Nous parlons de « trace de retour » et non de « modification » afin d’inclure les cas de « reprise esthétique » mentionnés précédemment. Le but de cette étude étant de mieux comprendre la gestion temporelle des processus rédactionnels grâce aux révisions, nous avons codé d’une part le type d’opération de révision, et d’autre part des informations de localisation concernant la révision (distance entre l’origine de la révision et le site de la révision;3 position de la révision dans le texte).4
Type d’opération de révision
14Plusieurs opérations de révision peuvent être identifiées. Nous nous sommes inspirés des remarques proposées par Doquet & Leblay (2014) , qui reprennent les quatre opérations identifiées par les travaux de génétique textuelle (Grésillon, 1994) : suppression, ajout, remplacement et déplacement, cette dernière opération n’ayant pas été relevée dans nos textes. Nous avons en outre ajouté un autre type d’opération : la « reprise esthétique ». Ces quatre types d’opération portent généralement sur un signe de ponctuation (dans le codage « pct ») ou un mot.
15Suppression (« SUP ») : Il s’agit de la suppression, généralement visible sur le manuscrit, d’un segment préalablement écrit (1).
(1) fut effrayé du regard si noir et intense que j SUP « j » lui jetait le détenu [S26] 5
16Ajout (« AJ ») : Il s’agit d’un retour sur le texte durant lequel un segment est inséré alors qu’aucun élément syntagmatiquement équivalent (dans l’exemple (2), un signe de ponctuation) n’était présent à ce site (ici, entre « agir » et « c’ »).6
(2) S’il voulait agir c’ AJ « , » était maintenant ou jamais [S07]
17Remplacement (« REMP ») : Les cas de « remplacement » sont assez rares, et pourraient être confondus avec une suppression suivie d’un ajout. Nous avons considéré qu’une révision correspondait à un « remplacement » lorsqu’un segment est supprimé et qu’il y a ensuite immédiatement un ajout d’un segment syntagmatiquement équivalent (3).
(3) qu'il avait eue avec Dimitri, deux jours auparavant, alors que REMP « , > . »7 [S03]
18Reprise esthétique (« ESTH ») : Les « reprises esthétiques » désignent des retours sur le texte laissant une trace visible lors du déroulement de la séance avec le logiciel Eye & Pen mais n’apportant aucune modification. Dans ces cas, le scripteur ne fait généralement que repasser un segment (par exemple, un point sur un « i », ou une lettre).
19En outre, nous avons isolé les modifications orthographiques (« ORTHO ») : il s’agit d’opérations visant à corriger l’orthographe, lexicale ou grammaticale, d’un mot. Certes, celles-ci pourraient être identifiées grâce aux opérations ci-dessus, puisque pour corriger un mot on peut supprimer une ou plusieurs lettres (e.g. plans > plan), en ajouter (e.g. leur > leurs) ou effectuer un remplacement (e.g. voie > voix). Cependant, la question de l’ajout et de la suppression est difficile d’un point de vue morphologique. Par exemple, dans le cas d’une correction de genre d’un adjectif, on aurait un remplacement dans le cas de « veuf > veuve » ou « veuve > veuf », mais un ajout pour « petit > petite » et une suppression pour « petite > petit ». De plus, il est difficile de dire dans le cas d’une modification orthographique si l’élément modifié est précisément le mot ou une unité infra-lexicale (morphème, lettre, accent). Il nous est donc paru plus pertinent, lors du codage, d’isoler ce type d’opération.
Localisation de la révision
Distance entre l’origine et le site de la révision
20Nous avons noté la distance entre l’origine de la révision (le lieu où le scripteur s’est arrêté et est revenu en arrière pour apporter une modification) et le site de la révision (le segment modifié). La révision pouvait porter sur le mot en cours (« n ») (4), ce qui était uniquement identifiable dans le cas d’une suppression de mot. En effet, si le scripteur apportait une reprise d’ordre esthétique ou modifiait une lettre du mot au cours de l’écriture de celui-ci, l’ensemble des opérations était comptabilisé dans une seule séquence « d’écriture du mot » : ces opérations n’étaient donc pas considérées comme des « révisions ». Sinon, la révision pouvait porter sur le mot précédent (« n-1 ») (5) ou sur un mot situé dans la même clause (« c », pour « distance courte ») (6). Si la séquence révisée était située dans une autre clause, nous avons distingué si la révision était effectuée au cours de l’écriture du texte (« m » pour « distance moyenne ») ou à la fin de la production (« l » pour « distance longue »).
(4) mais Amin était prêt à
tout pour sauver son frère Tho
SUP «Tho » Dimitri de la peine de mort. [S01]
(5) Dimitri était dans un
couloir __ il AJ « , » faisait très sombre [S17]
(6) Alors Dimitri poussa
de toute ses forces ORTHO « toute > toutes » [S24]
Position de la révision
21Pour chaque révision, nous avons localisé la position de l’origine et du site de la révision. Pour cela, nous avons indiqué la position de la séquence par rapport au début de la phrase, à la fin de la phrase, au début de la clause et à la fin de la clause. La clause est définie comme une unité comportant un seul prédicat unifié (Berman & Slobin, 1994), c’est-à-dire « un prédicat qui exprime une seule situation (activité, évènement, état), incluant des verbes fléchis et non fléchis ainsi que des prédicats adjectivaux ».8 La phrase est définie selon des critères graphiques, comme débutant par une majuscule et se terminant par un point. La première séquence de la phrase est le premier mot ; la première séquence par rapport à la fin de la phrase est le signe de ponctuation qui clôture cette phrase.
22Par exemple, la phrase (7) est composée de deux clauses délimitées par le signe « / ». Cette phrase contient une modification orthographique : « toute > toutes ». Le site de cette révision (« toute ») est la 5ème séquence par rapport au début de la phrase et la 9ème par rapport à la fin de la phrase ; c’est la 5ème séquence par rapport au début de la clause et la 3ème par rapport à la fin de la clause. L’origine de la révision (fin du mot « forces ») est la 7ème séquence par rapport au début de la phrase et la 6ème par rapport à la fin de la phrase ; c’est la 7ème séquence par rapport au début de la clause et la 1ème par rapport à la fin de la clause. Ainsi, le site de cette révision est situé au milieu de la phrase et de la clause, mais la révision est initiée en fin de clause.
(7) Alors Dimitri poussa de toute ses forces ORTHO « toute>toutes » / et la grille s’arracha. [S24]
3 | Résultats
3.1. Description générale
23En tout, le corpus (de 30 textes) compte 142 révisions, soit en moyenne un peu moins de 5 par texte. Cela masque quelques différences suivant les scripteurs : 19 scripteurs font moins de 5 révisions, 5 scripteurs en font entre 5 et 9 et 6 scripteurs en font entre 10 et 15. Le texte T31 compte au total 90 séquences de révision, soit 63% du corpus « Dimitri », qui est constitué de 30 textes. La Figure 1 illustre le type d’opération de révision effectué d’une part de manière générale dans le corpus, d’autre part dans T31.
24Au sein du corpus, l’opération la plus fréquente est la reprise esthétique (35%), alors que la plus rare est le remplacement (4%) ; il y a en outre légèrement plus d’opérations de suppression (20%) que d’ajout (16%). Par ailleurs, l’attention des scripteurs se porte majoritairement sur les mots (57%), et moins sur les signes de ponctuation (18%). Quasiment toutes les opérations de « reprise esthétique » portent sur le mot (47 sur 49), tout comme les opérations de suppression (27 sur 28), alors que les scripteurs ajoutent davantage de signes de ponctuation que de mots (19 sur 23) ; les cas de remplacement, plus rares, portent autant sur les mots que sur la ponctuation.
25Le texte T31 comporte en proportion beaucoup moins de modifications orthographiques que dans le corpus, mais davantage de reprises esthétiques, d’ajouts et de remplacements. En outre, dans une proportion non négligeable (16%) ces révisions concernent des groupes de mots, alors qu’il n’y avait pas de telles occurrences dans le corpus. Il arrive par ailleurs que des reprises esthétiques portent sur des ratures.
3.2. Localisation des révisions
26Afin de conserver la précision de nos données tout en évitant de généraliser à partir de données trop peu nombreuses, nous avons réorganisé les catégories pour la présentation de ces résultats. Ainsi, nous avons souhaité conserver l’information quant à l’opération « reprise esthétique », qui est une opération très fréquente et distincte des autres, puisque le scripteur ne modifie pas le texte déjà écrit. Par ailleurs, parmi les opérations, il y a très peu de cas de remplacement, et les opérations d’ajout et de suppression sont associées en grande partie respectivement aux éléments révisés « ponctuation » et « mot ». Les quatre catégories retenues sont donc :
- « ORTHO »
- « ESTHE » (qui porte presque toujours sur un mot)
- « MOT » (hormis les cas de reprise esthétique, donc presque toujours des suppressions)
- « PCT » (hormis les cas de reprise esthétique, donc presque toujours des ajouts)
27Le Tableau 2 concerne le corpus (30 textes) ; il indique le nombre de révisions en fonction de sa catégorie et de la distance entre l’origine et le site de la révision.
ESTH | MOT | ORTHO | PCT | Total | |
Longue (l) | 0 | 1 | 3 | 2 | 4% |
Moyenne (m) | 5 | 2 | 4 | 1 | 8% |
Courte (c) | 7 | 2 | 11 | 2 | 16% |
Mot précédent (n-1) | 37 | 5 | 18 | 18 | 55% |
Mot en cours (n) | 0 | 24 | 0 | 0 | 17% |
Total | 35% | 24% | 25% | 16% |
28Peu de révisions (12%) portent sur des séquences situées avant la clause en cours d’écriture ; en majorité, les révisions portent sur le mot précédent (55%). Comme attendu suite à notre manière de coder les révisions, les seuls cas de révisions sur le mot en cours (« n ») consistent en des suppressions de mot, ces suppressions immédiates constituant 70 % des révisions portant sur les mots. Pour les autres types de révision (ESTH, ORTHO, PCT), entre 50 et 80% des opérations portent sur le mot précédent. Les modifications orthographiques se font généralement au sein de la clause ; il s’agit en outre de l’opération la plus fréquente dans le cas des révisions « longues », c’est-à-dire effectuées à la fin du texte (3 cas sur 6). Les révisions effectuées sur la clause en cours d’écriture ou plus loin dans le texte déjà écrit consistent essentiellement en des modifications orthographiques ou des reprises esthétiques.
29Concernant le texte T31, nous avons tout d’abord relevé que, sur les 90 séquences de révisions, seules 35 interrompent l’écriture du texte. Pour les autres cas, les révisions s’enchainent les unes aux autres au cours de « sessions » de révision, comme ce qui avait été relevé par Severinson, Eklundh & Kollberg (2003). Les origines des 35 révisions interrompant l’écriture linéaire du texte ont été à nouveau réparties selon la distance entre l’origine et le site. De nouveau, des grandes différences illustrées par la Figure 2 peuvent être soulevées : par rapport au corpus, les révisions immédiates (n et n-1) sont beaucoup moins fréquentes dans T31, ce scripteur privilégiant les révisions courtes et moyennes.
Localisation par rapport aux phrases et aux clauses
30Nous avons regardé dans quelle mesure il était possible de trouver des schémas réguliers concernant les révisions : à quel endroit se situent les séquences révisées, et surtout à quel moment les révisions sont initiées.
31Dans le corpus (30 textes), les révisions « ESTH » sont majoritairement initiées en fin d’unité : dans 53% des cas la révision est initiée en fin de phrase, auxquels il faut ajouter 12% de cas où elle est initiée en fin de clause, sans que celle-ci soit la dernière de la phrase. Sur ces 65% d’origine en fin d’unité, la révision est davantage initiée après le signe de ponctuation (80%) qu’entre le dernier mot écrit et le signe de ponctuation. Concernant les révisions « PCT », elles sont initiées dans 59% des cas après le premier mot de la clause (dont seulement 9% de cas où c’est également le début de la phrase). Il s’agit généralement d’ajouts, qui sont insérés après le dernier mot de la clause précédente. Il y a 23% de cas supplémentaires dans lesquels la révision portant sur la ponctuation a lieu après avoir écrit le signe de ponctuation clôturant la phrase. Les révisions « ORTHO » sont quant à elles initiées dans 36% des cas en fin de phrase, que ce soit à part égale après ou avant le signe de ponctuation. Aucun schéma particulier ne ressort concernant les révisions « MOT ». Les résultats concernant la position de l’origine de la révision en fonction de la distance entre l’origine et la séquence révisée indiquent qu’une majorité des pauses « courtes » (50%) ou « moyennes » (58%) sont initiées en fin de clause. Cette proportion est plus faible pour les révisions de très courte distance, portant sur le mot (seulement 17%) ou le mot précédent (37%).
32Nous avons regardé en détail où les 35 révisions interrompant le texte T31 étaient initiées, en nous aidant cette fois du manuscrit, qui offre des informations quant à la disposition spatiale sur la feuille. Il est tout d’abord frappant de constater que 13 de ces révisions (37%) sont initiées en fin de ligne, ce qui suggère un comportement particulier lié à l’aspect spatial de l’écriture. Ces révisions initiées en fin de ligne correspondent souvent à des fins d’unités linguistiques (10 cas sur 13). Dans 12 autres cas dans le texte, la révision est également initiée en fin ou fin potentielle d’unité linguistique. Sur l’ensemble de ce texte, moins de 30% des révisions ne sont donc pas initiées à une frontière linguistique ou en fin de ligne.
33Nous avons ensuite analysé plus en détail la distribution spatiale des reprises esthétiques du texte T31, afin d’expliquer soit l’origine de la reprise esthétique, soit son site. Ainsi, la Figure 3 présente les reprises esthétiques effectuées en interrompant le texte en cours d’écriture, qu’elles soient ou non suivies de modifications. Nous avions noté que les reprises esthétiques étaient souvent de distance « courte » ou « moyenne », contrairement au corpus où elles portaient généralement sur le mot précédent et étaient initiées en fin d’unté linguistique. Or, l’observation de la page d’écriture indique qu’en réalité, dans seulement 2 cas (sur 22), la reprise esthétique est située « loin » de son origine. Par exemple, la plupart des reprises esthétiques initiées en fin de ligne portent sur le premier mot de cette ligne. Or, si le scripteur a déjà amené son stylo à gauche de la page pour écrire la ligne suivante, le premier mot de la ligne est en réalité le mot le plus proche ; d’ailleurs, il y a un cas où, après avoir écrit la conjonction « et » en début de ligne, le scripteur fait une nouvelle reprise esthétique sur le mot « certain », premier mot de la ligne supérieure. Il peut donc également arriver que le mot le plus « proche » le soit verticalement : c’est ce qui peut facilement expliquer la reprise esthétique sur « tranquillité » lorsque le scripteur s’arrête après « couloir », alors qu’il serait plus difficile de fournir une explication d’ordre linguistique du rapport entre ces deux mots.
3.3. Gestion temporelle des révisions
34Ayant à notre disposition la durée des pauses, il serait intéressant de voir dans quelle mesure les caractéristiques des révisions expliquent la durée des pauses avant l’origine de la révision ou avant la révision elle-même, permettant ainsi de questionner la quantité de ressources engagées pour chaque type de révision. Afin de prendre en compte la variabilité entre les scripteurs, il a été choisi de décrire les données temporelles non pas en millisecondes mais en termes de quartiles. Les quartiles partagent en quatre parties d’effectifs égaux les données ; nous avons nommé « Qi » les pauses dont la durée est comprise entre Qi-1 et Qi. Par exemple, les pauses « Q4 » correspondent aux 25% de pauses les plus longues du texte.
35Nous avons distingué les pauses « avant l’origine » (ORI), c’est-à-dire la durée de la pause qui précède le dernier mot écrit avant que la révision ne soit initiée, et la pause « avant la révision » (REV), c’est-à-dire la durée entre la fin du dernier mot écrit et le début de la révision. De manière générale, il peut être noté que la part de pauses longues (appartenant à Q4) est globalement élevée : c’est le cas de 61% des pauses avant les révisions, et 32% des pauses avant l’origine des révisions.
36La Figure 4 permet de faire ressortir quelques résultats quant à la temporalité des révisions pour le corpus (30 textes). Tout d’abord, il apparait que les pauses avant la révision sont plus longues que celles avant l’origine de la révision, à l’exception des opérations portant sur un signe de ponctuation (« PCT »), qui consistent généralement en un ajout. Les modifications orthographiques sont caractérisées par des pauses avant la révision très longues (c’est la catégorie qui a la plus grande proportion de pauses Q4), mais peu de pauses Q4 avant l’origine de la révision. La plus grande proportion de pauses courtes avant l’origine se retrouve dans la catégorie « ESTH ». Par ailleurs, toutes les révisions consistant en un remplacement de mot ou de ponctuation sont précédées d’une pause Q4. Concernant l’impact de la distance sur la durée des pauses, on observe un schéma régulier pour les pauses avant les révisions de plus longue distance : il y a plus de pauses Q4 avant une révision « longue », qu’avant une révision « moyenne », qu’avant une révision « courte ». En outre, ce sont les mots à l’origine des révisions « longues » qui sont précédés de la plus grande proportion de pauses longues. La plus grande proportion de pauses courtes se retrouve pour les pauses portant sur le mot précédent.
37Concernant T31, nous avons notamment remarqué que les reprises esthétiques étaient généralement précédées d’une pause longue (54% sont des pauses Q4), alors qu’elles sont spatialement très proches du point d’origine. Cela incite donc à penser qu’elles sont l’indice d’une relecture qui s’étend vraisemblablement bien au-delà de la séquence révisée, le scripteur faisant une trace à proximité du point d’inscription pendant qu’il relit ou réfléchit.
4 | Discussion
4.1. La gestion des processus rédactionnels au sein de la clause
38Dans le corpus de 30 textes, 88% des révisions portent sur un élément situé dans la même clause. Il y a globalement peu de révisions en fin de texte : seulement 6 dans l’ensemble du corpus, dont 4 effectuées par le même scripteur. Pourtant, 250 erreurs d’orthographe ont été relevées dans le corpus, dont près de 90% n’ont pas été corrigées, chaque texte comportant au moins une erreur. Il n’est donc pas possible de savoir si les 26 scripteurs n’ayant pas fait de révision en fin de texte n’ont pas relu celui-ci à la fin de sa production, ou s’ils n’étaient pas en mesure d’identifier ces erreurs, mais il est au minimum possible de noter que les erreurs d’orthographe n’ont pas été systématiquement corrigées en fin de production, bien que la consigne stipulât que le texte devait contenir le moins d’erreurs d’orthographe possible, et qu’il était possible de relire le texte une fois la rédaction de celui-ci achevée. Il est donc difficile d’affirmer qu’une relecture systématique soit effectuée en fin de clause, du moins dans le but de contrôler les erreurs d’orthographe. En effet, celles-ci sont corrigées dans 50% des cas dès le mot suivant l’erreur, dont la moitié des cas en interrompant le mot, et dans 25 % des cas au cours de l’écriture de la clause. Cela rejoint des études utilisant les mouvements oculaires, montrant que les scripteurs étaient capables de détecter une erreur en parallèle de l’écriture d’un mot en cours, même si la correction elle-même était parfois différée (Alamargot, Chesnet, Dansac & Ros, 2006).
39Une étude portant sur la coordination entre correction orthographique et complétion de la phrase avait montré que dans 90% des cas les scripteurs préféraient compléter la phrase avant de corriger l’erreur, même s’ils avaient repéré l’erreur avant (van Waes et al., 2010). Il était en outre plus rare de corriger l’erreur avant de compléter la phrase (que ce soit spontanément ou à la demande de l’expérimentateur) si la charge cognitive liée aux mots à retenir ou à la difficulté de la correction était plus élevée. Ce résultat n’est pas conforme à nos observations, puisqu’il est visible que les scripteurs choisissent très largement de corriger l’erreur au cours de la clause, donc sans doute rapidement après l’avoir repérée. Cette tendance à corriger les erreurs immédiatement pendant l’écriture de la clause réfère au processus d’editing, qui intervient de manière fréquente et « automatique » pour corriger rapidement des erreurs repérées (Hayes & Flower, 1980 ; Kaufer & al., 1986). Le fait que les résultats de l’étude expérimentale diffèrent de ceux relevés dans notre corpus peut être dû aux différences de protocole : dans le cas des expérimentations portant sur la complétion de phrase, les scripteurs devaient garder en mémoire les mots à utiliser, qui lui étaient imposés par l’expérimentateur. La préférence pour une correction immédiate dans le cas de notre corpus peut alors avoir deux explications. Une première possibilité est que le scripteur sait parfaitement ce qu’il souhaite écrire pour terminer sa clause ; dans ce cas, il peut se permettre de relire en parallèle ce qu’il vient d’écrire afin de détecter des erreurs, et d’interrompre sa rédaction sans être gêné pour la suite de l’écriture. Une deuxième possibilité est qu’au contraire le scripteur hésite sur la formulation de sa clause ; dans ce cas, il peut choisir de relire ce qu’il vient d’écrire afin d’avoir des idées pour la suite, et s’il détecte une erreur, il choisit de la corriger avant de poursuivre sa rédaction et sa réflexion.
4.2. Corrections et reprises esthétiques : des indices de relecture ?
40Si la clause est une « unité de production », il peut être attendu qu’à la fin de celle-ci il y ait de manière quasi-systématique un retour sur le texte, pour vérifier l’adéquation entre ce qui était conceptualisé et ce qui a été écrit. Or, la persistance de nombreuses erreurs d’orthographe met en doute cette relecture de surface systématique. Même dans le cas où une erreur est corrigée en fin d’unité, il est difficile de savoir si c’est suite à une relecture complète de la clause, ou parce que la correction d’une erreur détectée pendant l’écriture de la clause a été différée jusqu’à la complétion de celle-ci. Cependant, un des cas de « révision » traité dans cette étude peut appuyer l’hypothèse de relectures en fin de clause : les occurrences de « reprise esthétique ». Ces révisions ont la particularité de n’apporter aucune modification sur le mot : il peut s’agir de repasser une lettre, ou un diacritique, mais sans que la version originale nécessite une telle reprise. Logiquement, ces révisions ne devraient pas être couteuses à effectuer : or, près de 40% de ces reprises esthétiques sont précédées d’une pause « Q4 », alors qu’elles sont effectuées dans près de 80% des cas sur le mot précédent. Une explication peut être avancée si l’on regarde l’origine de ces révisions : de manière majoritaire (65%), ces reprises sont initiées en fin de clause, généralement après le signe de ponctuation. On peut alors supposer qu’en fin d’unité le scripteur entreprenne une relecture de ce qui a été produit ; pendant ce laps de temps, le scripteur peut, peut-être même sans s’en rendre compte, repasser sur le mot le plus proche, ou « ponctuer » la fin de sa relecture par une telle reprise esthétique. L’étude de cas (T31) indique que ce type de relecture peut avoir lieu non seulement en frontière d’unité linguistique, mais également pour des raisons spatiales, par exemple par un réflexe de relecture en fin de ligne.
41Certes, le mieux serait d’avoir à notre disposition les données relatives aux mouvements oculaires afin de savoir plus précisément ce qui a été relu. Cependant, un texte comme T31, comportant de très nombreuses séquences de révisions, peut déjà renseigner sur ce qui a été relu. En effet, on peut partir du principe qu’une trace laissée sur un mot indique que, au minimum, le regard s’est porté sur ce mot. La Figure 5 donne un exemple d’un « aperçu des mouvements oculaires » d’un texte issu d’une autre collecte de données. Le texte T31 ne permet pas de donner autant de détails, mais certains « chemins de relecture » peuvent être reconstruits à partir de la localisation des origines et sites des révisions, comme illustré par la Figure 6. Dans les deux cas, nous voyons des traces de mouvement (oculaire ou de stylo) « vertical », c’est-à-dire des cas où le scripteur relit le texte déjà écrit plusieurs lignes auparavant.
42Dans certains cas il n’y a aucune correction avant ou après la reprise esthétique : cette relecture peut alors simplement être une aide pour écrire la suite du texte. Ainsi, dans l’exemple (8), des longues pauses débutent la deuxième phrase : 7,1’’ avant le sujet, puis 27,2’’ avant le verbe « voyait ». Durant cette deuxième période de pause, il est fort probable que la phrase précédente ait été relue, puisque l’on sait au moins que le scripteur a posé son stylo sur le premier mot (« Dimitri ») de cette phrase.
- Dimitri avait bon espoir qu’il s’endorme, il attendrait aussi longtemps que nécessaire. (7,21’’) Il (15,9’’) [esth « Dimitri »] (11,3’’) voyait l’homme lutter contre le sommeil,
43Cela corrobore une étude récente, s’appuyant sur les mouvements oculaires, qui a montré que les séquences de relecture du texte n’étaient pas initiées de manière aléatoire : elles sont plus fréquentes et comportent davantage de fixations en frontière de phrase qu’aux frontières de plus bas-niveau (Torrance et al., 2015), suggérant que la lecture puisse jouer un rôle dans la planification de la phrase suivante.
5 | Conclusion: Les outils à disposition pour étudier les processus rédactionnels
44Nous pouvons à présent faire un bilan sur les traces à notre disposition en fonction du matériel utilisé, et surtout de quels processus ces empreintes et indices sont les témoins. De manière plus particulière, nous nous sommes intéressés dans cette étude aux retours sur le texte.
45Au niveau du manuscrit, les modifications apportées au texte déjà écrit (e.g. ratures, ajouts) sont l’empreinte d’un changement de choix lexicaux ou syntaxiques, et sont donc l’indice d’une réflexion sur ce qui doit être marqué. L’écriture enregistrée permet quant à elle de disposer de l’ensemble des révisions, ainsi que de la temporalité liée à celles-ci (ordre des révisions, lieu d’origine, durée). Là encore, les modifications apportées au texte déjà écrit, dont le relevé est plus complet que celui obtenu à partir du manuscrit, sont l’empreinte des changements de choix lexicaux ou syntaxiques, et donc l’indice de planification ou de formulation. Plus particulièrement, les lieux d’origine des révisions donnent des indices quant à la gestion des multiples processus au sein des unités de production : il est ainsi possible de repérer si le scripteur interrompt sa production pour effectuer des modifications au niveau des choix lexicaux ou syntaxique ; s’il s’interrompt pour corriger des erreurs d’orthographe repérées ; s’il effectue des retours systématiques sur le texte, soit en frontière linguistique, soit pour des raisons d’ordre spatial (e.g. en fin de ligne). Le fait d’avoir à disposition un corpus de textes et une étude de cas a permis de souligner des paritcularités individuelles. Par exemple, alors que les modifications portant sur le mot sont relativement rares dans le corpus, et généralement très vite apportées, le scripteur de l’étude de cas n’hésite pas à faire de profonds changements sémantiques et syntaxiques, en revenant même plusieurs fois sur un même passage au sein de son texte ; l’accès à la temporalité relative (i.e. l’ordre des révisions) permet alors de comprendre les raisons de certains choix : par exemple, la nécessité de changer d’items lexicaux (e.g. passage d’un groupe nominal à un pronom ou vice-versa) pour exprimer de manière plus adéquate la continuité référentielle modifiée suite à d’autres changements. Nous avons en outre noté que la plupart des erreurs d’orthographe du corpus étaient modifiées très rapidement, au cours de l’écriture de la clause. La fréquence des retours sur le texte initiés en fin de clause et de phrase suggère que la frontière de ces unités linguistiques sont des lieux privilégiés où le scripteur, ayant achevé la production de l’unité, relit ce qu’il a écrit pour préparer la suite de son texte. Par ailleurs, nous avons présenté l’intérêt d’associer les durées des pauses avec le type de révision effectué, afin que ces durées deviennent des indices de traitement cognitifs plus ou moins couteux, parfois non visibles par le simple examen des révisions : par exemple, les ajouts de ponctuation sont très rapides à effectuer, suggérant que le scripteur remarque et résout les problèmes de ponctuation de manière plus aisée que lors de modifications lexicales ou orthographiques.
46Enfin, nous avons montré l’importance de s’attarder sur les « reprises esthétiques », qui sont l’empreinte d’un retour sur le texte pas aussi superficiel que cela pourrait être supposé ; associées à la durée des pauses et aux lieux d’origine des révisions, ces reprises deviennent l’indice d’une relecture du texte déjà écrit, parfois en vue d’une planification plutôt que d’une vérification. Le terme « reprise esthétique », choisi au début de nos analyses, partait du postulat que ces révisions avaient pour principal but d’améliorer la lisibilité du texte, mais les analyses présentées ici conduisent donc davantage à les considérer comme des marques laissées lors de relectures. Outre à cause de sa superficialité apparente, l’absence de typologie concernant cette opération peut être expliquée par le matériau utilisé : ce type de retour sur le texte est invisible sur les manuscrits, et ne peut pas exister dans le cas du traitement de texte. Pour ce dernier cas, nous pouvons cependant faire l’hypothèse que des indices similaires pourraient être apportés par les mouvements de curseur, ne donnant pas forcément lieu à une modification du texte. Notre étude, même si elle porte sur des productions écrites sur papier, peut donc nous inviter à reconsidérer certains éléments de l’écriture par ordinateur, puisqu’il serait intéressant de voir de quels processus ces mouvements de curseur, qui paraissent à première vue peu utiles, pourraient être la trace.
47Le fait de considérer les retours sur le texte comme des indices de relecture dont le but n’est pas toujours une simple vérification souligne l’intérêt d’étudier davantage la place de la relecture dans la production écrite, ce qui a été peu fait dans le cadre de textes. Pour cela, il faut avoir recours à l’enregistrement des mouvements oculaires. En effet, les mouvements oculaires portés sur le texte déjà écrit sont des empreintes de relecture. Associés au contexte (lieu où le retour en arrière est initié, segment relu, segment écrit par la suite), ces mouvements oculaires seraient des indices des processus de réflexion, soit en vue de modifier ce qui a été déjà écrit, soit en vue de planifier ce qui va suivre, et pourraient ainsi permettre de mieux saisir comment s’effectuent certains processus de haut niveau, comme la mise en place de la cohésion du texte.
6 | Remerciements
48Nous remercions les relecteurs anonymes pour leurs remarques et suggestions ayant contribué à l’amélioration de cet article, ainsi que Florence Chenu pour ses conseils lors de l’élaboration de cette étude. Nous remercions également le Labex ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme français Investissements d'Avenir (ANR-11-IDEX-0007) opéré par l'Agence nationale de la recherche (ANR).
- 1 En français, le terme de "clause" fait souvent référence, dans le cadre du modèle de Fribourg (Béguelin, 2002, p. 7), à un « ilot maximal de solidarités rectionnelles » qui accomplit « un acte énonciatif minimal, visant à modifier l’état des représentations partagées par les interlocuteurs »". Dans notre étude, la notion de "clause" est plus proche de celle de "proposition" couramment utilisée dans les grammaires traditionnelles françaises, bien que nous choisissions de conserver la terminologie de Berman et Slobin (1994).
- 2 Ces unités seront définies dans la partie « Méthode ».
- 3 Le « site » correspond à l’élément affecté (ex : le segment qui est raturé) ; l’ « origine » correspond au lieu où le scripteur s’arrête pour effectuer sa révision (appelé dans certaines études « point d’inscription »).
- 4 La manière de coder les révisions est adaptée des travaux effectués au sein de l’équipe du Laboratoire Dynamique du Langage travaillant sur la production écrite, qui ont notamment été présentés lors d’une communication orale [CAU 08].
- 5 Dans chaque exemple, la révision est indiquée en gras, et le site est souligné.
- 6 Contrairement à Doquet (2003)nous ne comptons pas l’inscription de segments à la suite de ce qui est écrit comme une opération d’ « ajouts » à étudier, puisque nous ne nous intéressons qu’aux révisions.
- 7 le signe « > » indique le changement effectué (= « devient »)
- 8 Notre traduction : « a predicate that expresses a single situation (activity, event, or state), including finite and non finite verbs as well as predicate adjectives »
- 9 Le début de la flèche indique l’origine de la révision ; la pointe de la flèche indique le site de la révision.
- 10 Les cercles violets indiquent les origines des révisions interrompant l’écriture du texte ; les flèches rouges représentent les reprises esthétiques, et les flèches vertes les révisions avec modification du texte déjà écrit.