Linguistique de l’écrit

Revue internationale en libre accès

Revue | Volume | Article

173446

Linguistiques de corpus et mathématiques du continu

S Girault Bernard Victorri

pp. 147-170

Résumé

Les nouvelles technologies ont transformé radicalement les rapports des linguistes avec leur objet d’étude. On peut disposer aujourd’hui très facilement d’une impressionnante masse de données sur la langue, qui couvre la plupart de ses usages (du moins dans le domaine de l’écrit), sans aucune commune mesure avec ce qui était accessible il y a à peine dix ans. De plus, on commence à disposer de ressources linguistiques (comme les dictionnaires électroniques) de plus en plus exhaustives, et d’outils de traitement (analyseurs syntaxiques, etc.) de plus en plus fiables. Cet ensemble représente en fait un nouvel «instrument » qui permet de «voir » les phénomènes langagiers comme on n’avait jamais pu le faire auparavant, un peu comme la lunette de Galilée a permis de voir des phénomènes astronomiques (les ombres sur la Lune, les satellites de Jupiter, etc.) inaccessibles jusqu’alors. Il est donc assez normal que ce nouveau dispositif d’observation transforme assez radicalement les méthodes et les attendus de la modélisation informatique en linguistique et de ses applications en traitement automatique des langues.

Détails de la publication

Publié dans:

(2009) Mathématiques et langage. Histoire Épistémologie Langage 31 (1).

Pages: 147-170

Citation complète:

Girault S, Victorri Bernard, 2009, Linguistiques de corpus et mathématiques du continu. Histoire Épistémologie Langage 31 (1), Mathématiques et langage, 147-170.