CE QUI COMPTE - METHODES STATISTIQUES ECRITS CHOISIS, TOME II
Textes édités par Céline Poudat Préface de Ludovic Lebart
BRUNET ETIENNE
Ce volume recueille une sélection de dix-sept textes d`Étienne Brunet abordant les questions statistiques et informatiques pertinentes pour le traitement linguistique de corpus. Organisées chronologiquement, ces études parcourent quarante années d`une recherche qui explore sans relâche les rapports entre statistique et linguistique. Elles vont de l`évaluation des mesures à l`annotation et à la lemmatisation des corpus textuels. Ainsi voit-on, au fil des débats qui ont marqué ces disciplines, se structurer les champs de la lexicométrie et de la linguistique de corpus. Exposées et illustrées avec clarté, les méthodes présentées pourront être exploitées avec le logiciel HYPERBASE, installé sur le DVD de corpus littéraires annexé à ce volume. Préfacé par Ludovic Lebart, cet ouvrage est ainsi un indispensable guide méthodologique et permet de répondre aux questions que posent aujourd`hui l`analyse de données textuelles et la linguistique de corpus. Étienne Brunet est professeur émérite à l`Université de Nice et fondateur du laboratoire Bases, Corpus et Langage. Il est spécialiste d`informatique et de statistique appliquées aux études de textes, et l`auteur du logiciel Hyperbase. Il a publié des ouvrages sur Hugo, Zola, Proust, Giraudoux, et sur le vocabulaire français de 1789 à nos jours.