Axe 1 : plus d’informations

Recherches et réalisations

Coordinateurs: Sylvie HANOTE (PR, FORELL) and Manual GIMENES (MCF, CERCA)

Les recherches de l’axe sont actuellement centrées autour d’une thématique commune : la syllabe et la syllabation.

  • Dans le programme « Écrit » (Coordonnateur : Eric LAMBERT, MCF CerCA), une réflexion est menée autour de la pertinence de l’unité syllabique comme unité structurant le pattern temporel de l’écriture et comme unité d’acquisition de l’orthographe au cours de l’apprentissage de la langue écrite. Une réflexion est également menée dans le cadre de la relation entre morphologie et coupe syllabique.
  • Dans le programme « Parole » (Coordonnatrice : Sylvie HANOTE, PR FoReLL), des questions similaires se posent en diachronie comme en synchronie, sur le français et sur l’anglais, concernant par exemple l’évolution de la durée vocalique en français en lien avec la structure de la syllabe ou concernant les liens entre morphologie, coupe syllabique et transparence lexicale dans la prononciation des mots préfixés, suffixés et composés, par exemple. En partenariat avec le laboratoire XLIM (Universités de Poitiers et de Limoges), des travaux sont en outre en cours pour définir des corrélats acoustiques de la coupe syllabique.
  • En ce qui concerne le programme « Outils pédagogiques et nouvelles technologies numériques » (Coordonnateurs : Freiderikos VALETOPOULOS, PR FoReLL et Jacques BOUCHAND, MCF TechNE), nous nous intéressons à la perception de la syllabe et à la découpe syllabique par les apprenants. En lien avec le projet IDEFI-PARE de l’Université de Poitiers, une étude est envisagée concernant la prise de notes à l’université et le statut de la syllabe dans la prise de notes chez les apprenants avancés francophones (en lien avec l’Ecole Supérieure du Professorat et de l’Education) et allophones (en lien avec le centre de Français Langue Étrangère).

Réalisations de l’axe (corpus et bases de données) :

  • Corpus “Parole”:

Descriptif: Corpus constitué de documents radiophoniques authentiques, issus de la radio britannique BBC Radio 4 et de la radio américaine National Public Radio pour l’anglais ; pour le français, les documents sont issus de France Inter et de France 3 Télévision. Le corpus représente 80 000 mots (environ 8h d’audio) en date du 30 avril 2015. Ce corpus est prévu pour une exploitation de données en contexte. Il est actuellement centré sur l’anglais (britannique et américain), mais il contient quelques documents alignés en français et en espagnol et a vocation à s’élargir vers d’autres variétés d’anglais et vers d’autres langues comme l’allemand, le grec ou le roumain ainsi que vers des corpus plurilingues et comparables.

Format des Documents: .wav

Alignment: Les documents sont transcrits et alignés (texte-son) sous forme graphique et l’alignement a été effectué avec le logiciel Praat.

Exploitation (logiciels): Outil pour l’interrogation du corpus : logiciel Dolmen, développé par Julien Eychenne (www.julieneychenne.info/dolmen).

Contacts: Sylvie Hanote (sylvie.hanote@univ-poitiers.fr) and Nicolas Videau (nicolas.videau@univ-poitiers.fr).

Utilisation du corpus: Ce corpus est destiné à des chercheurs s’intéressant à divers domaines de la linguistique de l’oral : phonétique/phonologie morphologie, lexicologie, syntaxe, sémantique, analyse du discours. Souhaitant que ce corpus puisse servir au plus grand nombre, il a été décidé de nous en tenir à une transcription graphique selon des conventions précises, ce qui permettra à chaque chercheur d’y avoir recours selon ses besoins.

Adresse: http://forell.labo.univ-poitiers.fr/production-scientifique/corpus/corpus-oraux-unilingues-ou-multilingues/parole/

  • Base de données “Worldlex”

Descriptif: Worldlex est une base de données contenant des indices de fréquence lexicale et de diversité contextuelle pour plusieurs milliers de mots dans 66 langues différentes. Ces indices (calculés à partir de corpus de tweets, d’articles de blogs et d’articles de journaux en ligne) prédisent de manière fiable les temps de réaction dans des tâches de décision lexicale (Gimenes et New, en révision).

 

Format des documents: .txt

Utilisation de la base de données: ces fréquences sont principalement destinées à des chercheurs en psycholinguistique désirant étudier ou contrôler la fréquence lexicale et désirant faire des comparaisons inter-langues.

Contacts: Manuel Gimenes (manuel.gimenes@univ-poitiers.fr) and Boris New (boris.new@univ-savoie.fr).

Adresse: http://worldlex.lexique.org.

Recherche

Menu principal

Haut de page