-
Martine ADDA-DECKER, Cécile FOUGERON, Cédric GENDROT, Lori LAMEL & Elisabeth DELAIS-ROUSSARIE (Paris)La liaison dans la parole spontanée familière : une étude sur grand corpus
(French liaison in casually spoken French, as investigated in a large corpus of casual French speech)2012, Vol. XVII-1, pp. 113-128Cet article porte sur la liaison dans un parler spontané familier. Partant du constat que, dans la parole familière, les prononciations s'écartent souvent de leur forme canonique du fait d'un taux de réduction temporelle élevé, nous faisons l'hypothèse que le nombre de liaisons réalisées se trouve diminué dans ce type de parole. Notre étude repose sur une exploration du corpus NCCFr (Nijmegen Corpus of Casual French) à partir de techniques automatiques comme l'alignement automatique. Les taux de réalisation sont mesurés pour les consonnes de liaison les plus fréquentes (/z/, /n/ et /t/) dans des sites de liaison potentielle classés selon que la liaison y est obligatoire, facultative ou interdite. Nous proposons également une étude sur les relations entre le débit de parole et la réalisation des liaisons.
-
Martine ADDA-DECKER (Paris)Corpus pour la transcription automatique de l'oral
(Corpus for automatic transcription of spoken texts)2007, Vol. XII-1, pp. 71-84Cette contribution vise à illustrer la réalisation et l'utilisation de corpus à des fins de recherche en transcription automatique de la parole. Ces recherches s'appuyant largement sur une modélisation statistique, s'accompagnent naturellement de production de corpus écrits et oraux transcrits ainsi que d'outils facilitant la transcription manuelle. Les méthodes et techniques mises au point permettent aujourd'hui un déploiement vers le traitement automatique de l'oral à grande échelle, tout en contribuant à un domaine de recherche interdisciplinaire émergeant : la linguistique des corpus oraux.
-
Odile BAGOU & Ulrich H. FRAUENFELDER (Genève, Suisse)Alignement lexical et segmentation de la parole
(Lexical alignment and segmentation in speech recognition)2002, Vol. VII-1, pp. 67-82Comment les auditeurs segmentent-ils la parole continue en mots ? On aborde cette question essentielle en présentant d'abord les positions courantes sur la segmentation lexicale. Après quelques rappels sur le problème plus général de la reconnaissance des mots parlés, on examine les différents types de signaux - phonétiques, phonologiques, prosodiques, lexicaux - qui, ainsi qu'il a été établi, jouent un rôle dans la segmentation de la parole. On analyse alors comment ces signaux servent à localiser des points d'alignement dans la continuité du signal sonore. Ces points servent à définir quelles sont les parties du signal d'un côté et les représentations dans le lexique mental de l'autre qui se trouvent ainsi associées. Plusieurs solutions à ce problème d'alignement sont discutées à la lumière d'expériences récentes.
-
Mireille BILGER & Claire BLANCHE-BENVENISTE (Perpignan / Aix-en-Provence)Français parlé-oral spontané. Quelques réflexions
(Some thoughts on spontaneous spoken French)1999, Vol. IV-2, pp. 21-30Après un rappel de certaines considérations habituelles concernant l'opposition entre "écrit" et "oral", cet article essaie de montrer comment la prise en compte des données fournies par les corpus de français parlé oblige à nuancer les termes de cette opposition et à reconsidérer les rapports que les usagers entretiennent avec leur langue.
-
Mylène BLASCO-DULBECCO, Paul CAPPEAU & Marie SAVELLI (Clermont-Ferrand / Poitiers / Grenoble)Preuves à l'appui : les relations entre les données et l'analyse
(Proven relationships between data and analysis)1999, Vol. IV-2, pp. 31-40Les données orales sont souvent d'un point de vue fréquentiel et distributionnel différentes des données écrites. Elles obligent à affiner la description en fournissant des particularités de construction ou des contextes absents à l'écrit.Les dislocations et la forme 'il y a', réputées pour leur emploi massif à l'oral, apportent des exemples souvent imprévisibles tant du point de vue de leurs spécificités distributionnelles que pour leur rôle dans la dynamique textuelle.Le sujet 'certains', pour sa part peu fréquent dans la langue parlée, donne cependant des faits de distribution pour le moins variés et nettement répartis et ce en relation avec le genre de corpus dépouillé.Cet article se propose donc d'exposer trois cas de figure représentatifs de la relation entre les données et l'analyse.
-
Hélène BLONDEAU (Floride, Etats-Unis)Hors de LA norme point de salut ? La piste montréalaise de la variation des hypothétiques en si
(No salvation outside THE norm ? The Montreal study of variations in hypothetical si-clauses)2012, Vol. XVII-1, pp. 55-66A travers le suivi d'une cohorte de douze Montréalais de 1971 à 1995, cet article examine la variation entre la morphologie du conditionnel et de l'imparfait dans les propositions hypothétiques en si. Les deux variantes, bien en place dans le système des normes implicites de l'oral, s'opposent quant aux valeurs qu'on leur accorde dans le débat normatif. L'analyse indique une influence de la distance et de la potentialité de l'événement. A cause de la vacillation des fréquences selon l'année, l'étude ne peut confirmer l'hypothèse d'un changement à la faveur de la morphologie du conditionnel. Cette étude de cas documente la variation chez l'individu au cours de la vie et son lien avec la variation et le changement à l'échelle communautaire.
-
Galina BOUBNOVA (Moscou, Russie)Correction phonétique : enseignement du français / du russe à des apprenants russophones / francophones
(Phonetic correctness: the case of the teaching of French to Russophone learners and Russian to French learners)2006, Vol. XI-1, pp. 7-19Confronté aux nouvelles sonorités d'une langue étrangère, un apprenant adulte met en place une stratégie d'appropriation auditive qui opère par rapprochements et identifications surdéterminés par la catégorisation phonologique appartenant à sa langue maternelle. La correction phonétique telle qu'on la pratique le plus souvent dans une classe de langue étrangère en Russie privilégie le visuel et le tactilo-kinestésique grâce à de nombreux exercices de gymnastique articulatoire. Reliant la prononciation au contrôle neuromusculaire, cette pratique néglige la composante prosodique. La correction prosodique présentée dans cet article combine pour l'apprenant deux entrées au signal sonore : la perception visuelle et l'écoute. L'exploitation du canal visuel permet d'optimiser l'accès à la prosodie de la L2 aussi bien à l'étape de la perception qu'à celle de la production.
-
Philippe BOULA DE MAREÜIL, Albert RILLIARD & Alexandre ALLAUZEN (Paris Sud)Variation diachronique dans la prosodie du style journalistique : le cas de l'accent initial
(Diachronic variation in the prosody of French news announcer speech: changes in word initial accent)2012, Vol. XVII-1, pp. 97-111Cette étude traite de l'évolution de la prosodie dans le style journalistique français, à partir de l'analyse acoustique d'archives audiovisuelles remontant aux années 1940. Un corpus d'une dizaine d'heures de parole a été examiné automatiquement, et nous nous sommes concentrés sur l'accent initial, qui peut donner une impression de style emphatique. Des mesures objectives suggèrent qu'en un demi-siècle les traits suivants ont diminué : la hauteur de voix des journalistes, la montée mélodique associée à l'accent initial et la durée vocalique caractérisant un accent initial emphatique. Les attaques de syllabes initiales accentuées, quant à elles, se sont allongées. Ce résultat suggère que les corrélats de durée de l'accent initial ont changé au cours du temps, dans le style journalistique français.
-
Suzanne BURGER (Munich, Allemagne)RVG1 - A prototype for the collection of current spoken German1998, Vol. III-1, pp. 67-79
Cet article décrit les grandes lignes du projet "Collection of Currently Spoken German", en cours d'élaboration à l'Institut de Phonétique de l'Université de Munich, et qui a pour but de rassembler les différentes variantes de l'Allemand parlé au travers d'un réseau de stations d'enregistrement réparties sur tout l'espace germanophone. Le corpus RVG1 (Regional Variants of German) sert actuellement de prototype pour les données sonores recueillies régionalement. On peut le considérer comme une première base de données des enregistrements effectués ainsi et représentant les principales différences dialectales, ou du moins les principales régions représentatives des variantes les plus répandues. RVG1 contient des enregistrements très divers, dont les principaux traits sont ici présentés et discutés.
-
Sylvain DETEY & Isabelle RACINE (Tokyo, Japon / Genève, Suisse)Les apprenants de français face aux normes de prononciation : quelle(s) entrée(s) pour quelle(s) sortie(s) ?
(Learners of French and pronunciation norms in the FL : what input do we need to reach what results)2012, Vol. XVII-1, pp. 81-96En didactique du français, les développements de la linguistique de corpus ont contribué au renouvellement de la réflexion sur les normes pédagogiques et sur la place de la variation dans l'enseignement. Nous nous concentrons ici sur la dimension phonético-phonologique, et, après un bref regard sur les modèles de prononciation, nous nous penchons sur l'impact des descriptions sociolinguistiques sur la valorisation des variétés en didactique du FLE. Nous reprenons ensuite la problématique des 'erreurs' et des 'accents' chez les non-natifs afin de souligner la nécessité d'études à grande échelle semblables à celles entreprises auprès de natifs. Nous introduisons ainsi le projet InterPhonologie du français contemporain, qui interroge la notion de norme non native, tant dans une perspective théorique qu'applicative.
-
Jacques DURAND & Anne PRZEWOZNY (Toulouse)La phonologie de l'anglais contemporain : usages, variétés et structure
(Phonology of Contemporary English: usage, varieties and structures)2012, Vol. XVII-1, pp. 25-37Le projet PAC (Phonologie de l'Anglais Contemporain : usages, variétés, structure) se propose de fournir un portrait précis de l'anglais oral dans son unité et sa diversité géographique, sociale et stylistique. Fondé sur des critères laboviens, le projet permet de décrire les accents rhotiques et non-rhotiques de l'anglais, les variétés standard traditionnelles comme les variétés postcoloniales plus récentes. Le corpus constitué permet aux chercheurs d'analyser et de comparer des caractéristiques intervariétales telles que la rhoticité ou des phénomènes plus spécifiques comme la longueur vocalique en anglais australien ou la rhoticité variable en Nouvelle-Zélande. Le programme collaboratif LVTI, issu de la méthodologie des projets PAC et PFC, permet une enquête sociolinguistique interdisciplinaire des grands centres urbains que sont Manchester et Toulouse.
-
Julien EYCHENNE & Bernard LAKS (Groningue, Pays-Bas / Paris Ouest)Le programme Phonologie du français contemporain : bilan et perspectives
(The Phonology of Contemporary French program: results and perspective)2012, Vol. XVII-1, pp. 7-24Cet article offre un panorama des travaux menés dans le cadre du programme de recherche Phonologie du français contemporain : usages, variétés, structure (PFC). Nous situons tout d'abord ce programme dans le paysage de la phonologie du français et des études sur corpus et montrons en quoi sa méthodologie systématique permet d'offrir un renouvellement des descriptions disponibles. Après avoir exposé la méthodologie du projet et les protocoles de codage élaborés pour l'analyse du schwa et de la liaison, nous soulignons l'apport de ce programme, à la fois d'un point de vue descriptif (notamment pour les variétés non standard) mais aussi théorique, en présentant quelques résultats obtenus du point de vue de l'analyse de la liaison et du rôle de la fréquence d'usage.
-
Françoise GADET, Ralph LUDWIG, Lorenza MONDADA, Stefan PFÄNDER & Anne-Catherine SIMON (Paris Ouest / Halle, Allemagne / Bâle, Suisse / Fribourg, Allemagne / Louvain-la-Neuve, Belgique)Un grand corpus de français parlé : le CIEL-F. Choix épistémologiques et réalisations empiriques
(A large corpus of spoken French : CIEL-F. Epistemological choices and empirical outcome)2012, Vol. XVII-1, pp. 39-54Cet article présente d'un point de vue épistémologique et empirique le travail de constitution du Corpus International Ecologique de la Langue Française, grand corpus de français parlé bientôt disponible sur la toile. On y explique la réflexion ayant guidé le recueil des données (approche écologique, comparabilité de zones de la francophonie et situations de communication) et les choix effectués (aires communicatives et types d'activités documentés) en vue d'analyses relevant de domaines diversifiés (variation, interaction, multimodalité, français en contact, syntaxe orale), pour tenter de combler plusieurs lacunes des corpus oraux actuels. On aborde également la question de la mise en réseau des experts, des problèmes liés aux différents terrains, ainsi que de la standardisation, l'archivage et la diffusion des données collectées (enregistrements audio et vidéo, transcriptions, métadonnées), avant de présenter quelques exemples d'analyses comparées.
-
Sébastien GEORGES (Centre international d’études pédagogiques, Sèvres)Evaluer la production orale au travers d’une démarche scientifique
(Evaluate oral production by means of a scientific proocedure)2013, Vol. XVIII-1, pp. 47-58Dans cet article nous proposons une approche qui permet d’accorder les qualités de conception, d’élaboration et d’administration d’une épreuve de mesure des compétences en expression orale à une situation de fort enjeu. En s’appuyant sur des exemples de certifications où la production orale n’est pas l’unique compétence évaluée, nous montrerons que les bénéfices de la mise en œuvre d’une démarche rigoureuse et d’une approche scientifique, qui confère à l’outil de mesure des compétences des qualités de validité, de fidélité, de sensibilité et d’équité, sont des garanties pour répondre de façon appropriée à la demande initiale du commanditaire et aux attentes des utilisateurs finaux. Nous examinerons également les avantages de cette démarche pour les candidats.
-
Juana GIL FERNÁNDEZ (Madrid, Espagne)L'enseignement de la prononciation : rapport entre théorie et pratique
(The teaching of pronunciation: the widening gap between fundamental research and classroom practice)2012, Vol. XVII-1, pp. 67-80Ces dernières années, dans le domaine de la formation des professeurs de L2 et, plus particulièrement, des professeurs de prononciation, la fracture s'est encore creusée entre la recherche fondamentale et l'application de ses découvertes dans les salles de classe. Cela est dû, en partie, au fait que l'on a insisté sur les aspects méthodologiques au détriment de la connaissance même de la matière. Dans cet article, nous défendons, à partir de deux exemples concrets, le besoin de tenir en permanence les professeurs de prononciation au courant des découvertes faites par la recherche en phonétique / phonologie, créant ainsi un dialogue profitable aux deux facettes de la discipline.
-
Catherine KERBRAT-ORECCHIONI (Lyon 2)L'oral dans l'interaction : une liberté surveillée
(Oral language in interaction: restricted freedom)1999, Vol. IV-2, pp. 41-55L'auteur commence par rappeler et commenter trois propriétés fondamentales de l'oral (dont les deux premières l'opposent radicalement à l'écrit) : 1. les discours oraux sont généralement spontanés, 2. ce sont des improvisations collectives, 3. mais qui obéissent à un certain nombre de règles de nature diverse. Elle montre ensuite que ces règles étant pour la plupart floues, leur application peut prêter à négociation entre les participants à l'interaction. Elle donne quelques exemples de ces mécanismes négociatifs (négociation des signes échangés, du script de l'interaction, de la relation interpersonnelle), et conclut à l'intérêt d'une approche interactive du discours oral.
-
Philippe MARTIN (Toronto, Canada)L'intonation en parole spontanée
(Intonation in spontaneous speech)1999, Vol. IV-2, pp. 57-75L'intonation pose depuis longtemps des problèmes de description ardus, au vu notamment de l'extrême variabilité des données, particulièrement en parole spontanée. Aussi beaucoup de phonéticiens ne décrivent l'intonation qu'au travers d'outils statistiques sophistiqués alors que les phonologues se convainquent de la pertinence de représentations appauvries des données de type ToBI. Nous montrerons ici que les modèles de l'intonation élaborés à partir de parole lue peuvent constituer une base satisfaisante pour l'examen de l'intonation en parole spontanée, qui met en oeuvre dans des conditions particulières le même code linguistique que la lecture oralisée. Les données expérimentales présentées illustrent la diversité des stratégies utilisées par différents locuteurs pour structurer leurs phrases, mais qui font cependant appel aux mêmes règles prosodiques spécifiques au français.
-
Johan F. MATTER (Amsterdam, Pays-Bas)La prononciation authentique en langue étrangère : un problème négligé
(Authentic pronunciation in a Foreign Language: a neglected problem)2006, Vol. XI-1, pp. 21-32Dans cet article, nous examinons pourquoi une prononciation authentique en langue étrangère, contrairement aux autres aptitudes linguistiques, est si difficile, voire impossible, à atteindre. Plusieurs approches théoriques sont passées en revue : approches psycholinguistique, physiologique et psychologique. Celle à laquelle se rattache le nom de Guiora semble pour le moment la plus complète et la plus prometteuse. Le problème de la nécessité ou de la désirabilité d'une prononciation authentique du point de vue de l'enseignement n'est pas abordé. A la fin, la question est posée de savoir si dans le 'village global' où nous vivons le rôle d'une prononciation authentique ne changera pas nécessairement de nature.
-
Jim MILLER (Edimbourg, Grande-Bretagne)Magnasyntax and syntactic analysis1999, Vol. IV-2, pp. 7-20
La majorité des théories syntaxiques traitent de l'écrit. Il s'ensuit que les théories de l'acquisition de la langue maternelle, comme la théorie chomskyenne, sont fondées sur ce modèle de l'écrit. Pourtant c'est le langage parlé spontané que l'enfant acquiert en premier ; c'est seulement plus tard que l'enfant apprend l'écrit. Malgré les études récentes sur le langage parlé spontané, les analystes qui distinguent langage planifié et non-planifié et les différentes dimensions de la syntaxe et du lexique, ne semblent pas reconnaître l'étendue des différences entre la syntaxe du langage écrit formel et le langage parlé spontané non-planifié. On propose l'étiquette de 'magnavocabulary' pour l'ensemble des mots contenus dans tous les textes rédigés dans n'importe quelle langue de longue tradition écrite. L'étiquette de 'magnasyntax' est proposée ici pour le phénomène syntaxique parallèle - les constructions des textes écrits sont consignées dans des grammaires et peuvent se voir utilisées/ravivées par des écrivains et analysées par des grammairiens. De nombreuses théories syntaxiques focalisent sur la magnasyntaxe. Cet article analyse deux exemples de cette focalisation et montre les problèmes engendrés par des analyses qui ne distinguent pas les constructions appartenant à différentes étapes historiques d'une langue donnée et à des genres différents : la discussion du statut de 'that' (complémenteur ou pronom) par Van der Auwera et l'analyse de la construction clivée 'IT Cleft' par Quirk et Greenbaum.
-
Berthille PALLAUD & Marie SAVELLI (Aix-en-Provence / Grenoble)L’oral enfantin : comment l’évaluer ?
(Methods for evaluating speech production in children)2001, Vol. VI-1, pp. 121-135Si la notion de dysfonctionnement langagier n'est pas facile à cerner, c'est qu'on ne sait pas bien par rapport à quoi cette notion peut être établie. Les études, nombreuses maintenant, dans le domaine de l'oral ont montré combien il pouvait être tendancieux de vouloir jauger des énoncés oraux en les comparant à des énoncés écrits. L'élaboration de l'oral impose des particularités qui peuvent surprendre au regard d'énoncés écrits mais qui ne sont pas pour autant des signes de dysfonctionnement langagier. En ce qui concerne les paroles d'enfants notamment, les biais d'évaluation sont souvent redoublés d'un adultocentrisme qui conduit parfois à conclure trop rapidement et abusivement à un dysfonctionnement langagier. Nous nous proposons d'exposer ce qui peut être considéré comme faute "banale" à l'oral chez l'enfant et ce qui peut être indice de difficultés plus spécifiques.
-
André VALLI & Jean VÉRONIS (Aix-en-Provence)Etiquetage grammatical des corpus de parole : problèmes et perspectives
(Grammatical labeling of corpora of spoken language: problems and perspectives)1999, Vol. IV-2, pp. 113-133Les systèmes de transcription qui proposent de reproduire certains phénomènes de l'oral, comme les bribes, les hésitations, les répétitions, et qui n'utilisent pas de ponctuation peuvent laisser présager de grandes difficultés pour l'étiquetage grammatical de corpus transcrits. Le développement d'étiqueteurs directement conçus pour l'oral est souhaitable, mais ne peut constituer qu'une entreprise à long terme. Nous relatons dans cet article une expérience d'étiquetage d'un corpus oral à l'aide d'un étiqueteur conçu pour l'écrit, complété par des programmes de pré-édition et de post-édition adéquats, qui, contre toute attente, permet d'obtenir d'excellents résultats sur l'oral, presque comparables à ceux obtenus sur l'écrit. Ces résultats permettent d'envisager la constitution rapide de grands corpus oraux étiquetés pour le français.
Oral