Sumário dos números já publicados

2004-1Linguistique et informatique : nouveaux défis
(Linguistics and information technology: new challenges)
Clique no livro para ler um resumoEste número está on line, em versão integral, no portal: Cairn.info
  • Benoît HABERT (Paris X-Nanterre)
    Outiller la linguistique : de l'emprunt de techniques aux rencontres de savoirs
    (To tool up linguistics: from borrowing techniques to the meeting of knowledge)
    pp. 5-24

    Une bonne partie de la recherche linguistique ne suppose pas d'instrument particulier. Les travaux en linguistique ont cependant à gagner à intégrer les outils fournis par le TAL (Traitement automatique des langues) et par l'informatique de manière plus large. L'apport sera d'autant plus fructueux si l'on ne se cantonne pas à des emprunts de ressources ou de techniques et si s'approfondit le dialogue entre les savoirs de chaque discipline


  • Sarah LEROY (Paris X-Nanterre)
    Extraire sur patrons : allers et retours entre analyse linguistique et repérage automatique
    (Extraction on patterns: two-way traffic between linguistic analysis and automated identification)
    pp. 25-43

    Nous présentons ici un système de repérage automatique de l'antonomase du nom propre dans des textes étiquetés. On compare tout d'abord, en décrivant les rouages du système et les méthodes et outils utilisés, les repérages manuels et automatiques, pour constater que la machine l'emporte sur le plan de la fiabilité. Après avoir indiqué en quoi les possibilités et les limites du repérage automatique influent sur le travail linguistique, on met ce travail déjà ancien (2000) en perspective avec de nouveaux outils mis à la disposition des linguistes, en particulier la possibilité de lancer une requête sur le sous-ensemble de textes catégorisés de la base Frantext.


  • Nathalie GASIGLIA (Lille 3)
    Faire coopérer deux concordanciers-analyseurs pour optimiser les extractions en corpus
    (The co-operation of Cordial Analyser and Unitex for optimising corpus extractions)
    pp. 45-62

    Une étude linguistique circonscrite - l'analyse syntaxico-sémantique de certains emplois des verbes donner et passer dans la langue du football - offre un cadre utile pour développer une réflexion qualitative sur les ressources documentaires constituables en un corpus électronique instructif et de bonne couverture, et introduire la notion de 'corpus thématiques à haut rendement'. Ensuite, pour explorer le corpus construit, Cordial Analyseur et Unitex, deux concordanciers et analyseurs syntaxiques, sont mis à l'épreuve. La description de leurs fonctionnalités partagées, de leurs spécificités mais aussi de leurs faiblesses me conduit à formuler une proposition originale : faire collaborer ces deux outils afin que leurs complémentarités stratégiquement exploitées offrent le pouvoir de formuler des requêtes d'une complexité certaine en bénéficiant d'une fiabilité d'analyse avérée et d'une capacité à marquer chaque élément repéré dans les concordances produites avec un balisage en langage XML.


  • Augusta MELA (Montpellier 3)
    Linguistes et « talistes » peuvent coopérer : repérage et analyse des gloses
    (Linguists and NLP-specialists may work together: location and analysis of gloses)
    pp. 63-82

    Cet article s'inscrit dans le cadre d'un projet collectif de recherche linguistique sur le mot et sa glose. Comme les définitions, les gloses recueillent 'l'expérience parlée du sens'. Cette activité métalinguistique se manifeste dans les textes par des mots tels que c'est-à-dire, ou, signifier qui signent la relation de sémantique lexicale mise en jeu : équivalence avec c'est-à-dire, ou ; spécification du sens avec au sens ; équivalence avec ou, c'est-à-dire ; nomination avec dit, baptisé ; hyponymie avec en particulier, comme ; hyperonymie avec et/ou autre(s), etc.Grâce à l'existence de ces marques et des particularités de leurs configurations, un repérage automatique des gloses est envisageable. J'en décris ici la mise en ouvre, en prenant l'exemple des gloses en ou telles que 'un magazine électronique, ou webzine' et d'un environnement informatique 'pour linguistes', à savoir la base textuelle Frantext et son interpréteur de langage de requête Stella.


  • Céline VAGUER (Paris X-Nanterre)
    Constitution d'une base de données : les emplois de dans marquant la « coïncidence »
    (Creating a database: the different usages of 'dans' in marking simultaneity)
    pp. 83-97

    La constitution d'une base de données pour rassembler un corpus et les données qui lui sont associées (syntaxique, sémantique, etc.) n'est pas une pratique naturelle en linguistique (lorsqu'elle n'est pas spécialisée dans le Traitement Automatique des Langues-TAL). Cet article présente l'exploitation de ce support dans le cadre d'une recherche centrée sur la préposition dans.


  • Serge HEIDEN & Alexei LAVRENTIEV (ENS LSH Lyon)
    Ressources électroniques pour l'étude des textes médiévaux : approches et outils
    (Electronic aids in studying medieval texts: methods and tools)
    pp. 99-118

    Deux approches de la constitution de corpus de textes médiévaux se dessinent depuis une dizaine d'années déjà : 1. numérisation d'éditions critiques modernes ; 2. création de transcriptions diplomatiques précises de manuscrits, éventuellement accompagnées des images des originaux. Ces approches sont en réalité plutôt complémentaires qu'opposées, car elles permettent aux chercheurs de faire le choix entre la quantité (représentativité) et la qualité (sûreté et richesse) des données en fonction de la recherche effectuée. Pour les deux types de corpus nous analysons les enjeux de l'utilisation d'une représentation normalisée du texte et de son 'ancrage' signalétique (norme XML et conventions de représentation TEI). Les problèmes méthodologiques qui se posent lors de la création et de l'exploitation des corpus de textes anciens, et leurs solutions sont aussi valables pour d'autres types de corpus linguistiques.


  • Valérie BEAUDOUIN (France Télécom R & D)
    Mètre en règles
    (Metrics in rules)
    pp. 119-137

    Cet article rend compte d’une expérience d’analyse systématique des aspects métriques et rythmiques d’un corpus de près de 80 000 vers. Des outils d’analyse du vers ont été construits à partir de briques de Traitement Automatique des Langues déjà existantes. Nous défendons une approche expérimentale et cumulative qui consiste à enrichir la description des vers par des traits de nature différente (morphosyntaxe, accent, rime…) qui portent sur des unités de taille différente (position métrique, hémistiche, vers, couple de vers), et qui sont construits avec des outils hétérogènes. Cette intégration dans une seule base de données permet de valider des hypothèses classiques sur le vers et de tester de nouvelles hypothèses portant en particulier sur les corrélations entre niveaux d’analyse. Cette approche expérimentale s’appuie sur les savoirs traditionnels sur le vers, mais elle est aussi en mesure de faire évoluer les théories ou hypothèses dominantes en faisant émerger de nouvelles formes de régularités, peu visibles à l’œil nu, et des corrélations inattendues entre phénomènes relevant de plusieurs niveaux linguistiques.


Resenhas
  • Mécanique des signes et langage des sciences, de Y. Bréchet, P. Jarry & F. Letoublon
    par M. Arrivé
    pp. 138-139
  • La variation sociale en français, de F. Gadet
    par M. Debrock
    pp. 140-141
  • Le français en Tunisie, de H. Naffati & A. Queffélec
    par L. Abouda
    pp. 142-143