Colocações

  • Manuel BARBERA (Turin, Italie)
    Les lexies complexes et leur annotation morphosyntaxique dans le Corpus Taurinense
    (Complex lexical units and their morphosyntactic treatment in the Corpus Taurinense)
    2000, Vol. V-2, pp. 57-70

    Le Corpus Taurinense (CT) est la version morphologiquement annotée d'ItalAnt Corpus, un corpus électronique de textes d'ancien italien (écrits entre 1251 et 1300). Nous essayons ici de décrire l'approche suivie dans le CT pour l'annotation des lexies complexes (MWUs 'multiword units'). La lexie complexe dans notre travail est un groupe de deux mots graphiques ou plus qui reçoit (aussi) une étiquette de partie du discours d'ensemble parce que ce groupe de mots est en relation paradigmatique avec une autre unité lexicale de la même partie du discours.Notre étiquetage de parties du discours confirme que la majorité des conjonctions composées de l'italien moderne n'était pas lexicalisée à cette époque. L'ordre des composants est déjà celui de l'italien moderne mais ces conjonctions peuvent encore être interrompues par des éléments occasionnels.


  • Paul BOGAARDS (Leiden, Pays-Bas)
    Les informations collocationnelles dans les dictionnaires
    (Collocational information in dictionaries)
    1997, Vol. II-1, pp. 31-42

    Hausmann (1979, 1984) propose une théorie intéressante concernant la catégorisation et l'analyse interne des collocations. Ce qui peut paraître moins clair, c'est la valeur pratique de cette théorie pour le traitement des collocations dans les dictionnaires. Dans cet article, la théorie hausmanienne est discutée et mise à l'épreuve dans une recherche expérimentale où des apprenants de français et de néerlandais devaient indiquer sous quel mot ils iraient chercher dans le dictionnaire s'ils ne connaissaient pas l'équivalent français d'une série de collocations néerlandaises.


  • Christiane FELLBAUM (Princeton, États-Unis)
    Transforming a Corpus into a Lexical Resource. The Berlin Idiom Project
    2005, Vol. X-2, pp. 49-62

    Nous décrivons les buts et les méthodes du projet lexicographique « Collocations et expressions idiomatiques dans la langue allemande » mené à l'Académie des Sciences de Berlin-Brandenburg. Un très gros corpus est étiqueté et analysé automatiquement afin de permettre de rechercher de façons multiples les structures ciblées, à savoir les expressions idiomatiques verbales allemandes. Sur la base des tokens pertinents, une analyse détaillée linguistico-lexicographique est effectuée et consignée sur un ensemble de formulaires structurés qui forment une sorte d'entrée d'un dictionnaire électronique pour la structure cible. Afin de faciliter la transparence ainsi que les futures recherches, chaque phénomène linguistico-lexicographique retenu est apparié aux éléments appropriés du corpus. La ressource qui en résulte, qui combine une description exhaustive des propriétés des expressions idiomatiques et les éléments du corpus, permet d'effectuer des types de recherches multiples.


    Keywords: 
  • François MANIEZ (Lyon 2)
    Le repérage par traitement automatique du défigement lexical des proverbes dans la presse américaine
    (Automatic retrieval of intentionally modified proverbs in the American press)
    2000, Vol. V-2, pp. 19-32

    Le recours à l'allusion par défigement lexical est un aspect de la prose journalistique qui peut faire obstacle à la compréhension de l'apprenant en langue étrangère. L'automatisation du repérage de ces allusions serait utile dans le cadre d'un système d'aide à la compréhension en ligne. A partir d'une base de données regroupant 10 500 titres d'articles de la presse américaine, nous analysons les références au fonds culturel anglo-saxon par défigement lexical. Dans le cas des allusions aux proverbes, diverses méthodes d'automatisation du repérage de ces défigements sont testées par comparaison de ces titres avec les 800 proverbes les plus courants de la langue anglaise.


  • Denis MAUREL (Tours)
    Un dictionnaire électronique relationnel pour les noms propres
    (An electronic dictionary for proper names)
    1997, Vol. II-1, pp. 101-111

    Après les simples listes de mots et les dictionnaires électroniques classiques, le dictionnaire électronique relationnel du projet Prolex utilise le modèle relationnel défini dans le cadre des bases de données. Sa représentation, sous la forme d'un transducteur à nombre fini d'états, permet une consultation rapide et un compactage efficace des données.


  • Agnès TUTIN (Grenoble 3)
    Coder les collocations dans un lexique formel pour le TALN
    (Encoding collocations in a formal lexicon for NLP)
    1997, Vol. II-1, pp. 43-58

    Nous examinons ici le modèle du "Dictionnaire Explicatif et Combinatoire" développé par I. Mel’cuk et ses collègues dans la perspective du TALN. Nous nous intéressons en particulier aux collocations cooccurrentes restreintes du type 'envie folle'ou 'perpétrer un délit'. Nous présentons tout d'abord quelques traits caractéristiques de ces associations lexicales, puis la façon dont les collocations sont codées dans le DEC à l'aide de fonctions lexicales syntagmatiques. Nous examinons ensuite les propriétés syntaxiques des collocations en faisant l'hypothèse que ces propriétés ne sont pas complètement idiosyncrasiques mais qu'un certain nombre de généralisations peuvent être effectuées dans une entrée collocative générique. Nous étudions la faisabilité de cette proposition sur un sous-ensemble de collocatifs d'intensité et proposons un format d'encodage rendant compte de ces généralisations.


    Keywords: 
  • Agnès TUTIN (Grenoble 3)
    Le dictionnaire de collocations est-il indispensable ?
    (On the necessity of collocation dictionaries)
    2005, Vol. X-2, pp. 31-48

    <p>Dans cet article, nous comparons deux dictionnaires de collocations (le <em>Dictionnaire des cooccurrents</em> de Beauchesne (2001) et le <em>Lexique Actif du Français</em> (Mel’cuk et Polguère, en préparation)) avec les versions électroniques de deux dictionnaires de langue de référence du français&nbsp;: le <em>Petit Robert Electronique</em> (version 2.1) et le <em>Trésor de la Langue Française Informatisé</em>. Nous essayons d’évaluer dans quelle mesure les dictionnaires spécialisés paraissent mieux adaptés que les dictionnaires de langue pour le traitement des collocations en examinant trois points&nbsp;: l’accès aux expressions, la quantité de collocations recensées et le traitement linguistique effectué sur les expressions.</p>


    Keywords: 
  • Agnès TUTIN (Grenoble 3)
    Collocations régulières et irrégulières : esquisse de typologie du phénomène collocatif
    (Regular and irregular collocations. Towards a typology of the collocation phenomenon)
    2002, Vol. VII-1, pp. 7-25

    Les collocations constituent une thématique essentielle dans les phénomènes de combinatoire lexicale, mais restent souvent définies de façon floue. Dans cet article, notre premier objectif est de proposer une définition plus claire du phénomène, en nous appuyant sur des paramètres rendant compte du degré de figement. Nous présentons ensuite quelques caractéristiques syntaxiques, puis quelques mécanismes sémantiques productifs dans la genèse des collocations imagées. Nous distinguons enfin les collocations de notions voisines.


    Keywords: