Bref Résumé
Ce cours porte sur la cartographie syntaxique et ses interfaces entre la syntaxe combinatoire et les systèmes de sons et de sens. Il aborde les fondements du calcul syntaxique, la cartographie de la phrase, les propriétés sémantiques et discursives, et la question de l'acquisition des structures cartographiques. Le cours explore également la portée illimitée des capacités linguistiques humaines, en s'appuyant sur les travaux de Chomsky, Descartes et Galilée.
- Le cours examine comment les humains peuvent produire un nombre infini de phrases à partir d'une expérience linguistique finie.
- Il explore la distinction entre le lexique substantiel et le lexique fonctionnel, ainsi que l'évolution des computations syntaxiques vers des opérations plus abstraites.
- Le cours introduit le concept de "merge" comme opération fondamentale de construction de la structure, et examine sa présence dans les langues naturelles et les systèmes de communication animale.
Introduction au Cours et Programme [0:22]
Le cours de cette année est centré sur la cartographie syntaxique et ses interfaces, notamment entre la composante syntaxique combinatoire et les systèmes de sons et de sens. Le programme comprendra une exploration des ingrédients de base du calcul syntaxique, une introduction à la cartographie de la phrase, et une analyse des propriétés sémantiques (argumentales et de portée) et discursives exprimées syntaxiquement. Une partie du cours sera consacrée à la description et à l'explication des généralisations empiriques observées à travers les langues, ainsi qu'à la distinction entre sujet et topique. Le cours se conclura par une discussion sur l'acquisition des structures cartographiques par les enfants.
Séminaires et Colloque [4:23]
Une série de séminaires suivra les cours, avec des présentations sur des sujets variés tels que les langues des signes, la micro-comparaison entre les langues, et l'interface syntaxe-sémantique. Un colloque d'une journée sur la cartographie syntaxique et les langues africaines est également prévu, mettant en lumière les contributions de la linguistique africaine à ce domaine.
La Portée Illimitée des Capacités Linguistiques Humaines [7:31]
La question fondamentale abordée est la capacité humaine à produire un nombre indéfini de nouvelles phrases à partir d'une expérience limitée. Cette capacité, soulignée par Chomsky, Descartes et Galilée, distingue qualitativement l'homme de l'animal et de la machine. Descartes observe que même une personne peu brillante peut composer un discours pour exprimer ses pensées, une capacité que les animaux et les machines de son époque ne possédaient pas.
Universalité de la Raison et Intelligence Artificielle [11:34]
Descartes souligne que les machines peuvent exceller dans certaines tâches, mais elles manquent de l'universalité de la raison humaine. Chaque action particulière nécessite une disposition spécifique, contrairement à la raison qui peut servir en toutes sortes de rencontres. Cette observation fait écho aux débats modernes sur le test de Turing et la possibilité d'une intelligence artificielle générale. Les modèles de langage actuels, comme ChatGPT, montrent des difficultés systématiques par rapport à la structuration hiérarchique des énoncés linguistiques, accessible même à un enfant de 5 ans.
La Combinatoire Linguistique selon Galilée et Arnaud et Lancelot [14:39]
Galilée met en avant l'invention de l'écriture alphabétique comme la plus grande invention du génie humain, car elle permet de communiquer les pensées les plus cachées avec une simplicité remarquable. Il souligne que l'écriture est fondée sur l'observation empirique que le langage est un système combinatoire, partant de quelques dizaines de sons pour former un ensemble potentiellement illimité de phrases. Arnaud et Lancelot font la même observation directement en termes de langue naturelle, soulignant l'infinie variété de mots qui permet d'exprimer tous les divers mouvements de notre âme.
Usage Infini de Moyens Finis et la Critique du Béhaviorisme [18:40]
Humboldt formule la question de la combinatoire linguistique en termes d'un usage infini de moyens finis. Chomsky critique le béhaviorisme pour son incapacité à expliquer comment les apprenants font certaines analogies et pas d'autres. Il propose que nous ayons intériorisé un système computationnel, une grammaire, qui engendre ce type d'éléments et nous permet de reconnaître un item nouveau comme faisant partie de notre capacité linguistique.
Les Piliers de l'Approche Chomskienne et la Constitution des Sciences Cognitives [21:32]
La thèse de Chomsky, "Logical Structure of Linguistic Theory", son ouvrage "Syntactic Structures", et son compte-rendu de "Verbal Behavior" de Skinner sont les piliers de cette approche. Chomsky montre que les caractéristiques du langage ne peuvent pas être traitées de manière intéressante par le béhaviorisme, et propose une nouvelle approche qui a eu une influence fondatrice sur la constitution du paradigme des sciences cognitives. La linguistique a été l'une des disciplines inspiratrices de la nouvelle manière d'étudier l'esprit humain.
Mécanisme Computationnel et Inventaires [23:38]
Pour comprendre la nature du mécanisme computationnel que nous maîtrisons, il faut identifier deux types d'éléments : des inventaires (lexique) et des règles combinatoires. Le lexique contient des entités à deux faces (son et sens), et les règles combinatoires permettent de mettre ensemble les éléments des inventaires pour former des entités d'ordre supérieur. L'élément crucial dans ce système est le caractère récursif des règles, qui permet de réappliquer la règle sur son propre résultat indéfiniment.
Créativité Gouvernée par des Règles et la Notion d'Interface [25:48]
Ce système permet de traiter ce qui a été appelé la créativité gouvernée par des règles. Il faut croiser l'aspect combinatoire avec la propriété fondamentale du langage d'être un symbole des états de l'âme. La notion d'interface devient pertinente ici, car notre système combinatoire doit pouvoir échanger de l'information avec les systèmes sensorimoteurs et les systèmes de pensée. Il y a donc au moins deux interfaces : l'interface phonétique et l'interface sémantique.
Langues des Signes et Généralisation du Système [34:59]
Il faut généraliser ce type de système pour inclure les langues des signes, qui utilisent un autre canal (gestuel-visuel). Ces systèmes sont des langues naturelles à part entière, avec un lexique, une morphologie, une syntaxe et une sémantique. Les langues des signes soulèvent des questions importantes sur le rôle du canal utilisé : est-il fondamentalement indifférent, ou y a-t-il des propriétés spécifiques liées aux modalités choisies ?
Constance des Questions et Évolutions dans la Grammaire Générative [37:38]
Les questions fondamentales de la grammaire générative sont restées constantes sur une période d'environ 70 ans. Cependant, il y a eu des changements importants, notamment en ce qui concerne les inventaires (lexique) et les computations. Au niveau du lexique, il y a eu un déplacement d'en phase du lexique substantiel vers le lexique fonctionnel. Au niveau des computations, les opérations sont devenues de plus en plus abstraites.
Lexique Substantiel vs. Lexique Fonctionnel [38:24]
On peut distinguer entre un lexique substantiel (noms, verbes, adjectifs) et un lexique fonctionnel (déterminants, auxiliaires, complémenteurs). Le lexique fonctionnel est devenu de plus en plus important car il crée des squelettes structuraux, déclenche les actions computationnelles, exprime les éléments de la variation, participe à l'interprétation, exprime les connecteurs logiques, et détermine l'ordre des mots.
Évolution des Computations et Abstraction Croissante [44:20]
Les computations sont devenues de plus en plus abstraites, passant de règles calquées sur les constructions grammaticales à des opérations plus générales comme "merge" (assemblage) et le mouvement. Les constructions grammaticales ne disparaissent pas, mais elles sont considérées comme des conglomérats d'opérations élémentaires et de choix dans le lexique fonctionnel. Les conditions générales sur l'application de règles sont également devenues plus abstraites, ouvrant la possibilité qu'il s'agisse de cas particuliers de principes de nature plus générale.
Trois Facteurs dans la Conception du Langage [52:11]
Chomsky propose que la constitution du savoir linguistique obéit à trois types de facteurs : des principes spécifiques de la faculté du langage (grammaire universelle), l'expérience, et des principes non spécifiques au langage (analyse statistique de données, efficacité computationnelle). Le programme minimaliste vise à enrichir le rôle de cette troisième classe de principes tout en simplifiant radicalement les principes spécifiques du langage.
L'Opération "Merge" et ses Caractéristiques [54:59]
"Merge" est l'opération combinatoire la plus simple possible : elle prend deux éléments et les met ensemble pour former un troisième élément. Il y a une asymétrie entre les deux éléments, l'un sélectionnant l'autre. L'opération est récursive, permettant de construire des structures arborescentes complexes. La question est de savoir si "merge" est une propriété universelle des langues naturelles.
Systèmes Linguistiques sans "Merge" et Communication Animale [59:27]
Pour répondre à cette question, il faut se demander à quoi ressembleraient des systèmes linguistiques sans "merge". On pourrait considérer des systèmes sans "merge" du tout, ou des systèmes avec "merge" non récursif. Ces systèmes ne permettraient que d'énoncer des mots isolés ou des structures de longueur maximale de deux mots. On trouve des systèmes de ce type dans la communication animale, par exemple le système de cris d'alarme chez les singes vervets.
Formes Rudimentaires de Combinatoire dans la Communication Animale [1:05:09]
Certaines espèces de primates non humains montrent des formes rudimentaires de combinatoire, comme chez les singes de Campbell qui peuvent combiner des signes avec un suffixe pour indiquer le niveau de danger. Chez les cercopithèques, on trouve des signaux complexes qui ne sont pas interprétés compositionnellement, mais qui servent à étendre l'inventaire de signes possibles. Ces formes combinatoires sont extrêmement limitées par rapport à ce qu'on trouve dans les langues humaines.
Similarités entre Communication Animale et Langues Humaines [1:08:32]
Malgré la discontinuité entre langage humain et systèmes animaux, il y a des éléments de continuité qui méritent d'être explorés. On trouve des contraintes de sélection, des contraintes d'ordre, et un début de distinction entre la fixation et la combinaison syntagmatique dans la communication animale.
Typologie de "Merge" et Hiérarchie de Complexité [1:12:41]
Une typologie de "merge" peut être utile pour comparer les systèmes de communication. On peut prendre deux éléments du lexique, un syntagme et un item du lexique, ou deux syntagmes déjà formés. Il y a une gradation de complexité entre ces trois types d'application. Le passage d'un système sans répositoire temporaire à un système avec répositoire permet le saut vers la récursivité.
Séquence de Systèmes Computationnels de Complexité Croissante [1:16:52]
On peut envisager une séquence de systèmes computationnels de complexité croissante : "merge" zéro (pas de "merge"), "merge" 1 (merge non récursif), "merge" 2 (avec un répositoire), et "merge" 3 (avec deux répositoires). La ligne qui distingue les systèmes de communication animale et le langage humain se situe au niveau de la disponibilité d'un répositoire, qui permet l'application récursive de "merge".
Comparaison entre Langage Humain et Communication Animale [1:20:24]
Bien que le langage humain soit incomparablement plus riche que les systèmes de communication animale, il est légitime de comparer les mécanismes de base pour identifier précisément à quel stade la divergence se manifeste. Toutes les langues adultes utilisent le système de "merge" dans sa pleine richesse, incluant l'assemblage récursif et la possibilité d'assembler des syntagmes complexes.