Skip to main content
Welcome. This site supports keyboard navigation and screen readers. Press ? at any time for keyboard shortcuts. Press [ to focus the sidebar, ] to focus the content. High-contrast themes are available via the toolbar.
serard@dev00:~/cv

Le méta-modèle du mot

Un mot est un faisceau — pages 04, 08, 09 d'Ontologie du mot et ce qu'elles apportent à la pile M0-M3.

Rappel de contexte. Ce .md fait partie du dossier d'analyse croisée entre le PPTX récent Ontologie du mot (12 slides) et la série philosophique machine-à-projection-v2. Il se concentre sur ce que la série v2 ne fait pas — traiter les mots comme structures méta-modélisables — et sur le gain théorique qu'il y aurait à le faire. Le lecteur qui ouvre ce fichier directement peut se reporter au besoin à 00-synthese-cooperative.md.


1. L'anatomie du mot (page-04) : deux colonnes symétriques

La page-04 pose le cadre formel.

Anatomie du mot, page-04

Texte de la slide :

Mot

Champs d'explication du mot : Etymologie — Par Extension — Mathématique — Bases de données — Synonymes — Antonymes

Application du mot : Etymologie — Par Extension — Spécialement — Explication dans le champ d'application — Mots synonymes — Mots antonymes

Genre : Masculin — Féminin

Trois blocs. À gauche, les six champs d'explication (les réservoirs sémantiques disponibles). Au centre, les six applications correspondantes (leur mise en œuvre dans un énoncé concret). À droite, le nœud convergent Mot. En satellite, le Genre — morphologie orthogonale.

La distinction Champs d'explication vs Application du mot rejoue la distinction meta-model vs model de 03-pile-m0-m3.md : le champ est M2 (ce qui définit ce qu'un mot peut être), l'application est M1 (ce qu'un mot est dans un cas donné).

Autrement dit : la page-04 est la pile M0-M3 rejouée à l'intérieur d'un mot. Chaque mot a son M2 (les six champs) et son M1 (les six applications instanciées pour un usage précis). L'Etymologie comme champ est abstraite (« quelle est la généalogie possible de ce mot ? ») ; l'Etymologie comme application est concrète (« dans cet emploi, voici la filiation pertinente »). Même mot, deux niveaux. L'opération realizes de v2 — « An element may "realize" (being an instance of) a "typed" thing » — s'applique littéralement : chaque application réalise son champ.

Fait nouveau par rapport à v2 : l'inclusion explicite de Bases de données parmi les champs d'explication. Ce n'est pas une coquille pédagogique. C'est l'affirmation que tout mot courant mobilise déjà une ontologie technique. Quand je dis client, je mobilise à la fois l'étymologie latine (cliens), l'acception économique (l'acheteur), l'acception informatique (le logiciel qui contacte un serveur), et la colonne de base de données (le tuple avec un id). Ces champs coexistent dans le mot ; ils ne sont pas des sens concurrents à départager, ils sont des registres simultanément disponibles.

2. Le gabarit Etym × 5 (page-08) : un squelette de DSL

La page-08 radicalise le geste.

Gabarit Etym × 5, page-08

Texte minimal :

Mot

Etym — Etym — Etym — Etym — Etym

Cinq boîtes vertes toutes étiquetées Etym, une boîte bleue Mot. Slide-squelette : moment M2 pur — on pose la forme du mot avant tout contenu. Équivalent français du meta-model v2, à la différence près que la forme ici est déjà multiple par construction. Pont vers 09-pont-compilateur.md : un gabarit paramétrable = un DSL — le mot Etym occupe la même place qu'un slot typé dans un générateur de code.

C'est un point dur. La v2 ne pose jamais le mot comme un objet méta-modélisable dont on aurait le gabarit et les slots. Elle pose des concepts (M0, M1, M2, M3), des verbes (impress, realizes, defines), des piles. Mais pas de schema du mot. Le PPTX affirme, par une seule slide, qu'un mot est un agrégat typé de n étymologies simultanées — pas une, pas deux qui se succéderaient historiquement, mais n en parallèle.

Cette affirmation a une conséquence forte. Si un mot est déjà un faisceau de n étymologies, alors la désambiguïsation classique (choisir un sens parmi d'autres) est un appauvrissement méthodologique. La vraie opération n'est pas choisir mais pondérer — donner à chaque étymologie son poids dans le contexte. Le compilateur mou de M3 auto-référé (v2/04) pourrait opérer exactement cette pondération : typer chaque occurrence d'un mot par la distribution des étymologies pertinentes à ce point de la phrase.

3. La dissection de De (page-09) : la preuve par le monosyllabe

La page-09 instancie le gabarit sur le plus petit mot français.

Dissection de De, page-09

Texte :

De

Ablatif — Provenance — Particule nom de famille / Indique possession — Appartenance à nombre — Appartenance à groupe

Six acceptions hétérogènes : case grammaticale latine (ablatif), relation spatio-causale (provenance), marqueur sociologique de classe (particule nobiliaire), opérateur possessif, quantificateur (beaucoup de livres), appartenance ensembliste (l'un de nous). La slide instancie le gabarit de page-08 sur le mot français de — monosyllabe apparemment trivial, que la page révèle comme un opérateur logique polysémique. Ce que fait la slide, c'est démontrer par un seul mot-outil que la grammaire est déjà une ontologie : quand on dit de, on mobilise sans le savoir six catégories logico-métaphysiques. Le plus petit mot est le plus chargé.

L'argument est irréfutable. On ne peut pas dire de sans mobiliser l'une des six catégories ; et le contexte seul tranche lequel. Pire encore : certains contextes activent plusieurs catégories simultanément. « Le nom de Roland Dumas » active possession (le nom appartient à RD) et provenance (le nom vient de RD) ; « Un chien de berger », provenance (le chien vient du berger) et appartenance à groupe (le chien est un type de chien) ; « Roland Dumas » (prononcé dee-mah par certains) active discrètement la particule nobiliaire comme fantôme absent — le de qui n'est pas là mais qui pourrait l'être.

4. Ce que l'appareil v2 gagne à intégrer ce méta-modèle

La série v2 parle beaucoup de modèles et de méta-modèles mais jamais de la grammaire interne du mot comme objet de modélisation. Ce décalage produit trois manques que le PPTX peut combler.

Manque 1 — la polysémie typée. La série v2, dans M3 auto-référé (v2/04), pose les trois verbes impress / realizes / defines comme des atomes opérationnels. Mais chacun de ces verbes a, dans sa forme anglaise, une polysémie qui reste non-typée. impress veut dire à la fois marquer / graver (sens physique), faire impression (sens psychologique), contraindre à servir (sens militaire, via impressment). realizes veut dire à la fois rendre réel et prendre conscience. defines veut dire délimiter et donner une définition. L'article v2/07 (Impressed differently (v2/07)) exploite magnifiquement la polysémie d'impress — mais il la traite comme un heureux accident du vocabulaire. L'appliquer au gabarit Etym × 5 de la page-08 la rendrait structurelle : chaque verbe aurait son faisceau d'étymologies pondérées selon le contexte. La pile M0-M3 gagnerait un étage fin — celui du mot comme objet méta-modélisable.

Manque 2 — le genre comme orthogonalité. Le satellite Genre : Masculin — Féminin de la page-04 n'est pas négligeable. Il affirme qu'à côté des six champs d'explication, chaque mot porte une propriété morphologique qui ne se laisse pas réduire au sens. Cette orthogonalité est un rappel utile pour le compilateur juridique : typer un mot par son genre est aussi primitif que typer un nombre par son signe. Le créancier et la créancière ont les mêmes champs d'explication mais un genre différent — qui peut porter des conséquences légales non-négligeables (dans les dispositifs d'égalité, par exemple). V2 ne thématise jamais cette orthogonalité ; elle devrait.

Manque 3 — l'open/closed par décomposition. Un DSL, dans ce corpus, est paramétré par une ontologie produite par un Source Generator, jamais bloqué sur une bibliothèque pré-construite. Le méta-modèle du mot des pages 04-08-09 est exactement la structure qu'un Source Generator peut consommer : Etymologie, Par Extension, Spécialement, Synonymes, Antonymes sont des slots typés qu'un générateur remplit à partir d'un dictionnaire annoté. Le mot n'est plus figé dans une entrée de lexique — il devient un registre extensible dont chaque étymologie est un type paramétré par une source.

5. Proposition : décomposer impress / realizes / defines dans le gabarit

Voici la proposition concrète, à implémenter dans un article futur de la série v2 ou dans un prolongement d'Appareil et compilateur. Prendre les trois verbes de la page-23 du document 2017 (M3 auto-référé (v2/04)) et les dissequer selon le gabarit page-08 :

Diagram
Les trois verbes de v2/04 passés au gabarit du mot — chaque verbe devient un faisceau typé

Chacun des trois verbes du M3 de v2 cesse d'être un atome et devient un faisceau pondéré. Selon le contexte de l'énonciation (le moment de la boucle R/G, l'état du sujet au sens de page-23/v2/07), telle étymologie s'active davantage. Le triplet M3 devient paramétrable au lieu d'être posé une fois pour toutes. C'est la version linguistique du feedback open/closed via generators : le M3 n'est plus un enum figé de trois verbes mais une ontologie paramétrée par la distribution des étymologies qui traversent chaque verbe.

6. Et ce que v2 apporte en retour

La proposition inverse est juste. Le méta-modèle du mot des pages 04-08-09 n'a pas, en l'état du PPTX, de théorie de ses propres niveaux méta. Il pose Mot = n Etym ; il ne dit pas ce qu'est une Etymologie en général (M2 de l'étymologie), ni ce qu'est un champ d'explication en général (M3 du cadre lexicographique). La pile M0-M3 de v2 fournit cette complétion : Mot est M1, Etym est M2, Champs d'explication est M3. Le gabarit Etym × 5 devient alors auto-référentiel au sens de la page-21 du document 2017 — la liste des cinq Etym est elle-même une étymologie, et le gabarit se type lui-même.

Le dialogue est donc mutuel. Ontologie du mot fournit la matérialité grammaticale que v2 ne développe pas ; v2 fournit l'appareil méta-nivelé que le PPTX laisse implicite.


Voir aussi : 01-grammaire-comme-ontologie.md (le niveau supérieur — la grammaire du GN et de la phrase) ; 03-rosace-whiteheadienne.md (le niveau supérieur encore — la top-level ontology) ; 05-ponts-vers-compilateur.md (les conséquences pour le compilateur juridique).

⬇ Download