|
|
Traditionnellement, les deux ontologies, WordNet et les champs lexicaux étaient construits à la main, les linguistes ne se fiant qu’à l’introspection et à leur connaissance du monde. Cette méthode plutôt subjective a été améliorée, voire remplacée, par des ressources générées par ordinateur en s’appuyant sur des collections de texte immenses (notamment Internet), l’analyse grammaticale automatique et les statistiques. Par exemple, il existe des champs lexicaux générés automatiquement, sous la forme de réseaux de cooccurrences (Leipzig Wortschatz), et des dictionnaires de relations (DeepDict, Sketch Engine). Ils extraient automatiquement, par exemple, ce qu’un cheval (a) peut être [sauvage, sombre, en bois, de Troie], (b) peut faire [hennir, galoper, trotter] ou (c) ce qu’on peut lui faire [attacher, brosser], simplement en analysant des phrases dans lesquelles le mot cheval a la fonction syntaxique de noyau de groupe nominal, de subjet ou d’objet.
|