|
Parasti ontoloģijas, WordNet-us un semantiskos laukus valodnieki ir veidojuši, paļaujoties vienīgi uz pašanalīzi un pasaules zināšanu. Šāda kaut kādā mērā subjektīva metode šobrīd ir pilnveidota un dažreiz ir aizstājama ar datoru radītiem resursiem, pamatojoties uz milzīgām elektronisko tekstu kolekcijām (tādām, kā internets), automātisko gramatikas analīzi un statistiku.
|
|
Traditionally, both ontologies, WordNets and word fields have been built by hand, with linguists relying solely on introspection and world knowledge. This somewhat subjective method has since been enhanced, and sometimes replaced, by computer-generated resources drawing on huge electronic text collections (like the internet), automatic grammatical analysis and statistics. Examples are automatically generated word fields in the form of co-occurence webs (Leipzig Wortschatz), or relational dictionaries (DeepDict, Sketch Engine). They syntactically extract what, for instance, a horse can (a) be [wild, dark, wooden, Trojan], (b) do [neigh, gallop, trot], or (c) have done to [tether, groom], simply by evaluating sentences where the word horse has the syntactic function of noun phrase head, subject or object, respectively.
|
|
Traditionnellement, les deux ontologies, WordNet et les champs lexicaux étaient construits à la main, les linguistes ne se fiant qu’à l’introspection et à leur connaissance du monde. Cette méthode plutôt subjective a été améliorée, voire remplacée, par des ressources générées par ordinateur en s’appuyant sur des collections de texte immenses (notamment Internet), l’analyse grammaticale automatique et les statistiques. Par exemple, il existe des champs lexicaux générés automatiquement, sous la forme de réseaux de cooccurrences (Leipzig Wortschatz), et des dictionnaires de relations (DeepDict, Sketch Engine). Ils extraient automatiquement, par exemple, ce qu’un cheval (a) peut être [sauvage, sombre, en bois, de Troie], (b) peut faire [hennir, galoper, trotter] ou (c) ce qu’on peut lui faire [attacher, brosser], simplement en analysant des phrases dans lesquelles le mot cheval a la fonction syntaxique de noyau de groupe nominal, de subjet ou d’objet.
|