|
|
Traditionally, both ontologies, WordNets and word fields have been built by hand, with linguists relying solely on introspection and world knowledge. This somewhat subjective method has since been enhanced, and sometimes replaced, by computer-generated resources drawing on huge electronic text collections (like the internet), automatic grammatical analysis and statistics. Examples are automatically generated word fields in the form of co-occurence webs (Leipzig Wortschatz), or relational dictionaries (DeepDict, Sketch Engine). They syntactically extract what, for instance, a horse can (a) be [wild, dark, wooden, Trojan], (b) do [neigh, gallop, trot], or (c) have done to [tether, groom], simply by evaluating sentences where the word horse has the syntactic function of noun phrase head, subject or object, respectively.
|
|
|
Tradycyjnie, językoznawcy budowali obie klasyfikacje – bazy WordNet i pola wyrazowe – „ręcznie”, tj. opierając się wyłącznie na własnej introspekcji i znajomości świata. Ta nieco subiektywna metoda jest obecnie ulepszona, a niekiedy zastępowana, przez źródła generowane komputerowo, oparte na olbrzymich korpusach tekstów elektronicznych (na przykład tekstach z Internetu), z automatyczną analizą gramatyczną i obliczeniami. Przykładem mogą być automatycznie generowane pola leksykalne w formie sieci współwystępowań (Leipzig Wortschatz), lub słowniki relacyjne (relacyjne bazy danych) (DeepDict, Sketch Engine). Za ich pomocą można np. uzyskać następujące informacje dotyczące konia: a) jaki może być (dziki, czarny, drewniany, trojański), b) co może robić (rżeć, galopować, kłusować), c) co można z nim robić (uwiązywać, oporządzać). Informacja taka jest wydobywana poprzez sprawdzanie i ocenę zdań, w których wyraz koń pełni składniową funkcję, odpowiednio: centrum frazy rzeczownikowej, podmiotu i dopełnienia.
|