|
|
Traditionally, both ontologies, WordNets and word fields have been built by hand, with linguists relying solely on introspection and world knowledge. This somewhat subjective method has since been enhanced, and sometimes replaced, by computer-generated resources drawing on huge electronic text collections (like the internet), automatic grammatical analysis and statistics.
|
|
|
Традиционно как онтологии, так и электронные тезаурусы типа WordNet, семантические поля составлялись вручную лингвистами, опиравшимися на самонаблюдении и мировых знаниях. Этот несколько субъективный метод сейчас расширен, а иногда и заменяется, компьютерами для генерирования ресурсов, которые опираются на огромные текстовые ресурсы (такие, как Интернет), автоматизированный грамматический анализ и статистку. В качестве примера можно привести автоматические генерированные семантические поля из форм, встречаемые на веб-сайтах (Leipzig Wortschatz), или реляционные словари (DeepDict, Sketch Engine). Они синтаксическим путем добывают информацию о том, что конь может быть (a) [диким, темным, деревянным, Троянским], (b) совершать действия [ржать, скакать галопом, рысью], или (c) что его можно [оседлать, ухаживать за ним], просто они оценивают фразы, в которых слово лошадь имеет синтаксическую функцию главного действующего лица, субъекта или объекта соответственно.
|