|
(b) совершать действия [ржать, скакать галопом, рысью], или (c) что его можно [оседлать, ухаживать за ним], просто они оценивают фразы, в которых слово лошадь имеет синтаксическую функцию главного действующего лица, субъекта или объекта соответственно.
|
|
Traditionally, both ontologies, WordNets and word fields have been built by hand, with linguists relying solely on introspection and world knowledge. This somewhat subjective method has since been enhanced, and sometimes replaced, by computer-generated resources drawing on huge electronic text collections (like the internet), automatic grammatical analysis and statistics. Examples are automatically generated word fields in the form of co-occurence webs (Leipzig Wortschatz), or relational dictionaries (DeepDict, Sketch Engine). They syntactically extract what, for instance, a horse can (a) be [wild, dark, wooden, Trojan], (b) do [neigh, gallop, trot], or (c) have done to [tether, groom], simply by evaluating sentences where the word horse has the syntactic function of noun phrase head, subject or object, respectively.
|
|
Traditionnellement, les deux ontologies, WordNet et les champs lexicaux étaient construits à la main, les linguistes ne se fiant qu’à l’introspection et à leur connaissance du monde. Cette méthode plutôt subjective a été améliorée, voire remplacée, par des ressources générées par ordinateur en s’appuyant sur des collections de texte immenses (notamment Internet), l’analyse grammaticale automatique et les statistiques. Par exemple, il existe des champs lexicaux générés automatiquement, sous la forme de réseaux de cooccurrences (Leipzig Wortschatz), et des dictionnaires de relations (DeepDict, Sketch Engine). Ils extraient automatiquement, par exemple, ce qu’un cheval (a) peut être [sauvage, sombre, en bois, de Troie], (b) peut faire [hennir, galoper, trotter] ou (c) ce qu’on peut lui faire [attacher, brosser], simplement en analysant des phrases dans lesquelles le mot cheval a la fonction syntaxique de noyau de groupe nominal, de subjet ou d’objet.
|
|
Herkömmlicherweise wurden beide Sachverzeichnisse, WordNets und Wortfelder, von Hand zusammengestellt, und zwar von Linguisten, die sich einzig auf ihre eigene Erfahrung und ihr Weltwissen stützten. Diese etwas subjektive Methode wurde inzwischen verbessert und manchmal ersetzt durch computerbasierte Quellen, die ihr Material aus riesigen elektronischen Textsammlungen (wie dem Internet), automatischen grammatischen Analysen und Statistiken beziehen. Beispiele sind automatisch generierte Wortfelder in der Form von Fundstellen-Webseiten (Leipzig Wortschatz), relationale Wörterbücher (DeepDict, Sketch Engine). Sie suchen aus Sätzen heraus, was zum Beispiel ein Pferd alles (a) sein kann [wild, dunkel, hölzern, trojanisch], (b) tun kann [wiehern, galoppieren, trotten] oder (c) was man ihm tun kann (es anbinden, striegeln), einfach indem man Sätze auswertet, in denen das Wort Pferd die syntaktische Funktion des Schlüsselworts einer Nominalphrase beziehungsweise des Subjekts oder Objekts innehat.
|
|
Tradicionalmente, ambas ontologías, tanto los WordNet como los campos léxicos han sido creados a mano, por lingüistas que se apoyaban plenamente en la introspección y el conocimiento de las palabras. Este método, de alguna forma subjetivo, ha sido perfeccionado y a veces reemplazado por otros recursos generados por ordenador que utilizan enormes recopilaciones electrónicas de textos (como internet), análisis gramaticales automáticos y estadísticas. Por ejemplo, existen campos léxicos generados automáticamente bajo la forma de redes de co-ocurrencia (Leipzig Wortschatz), o diccionarios combinatorios (DeepDict, Sketch Engine). Lo que hacen éstos es extraer lo que puede (a) ser , por ejemplo, un caballo (salvaje, oscuro, de madera, de Troya), (b) hacer (relinchar, galopar, trotar) o (c) se le puede hacer (atar, cepillar), simplemente analizando frases donde la palabra caballo tiene la función sintáctica de núcleo de un sintagma nominal, de sujeto o complemento.
|
|
Tradizionalmente, entrambe le ontologie, Wordnet e il campo lessico, sono state costruite a mano, da linguisti che si son basati esclusivamente sull'introspezione e la conoscenza delle parole. Questo metodo alquanto soggettivo è stato perfezionato e a volte rimpiazzato da altre risorse generate attraverso i computer che utilizzano enormi raccolte di testi elettronici (come internet), analisi grammaticali automatiche e statistiche. Ad esempio esistono campi lessici generati automaticamente sottoforma di co occorrenze (Leipzig Wortschatz), o dizionari combinatori (DeepDict, Sketch Engine). Essi estraggono ciò che può (a) essere, per esempio, un cavallo (selvaggio, scuro, di legno, di Troia), (b) fare (nitrire, galoppare, trottare), o (c) che gli si può fare (strigliare, legare, cavalcare), semplicemente valutando frasi in cui la parola cavallo ha la funzione sintattica di nucleo del sintagma nominale, soggetto o complemento rispettivamente.
|
|
Traditioneel zijn beide ontologieën, WordNets en woordvelden met de hand opgebouwd door taalkundigen, die uitsluitend vertrouwen op hun eigen taal-intuïtie en kennis van de wereld. Deze enigszins subjectieve methode is inmiddels verbeterd — en soms vervangen — door computer-gegenereerde middelen op basis van enorme elektronische tekstcollecties (bijvoorbeeld internet), automatische grammaticale analyse en statistiek. Voorbeelden zijn automatisch gegenereerde woordvelden in de vorm van een samen-voorkomen-net (Leipzig Wortschatz), of relationele woordenboeken (DeepDict, Sketch Engine). Ze halen syntactisch uit, bijvoorbeeld (a) welke soort kan een paard zijn [wild, donker, houten, Trojaans], (b) wat kan het doen [hinniken, galop, draf], of (c) wat kan men er mee doen [teugelen, opmaken], simpelweg door het evalueren van zinnen waar het woord paard de syntactische functie vervult van substantiefgroep-kern, onderwerp of object.
|
|
По традиция, и онтологиите, и електронните речници от типа WordNet, и семантичните полета на думите са създанени ръчно, от лингвисти, които разчитат единствено на самонаблюдението и световното знание. Това е донякъде субективен метод, който се подобрява, а понякога и заменя, от компютърно генерирани средства, използващи огромни електронни текстови колекции (като интернет), автоматичен граматически анализ и статистика. Примери са автоматично генерираните семантични полета в уеб форми (Leipzig Wortschatz) или релационни речници (DeepDict, Sketch Engine). Те синтактично извличат, например, че един кон може (а) да бъде [див, тъмен, дървен, троянски], (б) да извършва действия [да цвили, галопира, тича в тръс] или да го [връзват, отглеждат] просто чрез оценка на изречения, където думата кон има синтактична функция съответно на главна част в именна фраза, предмет или обект.
|
|
Tradicionalno su i ontologije, mreže riječi i semantička polja riječi stvoreni ručno od strane lingvista koji su vjerovali svojoj vlastitoj intuiciji i razumijevanju svijeta. Tu ponešto subjektivnu metodu danas podupiremo a ponekad i zamijenjujemo metodom traženja resursa putem kompjutera iskorištavajući gigantske elektroničke korpuse tekstova (npr. na internetu), provodimo automatsku analizu gramatike ili statistiku. Primjeri su automatsko stvorena semantička polja u obliku slučajne mreže (Leipzig Wortschatz), ili rječnika odnosa (DeepDict, Sketch Engine) koji ekstrahiraju sintaktički, npr. (a) kakav može biti konj (divlji, tamni, drveni, trojanski), (b) što može raditi (hrzati, galopirati, kasati) ili (c) što mu možemo napraviti (jašiti ga, upregnuti ga, vezati ga), jednostavno analizirajući rečenice gdje riječ konj vrši sintaktičku funkciju imeničke grupe-srži rečenice odnosno subjekta ili objekta.
|
|
Traditionel er både ontologier, OrdNet og ordfelter blevet opbygget manuelt, og lingvisterne har brugt deres viden om verden og introspektion til formålet. Denne noget subjektive metode er nu blevet understøttet, og sommetider erstattet, af computer-skabte redskaber, der trækker på gigantiske elektroniske tekstsamlinger (fx Wikipedia eller Internettet), automatisk grammatisk analyse og statistik. Eksempler er automatisk genererede ordfelter i form af samforkomst-netværk (Leipzig Wortschatz), eller relationelle ordbøger (DeepDict, Sketch Engine). Disse værktøjer kan så selv automatisk udlede hvad en hest kan (a) være [vild, sort, trojansk], (b) gøre [vrinske, trave] eller (c) blive udsat for [tøjle, strigle], simpelthen ved at analysere sætninger hvor ordet hest optræder med en syntaktisk funktion som henholdsvis substantivsyntagmekerne, subjekt (grundled) eller objekt (genstandsled).
|
|
Mõlemad ontoloogiad, nii WordNet kui ka sõnaväljad on lingvistid loonud käsitsi, toetudes ainuüksi enese ja maailma teadmistele. Seda kuigivõrd subjektiivset meetodit on tõhustatud ja vahel asendatud arvuti loodud allikatega, luues hiiglasliku elektroonilise tekstikogu (nagu Internet), automaatilise grammatilise analüüsi ja statistika. Näited selle kohta on automaatselt loodud sõnaväljad netivõrkudes (Leipzig Wortschatz) või relatsioonilised andmebaasid (DeepDict, Sketch Engine). Nad võtavad süntaktiliselt kokku, mis võib näiteks hobune (a) olla [metsik, mustaverd, puust, Trooja], (b) teha [hirnuda, galopeerida, traavida], või mida (c) temaga saab teha [valjastada, sugeda]. Hinnatakse lihtsalt lauseid, kus sõnal hobune on nimisõnafraasis süntaktiline, vastavalt kas subjekti või objekti funktsioon,
|
|
Hagyományosan, mind az ontológiákat, WordNeteket, mind a jelentésmezőket manuálisan hozták létre, a nyelvészek saját tapasztalataikra és világismeretükre támaszkodtak. Ezt a kissé szubjektív módszert javították, sőt néha helyettesítik a számítógépes erőforrások, melyek nagy szöveggyűjteményekre, ún. korpuszokra támaszkodnak (pl az internet), automatikus nyelvtani elemzésre és statisztikára. Például automatikusan generált jelentésmezők, melyeket az együttes előfordulásokból merítenek (Lipcsei Szókincs) vagy relációs szótárak (DeepDict, Sketch Engine). Ezek a szintaktikai szerkezetekből kivonják, például egy ló (a) milyen lehet [vad, sötét, fából készült, trójai], (b) mit tud csinálni [nyerít, galoppol, üget], vagy (c) mit lehet vele csinálni [lovagol, befog] egyszerűen kiértékelve azokat a mondatokat, ahol a ló szó szintaktikai funkciója: a főnévi csoport feje, alany vagy tárgy.
|
|
Tradiciškai, tiek ontologijos, tiek elektroninių tezaurų ( tokių kaip WordNet), semantinius laukus sudarinėjo lingvistai, remdamiesi savo stebėjimais ir pasaulio žiniomis. Šis kiek subjektyvokas metodas dabar yra praplėstas, o kartais ir pakeičiamas kompiuterine analize, generuojant resursus, kurie remiasi didžiuliais tekstiniais resursai (pavyzdžiui, Internetu), automatizuota gramatinė analize ir statistika. Pavyzdžiu gali būti automatinis generavimas semantinių laukų iš formų sutinkamų interneto puslapiuose (Leipzig Wortschatz), arba reliaciniai žodynai (DeepDict, Sketch Engine). Jie sintaksės keliu gauna informaciją apie tai, kad arklys gali būti (a)[ laukinis, tamsus, medinis, Trojos], b) atlikti veiksmus [žvengti, šuoliuoti, ristele], arba c) juos galima [balnoti, prižiūrėti]), tiesiog vertina frazes, kuriuose žodis arklys turi sintaksės veiksnį, atitinkamai subjekto arba objekto.
|
|
Tradycyjnie, językoznawcy budowali obie klasyfikacje – bazy WordNet i pola wyrazowe – „ręcznie”, tj. opierając się wyłącznie na własnej introspekcji i znajomości świata. Ta nieco subiektywna metoda jest obecnie ulepszona, a niekiedy zastępowana, przez źródła generowane komputerowo, oparte na olbrzymich korpusach tekstów elektronicznych (na przykład tekstach z Internetu), z automatyczną analizą gramatyczną i obliczeniami. Przykładem mogą być automatycznie generowane pola leksykalne w formie sieci współwystępowań (Leipzig Wortschatz), lub słowniki relacyjne (relacyjne bazy danych) (DeepDict, Sketch Engine). Za ich pomocą można np. uzyskać następujące informacje dotyczące konia: a) jaki może być (dziki, czarny, drewniany, trojański), b) co może robić (rżeć, galopować, kłusować), c) co można z nim robić (uwiązywać, oporządzać). Informacja taka jest wydobywana poprzez sprawdzanie i ocenę zdań, w których wyraz koń pełni składniową funkcję, odpowiednio: centrum frazy rzeczownikowej, podmiotu i dopełnienia.
|
|
În mod tradițional ambele registre de inventar, Wordnets și câmpuri lexicale au fost construite de mână/manual, și anume de lingviști care s-au sprijinit singuri pe propria lor experiență și cunoaștere. Această oarecum subiectivă metodă a fost între timp îmbunătățită și uneori înlocuită de surse bazate pe computer(colecții uriașe de texte electronice) analize și statistici automate gramaticale. De exemplu, există câmpuri lexicale generate automat, sub forma de rețele de co-ocurență (Leipzig Wortschatz), dicționare relaționale (DeepDict, Sketch Engine). ele extrag automat, de exemplu ce un cal(a) poate fi [sălbatic,închis, de lemn, troian], (b) poate face [a necheza, a galopa, a tropăi] sau (c) ce se poate face cu el (lega, țesăla), analizând simplu propozițiile în care cuvântul cal are funcția sintactică de cuvânt cheie al unui grup nominal , de subiect sau complement direct.
|
|
Tradične sa WordNet-y aj sémantické polia založené na ontologických prístupoch ešte v nedávnej minulosti zostavovali manuálne a lingvisti sa spoliehali výhradne na vlastnú introspekciu a znalosti o svete.Táto do istej miery subjektívna metóda sa dnes začína dopĺňať a niekedy aj nahrádzať zdrojmi vygenerovanými počítačmi, ktoré využívajú obrovské súbory elektronických textov (ako napr. internet), automatické gramatické analýzy a štatistiky. Ako príklad môžeme uviesť automaticky generované sémantické polia na základe spoluvýskytu slovných tvarov na weboch (Leipzig Wortschatz) alebo relačných slovníkov (DeepDict, Sketch Engine). Tie vykonajú syntaktický výber napríklad (a) vlastností koňa [divý, tmavý, drevený, trójsky], (b) činností, ktoré kôň môže robiť [erdžať, cválať, klusať] alebo (c) činností, ktoré sa dajú s koňom robiť [uviazať, česať] jednoduchým vyhodnotením viet, v ktorých má slovo kôň syntaktickú funkciu hlavy mennej frázy, podmetu alebo predmetu v tomto poradí.
|
|
Tradicionalno sta obe ontologiji, tako WordNets kot tudi besedna polja, narejeni ročno, s strani lingvistov, ki so se lahko zanesli le na introspekcijo in svoje znanje. Ta nekoliko subjektivna metoda je bila v zadnjem času razširjena in do določene mere nadomeščena z računalniško generiranimi viri, ki črpajo iz ogromne elektronske zbirke besedil (na primer interneta), automatično slovnično analizo in statistiko. Kot primere lahko navedemo avtomatično generirana besedna polja v obliki mrež sopojavljanja (Leipzig Wortschatz) ali slovarja odnosov (DeepDict, Sketch Engine), ki sintaktično izvlečejo kaj na primer konj lahko (a) je [divji, temen, lesen, trojanski], (b) dela [rezgeta, galopira] ali (c) kaj lahko z njim delamo [privežemo, krtačimo] in sicer tako, da oceni stavke, v katerih se konj pojavlja v sintaktični funkciji samostalniške fraze kot jedro oziroma objekt in subjekt.
|
|
Traditionellt har ontologier och WordNets såväl som ordfält byggts för hand, av lingvister som förlitat sig enbart på introspektion och kunskap om världen. Denna något subjektiva metod har sedan dess förbättrats, och ibland ersatts, av datorskapade resurser som blivit möjliga tack vare enorma elektroniska textsamlingar (som Internet), automatisk grammatisk analys och statistik. Några exempel är autogenererade ordfält i form av samförekomst-nätverk (Leipzig Wortschatz) eller relations-orlistor (DeepDict, Sketch Engine). De extraherar syntaktiskt vad, till exempel, kan en häst (a) vara [vild, mörk, av trä, Trojansk], (b) gör [gnägga, galoppera, trava], eller (c) vad den kan utsättas för [tjudra, rykta], helt enkelt genom att utvärdera meningar där ordet horse (häst) fungerar syntaktiskt som huvudord i en substantivfras, respektive subjekt eller objekt.
|
|
Parasti ontoloģijas, WordNet-us un semantiskos laukus valodnieki ir veidojuši, paļaujoties vienīgi uz pašanalīzi un pasaules zināšanu. Šāda kaut kādā mērā subjektīva metode šobrīd ir pilnveidota un dažreiz ir aizstājama ar datoru radītiem resursiem, pamatojoties uz milzīgām elektronisko tekstu kolekcijām (tādām, kā internets), automātisko gramatikas analīzi un statistiku. Par piemēru var būt automātiski radīti semantiskie lauki, tādi kā kopsastopamības tīkli (Leipzig Wortschatz) vai vārdu sakaru vārdnīcas (DeepDict, Sketch Engine). Viņi sintaktiski noteic, ka, piemēram, zirgs (a) var būt [savvaļas, tumšs, koka, Trojas], (b) var darīt [zviegt, aulekšot, rikšot] vai (c) ko var darīt ar zirgu [piesiet, kopt], vienkārši vērtējot teikumus, kuros vārdam zirgs piemīt nominālās vārdkopas galvenā locekļa sintaktiska funkcija vai, attiecīgi, subjekta vai objekta sintaktiskas funkcijas.
|
|
Go traidisiúnta, is le lámh a thógtaí ointeolaíochtaí, WordNets agus agus réimsí focal, agus teangeolaithe ag brath go hiomlán ar inbhreithniú agus eolas faoin domhan. Tá an modh beagán suibiachtúil seo arna fheabhsú ó shin trí acmhainní a ghineann ríomhaire atá bunaithe ar bhailiúcháin téacs leictreonacha ollmhóra (cosúil leis an idirlíon), anailís gramadaí uathoibríoch agus staitisticí. Samplaí is ea réimsí focal a ghintear go huathoibríoch le gréasáín comhtharlúcháin (Leipzig Wortschatz), nó foclóirí coibhneasta (DeepDict, Sketch Engine). Tríd an gcomhréir tagann siad ar na nithe seo a leanas, mar shampla: mar is féidir le capall (a) a bheith [fiáin, dorcha, d'adhmad, Traíoch], (b) rudaí a dhéanamh [seitreach, sodar, dul ar chosa in airde], nó (c) go ndéanfaí rudaí dó [a cheangal, grúmaeireacht], trí abairtí ina bhfuil an focal capall le feidhm comhréire mar ainmní nó cuspóir, faoi seach, a mheas.
|