Valoda: nozīme un forma / Language: Meaning and Form 14, 2023, 156–173. [PDF]
https://doi.org/10.22364/vnf.14.11
Vārdkopas analogi „Latviešu valodas sintaktiski marķētajā korpusā”
Laura Rituma, Gunta Nešpore-Bērzkalne, Baiba Saulīte, Lauma Pretkalniņa
Matemātikas un informātikas institūts
Latvijas Universitāte
Raiņa bulvāris 29, Rīga, LV-1050, Latvija
E-pasts: laura.rituma@lumii.lv, gunta.nespore@lumii.lv, baiba.valkovska@lumii.lv, lauma.pretkalnina@lumii.lv
Latvijas Universitātes Matemātikas un informātikas institūtā tiek veidots „Latviešu valodas sintaktiski marķētais korpuss” (LVTB), kurā tiek marķētas gan latviešu valodas sintakses teorijā jau aprakstītās latviešu valodas sintaktiskās parādības, gan arī retākas, līdz šim gramatikās sīkāk neanalizētas konstrukcijas. Šajā rakstā aplūkota vārdkopas analoga izpratne latviešu valodniecībā, kā arī apkopoti līdz šim LVTB marķētie vārdkopas analogi un to klasifikācija. Sīkāks vārdkopas analogu iedalījums grupās balstīts uz noteiktiem gramatiskiem (vārdšķiras piederība un sintaktiskais raksturojums) un semantiskiem kritērijiem, šajos saliktajos teikuma locekļos nedaudz analizēta arī komponentu secība. Izplatītākie vārdkopas analogu veidi ir dažādu vietniekvārdu savienojumi, kā arī konstrukcijas ar prievārda savienojumu, kas nosauc daļu no kopuma. Pārējie parādās retāk, bet piemēru daudzums ir pietiekams, lai atklātu visos konstrukciju veidos lietoto leksēmu daudzveidību un izmantošanu dažādās sintaktiskajās funkcijās. Konsekventi vārdkopas analogu noteikšanas kritēriji un vienveidīgs sintaktiskais marķējums nodrošina ērti izmantojamu valodas materiālu turpmākai vārdkopas analogu un citu sintaktisko konstrukciju analīzei.
Atslēgvārdi: latviešu valodas sintakse; sintaktiski marķēts korpuss; vārdkopas analogs; salikts teikuma loceklis.
Analogue of subordinate phrase in Latvian Treebank
The Institute of Mathematics and Computer Science, University of Latvia, has developed Latvian Treebank – a syntactically annotated corpus of the Latvian language. It showcases both the syntactical phenomena of the Latvian language already described in the Latvian syntax theory, as well as the less common structures that have not yet been analysed in depth by theory. This paper considers understanding of the subordinate phrase analogue in Latvian linguistics. The paper provides an overview of the constructions labelled as such in Latvian Treebank. The principles of a further classification of the subordinate phrase analogues by certain grammatical criteria (morphological composition and syntactical characteristics) and semantic criteria are proposed. Some analysis of the order of components in these compound constituents is also provided. The two most common types of the subordinate phrase analogues in Latvian Treebank are groups of pronouns, as well as constructions with prepositional phrases. Other types appear less frequently. The amount of treebank examples is sufficient to cover the lexeme variety used for each type, as well as the range of syntactical functions fulfilled by each type. Hereby developed criteria for identifying the analogues of subordinate phrase and consistent syntactical annotation provide a convenient language material for further analysis of these constructions.
Keywords: Latvian syntax; syntactically annotated corpus; subordinate phrase analogue; compound part of sentence.
Rakstam ir Creative Commons Attiecinājuma 4.0 Starptautiskā licence (CC BY 4.0) /
This article is licensed under the Creative Commons Attribution 4.0 International License (CC BY 4.0) (https://creativecommons.org/licenses/by/4.0/)