raksti. runas. referāti
Dzīvais latviešu valodas un kultūras koks spēj zaļot un zarot vien Latvijā
Pasaules Brīvo latviešu apvienības un Latvijas Kultūras fonda rīkotajā konferencē “Latviešu valoda — esamība, vide, konteksti” Rīgā 1997.gada 14.martā Baiba Bičole, laikraksta “Laiks” galvenā redaktore, dzejniece
Latviešu valoda mums palīdzējusi palikt latviešiem
Atļaujiet nodot jums visiem sveicienu no latviešu laikraksta Amerikā — no avīzes “Laiks”!
Mani lūdza runāt par latviešu valodas problēmām Rietumu latviešu diasporā. Zinātnisku referātu neesmu sagatavojusi. Es runāšu par saviem vērojumiem, savu tiešo pieredzi un problēmām, kādas es tās redzu.
Gandrīz katrai latviešu ģimenei kāds radinieks, draugs vai paziņa dzīvo ārzemēs, tāpēc man nav jāskaidro, ko nozīmē dzīvot trimdā, nav jāstāsta par to, kā visus šos gadus esam dzīvojuši, mēģinājuši turēties. Mēs nebijām atstājuši dzimteni, lai meklētu labākus dzīves apstākļus, mēs bijām politiskie trimdinieki, un spēku mums deva apziņa, ka mūsu pienākums ir saglabāt latvietību, izaudzināt savus bērnus par latviešiem. Mans tēvs Jānis Bičolis bija baltu filologs, Jāņa Endzelīna skolnieks, arī literatūras vēsturnieks un folklorists, arī māmiņa Lidija Bičole bija literāte. Viņi abi strādāja latviešu bēgļu skolā, arī es tur mācījos. Savas skolas latvieši centās organizēt visur, lai saglabātu latviešu valodu, jo vienīgi te mūs varēja uzturēt par latviešiem. 50.un 60.gados latviešu skolās un vasaras nometnēs vēl strādāja pedagogi, kas izglītību bija ieguvuši Latvijā un tiešām spēja iemācīt bērniem labu latviešu valodu. Minsterē tika izveidota latviešu ģimnāzija, lai latviešu jaunieši varētu mācīties bez tiešas ārējās vides ietekmes. Šajā skolā bija tiešām latviska sajūta, audzēkņi labi apguva valodu. Tagad vairs nav motivācijas tur mācīties — latviešu valodu vislabāk var apgūt Latvijā. Tāpēc arī Minsteres latviešu ģimnāzija pastāv varbūt pēdējo gadu.
Diemžēl arī vecie skolotāji cits pēc cita aiziet aizsaulē. Ar katru paaudzi latviešu valodas zināšanas dilst. Dažkārt mēs sevi maldinām, domādami, ka latvietību var uzturēt ar latviešu tautas dejām un dziesmām. Priecājamies, cik mūsu bērni skaisti dejo latviešu tautiskajos brunčos, bet vajag tikai ieklausīties — viņi sarunājas angliski! Lai uzturētu dzīvu latviešu valodu, ļoti jāpiestrādā. Ar bērniem latviski daudz jārunā, jārunā katrā brīvā brīdī par visiem tematiem. Jāsūta uz vasaras nometnēm, bieži vien pārvarot lielus attālumus.
Ārzemēs iznākošo latviešu laikrakstu redakcijām valodas problēmas sagādā arvien lielākas raizes. Preses valoda slīd uz leju. Aizvien grūtāk atrast autorus, kas spētu rakstīt dzīvā, labā latviešu valodā. Šīs grūtības izjūtam arī mēs, “Laika” redakcija. “Laiks” sāka iznākt 1949.gadā, kad bija svarīgi pasaulei atgādināt, ka tāda Latvija ir, tādi latvieši pastāv. Tagad vienīgais dzīvais ar latviešu valodu saistītais latviskās kultūras koks, kas var zaļot, zarot un augļus nest, aug Latvijā.
Pēc “LV” redaktores
Ainas Rozenieces
ieraksta diktofonā
Dr. habil. philol. Jānis VALDMANIS,
Latviešu valodas institūta direktors:
Procesi latviešu valodā un to sekas sabiedrībā
Ir samērā viegli vērtēt bijušo (īpaši no šodienas viedokļa), grūtāk ir runāt par to, kas notiek pašlaik, un vēl grūtāk ir izteikt prognozes.
Aplūkojot notiekošo, manuprāt, ir konstatējami divi galvenie procesi latviešu valodā:
1) neformālās sarunvalodas ekspansija, nojaucot tradicionālās stilistiskās normas un izspiežot izlokšņu īpatnības;
2) aizvien jūtamāka angļu valodas ietekme.
Tas, ka no oficiālās runas un sarunvalodas tiek izspiesta runa ar izlokšņu īpatnībām ir normāls, dabisks process (starp citu, tas raksturīgs arī vairākām citām Eiropas valodām), jo runāt izloksnē nav motivācijas. Runāt izloksnē nav prestiži, īpaši jaunatnes vidū. Ja to reizēm dara, tad ar humora vai ironijas niansi. Ja to cenšas darīt nopietni, tas kļūst komiski.
Atkāpes no tradicionālajām stilistiskajām normām izpaužas divējādi.
Oficiālās runās, publiskā runā vai sarunvalodā tiek iekļauti neformālās sarunvalodas vārdi un veidotas tādas teikuma konstrukcijas, kas neatbilst tradicionālajām literārās valodas normām. Ar vienu piemēru to varētu raksturot šādi. No stilistiskā viedokļa deputāta runa parlamentā no tribīnes jūtami neatšķiras no sarunas starp bērnības draugiem pie vīna glāzes par jaunības piedzīvojumiem. Šāda tipa runas ir dzirdamas gan televīzijā un radio, gan Saeimā un citur.
Atkāpes no tradicionālajām stilistiskajām normām bieži vien izpaužas tā, ka reizēm pat viena teikuma robežās ir apvienoti dažādu funkcionālo stilu elementi. Vērojams it kā dažādu stilu saplūdums (cik organisks tas veidojas katrā konkrētā gadījumā, tas ir jautājums). Vienkopus parādās oficiāli lietišķās valodas standartfrāzes un frazeoloģismi; sabiedriski politiskā leksika, speciālā terminoloģija, profesionālismi, jaunienākušie svešvārdi un poētismi. Un šajā “kokteilī” arvien biežāk sastopami neformālās sarunvalodas vārdi, tādi kā aizmuhļīt, biezais, bīdīties, čajs, deķītis (varas), džobs, fīlings, iekortelēties, miskaste, pleķis, rossijānis, sapasēt, spice, šilte, tusoties, zilais un daudzi daudzi citi. Aizvien vairāk parādās dažādi okazionālismi: Godmaņkrāsniņa, ieērtoties mīkstos sēdekļos, izvaddaikts, nevalstsvaloda, prihvatizācija, smēķstūris u.tml.
Minētās stilistiskās pārmaiņas raksturīgas praktiski visiem publicistikas žanriem. Tas ļauj secināt, ka šis stilistisko pārmaiņu process ir masu saziņas līdzekļu ietekmes rezultāts. Jaunu izteiksmes līdzekļu meklējumi, lai kāpinātu teksta iedarbīgumu, publicistikā tiek meklēti ārpus literārās valodas — neformālajā sarunvalodā.
Šīs atkāpes no tradicionālajām stilistiskajām normām reizēm kvalificē kā valodas demokratizāciju. Tomēr nevar neredzēt, ka šīs pārmaiņas skar vienu no raksturīgākajām attīstītas literārās valodas īpašībām, proti, sazarotu un diferencētu stilistisko sistēmu (kas pilnā mērā nostabilizējās mūsu gadsimta 30.gados). Un tādā gadījumā ir jāapsver, vai termins “valodas demokratizācija” ir piemērotākais vārds šī procesa būtības izteikšanai.
Angļu valodas ietekmes pastiprināšanās kā tendence izpaužas divējādi: pieaugošs spiediens kā “eiropeizācijas” procesa sastāvdaļa, no vienas puses, un pieaugošs uzņēmīgums, atvērtība pret angļu valodu, no otras puses. Tiesa, reizēm šīs viena procesa divas puses praktiski ir grūti nošķiramas.
Sakaros ar citām Eiropas Savienības valstīm un institūcijām angļu valoda reāli ir kļuvusi par dominējošo valodu, kaut arī oficiālās valodas Eiropas Savienības institūcijās kopš 1995.gada ir veselas vienpadsmit. Šis fakts rada angļu valodas ietekmi kā objektīvu spiedienu. Un tā kā pie mums (līdzīgi Austrumeiropas valstīm) pastāv ļoti labvēlīgs uzņēmīgums, atvērtība angļu valodai, tad tendence ir samērā dinamiska, īpaši, protams, jaunatnes vidū. (Ļoti labvēlīgo attieksmi pret angļu valodu var izskaidrot ar to, ka padomju režīma laikā tā bija sava veida simbols demokrātijai un brīvā tirgus attiecībām.) Rezultātā, kā jau to varēja paredzēt, latviešu valodā parādās ļoti daudz aizguvumu, gan vajadzīgu, gan nevajadzīgu, visādu. Taču šis nebūtu svarīgākais angļu valodas ietekmes procesā.
Ir būtiskākas lietas. Kā piemēru varētu minēt Stokholmas Ekonomikas augstskolas filiāli, kurā mācību valoda ir angļu. Tas ir precedents. Var paredzēt, ka nākošais solis būs angļu valoda kā darba valoda starptautiskajās firmās un bankās. Rīgā, cik man zināms, jau ir pāris banku, kur saziņā ar vadību darbinieki lieto angļu valodu. Vēl viens piemērs. Reizēm iestādēs un institūcijās no darbiniekiem tiek prasīts iesniegt dažus dokumentus angļu valodā vai gan latviešu, gan angļu valodā. Līdzīgs piemērs — sludinājumi avīzēs ir lasāmi reizēm ne tikai latviešu, bet arī angļu valodā, reizēm tikai angļu valodā. Tie ir simptomi, ka angļu valoda minētajos gadījumos nefunkcionē vairs kā starpnacionāla saziņas valoda (kā tajos gadījumos, kad sazinās ar Eiropas Savienības institūcijām), bet to sāk lietot valsts valodas funkcijās.
Pastiprinoties angļu valodas ietekmei sociolingvistisko funkciju ziņā, (lielākā vai mazākā mērā) vājinās latviešu valodas kā valsts valodas funkcijas. Valsts valoda pamazām tiek spiesta uz sadzīves attiecību un nacionālās kultūras jomas pusi.
Bet — un tas ir būtiski — valsts valodas pozīciju kaut neliela vājināšanās rada savukārt citu tendenci, proti, stiprinās minoritāšu valodu pozīcijas. Mazinoties spiedienam no valsts valodas puses, īpaši krievu valodas nozīmīgums (kura vēl joprojām Latvijā bieži vien tiek lietota kā starpnacionālās saziņas valoda) sabiedrībā ievērojami palielināsies. Tādā gadījumā, nav šaubu, parādīsies sekas sabiedrībā.
Kādas sekas sabiedrībā var radīt “eiropeizācijas” process, kura svarīga sastāvdaļa ir angļu valodas ekspansija?
“Eiropeizācija” rada nepieciešamību būt vismaz bilingvālam. Cilvēkiem, kas grib kāpt pa karjeras kāpnēm (uz augšu, protams), īpaši jauniem cilvēkiem, absolūti nepieciešams zināt vismaz vienu starptautiskās saziņas valodu, pirmām kārtām, angļu valodu un, protams, valsts valodu, respektīvi, savu dzimto valodu. Pieprasījums pēc speciālistiem, kas zina svešvalodas (visbiežāk angļu, tad vācu un krievu), spriežot pēc sludinājumiem avīzēs, ir pietiekami liels. Faktiski valodu prasme tiek minēta kā otrais no diviem trim profesionalitātes rādītājiem. Tas nozīmē, ka svešvalodu prasme jau tiek uzskatīta par būtisku profesionalitātes sastāvdaļu. Tiesa, jāatzīst, ka piedāvājums vēl stipri atpaliek no pieprasījuma, spriežot pēc sociolingvistiskā pētījuma “The Language Situation in Latvia” (veikts Dr. habil. philol. I. Druvietes vadībā 1995.gadā) datiem, apmēram 18 % respondentu uzskata, ka viņi spēj sazināties angļu valodā, un 11 % respondentu - vācu valodā (tā kā šie skaitļi atspoguļo pašnovērtējumu, tad var pieņemt, ka tie mazliet izskaistina patieso stāvokli).
Ievērojot pašreizējo situāciju un svešvalodu apgūšanas dinamisko tendenci, var uzskatīt, ka Latvijas sabiedrība pamazām noslāņojas trīs sociālās grupās pēc valodu prasmes:
(1) cilvēki, kas zina latviešu valodu un vismaz vienu no trim Eiropā visbiežāk lietotajām starptautiskās saziņas valodām;
(2) cilvēki, kas zina tikai valsts valodu;
(3) cilvēki (sveštautieši un arī paši latvieši), kuriem valsts valoda ir šķērslis, lai pietiekami augstā profesionālā līmenī veiktu darba pienākumus un piedalītos sociālajā dzīvē.
Šo grupu pārstāvjiem ir stipri atšķirīgas iespējas (vērtība) darba tirgū. Šajā sakarā jāpiebilst, ka to cilvēku skaits, kam pat valsts valoda ir šķērslis pretendēt uz augstākas kvalifikācijas darbu, ir pārāk liels, ievērojami lielāks, nekā optimālais, proti, apmēram 63 % no visiem, kam latviešu valoda nav dzimtā valoda. Pirmām kārtām šie cilvēki jutīsies apdraudēti sakarā ar viņu ierobežotajām iespējām strādāt labāk atalgotu darbu.
Cenšoties iekļauties Eiropas Savienībā, ir jāapzinās valodas politikas pamatprincipi, kas izriet no Eiropas Savienības nostādnēm. Katrā dalībvalstī, tāpat kā Eiropas Savienībā kopumā, ir jāīsteno aktīva minoritāšu valodu, lingvistiskā un kulturālā plurālisma aizsardzības politika. Ir atzīts, ka Eiropas valodiskā un kulturālā bagātība nedrīkst tikt fosilizēta pašreizējā stāvoklī, valoda nav jāiekonservē nākotnei, bet ir nepieciešama mijiedarbība un savstarpēja stimulācija tālākai attīstībai. Tiek noraidīta arī valodas loma nacionālās identitātes uzturēšanā. Ir jātiecas uz praktiski daudzvalodīga etnosa radīšanu ne tikai Eiropas Savienības supranacionālajā līmenī, bet arī katrā Eiropas Savienības dalībvalstī.
Vai mēs esam to apzinājušies? Vai esam izanalizējuši Eiropas Savienības nostādnes valodas politikas jomā, apsvēruši visus “par” un “pret”. Vai esam izmodelējuši iespējamo Latvijas valodas situāciju nākotnē un izstrādājuši atbilstošu un valsts pamatiedzīvotājiem pieņemamu valodas politiku?
Referāts nolasīts konferencē “Latviešu valoda — esamība, vide, konteksti” 1997.gada 14.martā
Dr. phys. Andrejs Spektors, LU Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijas vadītājs:
Latviešu valoda “Internetā” un datorlingvistikas resursi
Sakarā ar “Interneta” straujo attīstību visā pasaulē valodas datorsistēmu attīstīšana kļūst par katras valodas izdzīvošanas jautājumu nākotnē. Informācijas apmaiņas ātrums pieaug proporcionāli jauno tehnoloģiju attīstībai. Cilvēces vēsture pierādījusi, ka zinātnes un tehnikas attīstība iespaidojusi humanitārās sfēras kopš vissenākajiem laikiem. Lai minam rakstības izgudrošanu, kuras paredzamās kaitīgās sekas spilgti aprakstītas Platona dialogā “Faidrs”, kur faraons pauž savas bažas: “Padomājiet, pie kā tas novedīs! Domas varēs lasīt no papīra. Tad jau galva vairs nebūs vajadzīga!”, un iespiedtehnikas izgudrošanu ar tās Gūtenberga efektu — to valodu pakāpenisku izzušanu, kurās netika ieviesta un izmantota iespiedtehnika. Eiropas Savienības institūcijās jau kopš deviņdesmito gadu sākuma apspriež iespējamā “otrā Gūtenberga efekta” sekas saistībā ar datoru un mākslīgā intelekta sistēmu plašu ieviešanu visās jomās, īpaši informācijas apstrādes tehnoloģijās. Arī Latvijā jau sācies līdzīgs process: bērni un jaunieši daudz laika pavada pie “Internet” monitoriem, kur piedāvātā informācija ir galvenokārt tikai angļu valodā. Rezultātā viņi dažkārt latviešu valodu vairs neprot lietot bez angļu valodas leksisko un gramatisko formu iestarpinājumiem. Šādu situāciju var labot, izstrādājot latviešu valodā datorsistēmas, kas interesentiem piedāvātu pietiekami lielu informācijas apjomu.
LU Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijā ar Sorosa fonda atbalstu izveidota informācijas sistēma par latviešu valodu. Tā satur ziņas par latviešu valodas gramatiku latviski un angliski, pamatvārdu (apmēram 1400 vārdu) vārdnīcu ar tulkojumiem angliski un krieviski, bilžu vārdnīcu, lietvedības terminu vārdnīcu un vēstuļu piemērus. Lielākais apjoms ir “Latviešu tautas ticējumiem”, jo “Interneta” WWW lapās tiek ievietoti visi četri P.Šmita sastādītie ticējumu sējumi. To visu var redzēt Internetā (http://ai1.mii.lu.lv/valoda.htm) un brīvi izmantot. Turpat ir pieejama arī “Latviešu valodas vārdnīca” (Rīga, 1987), kas varētu kalpot dažādiem mācību un zinātniskiem mērķiem. 1996. gada Kultūras projektu ietvaros uzsāktas veidot WWW lapas par latviešu kultūru (http://ai1.mii.lu.lv/kultura.htm). Mākslīgā intelekta laboratorijā izstrādāti dažādi ieteikumi un tehniskie līdzekļi latviešu valodas lietošanai datoros. Izveidots tekstu un dažādu vārdnīcu krājums ar aptuveni 10 miljonu vārdlietojumu. Izstrādāta latviešu valodas morfoloģiskās analīzes automatizēta sistēma, izveidotas vairākas specializētas elektroniskās vārdnīcas un radītas citas sistēmas, kas nepieciešamas datoru interfeisu izveidei latviešu valodā.
Uzsākta latviešu valodas morfēmiskās analīzes sistēmas izstrāde, kas nodrošinās latviešu valodas datorsistēmu tālāku attīstību. Izveidotie tekstu krājumi ietver dažādas pēdējo gadu laikrakstu publikācijas (ap 6 miljoni vārdu), “Latviešu tautas ticējumus” (apmēram 600 000 vārdu), Latvijas likumu tekstus (apmēram 560 000 vārdu), Bībeli (apmēram 600 000 vārdu), kā arī dažādus 16. un 17. gs. iespieddarbu tekstus (ap 1,6 miljoni vārdu). Datorā ievadītas arī vārdnīcas: E.Soidas un S.Kļaviņas “Inversā vārdnīca”, kas veido latviešu valodas vārdu sarakstu (apmēram 35 000), šo vārdu tulkojumi krieviski un angliski, “Latviešu valodas vārdnīca” (Rīga, 1987), “Frazeoloģiskā vārdnīca”, J.Baldunčika “Anglicismu vārdnīca”, dažādās terminoloģijas vārdnīcas u.c. mazākas vārdnīcas. No K.Mīlenbaha un J.Endzelīna vārdnīcas ievadīta pirmā daļa un iesākta otrās daļas ievadīšana. Izstrādāta īpašvārdu izrunas vārdnīca, kas satur 250 000 vārdu un to uzrunas pierakstu starptautiskajā fonētiskajā alfabētā. Latviešu valodas tekstu bāzu un leksikonu veidošana iespēju robežās sekmīgi norisinās arī LU Baltu valodu katedrā, Latviešu valodas institūtā, Literatūras, folkloras un mākslas institūtā un arī citās iestādēs. Tomēr parasti tiek veikta tikai darba lingvistiska daļa, bet nav nodrošināta saistība ar nepieciešamās programmatūras attīstību. Svarīgi būtu arī savlaicīgi sākt risināt valodas resursu standartizētas izveides marķēšanas un vērtēšanas problēmas, kas pašreiz ir aktuālas visā pasaulē, jo valodas datorresursi tiek izstrādāti visās attīstītajās valstīs.
Mūsdienīga valodas datorfonda radīšanai ir vismaz trīs atšķirīgi apsekti: pirmkārt, vajadzīgs tehniskais un programmatūru nodrošinājums, otrkārt, vajadzīga šī fonda valodnieciskā aprūpe, un, treškārt, datorfondam jāatspoguļo mūsdienu reālā pasaule, tāpēc tā satura izvēle ir arī kultūrsocioloģiska problēma. Pēdējos gadu desmitos pasaulē, pateicoties lielu un daudzu zinātnisko kolektīvu pēlēm, strauji attīstījusies datorsistēmu izmantošana dabīgo valodu apstrādē (vispirms — angļu valodā). Dažādām valodām kopējās problēmas tiek atrisinātas, galvenokārt veidojot angļu valodas datorsistēmas. Eiropas Savienības politika šajā jomā paredz nākotnē katram Eiropas pilsonim nodrošināt iespēju runāt savā dzimtajā valodā un tikt saprastam jebkurā citā Eiropas valodā ar tehnisko līdzekļu palīdzību. Tās būs nākotnes tehniskās iespējas, bet jau šodien ir būtiski veidot šādas sistēmas arī latviešu valodā, t.sk. “Internetā”. Pašlaik “Internet” sistēmā visā pilnībā gan pieejams tikai oficiālais laikraksts “Latvijas Vēstnesis” un Saeimas sēžu stenogrammas. Šīs stenogrammas mums ir svarīgas kā autentisks cilvēka runas pieraksts, savukārt “Latvijas Vēstnesis” piedāvā krietni plašāku tematiku un lielāku valodas lietojuma dažādību. Protams, katras valsts pašas uzdevums ir veidot šādu tehnisko līdzekļu iestrādes savai valodai. Speciālisti uzskata, ka tikai sasniedzot simts un vairāk miljonu vārdlietojumu datu bāzēs, var veikt tālākos pētījumus gan valodniecībā, gan datorlingvistikā. Tāpēc intelektuālas datorsistēmas latviešu valodā būs iespējams sākt realizēt tikai pēc attiecīgo vārdnīcu izveides datoros un uzkrāto tekstu analīzes ar šo vārdnīcu un citu izveidoto līdzekļu palīdzību. Valodas resursu izmantošana Latvijā, tāpat kā citās Austrumeiropas valstīs, ir tikai sākuma stadijā, tāpēc ir svarīgi savlaicīgi izstrādāt metodoloģiju jaunradīto resursu marķēšanai un vērtēšanai, tādējādi nākotnē ietaupot līdzekļus kļūdu novēršanai un standartizācijai. Vienlaicīgi tiks pārbaudīta standartu un rekomendāciju praktiska pielietojamība latviešu valodā, kura atšķiras no angļu un citām Rietumeiropas valodām ar savu fleksivitāti. (Fleksija — (no lat. flexio — liekšana, pāreja) — piemīt valodām, kurās lokot mainās vārda galotne un var notikt fonēmu maiņa vārda saknē). Latviešu valodas īpatnībām atbilstošu risinājumu meklējumi tad arī ir mūsu tuvākais mērķis.
Būtu jāuzsāk “Internetā” pieejamo latviešu preses izdevumu automatizēta primārā apstrāde un marķēšana. Vispirms ir esošie raksti jāpārveido vienotā latviešu valodas rakstības standartā, jo dažādos preses izdevumos vēsturiski ir izstrādāti dažādi datorizdevniecības tehnoloģiskie procesi, tāpēc elektroniskie tekstu masīvi neatbilst spēkā esošajiem Latvijas standartiem. Saprotams, ka izmaiņas izdevniecības tehnoloģiskajā procesā ne vienmēr var veikt īsā laika posmā, tāpēc var sagaidīt ilgstošu iepriekšējo kodu tabulu izmantošanu. Tā kā datorfonds jāveido atbilstoši spēkā esošajiem standartiem, nepieciešams izstrādāt automatizētus rīkus tekstu apstrādei. Tālākā datorfonda izveide prasīs automatizētas marķēšanas programmatūras izstrādi atsevišķu rakstu, to autoru un virsrakstu marķēšanai. Palielinoties datu apjomam “Internetā”, ir nepieciešams radīt rīkus automatizētu elektronisko preses izdevumu kataloga sastādīšanai, lai datorfonda vajadzībām varētu atlasīt preses izdevumu rakstus pēc autoriem un rakstu nosaukumiem.
Latviešu valodas teikumu marķēšanai vispirms nepieciešama algoritmu izstrāde dažādu latviešu valodas teikumu robežu viennozīmīgai indentifikācijai. Teikumu marķēšana ir viens no primārajiem nosacījumiem datorfonda tālākai izmantošanai pētnieciskajiem u.c. nolūkiem. Programmrīki, kas paredzēti teikumu marķēšanai, dažādās valodās atšķiras atkarībā no attiecīgās valodas pareizrakstības īpatnībām pieturzīmju lietošanā. Nepieciešama automatizēta teikuma analīze, teikuma locekļu identifikācija un marķēšana, paredzot automatizētu rīku izstrādi šo darbu veikšanai. Mākslīgā intelekta laboratorijā ir izstrādāta morfēmiskās analīzes programmatūra, kas ļauj automātiski analizēt tekstā sastaptos vārdus un noteikt to sastāvdaļas.
Konteksta analīze un frazeoloģismu marķēšana paredz metodikas, algoritmu un programmnodrošinājuma izstrādi šo funkciju veikšanai. Datorlingvistiskajos pētījumos bieži ir nepieciešams zināt, ar kādiem vārdiem kopā tiek lietots dotais vārds vai vārdu savienojums un kādi ir to lietojuma biežuma rādītāji. Šādu zināšanu nepieciešamība var rasties arī mākslīgā intelekta sistēmu izstrādē, mašīntulkošanā un teikumu sintēzē. Vienlaicīgi būs jāizstrādā arī līdzekļi dažādu frazeoloģismu marķēšanai, kas ļaus veikt dažādus to pētījumus. Paralēlo korpusu (kas satur vienādus tekstus divās vai vairāk valodās) analīzes un marķēšanas programmnodrošinājums paredz izstrādāt metodiku, algoritmus un programmnodrošinājumu šāda tipa uzdevumu risināšanai. Saņemot no redakcijas divās valodās iznākošas avīzes rakstu tekstus, datorfondā ir jāatrod savstarpējā atbilstība starp šiem tekstiem, lai varētu tos izmantot, teiksim, tulkotāja palīglīdzekļu izstrādei. Šāda veida teksti ir nepieciešami atsevišķu mašīntulkošanas uzdevumu risināšanai, nodrošinot sistēmai piemēru bibliotēku zinību apguvei. Pašlaik tiek saņemti “Rīgas Balss” teksti, kuru apstrādes līdzšinējā pieredze rāda, ka savstarpēji atbilstošo tekstu meklēšana ir ļoti darbietilpīgs process.
Mūsdienās lielākā daļa iespieddarbu tiek sagatavota ar datoru palīdzību, tāpēc tekstu ierakstīšanas process datoru informācijas nesējos notiek jau pirms iespieddarba iznākšanas no tipogrāfijas. Būtu pareizi, ja datorfonds varētu saņemt izdevniecību sagatavotos tekstus. Daudzās Eiropas valstīs šāda procedūra tiek nodrošināta jau ar likumu. Tomēr mūsu sabiedrībā tas vēl nav izplatīts, tāpēc jāmeklē ceļi, kā saglabāt tekstus elektroniskā formā, jo dažviet pēc iespieddarba iznākšanas elektroniskais ieraksts tiek vienkārši nodzēsts, lai attiecīgos informācijas nesējus izmantotu citiem mērķiem. Vispirms nepieciešama latviešu valodas elektronisko tekstu krājumu apzināšana un tipveida juridisko dokumentu izstrāde. Diemžēl jāatzīst, ka Latvijā nav speciālistu, kas varētu šo darbu veikt, jo te būtu nepieciešams apvienot filoloģiskās un juridiskās zināšanas. Tāpēc šī darba izpilde var būt ilgstošs process. Tālāk nepieciešama metodikas un kritēriju izstrāde tekstu atlasei no izdevniecībām, kas nodrošinātu datorfondu ar kvalitatīviem tekstiem visos aspektos, nevis aizpildītu to ar mūsdienu “sēnalu literatūru”, īpaši tulkojumos. Pēc tam jāveic metodikas un tehnoloģiju izstrāde dažādu elektronisko tekstu konvertēšanai uz kopēju glabāšanas formātu, jo katra izdevniecība var izmantot atšķirīgu tehnoloģiju savu iespieddarbu sagatavošanai. Ļoti interesants darbs būs Saeimas sēžu stenogrammu analīze un marķēšana. Parlamenta sēžu stenogrammas ir gandrīz vienīgais “dzīvās valodas” pieraksta veids, kas visur tiek izmantots arī datorfondos. Latvijā Saeimas sēžu stenogrammas ir brīvi pieejamas “Internetā”, tāpēc nav speciāli jāorganizē to sagāde. Nepieciešams tikai detalizētāk iepazīties ar šo stenogrammu struktūru, lai uzsāktu stenogrammu marķēšanu pēc runātājiem. Sākotnēji teikumu marķēšana stenogrammās būs jāveic “ar rokām”. Tikai apgūstot visas šo tekstu īpatnības, varēs sākt programmnodrošinājuma izstrādi šī darba automatizācijai.
Balansētam korpusam būtu jāatspoguļo visdažādākie valodas lietojuma žanri, tāpēc jāsāk ar metodikas un kritēriju izstrādi tekstu klasifikācijai. Darbs acīmredzot būs jāveic vairākās iterācijās, izstrādāto metodiku un kritērijus vajadzēs vairākkārt apspriest plašākā sabiedrībā, lai nodrošinātu augstāku kvalitāti. Tāpat jāveic arī literāro darbu atlases kritēriju izstrāde. Kritērijus galīgā variantā varēs izvēlēties tikai pēc apspriešanas plašākā sabiedrībā. Viens no apspriešanas veidiem varētu būt izstrādāto kritēriju publicēšana Internetā, bet tad daudzi Latvijas sabiedrisko zinātņu speciālisti var nesaņemt šo informāciju. Tāpēc jādomā arī par citiem publiskās apspriešanas veidiem. Jāatzīmē, ka darbu atlasē daudz kas var būt atkarīgs arī no izdevniecību ieinteresētības sadarbībā ar datorfondu, tāpēc atlases kritēriji jāizstrādā tā, lai paliktu izvēles iespējas starp dažādām izdevniecībām. Latvijā pašreiz ir izdevies atrast tikai laikrakstu “Rīgas Balss”, kas iznāk latviešu un krievu valodā un vienā no valodām publicē raksta tulkojumu. Laikrakstam “Diena” ir atsevišķas latviešu un krievu redakcijas, un tur tulkojumi ir daudz grūtāk atrodami, kaut gan noteikti ir. Līdzšinējā sadarbība ar “Rīgas Balss” redakciju norisinās tādā veidā, ka laikraksta elektroniskais arhīvs apmēram reizi trijos mēnešos tiek ierakstīts disketēs, kuras saņem Mākslīgā intelekta laboratorija. Lai gan teksti ir sagrupēti pa mēnešiem un katram tekstam ir redzams tā saglabāšanas datums, tomēr raksta tulkojumu meklēšana prasa lielu darbu. Tā kā ne visus tekstus izdosies saņemt no izdevniecībām un vajadzētu veidot arī literatūras klasikas daļu datorfondā, tad kāda daļa no tekstiem būs jāievada ar rokām. Ar rokām ievadāmie teksti tiks speciāli atlasīti un to ievadīšanas lietderība būs jādiskutē gan izpildītāju kolektīvā, gan arī konsultējoties ar citiem speciālistiem.
Kopumā latviešu valdas datorlingvistiskie resursi jāsāk tuvināt Eiropas Savienības valstu (valodu) līmenim. Tikai strādājot šo darbu jau šodien, mēs varam cerēt saglabāt savu valodu arī nākotnes pasaulē.
Referāts nolasīts konferencē “Latviešu valoda — esamība, vide, konteksti” 1997. gada 14. martā
Dr. philol. Aija Janelsiņa – Priedīte:
Vai 2097. gadā vēl runāsim latviski?
Šīs konferences lozungs sastāv no trim vārdiem: esamība, vide, konteksti. Vēlos savu sakāmo koncentrēt uz šiem trim jēdzieniem, galvenokārt pievēršot skatu nākotnei.
ESAMĪBA
Kāda ir latviešu valodas esamība, tās šodienas situācija? Neskatoties uz visiem pretējiem apgalvojumiem, es teiktu — burvīga, pasakaini laba! Staigājam pa ielām, un vairums uzrakstu ir latviešu valodā. Vai atceraties, kā tas bija 1987. gadā? Dzelzceļa biļetes varam nopirkt latviski. Kā bija pirms 10 gadiem? Grāmatu veikalos varam atrast Jungu blakus visprastākajai lubu literatūrai latviešu valodā. Un nemānīsim sevi, ar nicinājumu runājot par lubu literatūru. Tautas vairākumam tā patīk, un izsalkums pēc tās ir bijis liels, citādi jau neatmaksātos to izdot!
Vai kāds no mums pirms desmit gadiem būtu varējis iedomāties, ka latviešu valoda neīsā laikā atgūs valsts valodas statusu, ka Latvijā atgriezīsies preses brīvība, ka latviešu valoda atgūs valsts pārvaldes funkcijas, ka latviski tulkos dažādas starptautiskas konvencijas, Eiropas Savienības dokumentus, ka latviešu valodā rakstīs saimnieciskas analīzes, ka veidosies terminoloģija visdažādākās nozarēs? Kopsavilkumā — ka latviešu valoda reāli atkal būs dzīva valoda, kas var nostāties līdzās kurai katrai modernai valodai Eiropā? Priecāsimies katru dienu par šo pasakaino pavērsienu!
Tomēr vairums mūsu valodnieku un kultūras darbinieku nemaz tik pozitīvi neskatās uz šīm parādībām. Viņi uz mūsdienu latviešu valodu skatās retrospektīvi, no pagātnes, no vēsturiskā aspekta, un kreņķējas par to, ka mūsdienu valoda pastāvīgi mainās un nepakļaujas valodnieku fiksētām likumībām, ka valoda uzvedas kā spītīga padsmitniece, kas meklē un grib iet savus ceļus. Viņi ļoti labprāt redzētu latviešu valodu kā konservu zelta skārdenē, paceltu uz pjedestāla, skaistu, cēlu un nemainīgu. Viņi negrib saredzēt, ka dzīva valoda dzīvo savu dzīvo dzīvi, kuras rīcība nav iepriekš paredzama. Valodnieku uzdevums nav valodu ierobežot zelta kārbā kā pieminekli, bet gan aprakstīt šīs valodas dzīvi. Arī valodas dzīvē ir pagātne, tagadne un nākotne. Ierobežojoties tikai ar pagātnes aspektu, mēs savai valodai atņemam normālas attīstības spējas.
Ņemsim kā piemēru to pašu nelaimīgo mīkstināto r. Ja mīkstinātais r tautā ir zudis un šī zuduma ietekmē tauta daudzās pozīcijās, kur agrāk izrunāts šaurs e un ē, tagad lieto platu e un ē, tad tā ir dabiska valodas attīstība, nevis kļūda. Tā starplaikā ir norma, un kā tāda tā būtu arī jāfiksē. Cits piemērs. Tauta mūsdienās, tāpat kā agrāk, bieži neizšķir 2. personas īstenības un pavēles daudzskaitļa formas. Mēs dzirdam autobusā dzimtās valodas pārstāvjus runājam: dodat man biļeti un dodiet man biļeti ; vai pie friziera: griežat man matus labi īsus vai grieziet man matus labi īsus . Ja tauta tā runā, ja tauta neizjūt starpību starp īstenības un pavēles izteiksmi, tam būs savi iemesli, kas būtu jāpēta. Kas galu galā runā “pareizāk”; vecā māmiņa Kolkā, bruģētājs Cēsīs vai augstceltnes valodnieki?
VIDE
Aplūkojot nākamo konferences lozunga punktu — vidi, redzam diezgan daudzšķautņainu ainu. Šodienas latviešu valodas vidi ir ietekmējis gan vēstures, gan sabiedrisku normu mantojums. Latviešiem atstājot dzimtbūšanas ieslēgtību, kurā latviešu valoda dzīvoja izolētu un šādi arī aizsargātu dzīvi, tā nonāca aizvien stiprākā saskarsmē ar citām valodām un kultūrām. Šādi pastāvīgi palielinājās ārpuses apstākļu ietekmju loks. Tas bija liels pārbaudījums valodai, ko tā godam izturēja. Divdesmit brīvvalsts gadiem, kad kopš 1934. gada atkal aizvien stiprāk tika izkopta izolētības politika, sekoja 50 gadi, kuros latviešu valoda, no vienas puses, bija izolēta, no otras puses, Latvijā tā bija pakļauta krievu valodas un komunisma sabiedriskās iekārtas ietekmei, ārpus Latvijas — dažādo mītņu zemju valodu un kultūru iespaidam. Šī nav tik unikāla parādība, kā mums, latviešiem, tas šķiet, valodu vēsturē ar šādu likteni bijis jāsastopas daudzām valodām.
Raugoties no fiziskās vides viedokļa, neskatoties uz valsts valodas statusu , latviešu valodas situācija daudzās vietās Latvijā joprojām ir nelabvēlīga. Lai to mainītu, vajadzīgi īpaši gartermiņu risinājumi. Šīs problēmas nav risināmas dažu mēnešu, pat ne gadu laikā. Diemžēl mūsu valodas politiķi to nevēlas saprast.
Bet ne jau tikai tiešā vide iespaido valodu. Mūsdienās to vēl vairāk dara masu saziņas līdzekļi. Radio un televīzijas diktori lēnām, bet droši izlīdzina izlokšņu īpatnības. Preses brīvība palielina ne tikai informācijas daudzumu, bet arī vēlmi runāt par šo informāciju. Tas prasa jaunus izteiksmes līdzekļus un jēdzienus. Informācijas daudzums un ātrums neļauj pietiekami ātri visu informāciju piemērot valodas īpatnībām un prasībām. Šādi rodas neveikli aizguvumi un tulkojumi. Arī jaunās sabiedriskās struktūras, demokrātija, tirgus ekonomika, starptautiskās attiecības, kā arī modernās tehnikas straujā attīstība ir izaicinājums katrai valodai, un latviešu valoda šeit nav nekāds izņēmums.
Pārprastu jēdzienu un pārprastas terminoloģijas dēļ Latvijā ieviesies galīgi nepareizs termina “valsts valoda” lietojums. Valsts valoda ir juridisks termins — un viss! Valsts valodu nevar nedz mācīt, nedz iemācīties, jo tādas valodas vispār nav. Nav arī valsts valodas mācīšanas metodikas. Aiz šī pārprastā lietojuma, manuprāt, slēpjas mūsu kārtējais mazvērtības komplekss valsts līmenī. Lietojot jēdzienu “valsts valoda”, šai vārdkopai šķietami tiek piešķirts svarīgāks statuss. Patiesībā notiek tieši pretējais, mēs izņemam lietas būtību no aprites, runājot par kaut kādu abstraktu valsts valodu. Pietiek likumā izmainīt vienu vienīgu vārdiņu, un mūsu valsts valoda būs ķīniešu vai arābu.
Kopš atcelta cenzūra, mediji pārplūdina arī Latviju ar ārzemju un starplaikā — arī ar pašmāju reklāmu. Par to daudzi ļoti uztraucas, reizēm pat nevar īsti saprast, vai vairāk par valodu vai saturu. Tieši reklāma un dažādo preču satura un lietošanas apraksti skaidri rāda, ka latviešu valoda ir dzīva valoda. Par to varam pārliecināties katru dienu. Līdztekus svešķermenim “pamperi” radies burvīgais vārdiņš “autiņbiksītes”. “Librese” ieviesusi vārdu “ieliktnīši”, un arī latviešu valodā Volvo iemācījies ripot. Ko mums pierāda šie jaunvārdi, šis paplašinātais valodas lietojums? Proti, ka latviešu valoda ir spējīga dzīvot ne tikai tautas dziesmu vidē, bet arī tehnikai un citiem mehānismiem pakļautā modernā sabiedrībā. Tātad mūsu valoda nav mirusi valoda, nav pagātnes valoda, tā ir valoda, kas dzīvo savu patstāvīgo dzīvi, ņem vērā un sadzīvo ar jaunajiem izaicinājumiem. Priecāsimies par to! Mūsu valoda ir dzīva valoda!
KONTEKSTI
Ko īsti izprotam ar vārdu “konteksti”? Ar šo vārdu šajā sakarībā saprotu pasaules vidi. Pasaules kontekstā latviešu valodai ir divas nozīmes. Viena — latviešu valoda kā sens valodas piemineklis ar skatu uz pagātni, uz latviešu valodas senatnīgumu un formu bagātību. Otra ir mūsdienu latviešu valoda, kas spēj pildīt visas tās funkcijas, ko prasa mūsdienu sabiedrība, tātad ar skatu uz nākotni.
Ar skatu uz pagātni un latviešu valodas kā pieminekļa kopšanu varējām nodarboties, kamēr paši latvieši un latviešu valoda dzīvoja izolētu dzīvi, savā latviskajā geto. Mūsdienu Vakareiropas pasaule un sabiedrība ir atvērtas sabiedrības, un atvērta sabiedrība ir pakļauta iespaidu interakcijai, abpusējai iespaidu izmaiņai, uz labu un uz ļaunu.
Ja Latvija vēlas pieslēgties Eiropai, tad mums jāņem par labu starptautisku dokumentu plūsma uz abām pusēm. Ja mēs esam ANO un varam tur līdzrunāt kā pilntiesīgi locekļi, tad mums arī jāakceptē ANO iespaids uz mūsu valsti un mūsu valodu. Ja vēlamies piedalīties starptautiskā zinātniskā apritē, mums tai jāpiemēro arī mūsu valoda, arī, ja rakstām latviski.
Ja vēlamies saimniecisku uzplaukumu, mums jāpieņem mūsu valsts tranzītloma. Ja mums būs starptautiskas ostas, ja mūsu valstij ies cauri Via Baltica , tad mums arī daudz kas jāmaina valodas ziņā, jāpiekāpjas valsts uzplaukuma un valsts drošības dēļ. Ceļrāži, informācija, veidlapas utt. Tas būs atkarīgs vienīgi no mums pašiem, vai spēsim ņemt pretī šo izaicinājumu. Darīsim to, gatavosimies jau laikus, tad arī mūsu valoda dzīvos! Mums pašiem jākļūst vismaz divvalodīgiem, ja ne trīsvalodīgiem vai četrvalodīgiem. Aktīvi lietojot vairākas valodas līdzās, tās neizbēgami iespaido cita citu, bet tas ne vienmēr ir tikai ļaunums. Priecāsimies par to, ka varam piedalīties visās dzīves jomās, ka mūsu valoda mūs neizolē. Piedalīsimies šajā procesā radoši, nevis ar kreņķīgu grumbu pierē, ka neviens mūsu unikālo situāciju nesaprot.
Dzīvojot starptautiskā kontekstā, mums jārisina daudzi svarīgi valodnieciski jautājumi. Straujā informācijas plūsma nav burtiski vai mehāniski pārņemama. Manuprāt, ir labāk uz laiku likt kādu vārdu pēdiņās, piemēram, angļu “workshop”, nekā to tulkot ar darbnīcu, kas latvietim rada pilnīgi nepareizus priekšstatus. Tāpat latviešu valodā dzirdam jēdzienu “tehniskā palīdzība”, bieži pārprastā nozīmē, jo šeit nav vis runa par tehniska aprīkojuma apgādi, bet gan par konsultatīvu palīdzību.
Pārdomas rada arī tādi jaunumi, kas iet valodas dziļumā. Piemēram, divkāršu priedēkļu lietojums un priedēkļu lietojuma maiņa; pazvanīt piezvanīt vietā, uzziņa izziņas vietā vai atremontēt motoru un uzspēt autobusu utt. Manā valodas izpratnē kāds iet bojā , bet, dažu nedēļu laikā lasot avīzēs un žurnālos vārdkopu aiziet bojā , tā man vairs neliekas tik atbaidoša, kā pirmo reizi dzirdot. Aplūkojot Mīlenbaha—Endzelīna vārdnīcā dažādu priedēkļu lietojumu, atklājas lielas variācijas. Šādi rodas pārdomas, vai latviešu valodas priedēkļu lietojums ir tik viennozīmīgs un stabils, kā mums sākotnēji varētu šķist.
Mēs bieži lepojamies ar mūsu pareizrakstību, kas mums šķiet tik ideāla. Bet, ieejot modernā, atvērtā sabiedrībā, tā mums uzliek papildu slodzi. Piemēram, sakarā ar datortehniku, nemaz nerunājot par svešu personvārdu un vietvārdu rakstību. Šī gada 27. februāra LMuM Arturs Heniņš recenzē jaunu grāmatu par valsts apbalvojumiem, veselu sleju veltot valsts valodas likuma pārkāpumiem, proti, ka autors lietojis svešu vietvārdu un personvārdu oriģinālrakstību.
Nedomāju, ka grāmatas autors šo problēmu risinājis veiksmīgi, tekstā atstājot personvārdus un vietvārdus oriģinālrakstībā bez galotnēm. Tas katram, kas izjūt latviešu valodas būtību, izraisīs nepatiku. Tomēr grāmatas recenzenta spriedumi labi norāda uz latviešu valodas pareizrakstības likumu nepilnībām.
Ja negribam dzīvot latviskā Brīvdabas muzejā un skatīties tikai savā nabā, mums jārada risinājumi šajā jomā. Pavisam vienkāršu risinājumu esmu pati ierosinājusi kādā 1989. gada Karogā . Proti, pirmo reizi lietojot kādu svešu personvārdu vai vietvārdu, tam aiz vārda latviskojuma obligāti jāliek oriģināls iekavās. Tā kā Latvijā rīcību nenosaka veselais saprāts, bet visam jābūt fiksētam likumā, tad arī šāds mehānisms jāfiksē likumā. Tāpat šķiet pilnīgi absurdi, ka nule izdotajā franču valodas mācību grāmatā, lai lasītājs iemācītos šo vārdu lielo atšķirību rakstībā un izrunā, pedagoģisku iemeslu dēļ pastāvīgi tiek atkārtoti franču personvārdi un vietvārdi, tie latviešu tekstā transskribēti latviski. Valsts valodas likuma vārdā šeit zaudēts veselais saprāts.
Priecāsimies, ka latviešu valoda atkal ir kļuvusi moderna valoda, kas lietojama visās jomās. Nepārprotiet mani, nedomāju, ka būtu jāļauj valodai vulgarizēties. Manuprāt, ļoti liela uzmanība būtu jāpievērš masu saziņas līdzekļiem, jo tieši tie iespaido valodas attīstību visvairāk. Bet neaizmirsīsim, ka demokrātijas apstākļos nekā nevar panākt ar valodas policiju, toties ar labi skolotu konsultatīvu dienestu gan. Protams, jāfiksē un jāpēta valodas pārmaiņas, bet galvenā uzmanība jāpievērš jautājumiem, kas risināmi sakarā ar šo jauno kontekstu izaicinājumu.
Izbeigsim aizvainoti skatīties savā nabā un sūdzēties par to, ka mūs neviens nesaprot. Nerunāsim par latviešu valodu kā par mironi bērēs, bet atcerēsimies, ka latviešu valodā var priecāties un pat smieties! Mūsu valoda ir moderna saskarsmes valoda, nerunāsim par to tā, it kā tā būtu minoritāšu valoda. Pacelsim galvas un skatīsimies pāri robežām kā pašapzinīgi, normāli latvieši, mācīsimies citas valodas un kultūras! Pārzinot citas valodas un kultūras, mēs uzzināsim par sevi un savu valodu daudz vairāk un daudz plašākā kontekstā. Tad mēs apzināsimies, ka esam latvieši bez tautības špikera ieraksta pasē. Ja savu valodu uztversim kā normālu pasaules sastāvdaļu, nevis kā latvieša krustu, tad runāsim latviski arī pēc 500 gadiem un ne tikai 2097. gadā vien.
Referāts nolasīts konferencē “Latviešu valoda: esamība, vide, konteksti” 1997. gada 14. martā