Miks me seda uurime?

Teadlased on kõvasti vaeva näinud, et abstraktsus- ja konkreetsushinnanguid teistes keeltes koguda. Näiteks on inimestelt hinnangud kogutud suurele hulgale ingliskeelsetele sõnadele (1), hollandikeelsetele sõnadele (2) ja mandariinikeelsetele sõnadele (3). Mitmes keeles on kogutud hinnanguid väiksemale hulgale sõnadele (1000-4000), sh prantsuse (4), saksa (5), itaalia (6), hispaania (7), portugali (8), poola (9), horvaatia (10) ja indoneesia (11) keele sõnadele. Lisaks inimesi hõlmavale katsemeetodile on neid väikeste mööndustega võimalik koguda ka masinõppe abil, eriti kui mingi hulk inimhinnatud sõnade andmeid on juba ees olemas (12, 19).

Miks on aga selliseid hinnanguid teadlastele vaja? Esiteks saame rääkida sellest, mida nende abil on üldse võimalik
teha, ning teiseks sellest, mida me oma projekti raames nendega teha plaanime.



Mis nendega teha saab?

Konkreetsuse-abstraktsuse skaala on keeleteaduses ja psühholoogias kuum teema. Need kontseptsioonid on aja möödudes teaduses aina olulisemaks saanud, sest selleteemaliste artiklite arv kasvas u 300 pealt 1990ndatel 800 peale 2000ndatel ning 1900 peale viimasel kümnendil (3).

Nagu öeldud, siis meie projekti tulemusel valmib teadusvara, mida saavad oma töös kasutada mitme teadusharu esindajad. Esmajärjekorras on sellest palju abi keeleteadlastel, psühholingvistidel ja psühholoogidel. Konkreetsus ja abstraktsus mõjutavad seda, kuidas inimaju üldse keelt protsessib. Paljud teadlased töötavad teooriate kallal, mis püüavad seletada, miks konkreetsemaid sõnu on lihtsam protsessida kui abstraktseid (13, 14). Et ka eesti keele kohta selliseid uuringuid põhjalikumalt teha, on hädasti vaja teada, kui abstraktsed või konkreetsed uuringus kasutatavad sõnad on.

Samuti ei ole ilma nende hinnanguteta võimalik teha teatud tüüpi keelekatseid. Näiteks lasevad paljud katsed inimesel ekraanil olevaid objekte või teksti vaadata ning mõõdavad, kui palju aega neil reageerimiseks kulub. Et abstraktseid asju protsessib inimene alati kauem, tuleb katseid tehes pöörata tähelepanu sellele, et nähtavad objektid või sõnad oleks sarnase abstraktsustasemega, et katse tulemused sellest mõjutatud poleks.

Meie abstraktsuse-konkreetsuse hinnangutest võiks abi olla ka neuroloogias. Mõned teadlased on näidanud, kuidas abstraktsed ja konkreetsed sõnad mängivad erinevat rolli Parkinsoni tõve ja skisofreenia korral (15, 16). Huvitaval kombel paistab olevat nõnda, et kui Alzheimerit põdevad patsiendid kaotavad esmajärjekorras pigem abstraktset sõnavara, siis dementsust põdevate patsientide puhul võib esmalt kaduda just konkreetne sõnavara (17, 18).

Lisaks mainitud valdkondadele on need kategooriad üliolulised ka arvutiteaduses, eriti mis puutub keeletehnoloogiasse ja sellesse, kuidas arvuti inimkeelt protsessib ja toodab. Abstraktsuse-konkreetsuse hinnangud teevad võimalikuks näiteks teksti automaatse keerukuse hindamise ning automaatse teksti lihtsustamise, asesõnade mudeldamise, automaatsete lühikokkuvõtete tegemise ja metafooride automaatse tuvastamise. Aedmaa (2019) kasutas neid selleks, et õpetada arvutit ära tundma, kas sisestatud tekstis on sellised ühendverbid nagu "alla käima" mõeldud otseses tähenduses ("käis trepist alla") või ülekantud tähenduses ("käis elus alla"). Lisaks on hinnanguid kasutatud ka psühholoogias, meedia- ja tarbijakäitumisuuringutes, tarkvara arendamisel, kirjandusuuringutes ning keele- ja teiste kognitiivhäirete uurimisel.


Mida meie projekt nendega teeb?

Meil on eestikeelsete sõnade abstraktsuse-konkreetsuse hinnangute kogumisel laias laastus kaks eesmärki:

  1. Tahame hinnanguid kasutada selleks, et vastata keelesemantikat puudutavatele uurimisküsimustele. Mõned neist on järgmised:
    • Kuidas on omavahel seotud sõnade abstraktsus-konkreetsus ja nende sagedus? (3)

    • Kuidas suhestuvad eestikeelsete sõnade hinnangud ingliskeelsete sõnade hinnangutega? Eestikeelsetele sõnadele antud hinnanguid saab masintõlget kasutades võrrelda ingliskeelsetele sõnadele antud hinnangutega. Nii saab võrrelda, kuidas kahe eri keele rääkijad samu sõnu hindasid.

    • Kuidas varieeruvad erinevate sõnaliikide hinnangud? Kas nimisõnad, tegusõnad, omadussõnad ja määrsõnad asuvad abstraktsuse ja konkreetsuse skaalal sarnastel või erinevatel aladel? Millise sõnaliigi esindajad varieeruvad kõige rohkem?

    • Kuidas üksikutele sõnadele antud hinnangud varieeruvad ja kas mõnes sõnaliigis on rohkem sõnu, mille osas rääkijad pole väga ühtsel arvamusel? Näiteks kas nimisõnade hindamisel ollakse rohkem ühel nõul kui teiste sõnaliikide hindamisel?
    • Kuidas mõjutab sõna abstraktsuse-konkreetsuse hinnangut tema morfoloogia? Eesti keeles on suur hulk liiteid, mida sõnadele külge pannes saab luua uut tüüpi sõnu (“magama”, “magaja”, “magades”). Kas mõni liide teeb süstemaatiliselt sõnu abstraktsemaks või konkreetsemaks?   

  2. Tahame luua andmestiku, mida ka teised teadlased saaksid oma töös kasutada. Loe ülaltpoolt sellest, kuidas tegu on väärtusliku ja paljude teadusharude jaoks olulise andmekogumiga.