Tehisintellektiga loodud valeinfo teadusartiklites – kuidas eristada õiget? - Eesti Rahvusraamatukogu
Vaata lahtiolekuaegu
Foto: Pixabay.com

Tehisintellektiga loodud valeinfo teadusartiklites – kuidas eristada õiget?

27. aprill 2026

Kristiina Kaju
Sotsiaalia ja humanitaaria infokeskuse juht

Kuidas generatiivse tehisintellekti kiire levik on soodustanud võltsitud ja ebakvaliteetse sisu loomist nii Amazoni raamatuturul kui ka teadusartiklite hulgas, eriti Google Scholaris? Tehisintellekt võimaldab luua suuri koguseid tekste peaaegu olematute kuludega. See ohustab teadusmaailma autoreid, eksitab infotarbijaid ning võib kahjustada usaldust teaduse vastu. 

Amazoni raamatuturul on tehisintellekt muutnud võltsitud sisu loomise lihtsaks ja odavaks. Kui varem nõudis selline tegevus märkimisväärseid ressursse, siis nüüd saab sisu luua kiiresti ja vähese vaevaga. Kõige levinumad pettuse vormid on populaarsete raamatute kokkuvõtted ja juhendid, mida turustatakse originaalteoste kõrval. Sageli kordavad need teosed lihtsalt algmaterjali põhipunkte, pakkumata sisulist analüüsi. Samuti avaldatakse loata biograafiaid, mis kasutavad tuntud autorite nime ja eluloolisi fakte, kuid on tegelikult tehisintellekti loodud ja sageli ebatäpse sisuga. Lisaks kasutatakse tehisintellekti originaaltekstide ümber sõnastamiseks, et müüa neid uute teostena, kuigi nende sisu põhineb olemasoleval materjalil. Selline tegevus vähendab originaalautorite müügitulu ning eksitab lugejaid, kes võivad pidada neid teoseid usaldusväärseks või autentseks materjaliks. 

Teadusvaldkonnas on sarnased probleemid ilmnenud Google Scholaris, mis kasutab automatiseeritud süsteeme teadustekstide indekseerimiseks. Erinevalt kontrollitud sisuga teadusandmebaasidest võimaldab selline lähenemine ka madalakvaliteedilise või valeinfoga sisu levikut. Uuringute käigus on tuvastanud hulgaliselt kahtlaseid artikleid või võltsitud uuringuid, milles esinevad tehisintellektile omased fraasid. See on ohuks teadusliku kommunikatsiooni usaldusväärsusele ja teaduspõhise info kasutamisele, moonutades teaduslikku arutelu ja raskendades usaldusväärse info eristamist väärinfost. Eriti murettekitav on asjaolu, et suur osa neist artiklitest käsitleb poliitiliselt tundlikke teemasid, sealhulgas tervist ja keskkonda ka tehnoloogiat, mida saab kasutada avaliku arvamuse mõjutamiseks. Ekspertide sõnul on vaja selle probleemiga tegeleda. Üheks oluliseks sammuks peetakse tehisintellekti loodud sisu selget märgistamist, et kasutajad saaksid teadlikumalt hinnata selle usaldusväärsust. Samuti nähakse vajadust seadusandlike meetmete järele, mis kaitseksid autorite õigusi ja piiraksid nende nime või loomingulise stiili kuritarvitamist. Teadusandmebaaside puhul on oluline arendada täpsemaid filtreid, mis eristaksid retsenseeritud teadustöid kontrollimata materjalidest. Lisaks on vaja pöörata tähelepanu ka akadeemilisele süsteemile endale, näiteks survele avaldada suur hulk artikleid, mis võib soodustada tehisintellekti väärkasutamist.

Kuidas infot otsides ja uurimistööd kirjutades hinnata teadusartikli või teose usaldusväärsust?

Analüüsi teksti keelekasutust, väljendeid ja struktuuri

Kuigi tehisintellekt kirjutab inglise keeles grammatiliselt üsna korrektselt, on sellel teatud eripärad: 

  • liigne statistiline tõenäosus: tehisaru on optimeeritud ennustama statistiliselt kõige tõenäolisemaid järgmisi sõnu, et luua veenvat sisu. Teadlased aga keskenduvad hüpoteeside testimisele ja eksperimentide täpsele kirjeldamisele, mis tähendab, et nende keelekasutus on mitmekesisem ja vähem “ennustatav”;
  • sõnakordused ja seosed: uuringud näitavad, et AI-tekstides on sageli vähem unikaalseid sõnu, kuid need sõnad on omavahel tihedamini seotud. See tähendab, et tekst võib tunduda voolav, kuid sisu on korduv ja ringlev;
  • sisutud kokkuvõtted:  sageli vaid korrutatakse algse teose põhipunkte ilma uue analüüsi või kommentaarideta;
  • tehisintellektile omased tüüpväljendid;
  • tehisintellektiga genereeritud artiklite puhul kasutatakse sageli pealkirjades ja tekstides üldiseid moesõnu, et näida aktuaalsena. Pööra tähelepanu sisutühjadele sõnadele.

Vaata, kus tekst on avaldatud 

Suur osa kahtlastest tehisaru tekstidest ei ilmu usaldusväärsetes teadusajakirjades.

  • Indekseerimata ajakirjad: paljud tehisaruga loodud tööd leitakse ajakirjadest, mis ei kuulu ametlikesse teadusandmebaasidesse (nagu Scopus või Web of Science).
  • Google Scholar: ole ettevaatlik Google Scholari kasutamisel, kuna see kaasab oma otsingusse ka tekstid, millel puudub range kvaliteedikontroll. 

Uuri viiteid

Kontrolli, kas artiklid, millele viidatakse on olemas.

Uuri autorit või kirjastajat

Kasulik on autori või kirjastaja kohta rohkem infot otsida. Leia ja uuri ametlikku veebilehte ning kas autoril on varasemaid töid.

Kasutatud allikad: 

AI Is Driving a New Surge of Sham ‘Books’ on Amazon. (2024). AuthorsGuild 

Haider, J., Söderström, K. R., Ekström, B. & Rödl, M. (2024). GPT-fabricated scientific papers on Google Scholar: Key features, spread, and implications for preempting evidence manipulation. HKS Misinformation Review. 

Constantino, T. (2024). AI Tools Fuel Rise Of Fake Research Papers On Google Scholar. Forbes 

Rajkumar, R. (2024). Study finds AI-generated research papers on Google Scholar – why it matters. Zdnet. 

Moersen, A. (2025) AI detection for peer reviewers: Look out for red flags. Sage.