Author

Ruhada Emini

Date of Award

Fall 9-2020

Document Type

Thesis

Degree Name

Bachelor Degree

Department

Computer Science

First Advisor

Edmond Jajaga

Language

Albanian

Abstract

Viteve të fundit, me zhvillimin e rrjeteve sociale, lajmet e rreme për qëllime dhe përfitime të ndryshme kanë filluar të shfaqen në një numër të madh dhe me përhapje të shpejtë. Me fjalë mashtruese, përdoruesit e rrjetit social dhe lexuesit e portaleve mund të infektohen me lehtësi nga këto lajme të rreme në internet, gjë që ka sjellë efekte të jashtëzakonshme në shoqërinë. Një qëllim i rëndësishëm për të përmirësuar besueshmërinë e informacionit në rrjetet sociale dhe portale është identifikimi me kohë i lajmeve të rreme. Ky punim synon të hetojë parimet, metodologjitë dhe algoritmet për zbulimin e artikujve të lajmeve të rreme në gjuhën shqipe. Ai adreson sfidat e paraqitura nga karakteristikat e panjohura të lajmeve jo të vërteta dhe lidhjeve të ndryshme midis artikujve. Poashtu janë bërë një sërë eksperimentesh nga korpuse (grup të dhënash) të lajmeve për të krahasuar dhe dhënë rezultate sa më efikase në çështjen e detektimit të lajmeve të rreme. Punimi është unik në detektimin e artikujve të lajmeve në gjuhën shqipe duke mbuluar kategorinë e lajmeve legjitime dhe ato të rreme. Saktësia më e mirë u arrit deri në 99%, duke përdorur algoritme ekzistuese përmes gjuhës programuese Python dhe teknikën e mësimit të makinave (ang. machine learning). Kufizimi i vetëm në arritjen e një rezultati të kompletuar është mungesa e korpuseve testuese dhe ushtruese në gjuhën shqipe. Për këtë arsye është përdorur libraria e Python-it për përkthim të lajmeve. Rezultate më të mira u arritën kur u përdorën tekstet origjinale në vend të përmbledhjeve të shkruara nga njeriu. Në fund me modelin e gjeneruar është krijuar aplikacioni në ueb, duke përdorur framework-un Flask.

DOI

10.33107/ubt-etd.2020.2960

Share

COinS