Date of Award
Summer 7-2020
Document Type
Thesis
Degree Name
Bachelor Degree
Department
Computer Science
First Advisor
Bertan Karahoda
Language
Albanian
Abstract
Në këtë punim trajtohet problemi se cili algoritëm funksionon më së miri në klasifikimin e tekstit shqip në kategori të caktuara. Arsyeja kryesore pse kam zgjedhur këte temë është për shkak se klasifikimi i tekstit në gjuhën shqipe mund të jetë pak me i komplikuar për shkak të gjuhës sonë. Rëndesia e ketij punimi është se mund të implementohen këto algoritme në krijimin e platformave e ndryshme qe implementojne keto algoritme, mirepo me fokus kryesisht me permbajtje në gjuhën shqipe.
Për zgjedhjen e ketij problemi kemi marrur dy algoritme për krahasim, njëri prej tyre Naive Bayes dhe tjetri SVM. Kemi grumbulluar të dhëna për trajnim dhe testim të modeleve, ku në bazë të statistikave të dy algoritmet kane pasur një saktësi të madhe, mirepo për klasifikim të tekstit në gjuhën shqipe më mirë funksionon algoritmi i Naive Bayes.
Rezultatet e ketij punimi tregojne qe mund te krijohet një platformë ku mund të mblidhen lajme të ndryshme në gjuhen shqipe dhe me anë të ketyre algoritmeve të klasifikohen në kategoritë që i përkasin.
DOI
10.33107/ubt-etd.2020.2485
Recommended Citation
Zika, Myhedin, "KLASIFIKIMI I LAJMEVE ME ANE TE TEXT MINING" (2020). Theses and Dissertations. 1985.
https://knowledgecenter.ubt-uni.net/etd/1985