Date of Award

Summer 7-2020

Document Type

Thesis

Degree Name

Bachelor Degree

Department

Computer Science

First Advisor

Bertan Karahoda

Language

Albanian

Abstract

Në këtë punim trajtohet problemi se cili algoritëm funksionon më së miri në klasifikimin e tekstit shqip në kategori të caktuara. Arsyeja kryesore pse kam zgjedhur këte temë është për shkak se klasifikimi i tekstit në gjuhën shqipe mund të jetë pak me i komplikuar për shkak të gjuhës sonë. Rëndesia e ketij punimi është se mund të implementohen këto algoritme në krijimin e platformave e ndryshme qe implementojne keto algoritme, mirepo me fokus kryesisht me permbajtje në gjuhën shqipe.

Për zgjedhjen e ketij problemi kemi marrur dy algoritme për krahasim, njëri prej tyre Naive Bayes dhe tjetri SVM. Kemi grumbulluar të dhëna për trajnim dhe testim të modeleve, ku në bazë të statistikave të dy algoritmet kane pasur një saktësi të madhe, mirepo për klasifikim të tekstit në gjuhën shqipe më mirë funksionon algoritmi i Naive Bayes.

Rezultatet e ketij punimi tregojne qe mund te krijohet një platformë ku mund të mblidhen lajme të ndryshme në gjuhen shqipe dhe me anë të ketyre algoritmeve të klasifikohen në kategoritë që i përkasin.

DOI

10.33107/ubt-etd.2020.2485

Share

COinS