IRTUM – Institutional Repository of the Technical University of Moldova

A Graph Convolutional Network and Recurrent Neural Network ensemble for extractive text summarisation in the Hausa language

Show simple item record

dc.contributor.author SHEHU, Anas
dc.contributor.author KARATU, Musa
dc.contributor.author ROKO, Abubakar
dc.contributor.author ABDULLAHI, Sirajo
dc.date.accessioned 2025-06-03T16:58:19Z
dc.date.available 2025-06-03T16:58:19Z
dc.date.issued 2025
dc.identifier.citation SHEHU, Anas; Musa KARATU; Abubakar ROKO and Sirajo ABDULLAHI. A Graph Convolutional Network and Recurrent Neural Network ensemble for extractive text summarisation in the Hausa language. Journal of Engineering Science. 2025, vol. 32, nr 1, pp. 32-46. ISSN 2587-3474, eISSN 2587-3482. en_US
dc.identifier.issn 2587-3474
dc.identifier.issn 2587-3482
dc.identifier.uri https://www.doi.org/10.52326/jes.utm.2025.32(1).03
dc.identifier.uri https://repository.utm.md/handle/5014/31878
dc.description.abstract Automatic Text Summarisation (ATS) is crucial for managing information overload, especially in low-resource languages like Hausa. This study proposes a hybrid extractive approach that combines Graph Convolutional Networks (GCN) and Recurrent Neural Networks (RNN) to improve sentence ranking accuracy. By integrating GCN’s structural learning with RNN’s sequential modeling, the method overcomes limitations of existing graph-based techniques. The research was conducted in Visual Studio IDE using Python 3.12.4, with key libraries like NLTK, Pandas, and NetworkX. A pre-processed Hausa news dataset was tokenised, normalised, and vectorised using TF-IDF and a pre-trained Hausa FastText model to build a sentence similarity graph. GCNs propagated sentence embeddings, while RNNs refined rankings by capturing sequential dependencies. Experiments on 113 Hausa news articles showed the GCN-RNN model outperformed Modified PageRank, achieving higher ROUGE-1 precision (90.00) and balanced F1-scores. The Wilcoxon Signed-Rank Test confirmed significant improvements. Despite added computational overhead, the approach remains feasible for moderate datasets, with scalability as a key future focus. This study offers a robust and contextually coherent approach to Hausa text summarisation, advancing extractive summarisation techniques and multilingual ATS research. Future work will focus on optimising model efficiency and scalability while exploring transformer-based architectures for further enhancements. en_US
dc.description.abstract Sumarizarea automată a textului (ATS) este crucială pentru gestionarea supraîncărcării cu informații, în special în limbile cu resurse reduse, cum ar fi hausa. Acest studiu propune o abordare extractivă hibridă care combină rețelele convoluționale grafice (GCN) și rețelele neuronale recurente (RNN) pentru a îmbunătăți acuratețea clasificării propozițiilor. Prin integrarea învățării structurale a GCN cu modelarea secvențială a RNN, metoda depășește limitele tehnicilor existente bazate pe grafuri. Cercetarea a fost efectuată în Visual Studio IDE folosind Python 3.12.4, cu biblioteci cheie precum NLTK, Pandas și NetworkX. Un set de date de știri hausa preprocesat a fost tokenizat, normalizat și vectorizat folosind TF-IDF și un model hausa FastText pre-antrenat pentru a construi un grafic de similaritate a propozițiilor. GCN-urile au propagat încorporările de propoziții, în timp ce RNN-urile au rafinat clasamentele prin captarea dependențelor secvențiale. Experimentele pe 113 articole de știri hausa au arătat că modelul GCN-RNN a depășit performanța Modified PageRank, atingând o precizie ROUGE-1 mai mare (90,00) și scoruri F1 echilibrate. Testul Wilcoxon Signed-Rank a confirmat îmbunătățiri semnificative. În ciuda costurilor de calcul suplimentare, abordarea rămâne fezabilă pentru seturi de date moderate, scalabilitatea fiind un obiectiv cheie în viitor. Acest studiu oferă o abordare robustă și coerentă din punct de vedere contextual a rezumării textului în limba hausa, avansând tehnicile de rezumare extractivă și cercetarea ATS multilingvă. Lucrările viitoare se vor concentra pe optimizarea eficienței și scalabilității modelului, explorând în același timp arhitecturi bazate pe transformatoare pentru îmbunătățiri suplimentare. en_US
dc.language.iso en en_US
dc.publisher Technical University of Moldova en_US
dc.relation.ispartofseries Journal of Engineering Science, 2025, vol. 32, nr. 1;
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject language processing en_US
dc.subject extractive text summarisation en_US
dc.subject deep learning ensembles en_US
dc.subject automatic text summarisation en_US
dc.subject prelucrarea limbajului en_US
dc.subject limba hausa en_US
dc.subject sumarizare extractivă a textului en_US
dc.subject ansambluri de învățare profundă en_US
dc.subject sumarizare automată a textului en_US
dc.title A Graph Convolutional Network and Recurrent Neural Network ensemble for extractive text summarisation in the Hausa language en_US
dc.type Article en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account