Automatic Text Summarisation (ATS) is crucial for managing information overload, especially in low-resource languages like Hausa. This study proposes a hybrid extractive approach that combines Graph Convolutional Networks (GCN) and Recurrent Neural Networks (RNN) to improve sentence ranking accuracy. By integrating GCN’s structural learning with RNN’s sequential modeling, the method overcomes limitations of existing graph-based techniques. The research was conducted in Visual Studio IDE using Python 3.12.4, with key libraries like NLTK, Pandas, and NetworkX. A pre-processed Hausa news dataset was tokenised, normalised, and vectorised using TF-IDF and a pre-trained Hausa FastText model to build a sentence similarity graph. GCNs propagated sentence embeddings, while RNNs refined rankings by capturing sequential dependencies. Experiments on 113 Hausa news articles showed the GCN-RNN model outperformed Modified PageRank, achieving higher ROUGE-1 precision (90.00) and balanced F1-scores. The Wilcoxon Signed-Rank Test confirmed significant improvements. Despite added computational overhead, the approach remains feasible for moderate datasets, with scalability as a key future focus. This study offers a robust and contextually coherent approach to Hausa text summarisation, advancing extractive summarisation techniques and multilingual ATS research. Future work will focus on optimising model efficiency and scalability while exploring transformer-based architectures for further enhancements.
Sumarizarea automată a textului (ATS) este crucială pentru gestionarea supraîncărcării cu informații, în special în limbile cu resurse reduse, cum ar fi hausa. Acest studiu propune o abordare extractivă hibridă care combină rețelele convoluționale grafice (GCN) și rețelele neuronale recurente (RNN) pentru a îmbunătăți acuratețea clasificării propozițiilor. Prin integrarea învățării structurale a GCN cu modelarea secvențială a RNN, metoda depășește limitele tehnicilor existente bazate pe grafuri. Cercetarea a fost efectuată în Visual Studio IDE folosind Python 3.12.4, cu biblioteci cheie precum NLTK, Pandas și NetworkX. Un set de date de știri hausa preprocesat a fost tokenizat, normalizat și vectorizat folosind TF-IDF și un model hausa FastText pre-antrenat pentru a construi un grafic de similaritate a propozițiilor. GCN-urile au propagat încorporările de propoziții, în timp ce RNN-urile au rafinat clasamentele prin captarea dependențelor secvențiale. Experimentele pe 113 articole de știri hausa au arătat că modelul GCN-RNN a depășit performanța Modified PageRank, atingând o precizie ROUGE-1 mai mare (90,00) și scoruri F1 echilibrate. Testul Wilcoxon Signed-Rank a confirmat îmbunătățiri semnificative. În ciuda costurilor de calcul suplimentare, abordarea rămâne fezabilă pentru seturi de date moderate, scalabilitatea fiind un obiectiv cheie în viitor. Acest studiu oferă o abordare robustă și coerentă din punct de vedere contextual a rezumării textului în limba hausa, avansând tehnicile de rezumare extractivă și cercetarea ATS multilingvă. Lucrările viitoare se vor concentra pe optimizarea eficienței și scalabilității modelului, explorând în același timp arhitecturi bazate pe transformatoare pentru îmbunătățiri suplimentare.