Forecasting infection fatality rate of COVID-19: measuring the efficiency of several hybrid models

封面

如何引用文章

全文:

详细

The main goal of this paper is to delve into a crucial epidemiological metric the daily infection fatality rate in the context of the ongoing COVID-19 pandemic. The significance of understanding this metric lies in its potential to provide insights into the severity and impact of the virus on a daily basis. Methods: To achieve this overarching objective, we employ a comprehensive approach by applying various hybrid models that hybridize both machine learning and statistical techniques. In our pursuit of a deeper understanding, we leverage advanced machine learning algorithms, including Support Vector Machine and Random Forest. These techniques allow us to capture intricate patterns and relationships within the data, contributing to a more nuanced analysis of the infection fatality rate. The application of machine-learning models in epidemiological studies has gained prominence due to their ability to adapt to complex and evolving patterns inherent in infectious disease dynamics. Complementing our machine-learning arsenal, we integrate traditional statistical models such as ARIMA (AutoRegressive Integrated Moving Average), fractional ARIMA, and BATS (Bayesian Structural Time Series). Results. To assess the performance of these models, we employ key evaluation metrics, including Root Mean Squared Error (RMSE), Mean Squared Error (MSE), and Mean Absolute Error (MAE). These metrics serve as critical benchmarks, allowing us to quantify the accuracy and reliability of our models in predicting the daily infection fatality rate. A meticulous evaluation of model performance is crucial for ensuring the validity and of our findings. According to these measures, we see that hybrid models performed well especially ARIMA-RF model RMSE: 0.29, MSE: 0.084, MAE: 0.215 for the horizon 60 and for horizon 120 ARIMA-RF still the best performance, RMSE: 0.268, MSE: 0.071, MAE: 0.183, we get these results due to the capacity of this approach to handle complex patterns contrarily to other model ARIMA, BATS, RF and SVM. Conclusion. This work adopted this approach in order to build a model to predict infection fatality rate, we aspire to provide a nuanced understanding of the factors influencing the severity of the virus, ultimately contributing to the ongoing discourse on effective public health interventions and mitigation strategies.

作者简介

D. Seba

Higher School of Informatics; University of Bejaia

编辑信件的主要联系方式.
Email: d.seba@esi-sba.dz

Doctor in Mathematics, Assistant Professor, Laboratory of Applied Mathematics, Department of Mathematics

阿尔及利亚, Sidi Bel Abbes; Bejaia

K. Belaide

Higher School of Informatics; University of Bejaia

Email: d.seba@esi-sba.dz

Doctor in Mathematics, Full Professor, Laboratory of Applied Mathematics, Department of Mathematics

阿尔及利亚, Sidi Bel Abbes; Bejaia

参考

  1. Acosta-González E., Andrada-Félix J., Fernández-Rodríguez F. On the evolution of the COVID-19 epidemiological parameters using only the series of deceased. A study of the Spanish outbreak using Genetic Algorithms. Math. Comput. Simul., 2022, vol. 197, pp. 91–104. doi: 10.1016/j.matcom.2022.02.007
  2. Ahmar A.S., Boj E. Application of neural network time series (Nnar) andarima to forecast infection fatality rate (ifr) of COVID-19 in Brazil. International Journal on Informatics Visualization, 2021, vol. 5, no. 1, pp. 8–10. doi: 10.30630/joiv.5.1.372
  3. Alazab M., Awajan A., Mesleh A., Abraham A., Jatana V., Alhyari S. COVID-19 prediction and detection using deep learning. International Journal of Computer Information Systems and Industrial Management Applications, 2020, no. 12, pp. 168–181.
  4. Alzahrani S.I., Aljamaan I.A., Al-Fakih E.A. Forecasting the spread of the COVID-19 pandemic in Saudi Arabia using ARIMA prediction model under current public health interventions. J. Infect. Public Health, 2020, vol. 13, no. 7, pp. 914–919. doi: 10.1016/j.jiph.2020.06.001
  5. ArunKumar K.E., Kalaga D.V., Kumar C.M.S., Kawaji M., Brenza T.M. Comparative analysis of Gated Recurrent Units (GRU), long Short-Term memory (LSTM) cells, autoregressive Integrated moving average (ARIMA), seasonal autoregressive Integrated moving average (SARIMA) for forecasting COVID-19 trends. Alexandria Engineering Journal, 2022, vol. 61, no. 10, pp. 7585–7603. doi: 10.1016/j.aej.2022.01.011
  6. Beran J. Statistics for long- memory processes. CRC press, 1994. Vol. 61. doi: 10.1201/9780203738481
  7. Box G.E., Jenkins G.M., Reinsel G.C., Ljung G.M. Time series analysis: forecasting and control; 5th ed. John Wiley and Sons, 2015. doi: 10.1002/9781118619193
  8. Dehesh T., Mardani-Fard H.A., Dehesh P. Forecasting of COVID-19 confirmed cases in different countries with ARIMA models. MedRxiv, 2020.03.13.20035345. doi: 10.1101/2020.03.13.20035345
  9. Chen J.M. Novel statistics predict the COVID-19 pandemic could terminate in 2022. J. Med. Virol., 2022, vol. 94, no. 6, pp. 2845–2848. doi: 10.1002/jmv.27661
  10. Deif M.A., Solyman A.A., Hammam R.E. ARIMA model estimation based on genetic algorithm for COVID-19 mortality rates. International Journal of Information Technology and Decision Making, 2021, vol. 20, no. 6,pp. 1775–1798. doi: 10.1142/S0219622021500528
  11. De Livera A.M., Hyndman R.J., Snyder R.D. Forecasting time series with complex seasonal patterns using exponential smoothing. Journal of the American statistical association, 2011, vol. 106, no. 496, pp. 1513–1527. doi: 10.1198/jasa.2011.tm09771
  12. Kapoor A., Ben X., Liu L., Perozzi B., Barnes M., Blais M., O’Banion S. Examining COVID-19 forecasting using spatio-temporal graph neural networks. arXiv, 2020: 2007.03113 [Preprint]. doi: doi: 10.48550/arXiv.2007.03113
  13. Lukman A.F., Rauf R.I., Abiodun O., Oludoun O., Ayinde K., Ogundokun R.O. COVID-19 prevalence estimation: Four most affected African countries. Infect. Dis. Model., 2020, vol. 5, pp. 827–838. doi: 10.1016/j.idm.2020.10.002
  14. Namasudra S., Dhamodharavadhani S., Rathipriya R. Nonlinear Neural Network Based Forecasting Model for Predicting COVID-19 Cases. Neural. Process. Lett., 2023, vol. 55, no. 1, pp. 171–191. doi: 10.1007/s11063-021-10495-w
  15. Rath S., Tripathy A., Tripathy A.R. Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model. Diabetes Metab. Syndr., 2020, vol. 14, no. 5, pp. 1467–1474. doi: 10.1016/j.dsx.2020.07.045
  16. Roy S., Bhunia G.S., Shit P.K. Spatial prediction of COVID-19 epidemic using ARIMA techniques in India. Model. Earth Syst. Environ., 2021, vol. 7, no. 2, pp. 1385–1391. doi: 10.1007/s40808-020-00890-y
  17. Salgotra R., Gandomi M., Gandomi A.H. Time Series Analysis and Forecast of the COVID-19 Pandemic in India using Genetic Programming. Chaos Solitons Fractals, 2020, no. 138: 109945. doi: 10.1016/j.chaos.2020.109945
  18. Singh A., Bajpai M.K. SEIHCRD Model for COVID-19 spread scenarios, disease predictions and estimates the basic reproduction number, case fatality rate, hospital, and ICU beds requirement. ComputerModeling in Engineering & Sciences, 2020, vol. 125, no. 3, pp. 991–1031. doi: 10.32604/cmes.2020.012503
  19. Tamang S.K., Singh P.D., Datta B. Forecasting of COVID-19 cases basedon prediction using artificial neural network curve fitting technique. Global Journal of Environmental Science and Management, 2020, vol. 6, special iss. (COVID-19), pp. 53–64. doi: 10.22034/GJESM.2019.06.SI.06
  20. Tipping M. The relevance vector machine. Advances in Neural Information Processing Systems 12. 1999, pp. 652–658.
  21. Vapnik V. The Nature of Statistical Learning Theory. Springer, New York, 1995.
  22. Vattay G. Forecasting the outcome and estimating the epidemic model parameters from the fatality time series in COVID-19 outbreaks. Phys. Biol., 2020, vol. 17, no. 6: 065002. doi: 10.1088/1478-3975/abac69
  23. Yousaf M., Zahir S., Riaz M., Hussain S.M., Shah K. Statistical analysis of forecasting COVID-19 for upcoming month in Pakistan. Chaos Solitons Fractals, 2020, no. 138: 109926. doi: 10.1016/j.chaos.2020.109926
  24. Zeroual A., Harrou F., Dairi A., Sun Y. Deep learning methods for forecasting COVID-19 time-Series data: A Comparative study. Chaos Solitons Fractals, 2020, no. 140: 110121. doi: 10.1016/j.chaos.2020.110121

补充文件

附件文件
动作
1. JATS XML
2. Figure 1. Daily IFR of COVID-19 from January, 3rd 2020 to March 16th 2023

下载 (32KB)
3. Figure 2. ACF and PACF for Daily IFR

下载 (95KB)
4. Figure 3. Daily IFR Forecasting with horizon h = 60

下载 (141KB)
5. Figure 4. Daily IFR Forecasting with horizon h = 120

下载 (258KB)

版权所有 © Seba D., Belaide K., 2024

Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».