ПРОГНОЗУВАННЯ ПОКАЗНИКІВ ЯКОСТІ ПРОГРАМНИХ СИСТЕМ ІЗ ЗАСТОСУВАННЯМ МОДИФІКАЦІЙ МЕТОДУ SHAP
DOI:
https://doi.org/10.31649/1997-9266-2024-177-6-94-102Ключові слова:
оптимізація, модель глибокого навчання, Баєсівське оновлення, адаптивністьАнотація
Запропоновано 5 пропозицій для поліпшення практичного застосування методу SHAP (Shapley additive explanations — додаткові пояснення за Шеплі) у контексті оцінки якості програмних систем (ПС), що дозволило дослідити можливості вдосконалення методу SHAP щодо прогнозування показників якості ПС. Метою дослідження є підвищення точності та адаптивності методу SHAP шляхом його модифікацій для врахування різноманітних параметрів якості ПС, зокрема продуктивності, надійності, масштабованості та зручності використання. В роботі визначено такі завдання: провести детальний огляд проблем, пов’язаних із застосуванням методу SHAP під час оцінки якості ПС; математично описати п’ять модифікацій методу SHAP, спрямованих на підвищення його точності, адаптивності та швидкості оцінки показників якості ПС; провести експериментальну перевірку запропонованих модифікацій для оцінки їхньої ефективності в порівнянні з оригінальним методом. В ході досліджень розглянуто п’ять підходів, щодо вдосконалення методу SHAP: LSTM (Long Short-Term Memory — довга короткочасна пам’ять); CNN (Convolutional Neural Networks — згорткові нейронні мережі), адаптивний SHAP MLP (multilayer perceptron — багатошаровий перцептрон), RNN (Recurrent Neural Network — рекурентна нейронна мережа (розглядалися ансамблі моделей та Баєсівське оновлення)). Проведено практичне порівняння результатів, яке показало, що запропоновані варіації SHAP можуть значно підвищити точність та швидкість прогнозування, особливо в умовах динамічних змін та великих обсягів даних. В процесі розробки та обґрунтування п’яти оптимізаційних модифікацій методу SHAP досягнуто підвищення точності та ефективності прогнозування показників якості ПС. У ході дослідження встановлено, що методи, які використовують глибокі нейронні мережі (LSTM, CNN), показують вищу точність та адаптивність у порівнянні з оригінальним SHAP, проте ціною цього є складність реалізації та тривалий час виконання. Адаптивний SHAP та Ensemble є оптимальними з погляду балансу між точністю, адаптивністю та інтерпретованістю, проте потребують певної оптимізації для поліпшення часу виконання. Оригінальний SHAP показав задовільну точність (MAE 0,84) та інтерпретованість (7/10), проте поступається сучасним підходам у питаннях адаптивності (6/10) та часу виконання (0,4 години). SHAP потребує подальшої оптимізації, зокрема в умовах динамічних середовищ, де важлива швидка адаптація до нових даних. Часові ряди (LSTM) забезпечили найвищу точність серед інших методів (MAE 0,91) та хорошу адаптивність (8/10).
Посилання
A. Altmann, L. Toloşi, O. Sander, and T. Lengauer, “Permutation importance: A corrected feature importance measure,” Bioinformatics, no. 26 (10), pp.1340-1347, 2010. https://doi.org/10.1093/bioinformatics/btq134 .
T. Amoriello, R. Ciccoritti, and P. Ferrante, “Prediction of strawberries’ quality parameters using artificial neural networks,” Agronomy, no. 12 (4), pр. 963, 2022. https://doi.org/10.3390/agronomy12040963 .
L. Antwarg, R. M. Miller, B. Shapira, and L. Rokach, “Explaining anomalies detected by autoencoders using Shapley Additive Explanations,” Expert Systems with Applications, no. 186, pр.115736, 2021. https://doi.org/10.1016/j.eswa.2021.115736 .
K. N. Dheeraj, et al., “Crop quality prediction using ml and neural networks,” International Journal on Cybernetics & Informatics, no. 10 (2), рр. 07-11, 2021. https://doi.org/10.5121/ijci.2021.100202 .
R. EjrnÆs, E. Aude, B. Nygaard, and B. Münier, “Prediction of habitat quality using ordination and neural networks,” Ecological Applications, no. 12 (4), рр.1180-1187, 2002. https://doi.org/10.1890/1051-0761(2002)012[1180:pohquo]2.0.co;2 .
F. Fumagalli, M. Muschalik, E. Hüllermeier, and B. Hammer, “Incremental permutation feature importance (iPFI): Towards online explanations on data streams,” Machine Learning, 2023. https://doi.org/10.1007/s10994-023-06385-y .
H. Ghanmi, A. Ghith, and T. Benameur, “Ring spun yarn quality prediction using hybrid neural networks,” The Journal of the Textile Institute, рр.1-9, 2021. https://doi.org/10.1080/00405000.2021.2022826 .
K. N. Jha, and C. T. Chockalingam, “Prediction of quality performance using artificial neural networks,” Journal of Advances in Management Research, no. 6 (1), pр.70-86, 2009. https://doi.org/10.1108/09727980910972172 .
H. Kaneko, “Cross‐validated permutation feature importance considering correlation between features,” Analytical Science Advances, 2022. https://doi.org/10.1002/ansa.202200018 .
A. Michalski, K. Duraj, and B. Kupcewicz, “Leukocyte deep learning classification assessment using Shapley additive explanations algorithm,” International Journal of Laboratory Hematology, 2023. https://doi.org/10.1111/ijlh.14031 .
R. Miković, B. Arsić, and Đ. Gligorijević, “Importance of social capital for knowledge acquisition – DeepLIFT learning from international development projects,” Information Processing & Management, no. 61(4), pр.103694, 2024. Accessed: 8 Nov. 2024. [Online]. https://doi.org/10.1016/j.ipm.2024.103694 .
A. Movsessian, D. G. Cava, and D. Tcherniak, “Interpretable machine learning in damage detection using shapley additive explanations,” ASCE-ASME J Risk and Uncert in Engrg Sys Part B Mech Engrg, no. 8 (2), 2022. https://doi.org/10.1115/1.4053304 .
H. Ni, and H. Yin, “Exchange rate prediction using hybrid neural networks and trading indicators,” Neurocomputing, no. 72 (13-15), рр. 2815-2823, 2009. https://doi.org/10.1016/j.neucom.2008.09.023 .
S. Nirmalraj, A. S. M. Antony, at al. “Permutation feature importance-based fusion techniques for diabetes prediction,” Soft Computing, 2023. https://doi.org/10.1007/s00500-023-08041-y .
I. Poligné, B. Broyart, G. Trystram, and A. Collignan, “Prediction of mass-transfer kinetics and product quality changes during a dehydration-impregnation-soaking process using artificial neural networks. Application to pork curing,” LWT — Food Science and Technology, no. 35 (8), рр.748-756, 2002. https://doi.org/10.1006/fstl.2002.0939 .
N. H. A. Rahman, M. H. Lee, Suhartono, and M. T. Latif, “Artificial neural networks and fuzzy time series forecasting: An application to air quality,” Quality and Quantity, no. 49 (6), рр. 2633-2647, 2014. https://doi.org/10.1007/s11135-014-0132-6 .
A. M. Schweidtmann, et al., “Graph neural networks for prediction of fuel ignition quality,” Energy & Fuels, no. 34(9), рр.11395-11407. https://doi.org/10.1021/acs.energyfuels.0c01533 .
C. H. Tan, K. M. Yusof, and S. R. W. Alwi, “Quality prediction for polypropylene extrusion based on neural networks,” IOP Conference Series: Materials Science and Engineering, no. 1257 (1), pp. 012034, 2022. https://doi.org/10.1088/1757-899x/1257/1/012034 .
J. S. Tan, “Ablation study on feature group importance for automated essay scoring,” Asia-Pacific Journal of Information Technology and Multimedia, no. 11 (01), рр. 90-101, 2022. https://doi.org/10.17576/apjitm-2022-1101-08 .
M. M. T. Thwin, and T.-S. Quah, “Application of neural networks for software quality prediction using object-oriented metrics,” Journal of Systems and Software, no. 76 (2), рр. 147-156, 2005. https://doi.org/10.1016/j.jss.2004.05.001 .
S. Wang, and Y. Zhang, “Grad-CAM: Understanding AI models,” Computers, Materials & Continua, no. 76 (2), рр.1321-1324, 2023. https://doi.org/10.32604/cmc.2023.041419 .
##submission.downloads##
-
pdf
Завантажень: 5
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).