ارزیابی آماری پایداری معماری‌های یادگیری عمیق در تشخیص بیماری‌های برگ گوجه‌فرنگی

نوع مقاله : مقاله پژوهشی

نویسنده

گروه مهندسی میانیک بیوسیستم، دانشکدگان کشاورزی و منابع طبیعی، دانشگاه تهران، کرج، ایران

چکیده

تشخیص دقیق و به‌موقع بیماری‌های برگ گوجه‌فرنگی نقش اساسی در کاهش خسارات، افزایش بهره‌وری و دستیابی به کشاورزی پایدار دارد. بخش عمده‌ای از مطالعات در زمینه یادگیری عمیق در این حوزه، تنها به یک اجرای منفرد بسنده کرده و پایداری آماری را نادیده گرفته‌اند؛ موضوعی که اعتبار و کاربردپذیری عملی این روش‌ها را محدود می‌سازد. هدف این پژوهش، پر کردن این شکاف از طریق ارائه یک چارچوب ارزیابی جامع و پایدار برای مقایسه معماری‌های مختلف یادگیری عمیق در تشخیص بیماری‌های برگ گوجه‌فرنگی است. در این راستا، یک شبکه عصبی پیچشی پایه آموزش‌دیده از ابتدا، در کنار چندین مدل پیشرفته مبتنی بر یادگیری انتقالی از خانواده‌های ResNet، GoogLeNet، EfficientNet و DenseNet بر روی مجموعه‌داده استاندارد مجع مورد ارزیابی تطبیقی قرار گرفت. برای تضمین مقایسه‌ای واقع‌بینانه، تمامی مدل‌ها تحت ۲۵ اجرای کاملاً مستقل با مقداردهی اولیه تصادفی آموزش داده شدند و شاخص‌های متنوعی شامل دقت، صحت، حساسیت، امتیاز F1، ضریب همبستگی متیوز، مساحت زیر منحنی ROC و انحراف معیار نتایج، محاسبه و تحلیل شد. نتایج نشان داد که مدل‌های مبتنی بر یادگیری انتقالی، علاوه بر دستیابی به دقت بالاتر، از پایداری آماری به‌مراتب بیشتری نسبت به شبکه پایه برخوردارند. در میان آن‌ها، DenseNet121 با دقت میانگین ۰٫۹۹۶ و کمترین انحراف معیار (۰٫۰۰۱۱)، پایدارترین عملکرد را داشت. تحلیل کیفی ماتریس‌های درهم‌ریختگی نیز کاهش معنادار خطاهای بین‌کلاسی را تأیید کرد. این یافته‌ها نشان می‌دهد که ارزیابی چنداجرایی و توجه به پایداری آماری، گامی ضروری برای انتخاب مدل‌های قابل اعتماد در سامانه‌های هوشمند تشخیص بیماری گیاهان و توسعه کاربردهای عملی در کشاورزی آینده است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Statistical Reliability Assessment of Deep Learning Architectures for Tomato Leaf Disease Classification

نویسنده [English]

  • shahin rafiee
Department of Biosystems Mechanical Engineering, Faculty of Agriculture and Natural Resources, University of Tehran, Karaj, Iran
چکیده [English]

Accurate and timely detection of tomato leaf diseases is essential for reducing crop losses, improving productivity, and supporting sustainable agriculture. Despite the growing success of deep learning approaches in this field, most existing studies report results based on a single training run and primarily focus on peak accuracy, while neglecting statistical stability. This limitation weakens the reliability and real-world applicability of many proposed models. To address this gap, this study introduces a stability-oriented evaluation framework for a comprehensive comparison of deep learning architectures for tomato leaf disease classification. A baseline convolutional neural network trained from scratch was systematically compared with state-of-the-art transfer learning models from the ResNet, GoogLeNet, EfficientNet, and DenseNet families using a standard benchmark dataset. To ensure a fair and realistic assessment, all models were trained under 25 fully independent runs with random initialization. Performance was evaluated using multiple metrics, including accuracy, precision, recall, F1-score, Matthews correlation coefficient, area under the ROC curve, and the standard deviation of results across repeated runs. The results demonstrate that transfer learning models consistently outperform the baseline CNN not only in terms of average accuracy but also in statistical stability. Among all evaluated architectures, DenseNet121 achieved the most reliable performance, with a mean accuracy of 0.996 and the lowest standard deviation (0.0011). Qualitative analysis of confusion matrices further confirmed reduced inter-class misclassifications. These findings highlight the importance of multi-run stability analysis for selecting dependable deep learning models in practical smart agriculture systems.

کلیدواژه‌ها [English]

  • Transfer Learning
  • Convolutional Neural Networks
  • Model Robustness
  • Overfitting
  • Plant Health Monitoring