عمومی | سیویلیکا

طبقه بندی گزارش های باگ برپایه ی تکنیک های متن کاوی

سالهای اخیر شاهد علاقه شدید به پیش‌بینی جنبه‌های مختلف نقصهای نرمافزاری مانند تعداد و شدت، بر اساس دادههای جمع‌آوری‌شده از مخازن بودهایم. باهدف شناسایی این نقصها به‌صورت موثر و در جهت کاهش هزینههای کلی تعمیر و نگهداری ، بسیاری از مدلهای آماری، توسعه‌یافته است. به‌طورکلی، چنین مدلهایی بر روی اطلاعات گذشته جهت پیش-بینی باگ تکیه میکنند.در میان منابع بسیاری از اطلاعات، سیستمهای ردیابی باگ به دلیل غنای اطلاعات نقص و همچنین کاربرد وسیع در عملکرد از اهمیت خاصی برخوردارند. مطالعات تجربی اخیر، مقدار قابل‌توجهی از گزارشهای باگی را نشان داده است که درواقع غیر مرتبط با باگ است. طبقهبندی اشتباه گزارش‌های باگ کارایی مدلهای پیشبینی باگ را از بین می‌برد. سیستم‌های طبقهبندی خودکار و یا طبقهبندی کنندهها میتوانند برای اختصاص دادن باگ به توسعه‌دهندگان، ساخت مدلهای ایجاد خطا ، و برنامهریزی موثر فعالیت‌های دیگر مانند افزایش و یا بازسازی استفاده شوند. در این پژوهش باهدف کاهش اشتباهات طبقه بندی گزارش باگ، از الگوریتم داده‌کاوی جهت طبقه‌بندی استفاده شده که در این راستا مطالعه گستردهای بر روی مجموعهای از گزارشهای باگ از پنج پروژه بزرگ منبع باز شامل : موزیلا ، ایکلیپس ، جی باس ، هسته‌ی فایرفاکس ، اُپن فوم که به‌طور تصادفی انتخاب‌شده‌اند، جهت صحت روش این پژوهش انجام شده است. مطالعه مقایسه‌ای، بهبود عملکرد این روش را تائید می‌کند.

---

نگارنده: نفیسه آریان
استاد راهنما: جناب آقای دکتر امیرحسین راسخ
استاد مشاور: سرکار خانم مهندس بتسابه تنوری
استاد داور: جناب آقای مهندس محمدرضا جم نژاد