طبقه بندی گزارش های باگ برپایه ی تکنیک های متن کاوی
سالهای اخیر شاهد علاقه شدید به پیشبینی جنبههای مختلف نقصهای نرمافزاری مانند تعداد و شدت، بر اساس دادههای جمعآوریشده از مخازن بودهایم. باهدف شناسایی این نقصها بهصورت موثر و در جهت کاهش هزینههای کلی تعمیر و نگهداری ، بسیاری از مدلهای آماری، توسعهیافته است. بهطورکلی، چنین مدلهایی بر روی اطلاعات گذشته جهت پیش-بینی باگ تکیه میکنند.در میان منابع بسیاری از اطلاعات، سیستمهای ردیابی باگ به دلیل غنای اطلاعات نقص و همچنین کاربرد وسیع در عملکرد از اهمیت خاصی برخوردارند. مطالعات تجربی اخیر، مقدار قابلتوجهی از گزارشهای باگی را نشان داده است که درواقع غیر مرتبط با باگ است. طبقهبندی اشتباه گزارشهای باگ کارایی مدلهای پیشبینی باگ را از بین میبرد. سیستمهای طبقهبندی خودکار و یا طبقهبندی کنندهها میتوانند برای اختصاص دادن باگ به توسعهدهندگان، ساخت مدلهای ایجاد خطا ، و برنامهریزی موثر فعالیتهای دیگر مانند افزایش و یا بازسازی استفاده شوند. در این پژوهش باهدف کاهش اشتباهات طبقه بندی گزارش باگ، از الگوریتم دادهکاوی جهت طبقهبندی استفاده شده که در این راستا مطالعه گستردهای بر روی مجموعهای از گزارشهای باگ از پنج پروژه بزرگ منبع باز شامل : موزیلا ، ایکلیپس ، جی باس ، هستهی فایرفاکس ، اُپن فوم که بهطور تصادفی انتخابشدهاند، جهت صحت روش این پژوهش انجام شده است. مطالعه مقایسهای، بهبود عملکرد این روش را تائید میکند.
---
نگارنده: نفیسه آریان
استاد راهنما: جناب آقای دکتر امیرحسین راسخ
استاد مشاور: سرکار خانم مهندس بتسابه تنوری
استاد داور: جناب آقای مهندس محمدرضا جم نژاد