مقالات آماده انتشار ، پذیرفته شده ، انتشار آنلاین از تاریخ 30 خرداد 1396 اصل مقاله ( 1675 K )
نوع مقاله: مقاله پژوهشی
نویسندگان
شیما جوانمردی ¹ ؛ محمد علی زارع چاهوکی ²
¹ دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی، دانشکده برق و کامپیوتر، دانشگاه یزد
² دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد
چکیده
فرآیند پالایش شرح گذاری تصاویر، رویکردی موثر در بهبود بازیابی تصاویر مبتنی بر برچسب می‌باشد. در شبکه های اجتماعی و موتورهای جستجو بسیاری از تصاویر دارای تگ های مبهم، ناقص و بی ارتباط با محتوا هستند. وجود این تگ های غیرقابل اعتماد، موجب کاهش دقت بازیابی تصاویر می شود. از اینرو در دهه اخیر، الگوریتم هایی با عنوان پالایش تگ (TR) مطرح شده‌اند که به رفع نویز و غنی‌سازی برچسب‌های تصاویر می‌پردازند. به منظور دستیابی به نتایج بهینه در TR، استخراج ویژگی هایی از تصویر که توصیف مناسبی از محتوای دیداری تصویر داشته باشند، تاثیر مستقیمی بر دقت فرآیند TR دارد. از جمله چالش های عمده در فرآیند پالایش شرح گذاری تصاویر، رسیدن به توصیفی مناسب و مرتبط با محتوای تصاویر میباشد. بدین منظور با توجه به کارآمدی فرآیند یادگیری عمیق در بسیاری از حوزه های پژوهشی، در این مقاله نیز به منظور استخراج ویژگی های کارآمد در تشابه دیداری تصاویر و ارتباط معنایی تصاویر با هم، از شبکه های عصبی کانولوشنال عمیق (DCNN) استفاده شده است. بهره گیری از فرآیند یادگیری انتقالی استفاده شده در DCNN مبتنی بر تصاویر ImageNet در توصیف و ایجاد ارتباط معنایی در مجموعه تصاویر با مقیاس بزرگ NUS-WIDE، بیانگر موثر بودن این رویکرد در کاربرد پالایش تگ تصاویر است.
کلیدواژه ها
پالایش شرح گذاری تصاویر ؛ شبکه عصبی کانولوشنال عمیق ؛ پالایش تگ ؛ بازیابی تصاویر ؛ یادگیری انتقالی


مراجع

آمار تعداد مشاهده مقاله: 235 تعداد دریافت فایل اصل مقاله: 883