عمومی | دیده بان علم ایران

نخستین سامانه نظرکاوی و تحلیل محتوایی متون فارسی راه‌اندازی شد

تولید ابزاری که برای نخستین بار قابلیت تحلیل معنایی نظرات فارسی را داشته باشد یکی از اهداف طرح پژوهشی “سامانه نظرکاوی و تحلیل محتوایی متون فارسی” است که با پشتیبانی صندوق حمایت از پژوهشگران و فناوران معاونت علمی انجام شد.

به گزارش دیده بان علم ایران ظهور وب باعث شد کاربران اینترنتی حجم انبوهی از متون را در اینترنت با دیگران به اشتراک بگذارند بنابراین تحلیل این داده‌ها نیاز به پردازش‌های ویژه دارد. از این رو رشته ای نو پدید آمد. نظرکاوی رشته‌ای جدید است که به پردازش متون حاوی نظرات شخصی می‌پردازد تا بتوان دریافت که افراد درباره موضوعات مختلف و جنبه‌های گوناگون آن چه فکری دارند و جهت‌گیری آنها (مثبت و منفی بودن نظرشان) چگونه است.
“سامانه نظرکاوی و تحلیل محتوایی متون فارسی” عنوان طرح پژوهشی است که با پشتیبانی صندوق حمایت از پژوهشگران و فناوران معاونت علمی توسط محققان دانشگاه تربیت مدرس تهران انجام شد. در این طرح، کار نظرکاوی منجر به تولید یک فرهنگ واژگان نظر (عباراتی که جهت‌دار بودن نظرات را نشان می‌دهند) و تولید مدلی خواهد شد که طبق آن می‌توان مشخص کرد که آیا متن مورد نظر حاوی نظر شخصی است یا این که نظری شخصی در آن ابراز نشده است، در صورتی که پاسخ سوال اول مثبت است آن نظرات درباره چه موجودیت‌ها و چه جنبه‌هایی از آنهاست. همچنین نظراتی که ابراز شده آیا مثبت هستند یا منفی و شدت مثبت یا منفی بودن نظرات به چه ترتیب است.
همچنین در این طرح متون فارسی برای پردازش در نظر گرفته می‌شود. برای وب فارسی هنوز فرهنگ واژگان نظر مناسبی ساخته نشده است که ایجاد و توسعه آن بخشی از این تحقیق است. این طرح تلاش دارد مدلی بسازد که با آن بتوان حجم انبوه نظرات شخصی افراد که در سایت های خبری، وبلاگ ها درباره مسائل مختلف ابراز می‌کنند را پردازش کرد و میزان و روند جهت‌گیری آنها درباره محصولات تجاری و موضوعات مختلف دیگر را سنجید و دریافت که آیا نظرات افراد نسبت به یک موضوع مثبت است یا منفی، این که نظر آنها در گذر زمان چه تغییراتی می‌کند، و این که چه عواملی بیشترین تاثیرات را روی نظرات آنها دارد هدف کلی طرح ایجاد مدلی برای پردازش متون حاوی نظرات شخصی و استخراج دانش درباره مثبت یا منفی بودن نظرات ابرازشده است.
می توان گفت نظرات به طور کلی هسته موضوعی جدید را تشکیل می دهند که نظر کاوی نام دارد. حضور و رشد سریع رسانه های اجتماعی در وب همچون بررسی ها در سایت های مختلف، وبلاگ ها، میکروبلاگ هایی مانند توییتر و البته شبکه های اجتماعی باعث شده برای نخستین بار در تاریخ دیجیتال شاهد چنین حجمی از نظرات باشیم که به آسانی قابل دسترسی هستند. بحث نظر کاوی از اوایل قرن بیست و یکم به یکی از فعال ترین حوزه های تحقیق در زمینه پردازش زبان های طبیعی شده و در مباحث داده کاوی، وب کاوی و متن کاوی نیز روی آن بسیار مطالعه شده است. این بحث از علوم کامپیوتر برخاسته و به رشته هایی همچون مدیریت و علوم اجتماعی کشیده شد. در این طرح پژوهشی نیز به مساله نظر کاوی پرداخته شده است و هدف نهایی تولید ابزاری است تا برای نخستین بار قابلیت تحلیل معنایی نظرات فارسی را داشته باشد.

انتهای پیام