
رفع مشکل کوچک شدن گرادیان در آموزش شبکه افزایش داده به کمک شبکه های مولد متخاصمی جهت تشخیص احساس از سیگنال گفتار
Vanishing Gradient Problem Solving in Data Augmentation Training Process with Generative Adversarial Networks for Speech Emotion Recognition
نویسندگان :
آرش شیلاندری ( دانشگاه صنعتی شاهرود ) , حسین مروی ( دانشگاه صنعتی شاهرود ) , حسین خسروی ( دانشگاه صنعتی شاهرود )
چکیده
هنگامیکه دادههای آموزشی در پایگاه داده متنوع نیستند و تعداد و تنوع آنها در هر کلاس آموزشی محدود است، آموزش یک شبکه عصبی عمیق بدون آنکه پدیده اورفیتینگ اتفاق بیفتد، بیش از حد چالشبرانگیز است. برای غلبه بر این چالش، این مقاله یک شبکه افزایش داده جدید، یعنی شبکه افزایش داده متخاصمانه و مبتنی بر شبکههای مولد متخاصمی را پیشنهاد می کند. این شبکه افزایش داده پیشنهادی، از یک شبکه مولد متخاصمی، یک رمزگذار خودکار و یک طبقهبند تشکیل شده است. این شبکهها به طور خصمانه آموزش داده میشوند تا بردارهای ویژگی وابسته به هر کلاس را در فضای ویژگیها ترکیب کنند، و سپس آنها را به دادههای موجود در پایگاه داده بیفزایند. برای داده های هر کلاس بهصورت جداگانه یک شبکه مولد متخاصمی پیشنهاد شده است که از یک سو شباهت بین نمونههای واقعی و تولید شده را تضمین کند و از طرف دیگر باعث ایجاد تمایز عاطفی در بین نمونههای تولید شده بین کلاسهای مختلف شود. برای رفع مشکل کوچک شدن بیش از حد گرادیان در فرایند آموزش شبکه افزایش داده متخاصمی که منجر به عدم آموزش کافی شبکه های مولد و تشخیصدهنده و متوقف شدن فرایند آموزش پیش از یادگیری کامل توزیع داده ها در فضای ویژگی ها می شود، بجای استفاده از خطای متداول آنتروپی متقابل برای آموزش شبکه مولد متخاصمی، واگرایی واسراستین برای تولید نمونههای مصنوعی با کیفیت بالا استفاده شده است. عملکرد این مدل با استفاده از پایگاه داده احساسی برلین بهعنوان مجموعه دادههای آموزش، تست و ارزیابی شبکه مورد آزمایش قرار گرفته و مشخص شد که با ترکیب نمودن بردارهای ویژگی مصنوعی و بردارهای ویژگی واقعی، میتوان مشکل کوچک شدن بیش از حد گرادیان و متعاقباً متوقف شدن ادامه روند آموزش شبکه را تا حد زیادی کاهش داد. همچنین، نتایج بهدستآمده نشان میدهد که دادههای تولید شده توسط شبکه پیشنهادی میتوانند در یک شبکه تشخیص احساس از سیگنال گفتار استفاده شوند و به این شبکه کمک کنند تا کلاسهبندی احساسی بهتری را انجام دهد.کليدواژه ها
مشکل کوچک شدن گرادیان، افزایش داده، یادگیری عمیق، شبکههای مولد متخاصمی، واگرایی واسراستینکد مقاله / لینک ثابت به این مقاله
برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است :نحوه استناد به مقاله
در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:آرش شیلاندری , 1400 , رفع مشکل کوچک شدن گرادیان در آموزش شبکه افزایش داده به کمک شبکه های مولد متخاصمی جهت تشخیص احساس از سیگنال گفتار , بیستمین کنفرانس ملی دانشجویی مهندسی برق ایران
دیگر مقالات این رویداد
© کلیه حقوق متعلق به دانشگاه رازی کرمانشاه میباشد.