Category ia & human emotion recogniation

AC – نظریه اساسی

تعریف

طراحی سیستم هایی که می توانند احساسات انسانی و پدیده های عاطفی مرتبط را تشخیص ، تفسیر و شبیه سازی کنند.

هدف پژوهش

اصول و نظریه های توضیح دهنده اینكه چرا و چگونه عوامل عاطفی تعامل بین انسان و فناوری را شرط بندی می كنند ، در مورد اینكه چگونه فنون سنجش و شبیه سازی عاطفی می توانند اطلاعات ما را از فرآیندهای عاطفی انسان آگاه كنند و همچنین در مورد طراحی و اجرای و ارزیابی سیستم هایی كه به دقت تأثیر می گذارند از عواملی است كه قابلیت استفاده آنها را تحت تأثیر قرار می دهد.

سرفصل های تحقیق

تشخیص حالت عاطفی

تعریف: طراحی سیستم هایی که می توانند احساسات انسانی و پدیده های عاطفی مرتبط را تشخیص ، تفسیر و شبیه سازی کنند.

  1. سنجش و تحلیل: الگوریتم ها و ویژگی های تشخیص حالت عاطفی از حرکات صورت و بدن
  2. تجزیه و تحلیل متن و زبان گفتاری برای تشخیص احساسات
  3. تحلیل عروض و کیفیت صدای گفتار احساسی
  4. شناخت انفجارهای تأثیر شنوایی و بینایی
  5. تشخیص حالت عاطفی از اقدامات فیزیولوژیکی مرکزی و محیطی
  6. روش های تشخیص چند حالت وضعیت عاطفی
  7. شناخت احساسات گروهی

مدل احساسی

  1. روش های جمع آوری اطلاعات با توجه به مسائل روانشناختی به عنوان القا mood خلق و خو و روش استخراج به عنوان ضبط حرکت
  2. ابزارها و روش های حاشیه نویسی برای تهیه اعضای عاطفی. توضیح مفاهیم مربوط به “محاسبات عاطفی”
  3. مدل های محاسباتی فرآیندهای احساسات انسانی (مدل های تصمیم گیری که تأثیر عاطفه را حساب می کنند ؛ مدل های پیش بینی کننده وضعیت احساسی کاربر و غیره)

بیان عاطفی

  1. مطالعاتی درباره تفاوت های فرهنگی ، گروهی و میان زبانی در بیان عاطفی
  2. مشارکت در استاندارد و زبان علامت گذاری برای محاسبات احساسی. مدلهای محاسباتی بیان عاطفی بصری ، صوتی و متنی برای عوامل مصنوعی و رباتیک
  3. مدل های بیان کلامی و غیرکلامی انواع مختلف تأثیر که اجرای دستگاه را تسهیل می کند

تعامل احساسی

  1. روش هایی برای انطباق تعامل با فناوری با وضعیت عاطفی کاربران
  2. روش های محاسباتی برای تأثیرگذاری بر وضعیت عاطفی افراد
  3. روش های جدید برای تعریف و ارزیابی قابلیت استفاده از سیستم های عاطفی و نقش تأثیر در قابلیت استفاده
  4. روش های نمایه سازی عاطفی و سازگاری در تعامل میان مدت و بلند مدت

برنامه های محاسباتی موثر

  1. استفاده از محاسبات عاطفی از جمله آموزش ، مراقبت های بهداشتی ، سرگرمی ، خدمات مشتری ، طراحی ، عملکرد وسیله نقلیه ، عوامل اجتماعی / رباتیک ، هوش محیطی احساسی ، اندازه گیری تجربه مشتری ، بازیابی چندرسانه ای ، سیستم های نظارتی ، بیومتریک ، بازیابی موسیقی و تولید آن

NLP – مجموعه واژه نامه ها و مجموعه داده ها

کاغذکنفرانسملاحظات
پایگاه داده SEMAINE: سوابق چندمرحله ای حاوی مکالمات رنگی احساسی بین یک شخص و یک عامل محدودIEEE TAC 20121. به عنوان بخشی از یک رویکرد تکراری برای ایجاد عوامل که می توانند فرد را با یک الگوی شنوندنی مصنوعی حساس (SAL) درگیر کنند ، یک پایگاه داده بزرگ سمعی و بصری معرفی کنید. 
2. این مجموعه داده شامل 150 شرکت کننده است که در مجموع 959 مکالمه با شخصیت های SAL منفرد دارد و هر کدام تقریباً 5 دقیقه به طول می انجامد.
آفتاب پرست ها در مکالمات خیالی: رویکرد جدیدی برای درک هماهنگی سبک زبانی در گفتگوهاCMCL Workshop 20111. مجموعه داده های گفتگوی فیلم کرنل را ارائه دهید
2. هماهنگی قابل توجهی را در بین بسیاری از خانواده های کلمات عملکردی در مجموعه بزرگ فیلمنامه ما پیدا کنید
هنجارهای ظرفیت ، برانگیختگی و تسلط برای 13915 لموی انگلیسیروشهای تحقیق رفتار 20131. چهار خط تحقیق برای رتبه بندی عاطفی کلمات: خود احساسات ؛ تأثیر ویژگیهای عاطفی بر پردازش و حافظه کلمات ؛ برآورد احساسات بیان شده توسط کل پیام ها یا متن ها ؛ تخمین خودکار ارزشهای احساسی کلمات جدید با مقایسه آنها با کلمات معتبر. 
2. مجموعه داده ای متشکل از 13915 جفت لما-VAD ارائه شده است
تحقیق زبانی و تعداد کلمات: LIWC2015www.liwc.netکتابچه راهنمای کاربر برای نرم افزار LIWC را ارائه دهید
پیکره گفتگوی اوبونتو: مجموعه داده های گسترده ای برای تحقیق در سیستم های گفتگوی چند چرخشی بدون ساختارSIGDIAL 2015مجموعه داده ای را شامل 1 میلیون گفتگوی چند نوبت ، با مجموع بیش از 7 میلیون گفتار و 100 میلیون کلمه معرفی کنید.
مدل سازی والنس و برانگیختگی در پست های فیس بوککارگاه آموزشی WASSA 2016مجموعه داده جدیدی از 2895 پست رسانه اجتماعی را که توسط دو حاشیه نویسی آموزش دیده روانشناختی در دو مقیاس جداگانه نه نقطه ای (ظرفیت و برانگیختگی) رتبه بندی شده اند ، معرفی کنید.
بررسی شرکت های موجود برای ساخت سیستم های گفتگوی مبتنی بر دادهArxiv 20171. بررسی گسترده ای از مجموعه داده های عمومی که برای یادگیری داده محور سیستم های گفتگو مناسب است. 
2. درباره خصوصیات مهم این مجموعه داده ها ، چگونگی استفاده از آنها برای یادگیری استراتژیهای متنوع گفتگو و سایر کاربردهای بالقوه آنها بحث کنید. 
3. روش های انتقال یادگیری بین مجموعه داده ها و استفاده از دانش خارجی را بررسی کنید. 4- در مورد انتخاب مناسب معیارهای ارزیابی برای هدف یادگیری بحث کنید.
AMIGOS: مجموعه ای از داده ها برای بررسی تأثیر ، شخصیت و خلق و خو در افراد و گروه هاIEEE TAC 20171. یک مجموعه داده برای تحقیقات چند مدلی در مورد تأثیر ، ویژگی های شخصیتی و خلق و خوی در افراد و گروه ها. 
2. مجموعه داده شامل فیلم ها و سیگنال های عصبی-فیزیولوژیکی است. 
3. احساسات شرکت کنندگان هم با ارزیابی خود از سطح عاطفه (ظرفیت ، تحریک ، کنترل ، آشنایی ، پسندیدن و احساسات اساسی) که در طول فیلم ها احساس شده اند و هم ارزیابی بیرونی از سطح ظرفیت و تحریک ، حاشیه سازی شده اند.
رویکرد مبتنی بر احساس و معناشناسی برای تشخیص احساس در مکالمات متنیArxiv 20181. مجموعه ای شامل بیش از 30K توییت سه نوبت حاوی چهار احساس شاد ، غمگین ، عصبانی و دیگران را معرفی کنید. 
2. چهار نوع مدل شبکه عصبی کانولوشن مبتنی بر توالی را با توجه به استفاده از اطلاعات توالی محصور شده در گفتگو پیشنهاد می کند.
تشخیص احساسات در رونوشت های نمایش تلویزیونی با شبکه های عصبی کانولوشن مبتنی بر توالیکارگاه آموزشی AAAI 20181. یک مجموعه جدید ارائه دهید که حاوی حاشیه نویسی از هفت احساس در مورد اظهارات متوالی در گفتگوهای استخراج شده از نمایش است ، دوستان.
EmotionLines: مجموعه ای از احساسات از مکالمات چند جانبهLREC 2018در مجموع 29245 جمله از 2000 گفتگو در EmotionLines برچسب گذاری شده اند ، هر عبارت در یکی از 7 احساس برچسب گذاری شده است: شش احساس Ekman + خنثی.
MELD: یک مجموعه داده چند طرفه چند حالته برای تشخیص احساس در مکالماتArxiv 20181. نسخه به روز شده از EmotionLines. 2. هر سخنی در MELD با احساسات و برچسب احساسات همراه است. گفته ها در MELD شامل چند حالت شامل موارد صوتی و تصویری همراه با متن است.

AC – سیگنالهای فیزیولوژیک

کاغذکنفرانسملاحظات
به سمت هوش هیجانی ماشین: تجزیه و تحلیل وضعیت فیزیولوژیکی موثرIEEE TPAMI 20011- توانایی ماشین را در تشخیص حالت عاطفی انسان با توجه به چهار سیگنال فیزیولوژیکی ایجاد کنید. 
2. ویژگی ها و الگوریتم های جدید را پیشنهاد دهید و عملکرد آنها را برای مسائل تغییرات روزانه مقایسه کنید (ویژگی های احساسات مختلف در همان روز خوشه نزدیکتر از ویژگی های همان احساس در روزهای مختلف است)
DEAP: پایگاه داده ای برای تجزیه و تحلیل احساسات با استفاده از سیگنال های فیزیولوژیکیIEEE TAC 20121. یک مجموعه داده چند حالته برای تجزیه و تحلیل حالات عاطفی انسان ، شامل EEG و سیگنال های فیزیولوژیکی محیطی 32 شرکت کننده ارائه دهید. 
2. تجزیه و تحلیل گسترده ای از رتبه بندی شرکت کنندگان در طول آزمایش ارائه شده است. ارتباط بین فرکانس های سیگنال EEG و رتبه بندی شرکت کنندگان بررسی می شود. 3. روش ها و نتایج برای طبقه بندی یک دوره ای آزمون های برانگیختگی ، ظرفیت و مانند / متنفر بودن با استفاده از روش های EEG ، سیگنال های فیزیولوژیکی محیطی و تجزیه و تحلیل محتوای چندرسانه ای ارائه شده است.
یک پایگاه داده چند حالته برای شناسایی تأثیرات و برچسب گذاری ضمنیIEEE TAC 20121. ارائه یک پایگاه داده چند مدلی که در پاسخ به محرکهای عاطفی با هدف شناخت احساسات و تحقیقات برچسب گذاری ضمنی ضبط شده است. 
2. یک تنظیم چند حالته برای ضبط همزمان فیلم های صورت ، سیگنال های صوتی ، داده های نگاه چشم و سیگنال های فیزیولوژیکی سیستم عصبی محیطی / مرکزی ترتیب داده شد.
مروری بر روشهای محاسباتی برای تخمین حالت هیجانی از EEG انسانیروش های محاسباتی و ریاضی در پزشکی 20131. روشهای محاسباتی را که برای کسر شاخصهای EEG از احساسات ، استخراج ویژگیهای مربوط به احساسات یا طبقه بندی سیگنالهای EEG در یکی از بسیاری از حالتهای عاطفی ایجاد شده است ، مرور می کند. 
2. پیشنهاد می کند با استفاده از استنباط متوالی بیزی ، وضعیت احساسی مداوم را در زمان واقعی تخمین بزنید. 
3. برانگیختگی ، قدرت ، تسلط و پیش بینی و همچنین کلمات کلیدی احساسی ثبت می شوند.
پایگاه های EEG برای تشخیص احساساتICCW 20131. دو پایگاه داده EEG احساسی ارائه شده است.
 2. داده های EEG توسط شرکت کنندگان با سطح برانگیختگی ، ظرفیت و تسلط رتبه بندی می شود. همبستگی بین قدرت باندهای مختلف EEG و رتبه بندی عاطفی مطالعه شده است. 
3. استفاده از ویژگی Fractal Dimension در ترکیب با ویژگی های آماری و مرتبه های بالاتر (HOC) با بهترین دقت نتایج را به ما می دهد.
طبقه بندی حالت هیجانی از داده های EEG با استفاده از رویکرد یادگیری ماشینNeurocomputing 20141. به طور سیستماتیک سه نوع ویژگی EEG موجود را برای طبقه بندی احساسات مقایسه می کند ، یک روش هموار سازی ویژگی کارآمد برای از بین بردن سر و صدا غیر مرتبط با وظیفه احساسات را معرفی می کند ، و یک روش ساده برای ردیابی مسیر تغییرات احساسات با یادگیری چند برابر ارائه می دهد. 
2. یک آزمایش القایی فیلم را طراحی کنید که خود به خود افراد را به حالت های واقعی احساسی سوق دهد و یک مجموعه داده EEG متشکل از شش نفر را جمع آوری کند. 
3. نتایج نشان می دهد که: الف) ویژگی طیف قدرت از دو نوع ویژگی دیگر برتر است. (ب) یک روش روان سازی ویژگی مبتنی بر سیستم پویا می تواند به طور قابل توجهی دقت طبقه بندی احساسات را بهبود بخشد. و (ج) مسیر تغییرات احساسات را می توان با کاهش ویژگی های مستقل از موضوع با یادگیری چند برابر تجسم کرد.
استخراج و انتخاب ویژگی برای تشخیص احساس از EEGIEEE TAC 20141. بررسی ها از روشهای استخراج برای تشخیص احساسات از EEG بر اساس 33 مطالعه استفاده می کنند. 
2. نتایج با توجه به عملکرد روشهای مختلف انتخاب ویژگی ، استفاده از انواع ویژگیهای انتخاب شده و انتخاب مکانهای الکترود ارائه می شود.
برداشت مصنوع EEG – پیشرفته ترین و رهنمودهامجله مهندسی عصبی 2015یک بررسی گسترده در مورد الگوریتم های برداشت مصنوع برای حذف منابع اصلی تداخل در الکتروانسفالوگرام (EEG) ، به ویژه مصنوعات چشم ، عضله و قلب ارائه می دهد
بررسی باندهای فرکانس بحرانی و کانال های تشخیص احساس مبتنی بر EEG با شبکه های عصبی عمیقمعاملات IEEE در توسعه ذهنی خودمختار 20151. شبکه های باور عمیق (DBN) را برای ساخت مدل های تشخیص احساس مبتنی بر EEG معرفی می کند. 
2. باندها و کانالهای فرکانسی بحرانی که با استفاده از وزن DBN های آموزش دیده تعیین می شوند با مشاهدات موجود سازگار هستند. 
3. نتایج آزمایش نشان می دهد که امضاهای عصبی مرتبط با احساسات مختلف وجود دارد و آنها در جلسات و افراد مشترک هستند.
شناسایی الگوهای پایدار در طول زمان برای تشخیص احساس از EEGIEEE TAC 20161- الگوهای پایدار الکتروانسفالوگرام (EEG) را به مرور زمان برای تشخیص احساسات با استفاده از روش یادگیری ماشین بررسی کنید. 
2. به طور سیستماتیک عملکرد این روشهای مختلف استخراج ویژگیهای محبوب ، انتخاب ویژگیها ، هموار سازی ویژگیها و طبقه بندی الگوها را با مجموعه داده DEAP و یک مجموعه داده تازه توسعه یافته به نام SEED برای این مطالعه ارزیابی کنید.
 3. نتایج تجربی نشان می دهد که الگوهای پایدار در طول جلسات سازگاری دارند.
آموزش یادگیری از EEG با شبکه های عصبی عمیق تکرار شوندهICLR 20161. یک روش جدید برای یادگیری چنین بازنمایی هایی از سری های زمانی EEG چند کانال از طریق تصاویر چند طیفی پیشنهاد می کند.
 2. روش پیشنهادی برای حفظ ساختار مکانی ، طیفی و زمانی EEG طراحی شده است که منجر به یافتن ویژگی هایی می شود که نسبت به تغییرات و تحریفات در هر بعد حساسیت کمتری دارند.
DREAMER: پایگاه داده ای برای شناخت احساس از طریق سیگنال های EEG و ECG از دستگاه های بی سیم ارزان قیمت خارج از قفسهIEEE JBHI 20171. Present DREAMER ، یک پایگاه داده چند مدلی متشکل از سیگنالهای الکتروانسفالوگرام (EEG) و الکتروکاردیوگرام (ECG) که در حین ایجاد اثر با استفاده از محرکهای دیداری و شنیداری ثبت می شوند. 
2. یک مبنای اساسی برای تشخیص تأثیر شرکت کنندگان با استفاده از EEG و ویژگی های مبتنی بر ECG و همچنین همجوشی آنها ، از طریق آزمایش های طبقه بندی نظارت شده با استفاده از ماشین های بردار پشتیبانی (SVM) ایجاد شد.
بررسی و طبقه بندی شناخت احساس بر اساس تحقیق سیستم رابط مغز و رایانه EEG: یک مرور سیستماتیکعلوم کاربردی 20171. بررسی مقالات منتشر شده در مورد شناسایی ، شناسایی و طبقه بندی احساسات با استفاده از EEG. 2. مقالات بر اساس طرحی متشکل از دو دسته طبقه بندی شدند: جهت گیری تحقیق و حوزه ها / کاربردها.
تشخیص احساس مبتنی بر EEG از طریق هموار سازی سریع و قویICBI 20171. یک روش صاف کردن ویژگی را برای کاهش نویز و مشکلات بعدی سیگنالهای EEG پیشنهاد دهید. 
2. شش ویژگی آماری را از سیگنالهای EEG خام استخراج کرده و یک روش ساده و در عین حال مقرون به صرفه برای صحیح تشخیص ، به کار ببرید.
تشخیص احساسات با استفاده از سیگنال های EEG: یک بررسیIEEE TAC 20181. ارائه یک تحقیق از تحقیقات فیزیولوژی مغز و اعصاب که از سال 2009 تا 2016 انجام شده است ، و با استفاده از سیگنال های EEG ، یک نمای کلی از آثار موجود در تشخیص احساسات ارائه می دهد. 
2. تجزیه و تحلیل ما را در جنبه های اصلی درگیر در فرآیند شناسایی متمرکز کنید (به عنوان مثال ، موضوعات ، ویژگی های استخراج شده ، طبقه بندی کننده ها) و آثار را با یکدیگر مقایسه کنید. 
3. مجموعه ای از توصیه های عمل خوب را پیشنهاد دهید که محققان باید برای دستیابی به نتایج قابل تکرار ، تکرار ، معتبر و با کیفیت بالا دنبال کنند.
مروری بر شناخت احساسات با استفاده از سیگنال های فیزیولوژیکیسنسورهای 2018یک بررسی جامع در مورد شناخت احساسات مبتنی بر سیگنال فیزیولوژیکی ، شامل مدل های هیجان ، روش های استخراج احساس ، مجموعه داده های فیزیولوژیکی احساسی منتشر شده ، ویژگی ها ، طبقه بندی ها و کل چارچوب شناخت احساسات بر اساس سیگنال های فیزیولوژیکی ارائه می دهد.
یادگیری عمیق برای شناخت تأثیرات انسانی: بینش ها و تحولات جدیدArxiv 20181. با تمرکز ویژه بر رویکردهای استفاده از شبکه های عصبی عمیق ، ادبیات مربوط به شناخت انسان را بین سال های 2010 و 2017 مرور می کند. 
2. در می یابد که یادگیری عمیق برای یادگیری (i) نمایش ویژگی های مکانی ، (ii) نمایش ویژگی های زمانی و (III) بازنمایی ویژگی های مشترک برای داده های حسگر چند مد استفاده می شود.
تشخیص احساس گسسته ناشی از فیلم در زمان واقعی از سیگنال های EEGIEEE TAC 20181. یک سیستم تشخیص احساسات ناشی از فیلم در زمان واقعی برای شناسایی حالات عاطفی فرد از طریق تجزیه و تحلیل امواج مغزی را ارائه می دهد. 
2. نتایج از نظر صحت طبقه بندی و توانایی تشخیص احساسات گسسته مشابه نزدیک به فضای مختصات تحریک ظرفیت ، برتری را نسبت به پیشرفته ترین سیستم های تشخیص احساس در زمان واقعی از سیگنالهای EEG نشان می دهند.
خط لوله پردازش خودکار هاروارد برای الکتروانسفالوگرافی (HAPPE): نرم افزار پردازش استاندارد برای داده های رشد و مصنوعات بالامرزها در علوم اعصاب 20181. خط لوله پردازش خودکار هاروارد را برای EEG (HAPPE) به عنوان یک خط لوله خودکار استاندارد و سازگار با ضبط های EEG با طول متغیر و سطح آلودگی مصنوعی پیشنهاد می کند. 
2. HAPPE داده های EEG مربوط به رویداد و حالت استراحت را از پرونده های خام از طریق یک سری مراحل فیلتر کردن ، رد مصنوع و مراجعه مجدد به EEG پردازش شده مناسب برای تجزیه و تحلیل دامنه با فرکانس زمان پردازش می کند. HAPPE همچنین شامل گزارش پس از پردازش معیارهای کیفیت داده ها برای ارزیابی و گزارش کیفیت داده ها به روشی استاندارد شده است.
بررسی ویژگی های EEG در تشخیص احساس بین موضوعیمرزها در علوم اعصاب 20181. بررسی جامع تری در مورد تعمیم پذیری ضعیف ویژگی ها با طیف گسترده تری از انواع ویژگی ها ، از جمله 18 نوع ویژگی EEG خطی و غیر خطی ، ارائه می دهد. 
2. اهمیت ویژگی های مختلف EEG را در شناخت احساسات متقابل از چندین منظر ، از جمله کانال های مختلف ، مناطق مغزی ، ریتم ها و انواع ویژگی ها ، کاوش می کند.
تشخیص احساس EEG با استفاده از شبکه های عصبی همگرا نمودار پویاIEEE TAC 20181. یک روش تشخیص کانال EEG چند کاناله بر اساس یک شبکه عصبی کانولوشن نمودار پویا جدید (DGCNN) پیشنهاد می کند. 
2. روش DGCNN پیشنهادی می تواند از طریق آموزش یک شبکه عصبی ، رابطه ذاتی بین کانالهای مختلف الکتروانسفالوگرام (EEG) را که توسط یک ماتریس مجاور نشان داده می شود ، یاد بگیرد تا از استخراج متمایزتر EEG بهره مند شود.
یک مدل شبکه عصبی خصمانه دامنه دو نیمکره برای تشخیص احساس EEGIEEE TAC 20181. یک مدل شبکه عصبی جدید ، به نام مدل شبکه عصبی خصمانه دامنه دو نیمکره (BiDANN) ، برای تشخیص احساس الکتروانسفالوگراف (EEG) پیشنهاد می کند. 
2. این مدل شامل یک جهانی و دو تبعیض گرایانه محلی است که با یک طبقه بندی کننده برای یادگیری ویژگی های عاطفی افتراق دهنده برای هر نیمکره خصمانه کار می کنند. 
3. با کاهش تأثیر اطلاعات شخصی افراد به تشخیص احساس EEG ، نسخه بهبود یافته BiDANN را که با BiDANN-S مشخص شده است ، برای مسئله تشخیص احساس EEG مستقل از موضوع پیشنهاد می کند.
شبکه های عصبی تکرار شونده آبشاری و موازی در تشخیص قصد مبتنی بر EEG برای رابط رایانه مغزAAAI 20181. مدل های شبکه عصبی تکرار شونده آبشار و موازی را برای شناسایی دقیق حرکات و دستورالعمل های در نظر گرفته شده توسط انسان با یادگیری موثر نمایش های مکانی-زمانی ترکیب جریان های EEG خام معرفی می کند.
مروری بر روش های غیرخطی با استفاده از ضبط های الکتروانسفالوگرافی برای تشخیص احساسIEEE TAC 20191. خلاصه ای از کارهای اخیر که از روش های غیرخطی در تحلیل سیگنال EEG برای تشخیص احساس استفاده کرده اند. 
2. برخی از شاخص های غیرخطی را که هنوز در این زمینه تحقیق استفاده نشده اند ، شناسایی می کند.
یادگیری عمیق برای کارهای طبقه بندی الکتروانسفالوگرام (EEG): یک مرورمجله مهندسی عصبی 20191. بررسی سیستماتیک ادبیات مربوط به کاربردهای یادگیری عمیق در طبقه بندی EEG برای پاسخگویی به س criticalالات مهم زیر انجام شده است:
(1) کدام یک از کارهای طبقه بندی EEG با یادگیری عمیق بررسی شده است؟ 
(2) از چه فرمول های ورودی برای آموزش شبکه های عمیق استفاده شده است؟
 (3) آیا ساختارهای شبکه یادگیری عمیق خاصی برای انواع خاصی از کارها مناسب است؟ 
2. وظایفی که از یادگیری عمیق استفاده می کردند ، در پنج گروه کلی قرار گرفتند: تشخیص احساسات ، تصاویر حرکتی ، میزان کار ذهنی ، تشخیص تشنج ، تشخیص بالقوه مربوط به وقایع و امتیازدهی به خواب. برای هر نوع کار ، فرمول ورودی خاص ، مشخصات اصلی و توصیه های طبقه بندی نهایی را که از طریق این بررسی پیدا شده است ، توصیف می کنیم.
تکنیک های سازگاری دامنه برای تشخیص احساس مبتنی بر EEG: یک مطالعه تطبیقی ​​در دو مجموعه داده عمومیمعاملات IEEE در سیستم های شناختی و توسعه 20191. یک مطالعه مقایسه ای در مورد چندین روش پیشرفته سازگاری حوزه در دو مجموعه داده انجام می دهد: DEAP و SEED. 2. نشان می دهد که تکنیک های سازگاری دامنه می تواند دقت طبقه بندی را در هر دو مجموعه داده بهبود بخشد ، اما در DEAP به اندازه SEED بسیار موثر نیست. 
3. هنگامی که داده ها در محیط های مختلف با استفاده از دستگاه های مختلف و پروتکل های تجربی جمع آوری می شوند ، اثر سازگاری دامنه را در یک مجموعه داده متقابل بررسی می کند. 
4- پیشنهاد می کند از انطباق دامنه برای کاهش واریانس بین موضوع و همچنین اختلافات فنی بین مجموعه داده استفاده شود و سپس یک طبقه بندی مستقل از موضوع را بر روی یک مجموعه داده آموزش داده و روی دیگری را آزمایش کند.
فضایی-عصبی تکراری شبکه عصبی برای تشخیص احساسمعاملات IEEE در Cybernetics 20191. یک لایه شبکه عصبی عود کننده چند جهته (RNN) را برای گرفتن نشانه های زمینه ای با برد طولانی با عبور از مناطق مکانی هر برش زمانی در جهت های مختلف پیشنهاد دهید. یک لایه RNN زمانی دو جهته بیشتر برای یادگیری ویژگی های افتراقی توصیف کننده وابستگی های زمانی توالی ها استفاده می شود. 
2. برای بهبود توانایی تمایز مدل ، طرح پراکنده را به آن حالت های پنهان حوزه های مکانی و زمانی تحمیل کنید. 
3. نتایج تجربی در مجموعه داده های عواطف عمومی الکتروانسفالوگرام و حالت چهره نشان می دهد که روش پیشنهادی STRNN نسبت به آن روش های پیشرفته رقابت بیشتری دارد.

AC – تجزیه و تحلیل تصویر

کاغذکنفرانسملاحظات
FaceWarehouse: یک پایگاه داده سه بعدی بیان صورت برای محاسبات بصریIEEE TVCG 20131. داده های RGBD از 150 فرد 7-80 ساله از نژادهای مختلف. 
2. عبارات خنثی و 19 عبارت دیگر برای هر شخص گرفته می شود. 
3. برای هر رکورد داده خام RGBD ، مجموعه ای از نقاط ویژگی های صورت واقع شده است. 
4. نقاط ویژگی را بر روی تصاویر رنگی به مش تصویر عمقی مطابقت دهید. 
5- مجموعه ای از ترکیب های بیان خاص برای هر شخص را بسازید. 
6. یک مدل صورت دو خطی با ویژگی ها: هویت و بیان. 
7. مزایای آن نسبت به سایر پایگاه های داده: مجموعه مطابقت بسیار غنی تر عبارات. 
8. برنامه های کاربردی: دستکاری تصویر صورت. انتقال جز component صورت ؛ انیمیشن واقعی تصویر مبتنی بر عملکرد در زمان واقعی ؛ هدفگذاری مجدد انیمیشن صورت از ویدئو به تصویر
استفاده از Kinect برای تشخیص احساسات در زمان واقعی از طریق حالت های چهرهFIETT 20151. یک رویکرد تشخیص احساس در زمان واقعی بر اساس ویژگی های بیان چهره 2D و 3D که توسط حسگرهای Kinect گرفته شده است. 
2. برای گرفتن تغییر شکل شبکه سه بعدی در هنگام بیان چهره ، ویژگی های واحدهای انیمیشن و موقعیت های نقطه ویژگی ها ترکیب می شوند.
 3. یک الگوریتم همجوشی مبتنی بر نمایه های احساسی بهبود یافته (IEP) و حداکثر اعتماد به نفس برای تشخیص احساسات پیشنهاد شده است. 
4. عملکرد برتر روش ما را نشان دهید.

AC – تجزیه و تحلیل متن

کاغذکنفرانسملاحظات
آیا اشتیاق عاطفی در داستان ها را می توان از روی کلمات تعیین کرد؟شناختی و عاطفی 19941. مقادیر عاطفی جملات چهار متن را که توسط خوانندگان درک می شود ، با مقادیر تولید شده توسط کلمات تشکیل دهنده متن مقایسه کنید. 
2. پشتیبانی از واقعیت روانشناختی زنگ های احساسی واحدهای زبانی بزرگتر از یک کلمه ، و امکان ارزیابی آنها از طریق اطلاعات لغوی
بررسی ترکیب احساسات در متن: احساسات کلمه ، احساسات جملات و برچسب گذاری خودکارAAAI 2006روشی را برای علامت گذاری خودکار متن ها با برچسب های احساسی ارائه می دهد.
ابراز احساسات در ارتباطات مبتنی بر متنCHI 20071. نحوه بیان و تشخیص احساسات در هنگام برقراری ارتباط مبتنی بر متن را بررسی می کند. 
2. نتیجه نشان می دهد که کاربران برای ابراز خوشحالی در برابر غم و اندوه به چهار استراتژی اعتماد کرده اند ، از جمله عدم توافق ، اصطلاحات تأثیر منفی ، علائم نگارشی و زبانی.
اندازه گیری بیان عاطفی با تحقیق زبانی و تعداد کلماتمجله روانشناسی آمریکا 20071. ارزیابی کنید که آیا تعداد LIWC فرایندهای احساسات کلمات نسبت به ابراز ناراحتی و سرگرمی کلامی حساس هستند یا خیر. 
2. نتیجه نشان می دهد که به نظر می رسد LIWC یک روش معتبر برای اندازه گیری بیان کلامی احساسات است
مدل های معنایی توزیعی برای تحلیل متن تأثیرگذارIEEE TASLP 20131. یک مدل تجزیه و تحلیل متن احساسی ارائه دهید که می تواند به طور مستقیم رتبه بندی عاطفی اصطلاحات چند کلمه ای را با استفاده از مسئله قطب جمله / تشخیص جهت گیری معنایی تخمین زده و ترکیب کند. 
2. رتبه بندی عاطفی برای اصطلاحات n گرمایی از ترتیب های مختلف از طریق یک روش مبتنی بر پیکره با استفاده از معیارهای تشابه معنایی توزیعی بین کلمات دیده نشده و مجموعه ای از کلمات هسته تخمین زده می شود.
احساسات در متن: مدل های بعدی و طبقه بندی شدهCI 2013روش جدیدی برای استفاده از پایگاه داده های هنجاری به عنوان روشی برای پردازش متن با یک مدل ابعادی و مقایسه آن با رویکردهای مختلف طبقه ای معرفی کنید.
توزیع کلمات تأثیرگذار در مجموعه مقالات روزنامهCILC 2013مربوط به توزیع کلمات عاطفی در زیرشاخه های مختلف یک مجموعه روزنامه به همراه سه پارامتر عاطفی است: والنس (V) ، دلپذیری ، برانگیختگی (A) ، شدت احساسات و تسلط (D) ، میزان کنترل اعمال شده توسط ادراک کننده بیش از محرک.
پتانسیل هیجان جملات ساده: تأثیرات افزودنی یا تعاملی اسم و صفت؟مرزها در روانشناسی 20151. ارزیابی کنید که چگونه ظرفیتهای مختلف کلمات در یک جمله بر روی پردازش و ارزیابی عاطفی فوقالعمل آن تأثیر می گذارند. 
2. نتیجه نشان می دهد که جملات با کلمات همخوان از نظر احساسی (به عنوان مثال ، پدربزرگ باهوش است) سریعتر از جملات حاوی کلمات ناسازگار از نظر احساسی تأیید شده اند (به عنوان مثال پدربزرگ تنهاست.
Sentiment Analysis: بررسی و تحلیل مقایسه ای خدمات وبعلوم اطلاعاتی 20151. تعریف تحلیل احساسات: تجزیه و تحلیل احساسات ، عقاید ، نگرش ها ، عواطف و غیره افراد نسبت به عناصری مانند عناوین ، محصولات ، افراد ، سازمان ها و خدمات. 
2. هدف این کار: بررسی و مقایسه 15 سرویس وب دسترسی آزاد برای تجزیه و تحلیل احساسات ، تجزیه و تحلیل توانایی های آنها برای طبقه بندی و امتیاز دهی متن های مختلف متناسب با احساسات موجود در آن.
شناسایی احساسات برای تجزیه و تحلیل حمایت اجتماعی در انجمن های آنلاین بهداشتIJCNLP 20171. تشخیص انواع هیجانات در جوامع آنلاین بهداشت ، اطلاعات مفیدی از وضعیت عاطفی کاربران می دهد. 
2. ویژگی های سطح بالا ایجاد شده توسط CNN بدون ساخت هیچ ویژگی دستی یا خودکار. 
3. دقت بهتر نسبت به کارهای قبلی در شناسایی پیام های احساسی. 4. مقایسه وضعیت عاطفی بیماران بین روزهای تعطیل و روز عادی در ایالات متحده آمریکا.

AC – داده های چند حالته

کاغذکنفرانسملاحظات
بررسی روشهای شناسایی تأثیر: عبارات صوتی ، تصویری و خود به خودیIEEE TPAMI 20091. درک احساسات انسان را از منظر روانشناسی بحث کنید. 
2. رویكردهای موجود را برای تشخیص احساسات و موضوعات مهمی مانند جمع آوری و در دسترس بودن اطلاعات آموزش و آزمون را بررسی كنید. 3. برخی چالش ها را برای شناسایی تأثیرات مشخص کنید
تشخیص تأثیر: یک بررسی میان رشته ای از مدل ها ، روش ها و کاربردهای آنهاIEEE TAC 20101. از دیدگاه های نظری بحث می کند که به احساسات به عنوان بیان ، تجسم ، نتایج ارزیابی شناختی ، ساختارهای اجتماعی ، محصولات مدار عصبی و تفسیرهای روانشناختی احساسات اساسی نگاه می کنند.
 2. متاآنالیز در مورد بررسی های موجود در مورد سیستم های تشخیص تأثیر که بر روی روش های تشخیص تأثیر سنتی مانند فیزیولوژی ، چهره و صدا متمرکز هستند ، و همچنین تحقیقات در حال ظهور در کانال های جدیدتر مانند متن ، زبان بدن و سیستم های پیچیده چند منظوره را بررسی می کند.
شناسایی تأثیر چند حالته با استفاده از KinectArxiv 2016در این تحقیق از دستگاه های سنجش رنگ و عمق مانند Kinect برای استخراج ویژگی های صورت و ردیابی مفاصل بدن انسان استفاده شده است. ویژگی ها: ویژگی های زمانی در چندین قاب. همجوشی سطح تصمیم گیری با رای اکثریت ؛ ترکیبی از الگوهای هیجان و یادگیری نظارت شده. نتایج: شناخت بهتر از یادگیری تحت نظارت به تنهایی. شناخت بهتر از ویژگی های مبتنی بر موقعیت

NLP – تجزیه و تحلیل احساسات

مقالهکنفرانسملاحظات
توییتر طبقه بندی احساسات با استفاده از نظارت از راه دورNA 2009روشی نوین برای طبقه بندی خودکار احساس پیام های توییتر با استفاده از یادگیری نظارت شده از راه دور ارائه می دهد.
شبکه های عصبی کانولوشن برای طبقه بندی جملاتEMNLP 2014نشان دهید که یک CNN ساده با تنظیم بیش از حد پارامتر و بردارهای ساکن نتایج عالی را در چندین معیار در کار طبقه بندی جمله بدست می آورد.
مقایسه رویکردهای مبتنی بر واژه نامه برای تجزیه و تحلیل احساسات پست های میکروبلاگArxiv 2014بر اساس بهره برداری از منابع واژگانی گسترده مانند SentiWordNet ، WordNet-Affect ، MPQA و SenticNet ، یک روش مبتنی بر واژه نامه برای طبقه بندی احساسات در پست های توییتر ارائه دهید.
مقایسه و ترکیب روشهای تحلیل احساساتArxiv 20141. مقایسه هشت روش محبوب تجزیه و تحلیل احساسات از نظر پوشش (به عنوان مثال ، بخشی از پیام هایی که احساسات آنها شناسایی می شود) و توافق (به عنوان مثال ، بخشی از احساسات شناسایی شده که با حقیقت زمین مطابقت دارند). 2. ایجاد روشی جدید که ترکیبی از رویکردهای موجود ، ارائه بهترین نتایج پوشش و توافق رقابتی باشد. 3. یک سرویس وب رایگان به نام iFeel ارائه دهید ، که یک API باز برای دسترسی و مقایسه نتایج مختلف روشهای مختلف احساسات برای یک متن داده شده فراهم می کند.
الگوریتم ها و کاربردهای تحلیل احساسات: یک نظر سنجیمجله مهندسی Ain Shams 20141- تصویری تقریباً کامل از تکنیک های SA و زمینه های مرتبط با جزئیات مختصر ارائه دهید. 2. دسته بندی های پیچیده ای از تعداد زیادی از مقالات اخیر و نشان دادن روند اخیر تحقیقات در تجزیه و تحلیل احساسات و مناطق مرتبط با آن را ارائه دهید.
تجزیه و تحلیل احساسات: تشخیص ظرفیت ، احساسات و سایر حالات تأثیرگذار از متناندازه گیری احساسات 20151. خلاصه منظر متنوع وظایف و برنامه های مرتبط با تجزیه و تحلیل احساسات. 2. چالش های کلیدی ناشی از پیچیدگی و ظرافت استفاده از زبان ، رواج زبان خلاق و غیراستاندارد و فقدان اطلاعات زبان زبانی مانند نشانگرهای تن و تنش را مشخص کنید. 3- سیستم ها و مجموعه داده های خودکار را که معمولاً در تحلیل احساسات استفاده می شوند ، توصیف کنید. 4- خلاصه ای از چندین رویکرد دستی و خودکار برای ایجاد واژه نامه های مرتبط با اشتیاق و احساسات. 5- درباره روشهای مقدماتی ترکیب احساسات (چگونگی ترکیب واحدهای کوچکتر متن برای بیان احساسات) و رویکردهای تشخیص احساسات به زبان مجازی و استعاری بحث کنید.
تجزیه و تحلیل حساسیت (و راهنمای تمرین کنندگان) شبکه های عصبی کانولوشن برای طبقه بندی جملاتArxiv 20151. برای بررسی تأثیر م componentsلفه های معماری بر عملکرد مدل ، یک تحلیل حساسیت از CNN های یک لایه انجام دهید. 2. بین تصمیمات مهم و نسبتاً بی نتیجه طراحی برای طبقه بندی جمله ها تفاوت قائل شوید. 3- از نتایج تجربی گسترده ما برای کسانی که علاقه مند هستند از CNN برای طبقه بندی جمله در تنظیمات دنیای واقعی بیشترین بهره را بگیرند ، مشاوره عملی بگیرید.
تجزیه و تحلیل احساسات: تشخیص ظرفیت ، احساسات و سایر حالات تأثیرگذار از متناندازه گیری احساسات 20161. تجزیه و تحلیل احساسات به تعیین نگرش افراد نسبت به یک هدف یا موضوع خاص اشاره دارد. 2. اسگود و همکاران (1957) سه بعد برجسته معنایی را ارزیابی (خوب-بد) ، قدرت (قوی-ضعیف) و فعالیت (فعال-منفعل) یا به طور خلاصه فرم EPA نشان داد. فرم محبوب دیگر ، قدرت ، تحریک و تسلط یا فرم PAD توسط راسل (1980) است. 3. تجزیه و تحلیل احساسات کاربردهای گسترده ای در مراقبت های بهداشتی ، سیاسی ، مدیریت برند ، آموزش و غیره دارد.
تجزیه و تحلیل احساسات استفاده از احساسات و تعبیه کلماتسیستم های خبره با برنامه های کاربردی 20161. یک روش سریع ، انعطاف پذیر و عمومی برای تشخیص احساسات از میان بریده های متنی ارائه می دهد که نظرات مردم را به زبان های مختلف بیان می کند. 2. رویکرد یادگیری ماشینی را تصویب می کند که اسناد متنی توسط بردارها نشان داده می شوند و برای آموزش مدل طبقه بندی قطبیت استفاده می شوند. 3. صلاحیت این نمایش های ویژگی برای کار طبقه بندی احساسات ارزیابی می شود
LSTM برای طبقه بندی احساس به طور زبانی منظم می شودACL 20171. یک مدل ساده آموزش داده شده با حاشیه نویسی در سطح جمله که سعی دارد نقش زبانی واژه نامه های احساسات ، کلمات نفی و کلمات شدت را مدل کند
EmoNet: تشخیص احساس ریز دانه با شبکه های عصبی عودکننده دردارACL 20171. یک مجموعه داده بسیار بزرگ با اندازه 1.6 میلیون توییت برای 24 احساس خوب ایجاد کنید. 2. یک مدل GRU بسیار عمیق برای طبقه بندی احساسات با نتیجه هنر بسازید.
تجزیه و تحلیل احساس وابسته به متن در فیلم های تولید شده توسط کاربرACL 2017یک مدل مبتنی بر LSTM ارائه دهید که گفته ها را برای گرفتن اطلاعات متنی از محیط پیرامون خود در تجزیه و تحلیل فیلم چند حالته امکان پذیر می کند.
با استفاده از میلیون ها مورد شکلک برای یادگیری بازنمایی هر دامنه برای تشخیص احساسات ، احساسات و کنایه هاEMNLP 20171. نظارت گسترده را بر روی مجموعه متنوعی از برچسب های پر سر و صدا گسترش دهید ، با استفاده از یک مجموعه داده 1246 میلیون توئیتی حاوی یکی از 64 شکلک رایج برای یادگیری نمایش های غنی تر. 2. دستیابی به عملکرد پیشرفته در 8 مجموعه داده معیار در تشخیص احساسات ، عواطف و کنایه ها با استفاده از یک مدل آموزش دیده تنها.
EMOBANK: بررسی تأثیر چشم انداز حاشیه و قالب نمایش در تحلیل احساسات بعدیEACL 20171. مجموعه ای از 10k جمله انگلیسی با حاشیه نویسی VAD. 2. زیرمجموعه ای از 1200 جمله انگلیسی با شش رتبه بندی احساسی VAD و Ekman. 3. هر دو دیدگاه خواننده و نویسنده. 4. عملکرد نزدیک به انسان برای نقشه برداری بین قالب های بعدی و دسته بندی شده
مدل سازی توجه برای احساسات هدفمندEACL 2017از مدل LSTM وانیل برای القای مقدار توجه کل جمله استفاده می شود. این مدل بیشتر برای تمایز زمینه های چپ و راست با توجه به یک هدف خاص پس از کارهای قبلی گسترش یافته است
LSTM توجه محور برای طبقه بندی احساس وابسته به هدفEACL 2017ترازبندی بین موجودیت های هدف و متمایزترین ویژگی ها را می آموزد.
اهرم کردن مقدار زیادی از داده های ضعیف نظارت شده برای طبقه بندی احساسات چند زبانهWWW 2017برای آموزش یک شبکه کانولوشن چند لایه و نشان دادن اهمیت استفاده از پیش آموزش چنین شبکه هایی ، از مقدار زیادی داده تحت نظارت ضعیف به زبان های مختلف استفاده می کند.
توجه آگاهانه از زمان و پویایی به نقش و زمینه های بلندگو برای درک زبان گفتاریASRU 2017یک شبکه مبتنی بر توجه را پیشنهاد می کند که علاوه بر این از اطلاعات زمانی و نقش بلندگو برای SLU بهتر استفاده می کند ، جایی که می توان توجه به زمینه ها و نقش های بلندگو را به صورت خودکار به صورت پایان به پایان یاد گرفت.
LSTM عمیق با توجه به سطح پیام و تجزیه و تحلیل احساسات مبتنی بر موضوعSemEval 20171. LSTM دو لایه با دقت ، در بالای تعبیه شده کلمه. 2. یک ابزار پردازش متن برای مجموعه داده های توییتر ارائه دهید
کاوش در جاسازی احساسات و مدل بعدی قدرت پیش بینی احساسات در احساسات توسطپایان نامه 20171. عدم درک سیستم هوش مصنوعی از احساسات انسانی مانع برقراری ارتباط موثر بین سیستم و افراد متقابل انسانی می شود. احساسات سهم بزرگی در برقراری ارتباط دارند زیرا به انسانها اجازه می دهد تا با یکدیگر همدلی و درک کنند. 2. اعتبار استفاده از مدل سه بعدی احساس را در مقابل مدل قطب ساده لوحانه در پیش بینی احساس داده های متنی مشخص کاوش کنید. 3- از مدل احساسات سه بعدی ، یعنی بردارهای VAD استفاده کنید و تعبیه های هیجان را آموزش دهید. 4- تجسم عدم تعمیم زمینه در تعبیه احساسات را نشان داد
ارزیابی مدل های احساسی پیشرفته در مجموعه داده های احساسی پیشرفتهWASSA 2017چندین مدل تجزیه و تحلیل احساسات را در شش معیار مختلف مقایسه کنید که متعلق به حوزه های مختلف هستند و علاوه بر این دارای سطوح مختلف دانه دانه (باینری ، 3 کلاس ، 4 کلاس و 5 کلاس) هستند.
# BB_twtr در SemEval-2017 وظیفه 4: تجزیه و تحلیل احساسات توییتر با CNN و LSTMSemEval 20171. تلاش برای تولید یک طبقه بندی پیشرفته احساسات توییتر را با استفاده از شبکه های عصبی کانولوشن (CNN) و حافظه کوتاه مدت بلند مدت (LSTM ها) توصیف کنید. 2. سیستم پیشنهادی از مقدار زیادی داده بدون برچسب استفاده می کند تا قبل از آموزش تعبیه کلمات. 3- سپس نویسندگان از زیر مجموعه ای از داده های بدون برچسب برای تنظیم دقیق تعبیه شده ها با استفاده از نظارت دور استفاده می کنند. 4- عملکرد برتر با جمع آوری چندین CNN و LSTM حاصل می شود
DataStories at SemEval-2017 Task 4: LSTM عمیق با توجه به سطح پیام و تجزیه و تحلیل احساسات مبتنی بر موضوعSemEval 20171. شبکه های حافظه کوتاه مدت (LSTM) با دو نوع مکانیسم توجه ، در بالای جاسازی های کلمه که از قبل روی مجموعه بزرگی از پیام های توییتر آموزش دیده اند ، تقویت کنید. 2. ارائه یک ابزار پردازش متن مناسب برای پیام های شبکه های اجتماعی ، که توکن سازی ، نرمال سازی کلمات ، تقسیم بندی و تصحیح هجی را انجام می دهد.
آموزش ایجاد نظرات و کشف احساساتArxiv 2017یک واحد واحد پیدا کنید که تجزیه و تحلیل احساسات را در مدل های زبان تکراری در سطح بایت انجام دهد.
بهره برداری از دانش سند برای طبقه بندی احساس در سطح جنبهACL 2018برای بهبود عملکرد طبقه بندی احساسات در سطح جنبه ، دو رویکرد انتقال دانش از داده های سطح اسناد را که به دست آوردن آنها هزینه بسیار کمتری دارد ، کاوش می کند.
یک دست کمک کننده: آموزش تجزیه و تحلیل احساسات عمیق را منتقل کنیدACL 20181. ارائه روشی برای تغذیه نشانه های عمومی در فرآیند آموزش چنین شبکه هایی ، که منجر به توانایی های تعمیم بهتر با توجه به داده های آموزشی محدود می شود. 2. پیشنهاد القای جاسازی احساسات از طریق نظارت بر داده های خارجی ، که سپس از طریق یک م dedicatedلفه اختصاصی مبتنی بر حافظه به مدل وارد می شود.
یک شبکه توجه چند منظوره برای طبقه بندی احساساتACL 2018یک شبکه توجه چند منظوره (MEAN) را پیشنهاد دهید تا با ادغام سه نوع دانش زبانی احساسات (به عنوان مثال ، واژه نامه احساسات ، کلمات نفی ، کلمات شدت) از طریق مکانیسم های توجه ، مشکل را برطرف کند.
آموزش مجدد طبقه بندی های احساس با داده های گفتگوی بدون برچسبACL 2018وظیفه طبقه بندی احساسات را برای یک سرویس تجزیه و تحلیل توییت به عنوان یک مطالعه موردی برطرف کنید و یک استراتژی پیشآموزشی را با داده های گفتگوی بدون برچسب (جفت پاسخ های توییت) از طریق مدل رمزگذار-رمزگشای پیشنهاد دهید.
تشخیص احساس ریز ریز در پست های آنلاین مرتبط با سلامتیEMNLP 2018پیشنهاد کنید انواع هیجانات ریز را از پست های مربوط به سلامتی شناسایی کنید و نشان دهید چگونه می توان از ویژگی های سطح بالا و انتزاعی مشتق شده از شبکه های عصبی عمیق همراه با ویژگی های مبتنی بر فرهنگ لغت برای تشخیص احساسات استفاده کرد.
یادگیری مشترک برای طبقه بندی احساسات و تشخیص علت احساساتEMNLP 2018یک رمزگذار مشترک استفاده کنید که از یک چارچوب واحد برای استخراج ویژگی های هر دو وظیفه فرعی و یک مربی مدل مشترک استفاده کند که به طور همزمان دو مدل را برای دو وظیفه فرعی جداگانه یاد بگیرد.
گسترش مدل گفتگوی تولیدی عصبی با استفاده از منابع دانش خارجیEMNLP 2018درج دانش خارجی در مدل گفتگوی Seq2Seq از خلاصه های ویکی پدیا و همچنین پایگاه دانش NELL.
اجازه دادن به احساسات جریان داشته باشد: پیش بینی موفقیت با مدل سازی جریان احساسات در کتاب هاNAACL 2018با استفاده از شبکه های عصبی مکرر ، جریان احساسات را روی کتاب مدلسازی کنید و میزان سودمندی آن را در پیش بینی موفقیت در کتاب کمی کنید.
شبکه حافظه مکالمه برای تشخیص احساس در فیلم های گفتگوی دوتاییNAACL 20181. یک چارچوب عصبی عمیق ، تحت عنوان شبکه حافظه مکالمه ، پیشنهاد کنید که از اطلاعات متنی از تاریخ مکالمه استفاده می کند. 2. این کار بیانات گذشته هر سخنران را به عنوان خاطره در می آورد.
تجزیه و تحلیل احساسات: پیچیده است!NAACL 20181. استدلال کنید که حذف داده های مبهم یا پر سر و صدا یک روند مشکل ساز است زیرا ، هنگام انجام طبقه بندی احساسات در زمان واقعی از متن کوتاه ، یک سیستم خودکار نمی تواند از قبل مطلع شود که کدام نمونه ها در این دسته از احساسات مورد مناقشه قرار می گیرند. 2. برای طبقه بندی چنین متنی ، مفهوم طبقه ای از احساسات “پیچیده” را پیشنهاد دهید و استدلال کنید که درج آن در چارچوب تحلیل احساسات متن کوتاه ، کیفیت سیستم های تجزیه و تحلیل احساسات خودکار را همانطور که در محیط های واقعی اجرا می شوند ، بهبود می بخشد.
زمان چقدر مهم است: یادگیری توجه به زمان ، برای درک زبان گفتاری متنی در گفتگوهاNAACL 2018انواع مختلف توجه به تحلیل رفتن زمان را در سطح جمله و سطح سخنران طراحی و بررسی می کند ، و همچنین مکانیزم توجه به انعطاف پذیری جهانی کاهش زمان را پیشنهاد می کند.
شبکه توجه دو لایه غنی از دانش برای تجزیه و تحلیل احساساتNAACL 2018یک شبکه توجه دو لایه جدید مبتنی بر حافظه کوتاه مدت دو جهته برای تجزیه و تحلیل احساسات ارائه می دهد ، که از پایگاه های دانش خارجی برای بهبود پیش بینی احساسات بهره می برد.
فراتر از اهمیت کلمه: تجزیه متنی برای استخراج فعل و انفعالات از LSTMICLR 20181. تجزیه متنی (CD) ، الگوریتمی تفسیر برای تجزیه و تحلیل پیش بینی های فردی ساخته شده توسط LSTM های استاندارد ، بدون هیچ تغییری در مدل اساسی ، معرفی کنید. 2. با تجزیه خروجی LSTM ، CD سهم ترکیب کلمات یا متغیرها را برای پیش بینی نهایی LSTM ضبط می کند.
یادگیری توزیع احساس متن از طریق شبکه عصبی چند منظوره ConvolutionalIJCAI 2018برای پرداختن به مسئله یک جمله منفرد چندین احساس با شدتهای مختلف ، این کار یادگیری توزیع احساسات را معرفی می کند و یک شبکه عصبی کانولوشن چند منظوره را برای تجزیه و تحلیل احساس متن ارائه می دهد ، که به طور همزمان وظایف پیش بینی و طبقه بندی توزیع را بهینه می کند.
شناخت احساسات در توییتر: مطالعه مقایسه ای و آموزش یک مدل UnisonIEEE TAC 20181. عملکرد چندین شبکه عصبی تکرار شونده و مبتنی بر کاراکتر را با عملکرد مدل های نمایه سازی معنایی پنهان و کلمه ای مقایسه کنید. 2. بررسی قابلیت انتقال نمایش های پنهان نهایی بین طبقه بندی های مختلف احساسات ، و اینکه آیا می توان با استفاده از یک نمایش مشترک ، یک مدل هماهنگ برای پیش بینی همه آنها ساخت؟ 3. نشان دهید که شبکه های عصبی مکرر ، به ویژه شبکه های مبتنی بر شخصیت ، می توانند نسبت به کلمات کلیدی و مدل های نمایه سازی معنایی نهفته ، بهبود یابند
تکامل تجزیه و تحلیل احساسات – مروری بر مباحث پژوهشی ، مکان ها و مقالات برتربررسی علوم کامپیوتر 20181- حدود 6996 مقاله را با كمك رايانه مرور كنيد.
SeerNet در SemEval-2018 وظیفه 1: سازگاری دامنه برای تأثیر در توییت هاSemEval 2018سیستم پیشنهادی سازگاری دامنه ای از 4 مدل مختلف را انجام می دهد و گروهی را برای پیش بینی نهایی ایجاد می کند
یادگیری عمیق برای تجزیه و تحلیل احساسات: یک نظرسنجیArxiv 2018ابتدا مروری بر یادگیری عمیق دارد و سپس یک بررسی جامع از کاربردهای فعلی آن در تحلیل احساسات ارائه می دهد.
تشخیص احساس در متن: یک بررسیArxiv 20181. کارهایی را که در شناسایی اصطلاحات عاطفه در متن انجام شده مرور کنید و استدلال کنید که اگرچه بسیاری از تکنیک ها ، روش ها و مدل ها برای شناسایی احساسات در متن ایجاد شده اند ، دلایل مختلفی وجود دارد که این روش ها را ناکافی می کند. 2. آرگوس برای بهبود طراحی و معماری سیستم های فعلی ، عواملی مانند پیچیدگی عواطف انسانی و استفاده از زبان ضمنی و استعاری در بیان آن ، نیاز اساسی دارد ، ما را به این فکر می اندازد که فقط یک هدف جدید روش ها برای درک این پیچیدگی ها کافی نخواهند بود و توجه به پیچیدگی های زبانی بیان احساسات مهم است.
رویکرد مبتنی بر احساس و معناشناسی برای تشخیص احساس در مکالمات متنیArxiv 20181. با استفاده از یک مدل یادگیری عمیق مبتنی بر LSTM ، یک روش جدید برای تشخیص احساساتی مانند شاد ، غمگین یا عصبانی در مکالمات متنی پیشنهاد کنید. 2. تعبیه های معنایی و احساسی را با هم ترکیب کنید
DialogueRNN: RNN توجه برای تشخیص احساس در مکالماتAAAI 2019روش جدیدی را مبتنی بر شبکه های عصبی مکرر معرفی کنید که وضعیت های جداگانه طرف را در طول مکالمه ردیابی می کند و از این اطلاعات برای طبقه بندی احساسات استفاده می کند
مدلسازی پویای هیجان و تشخیص ناهنجاری در مکالمه بر اساس سنسور انتقال عاطفیFusion Information 2019یک مدل ترکیبی را ارائه می دهد که ترکیبی از شبکه عصبی کانولوشن حافظه کوتاه مدت (CNN-LSTM) با روش مارکت زنجیره ای Monte Carlo (MCMC) است تا احساسات کاربران را شناسایی کند ، از انتقال عاطفی کاربران استفاده کند و ناهنجاری ها را با توجه به سنسور انتقال تشخیص دهد.

شبکه‌ عصبی بازگشتی چیست ؟

Siri اپل و Alexa  آمازون ، جدا از این که دستیاران شخصی باشند ، یک وجه اشتراک دارند : هر دو آن ها برای درک گفتار انسان و ارائه پاسخ ، از شبکه های عصبی بازگشتی استفاده می کنند. نه تنها این دو، بلکه تقریباً هر شرکتی از شبکه ‌های عصبی بازگشتی استفاده می کند. 

در این آموزش ، در مورد یکی از مهم ترین انواع الگوریتم یادگیری ماشین یعنی شبکه عصبی بازگشتی ( RNN ) صحبت خواهیم کرد. این نوع الگوریتم ها در هنگام ترجمه یک زبان به زبان دیگر به شما کمک می کنند. ما پیشینه، نحوه کار و کاربرد های مختلف RNN را مطالعه خواهیم کرد. پس بیایید این آموزش را با معرفی اولیه شبکه های عصبی بازگشتی شروع کنیم.

معرفی شبکه های عصبی بازگشتی

شبکه عصبی بازگشتی چیست؟

شبکه عصبی بازگشتی نوعی شبکه عصبی است که در آن یک ارتباط بین گره ها طی یک توالی زمانی وجود دارد. این ارتباط ، یک گراف جهت دار است. منظور از توالی زمانی ، داده هایی است که با گذر زمان انتقال می یابند.

مثال RNN : داده های سری زمانی ، شامل قیمت سهام ها که با تغییر زمان ، اطلاعات ثبت شده از حسگر ها ، سوابق پزشکی و غیره تغییر می کنند. این شبکه های عصبی بازگشتی از حالت داخلی یا حافظه خود برای پردازش دنباله داده های ورودی استفاده می کنند. این قبیل ورودی ها به ورودی قبلی وابسته هستند. بنابراین، یک ارتباط بین دنباله های ورودی وجود دارد. لذا از آن ها در حوزه هایی مانند پردازش زبان طبیعی و تشخیص گفتار استفاده می کنیم.

چرا RNN ؟

شبکه های عصبی قدیمی ، توانایی پرداختن به ورودی های بعدی براساس موارد قبلی را ندارند. برای مثال ، یک شبکه عصبی معمولی نمی تواند بر اساس دنباله های قبلی ، کلمه بعدی را در دنباله پیش بینی کند. در حالیکه ، یک شبکه عصبی بازگشتی ( RNN ) قطعا می تواند این کار را انجام دهد.

شبکه عصبی بازگشتی ، همانطور که از نامش پیداست ، تکرارشونده است. بنابراین به صورت حلقه هایی اجرا می شوند که باعث ماندگاری اطلاعات می شود.

شبکه عصبی بازگشتی چیست

در نمودار فوق ، یک شبکه عصبی داریم که ورودی xt را گرفته و از خروجی ht استفاده می کند. بنابراین، اطلاعات از یک مرحله به مرحله بعدی منتقل می شود. این شبکه عصبی بازگشتی ، در حین طی کردن روند تکاملی ، می تواند نسخه هایی از همان شبکه ای باشد که اطلاعات را به حالت بعدی منتقل می کند.

RNN ها به ما این امکان را می دهند که مدلسازی را بر روی یک دنباله یا زنجیره ای از بردار ها انجام دهیم. این دنباله ها می توانند ورودی ، خروجی و یا هر دو باشند. بنابراین ، می توان نتیجه گرفت که شبکه های عصبی ، با لیست ها یا دنباله ها مرتبط هستند. بنابراین ، هر وقت داده ای با ماهیت ترتیبی داشتید، باید از شبکه های عصبی بازگشتی استفاده کنید.

شبکه های عصبی بازگشتی چگونه کار می کنند؟

در شبکه های عصبی قدیمی ، یک لایه مخفی با مجموعه ای از وزن ها و بایاس های مخصوص به خود وجود دارد. بگذارید این وزن و بایاس را به ترتیب برای وزن ۱ و بایاس ۱ ، w1 و b1 فرض کنیم. به همین ترتیب w2 ، b2 و w3 ، b3 را برای لایه های دوم و سوم خواهیم داشت. این لایه ها همچنین از یکدیگر مستقل هستند ، به این معنی که آن ها خروجی قبلی را نمی دانند.

فرض کنید یک شبکه عمیق تر با یک لایه ورودی، سه لایه مخفی، و یک لایه خروجی داشته باشیم.

شبکه عصبی بازگشتی چگونه کار می کند

شبکه عصبی بازگشتی بصورت زیر اجرا می شود :

  • شبکه بازگشتی ابتدا فعالساز های مستقل را به وابسته تبدیل می کند. همچنین به همه لایه ها ، وزن و بایاس یکسانی اختصاص می دهد که پیچیدگی پارامتر های RNN را کاهش می دهد و با ارائه خروجی قبلی به عنوان ورودی لایه بعدی ، یک پلتفرم استاندارد برای حفظ کردن خروجی های قبلی فراهم می کند.
  • این سه لایه دارای وزن ها و بایاس های یکسان ، در یک واحد بازگشت با هم ترکیب می شوند.
نحوه کار شبکه های عصبی بازگشتی

برای محاسبه حالت فعلی 

ht = f ( ht-1 , x)

  • ht : حالت فعلی
  • ht-1 : حالت قبلی
  • xt : حالت ورودی

به منظور اعمال تابع فعالساز tanh، داریم:

ht = tanh ( Whh ht-1 + Wxh x)

که در آن:

  • Whh : وزن نورون فعلی
  • Wxh : وزن نورون ورودی

فرمول محاسبه خروجی:

yt = Why ht

  • yt : خروجی
  • Why : وزن در لایه خروجی

آموزش از طریق RNN :

  • این شبکه یک واحد گام زمانی از ورودی می گیرد.
  • حالت فعلی را از طریق ورودی فعلی و حالت قبلی محاسبه می کنیم.
  • حالا خروجی حالت ht تبدیل به ورودی حالت ht-1 می گردد.
  • این اتفاق برای n گام مختلف می تواند اتفاق بیفتد و در انتها، تمام اطلاعات به هم متصل می شود.
  • پس از تکمیل تمام مراحل ، مرحله آخر محاسبه خروجی است.
  • در آخر ، با محاسبه اختلاف بین خروجی واقعی و خروجی پیش بینی شده ، خطا را محاسبه می کنیم.
  • خطا برای تنظیم وزن ها و تولید یک نتیجه بهتر به شبکه برگشت داده می شود.

کاربرد های شبکه عصبی بازگشتی

این جالب ترین بخش از آموزش شبکه های عصبی بازگشتی ماست. در ادامه برخی از کاربرد های فوق العاده RNN را مشاهده می کنید :

۱- ترجمه ماشینی

ما از شبکه های عصبی بازگشتی در موتورهای ترجمه استفاده می کنیم تا متن را از یک زبان به زبان دیگر ترجمه کنیم. آن ها می توانند این کار را با ترکیبی از مدل های دیگر مانند حافظه طولانی کوتاه مدت ( LSTM ) انجام دهند.

ترجمه ماشینی با شبکه های عصبی بازگشتی

۲- تشخیص گفتار

شبکه های عصبی بازگشتی جایگزین مدل های شناسایی گفتار قدیمی شده اند که از مدل های مخفی مارکوف استفاده می کردند. شبکه های عصبی بازگشتی می توانند به همراه LSTM ها ،  گفتار را بهتر طبقه بندی کنند و بدون از دست دادن مفهوم ، آن ها را  به متن تبدیل کنند.

تشخیص گفتار با شبکه های عصبی

۳- برچسب زنی خودکار تصویر

RNN ها همراه با شبکه های عصبی کانولوشنی می توانند تصاویر را شناسایی کرده و توصیف آن ها را در قالب برچسب ها ارائه دهند. برای مثال، تصویر روباهی که از روی پرچین می پرد ، بهتر است با استفاده از RNN ها توصیف شود.

برچسب زنی خودکار تصاویر با شبکه عصبی بازگشتی

۴-تحلیل احساسات

برای درک احساسات کاربر ، از تجزیه و تحلیل احساسات برای تشخیص مثبت بودن ، منفی بودن یا خنثی بودن جمله استفاده می کنیم. بنابراین ، RNN ها در پردازش داده های متوالی به منظور یافتن احساسات جمله ، مهارت بالایی دارند.

تحلیل احساسات با شبکه های عصبی بازگشتی

خلاصه

به عنوان خلاصه بندی آموزش شبکه های عصبی بازگشتی ، ما کاربرد های RNN و نحوه پردازش داده های متوالی را دیدیم. همچنین نحوه ترکیب RNN با مدل های دیگر برای پردازش بهتر داده را مورد مطالعه قرار دادیم.

تحلیل داده های صوتی با استفاده از یادگیری عمیق

در این آموزش ، ما به تحلیل صوت با استفاده از یادگیری عمیق خواهیم پرداخت. همچنین ، با مدیریت داده ها در حوزه صوت و کاربرد های پردازش صوت آشنا خواهیم شد. به علاوه ، برای درک بهتر تحلیل داده های صوتی از نمودار ها استفاده خواهیم کرد.

تحلیل داده های صوتی با یادگیری عمیق

مقدمه ای بر تحلیل صوت

ما همیشه با صدا ها سروکار داریم، گاهی مستقیم یا شاید گاهی غیرمستقیم. مغز ما به طور مداوم کار می کند، بنابراین مغز در هر لحظه اطلاعات را پردازش و درک می کند. و درنهایت ، اطلاعات مربوط به محیط را به ما ارائه می دهد تا ما محیط اطراف را درک کنیم.

گاهی اوقات صدا هایی را در اطرافمان می شنویم و به نظرمان مفید و جالب هستند. ابزارهایی هستند که به دریافت این صدا ها کمک می کنند و همچنین می توانند در فرمت قابل خواندن توسط کامپیوتر نمایش داده می شوند.

برخی از این فرمت ها عبارتند از:

  • فرمت wav ( Waveform Audio File )
  • فرمت mp3 ( MPEG-1 Audio Layer 3 )
  • فرمت WMA ( Windows Media Audio )

در نهایت اگر کمی بیشتر این صدا ها را بررسی کنیم به این نتیجه می رسیم که صوت ، یک قالب موجی شکل از داده هاست، که می تواند به صورت زیر نمایش داده شود.

نمودار تحلیل صوت

بیایید یادگیری انتقالی برای یادگیری عمیق با CNN را مجددا مرور کنیم

مدیریت داده ها در حوزه صوت

از آنجا که در حال حاضر، برخی فرمت های داده بدون ساختار وجود دارند، لذا برای آن داده های صوتی ، به چند مرحله پیش پردازش نیاز داریم که باید قبل از تجزیه و تحلیل صوتی ، انجام گیرد.

در مرحله اول، ما باید داده ها را در فرمت قابل فهم برای ماشین بارگذاری کنیم. برای این کار ، ما به سادگی بعد از هر بازه زمانی مشخص , از مقادیر نمونه می گیریم.

به عنوان مثال ، در یک فایل صوتی ۲ ثانیه ای ، مقادیر را در هر نیم ثانیه استخراج می کنیم. به این کار ، نمونه گیری از داده های صوتی و به میزان نمونه برداری از آن ها ، نرخ نمونه برداری ( Sampling Rate ) گفته می شود.

نمودار تحلیل صوت

ما می توانیم آن را به روش دیگری نمایش دهیم. می توانیم داده ها را به یک حوزه دیگری به نام حوزه فرکانس تبدیل کنیم. وقتی یک داده صوتی را نمونه برداری می کنیم ، برای نمایش کل داده ها به نقاط داده بیشتری نیاز داریم. همچنین نرخ نمونه برداری باید تا حد امکان بالا باشد.

به این ترتیب ، اگر داده های صوتی را در حوزه فرکانس نشان دهیم، آنگاه فضای محاسباتی بسیار کمتری مورد نیاز است. برای درک شهودی ، به تصویر زیر نگاهی بیندازید

تحلیل ویژگی های صوت

در اینجا ، ما باید یک سیگنال صوتی را به ۳ سیگنال خالص مختلف تفکیک کنیم ، که به راحتی می تواند به عنوان سه مقدار منحصر به فرد در یک حوزه فرکانس باشد.

همچنین راه های دیگری نیز وجود دارند که در آن ها می توانیم داده های صوتی و تحلیل صوتی آن را ارائه کنیم.

برای مثال، با استفاده از MFC ( فرکانس مل کپستروم ) ها. که چیزی نیستند جز روش های مختلف برای نمایش داده ها.

علاوه بر این ، ما باید ویژگی هایی را از این نمایش های صوتی استخراج کنیم. که این الگوریتم بر روی این ویژگی ها کار می کند و وظیفه ای را که برای آن طراحی شده است انجام می دهد. در اینجا یک نمایش بصری از دسته های ویژگی های صوتی قابل استخراج وجود دارد.

پس از استخراج ، باید آن را برای تجزیه و تحلیل بیشتر به مدل یادگیری ماشین بفرستیم.

کاربرد های پردازش صوت

  • فهرست بندی مجموعه ای از موزیک ها با توجه به ویژگی های صوتی آن ها.
  • پیشنهاد دادن موسیقی برای کانال های رادیویی
  • جستجوی شباهت فایل های صوتی ( مانند برنامه Shazam )
  • پردازش و سنتز گفتار – تولید صدای مصنوعی برای عوامل گفتگو

نتیجه گیری

در نتیجه ، ما تحلیل صوت و داده گردانی را در یک حوزه صوتی با کاربرد های پردازش صدا مورد مطالعه قرار داده‌ایم. همچنین ، ما از نمودار هایی برای کمک به شما در درک بهتر داده های صوتی استفاده کرده ایم

شبکه های عصبی کانولوشنی – ماشین ها چگونه تصاویر را تفسیر می کنند

آیا می دانستید پژوهشگران به طور مداوم در حال آموزش ماشین ها هستند تا مانند انسان ها فکر کنند، و ماشین ها نیز تقریبا موفق به این کار شده اند؟ اساس این قضیه شبکه های عصبی است. پیش از این، مطالب مختلفی در مورد الگوریتم های یادگیری ماشین منتشر کرده بودیم، و اکنون، با آموزش شبکه های عصبی کانولوشنی ، با شما همراه هستیم. خواهید دید که شبکه های عصبی کانولوشنی چگونه به پشتوانه اصلی صنعت هوش مصنوعی تبدیل شده اند و اینکه CNN ها چگونه صنایع آینده را شکل می دهند.

” رایانه ها قادر به دیدن ، شنیدن و یادگیری هستند. به آینده خوش آمدید. ” – دیو واترز

یادگیری ماشین ، الگوریتم های زیادی دارد که وظیفه انتقال اطلاعات به سیستم ها را به عهده دارند. انواع گسترده ای از کاربرد های یادگیری ماشین وجود دارد. یکی از این کاربرد ها ، بینایی رایانه ای است. هدف شناسایی چهره ها و دیگر تصاویر ، به خوبی به کمک نوع خاصی از شبکه های عصبی به نام شبکه های عصبی کانولوشنی  (CNN) انجام می شود. در این آموزش ، به نحوه کار CNN ها و همچنین تاریخچه و کاربردهای آن ها می پردازیم.

CNN چیست؟

شبکه های عصبی کانولوشنی ، نوعی از الگوریتم یادگیری عمیق هستند که تصویر را به عنوان ورودی گرفته و ویژگی های مختلف تصویر را از طریق فیلتر ها یاد می گیرند. این روش به آن ها امکان شناسایی اشیاء مهم موجود در تصویر را می دهد و می توانند یک تصویر را از دیگری تمایز دهند. به عنوان مثال ، شبکه کانولوشنی ، ویژگی های خاص گربه ها را که با سگ ها متفاوت اند ، یاد می گیرند ، به طوری که وقتی ما ورودی گربه ها و سگ ها را می دهیم، می تواند به راحتی بین این دو تفاوت قائل شود. یکی از ویژگی های مهم شبکه عصبی کانولوشنی که آن را از دیگر الگوریتم های یادگیری ماشین متمایز می کند، این است که خودش قادر به پیش پردازش داده ها است. بنابراین، احتمالاً شما منابع زیادی را در پیش پردازش داده ها صرف نخواهید کرد. در هنگام شروع سرد (راه اندازی اولیه) ، فیلتر ها ممکن است نیاز به تنظیمات دستی داشته باشند، اما با پیشرفت در آموزش دهی ، آن ها قادر به سازگاری با ویژگی های آموخته شده و توسعه فیلتر های مورد نظر خود هستند. بنابراین ، CNN با افزایش داده ها، دائماً در حال تغییر است.

معرفی شبکه های عصبی کانولوشنی

اگر مفهومی از یادگیری ماشین وجود دارد که آن را نمی دانید، پس بهتر است مجموعه خودآموز یادگیری ماشین را دنبال کنید.

شبکه های عصبی کانولوشنی چگونه کار می کنند؟

CNN ها عملکرد مشابهی با شبکه های عصبی تماماً متصل معمولی دارند. این شبکه های کانولوشنی دارای وزن هایی هستند که می توانند از ورودی و بایاس ها یاد بگیرند. هر نورون متصل در شبکه یک ورودی دریافت می کند و یک ضرب نقطه ای روی آن انجام می دهد. این امر به روش غیرخطی ادامه می یابد. در پایان، یک تابع امتیاز مشتق پذیر منحصر به فرد وجود خواهد داشت. این تابع ، متشکل از امتیازهایی است که ما از لایه های مختلف شبکه عصبی بدست می آوریم. در نهایت در پایان کار ، یک تابع زیان ، عملکرد مدل را ارزیابی می کند. شبکه عصبی کانولوشنی با شبکه عصبی استاندارد متفاوت است، چون فرض واضحی از ورودی به عنوان یک تصویر وجود دارد.

نحوه کار شبکه های عصبی کانولوشنی

این فرض به معماری کمک می کند تا به شیوه ای کاربردی تر تعریف شود. مثلاً برخلاف ترتیب خطی نورون ها در یک شبکه عصبی ساده. این نورون ها یک ساختار کلی از سه بُعد – طول ، عرض و ارتفاع دارند. برای مثال، تصاویر موجود در مجموعه داده CIFAR 10 حاوی تصاویری با ابعاد ۳۲*۳۲*۳ و خروجی نهائی یک بردار منفرد از تصاویر با ابعاد ۱*۱*۱۰ خواهند داشت. معماری شبکه عصبی کانولوشنی به شرح زیر است:

  • ورودی – همانطور که در بالا توضیح داده شد، یک تصویر معمولی در داده های CIFAR-10 که دارای ابعاد ۳۲*۳۲*۳ باشد که در آن عمق، نشان دهنده تعداد کانال های تصویر (RGB) است.
  • لایه CONV مسئول محاسبه ضرب نقطه ای بین وزن های نورون و ناحیه تصویر ورودی است تا مورد اتصال قرار گیرد. در اینجا، ابعاد ۳۲*۳۲*۱۲ می شوند که نشانگر ۱۲ فیلتری هستند که شبکه عصبی از آن ها استفاده می کند.
  • لایه سوم شامل RELU است که برای کاربرد تابع فعالساز روی نتیجه حاصل از ضرب نقطه ای، استفاده می شود. در اینجا ابعاد نتیجه تغییری نمی کند.
  • لایه چهارم POOL از ابعاد مکانی تصویر یعنی عرض و ارتفاع را نمونه کاهی ( Downsampling ) می کند. این کار ابعاد را به ۱۶*۱۶*۱۲ کاهش می دهد.
  • لایه تماما متصل ، مسئول محاسبه امتیاز کلاس است که منجر به ابعاد نهائی ۱*۱*۱۰ خواهد شد. در اینجا ۱۰ نشانگر دسته های CIFAR-10 است.

مهم ترین لایه در معماری CNN، لایه کانولوشنی است. مؤلفه اصلی لایه CONV شامل یک فیلتر قابل یادگیری است. هر فیلتر روی شاخه های CONV دارای اندازه ۵*۵*۳ است. هنگامی که انتشار به جلو انجام می شود، ما روی هر فیلتر را در عرض و همچنین عمق ابعاد ورودی حرکت می دهیم و در آخر، ضرب نقطه ای را محاسبه می کنیم. این ضرب نقطه ای در نهایت منجر به یک نگاشت فعالساز ۲ بعدی خواهد شد که پاسخ فیلتر را در هر موقعیت مکانی به ما می دهد.

آنگاه شبکه ، فیلترهای مختلفی که همراه با ویژگی های بصری مانند لبه یا غیرواضح بودن برخی رنگ ها در لایه اول ظاهر می شوند را یاد می گیرد و در لایه بالاتر شبکه، یک الگو لانه زنبوری مانند تولید می کند. هر یک از ۱۲ فیلتر موجود در ConvNet ، یک نگاشت فعالساز ۲ بعدی ایجاد می کند که برای تولید ابعاد خروجی از آن استفاده می کنیم.

کاربرد های شبکه های عصبی کانولوشنی

  • شبکه های عصبی کانولوشنی یا CNN ها ، برای شناسایی تصویر توسعه داده شده اند و در نتیجه بیشتر در حوزه بینایی رایانه ای کاربرد دارند که برای کلاسه بندی تصاویر، ناحیه بندی آن ها و همچنین انجام مکان یابی ( Localization ) روی تصاویر مورد استفاده قرار می گیرند.
تشخیص چهره در تصویر با شبکه های عصبی کانولوشنی
  • ویدئو ها با تصاویر تفاوت دارند چون دارای یک بُعد زمانی هستند. با اینکه پیچیده تر از تصاویر هستند ، اما می توانیم CNN ها را برای استفاده در این نوع ورودی های بصری نمایشی، اصلاح کنیم. در اغلب موارد ، استفاده از شبکه های کانولوشنی در کنار دیگر الگوریتم ها مانند LSTM و ماشین بولتزمن برای بهبود عملکرد شان در کنترل ورودی ویدئویی ، بسیار پرطرفدار است.
  • CNN ها، علاوه بر ورودی های بصری، همچنین در زمینه پردازش زبان طبیعی برای تجزیه معنایی ، مدل سازی جمله ، پیش بینی و همچنین کلاسه بندی مورد استفاده قرار می گیرند.
کاربرد الگوریتم cnn در مدل سازی جملات
  • اخیراً شرکت هایی مانند گوگل ، از CNN ها در کنار شبکه های عصبی بازگشتی و LSTM ها برای تشخیص گفتار استفاده کرده اند.
تشخیص گفتار با شبکه های عصبی کانولوشنی
  • CNN ها همچنین در دارو پژوهی مورد استفاده قرار می گیرند که اثبات می شود ابزاری موثر برای شناسایی برهم کنش بین مولکول ها و پروتئین های بیولوژیکی برای تشخیص درمان های بالقوه هستند.

خلاصه

خب، به طور خلاصه شبکه های عصبی کانولوشنی را بررسی کردیم. شبکه عصبی کانولوشنی ، محبوب ترین و مهم ترین الگوریتم برای کار با داده های تصویری است. ما یاد گرفتیم که چگونه CNN برای حوزه های دیگر فراتر از داده های تصویر نیز مورد استفاده قرار می گیرد تا دامنه کاربردهای آن را افزایش دهد. ما همچنین یاد گرفتیم که CNN ها چگونه کار می کنند و چگونه می توانند انواع مختلفی از عملیات را انجام دهند.