NLP – مجموعه واژه نامه ها و مجموعه داده ها
کاغذ | کنفرانس | ملاحظات |
---|---|---|
پایگاه داده SEMAINE: سوابق چندمرحله ای حاوی مکالمات رنگی احساسی بین یک شخص و یک عامل محدود | IEEE TAC 2012 | 1. به عنوان بخشی از یک رویکرد تکراری برای ایجاد عوامل که می توانند فرد را با یک الگوی شنوندنی مصنوعی حساس (SAL) درگیر کنند ، یک پایگاه داده بزرگ سمعی و بصری معرفی کنید. 2. این مجموعه داده شامل 150 شرکت کننده است که در مجموع 959 مکالمه با شخصیت های SAL منفرد دارد و هر کدام تقریباً 5 دقیقه به طول می انجامد. |
آفتاب پرست ها در مکالمات خیالی: رویکرد جدیدی برای درک هماهنگی سبک زبانی در گفتگوها | CMCL Workshop 2011 | 1. مجموعه داده های گفتگوی فیلم کرنل را ارائه دهید 2. هماهنگی قابل توجهی را در بین بسیاری از خانواده های کلمات عملکردی در مجموعه بزرگ فیلمنامه ما پیدا کنید |
هنجارهای ظرفیت ، برانگیختگی و تسلط برای 13915 لموی انگلیسی | روشهای تحقیق رفتار 2013 | 1. چهار خط تحقیق برای رتبه بندی عاطفی کلمات: خود احساسات ؛ تأثیر ویژگیهای عاطفی بر پردازش و حافظه کلمات ؛ برآورد احساسات بیان شده توسط کل پیام ها یا متن ها ؛ تخمین خودکار ارزشهای احساسی کلمات جدید با مقایسه آنها با کلمات معتبر. 2. مجموعه داده ای متشکل از 13915 جفت لما-VAD ارائه شده است |
تحقیق زبانی و تعداد کلمات: LIWC2015 | www.liwc.net | کتابچه راهنمای کاربر برای نرم افزار LIWC را ارائه دهید |
پیکره گفتگوی اوبونتو: مجموعه داده های گسترده ای برای تحقیق در سیستم های گفتگوی چند چرخشی بدون ساختار | SIGDIAL 2015 | مجموعه داده ای را شامل 1 میلیون گفتگوی چند نوبت ، با مجموع بیش از 7 میلیون گفتار و 100 میلیون کلمه معرفی کنید. |
مدل سازی والنس و برانگیختگی در پست های فیس بوک | کارگاه آموزشی WASSA 2016 | مجموعه داده جدیدی از 2895 پست رسانه اجتماعی را که توسط دو حاشیه نویسی آموزش دیده روانشناختی در دو مقیاس جداگانه نه نقطه ای (ظرفیت و برانگیختگی) رتبه بندی شده اند ، معرفی کنید. |
بررسی شرکت های موجود برای ساخت سیستم های گفتگوی مبتنی بر داده | Arxiv 2017 | 1. بررسی گسترده ای از مجموعه داده های عمومی که برای یادگیری داده محور سیستم های گفتگو مناسب است. 2. درباره خصوصیات مهم این مجموعه داده ها ، چگونگی استفاده از آنها برای یادگیری استراتژیهای متنوع گفتگو و سایر کاربردهای بالقوه آنها بحث کنید. 3. روش های انتقال یادگیری بین مجموعه داده ها و استفاده از دانش خارجی را بررسی کنید. 4- در مورد انتخاب مناسب معیارهای ارزیابی برای هدف یادگیری بحث کنید. |
AMIGOS: مجموعه ای از داده ها برای بررسی تأثیر ، شخصیت و خلق و خو در افراد و گروه ها | IEEE TAC 2017 | 1. یک مجموعه داده برای تحقیقات چند مدلی در مورد تأثیر ، ویژگی های شخصیتی و خلق و خوی در افراد و گروه ها. 2. مجموعه داده شامل فیلم ها و سیگنال های عصبی-فیزیولوژیکی است. 3. احساسات شرکت کنندگان هم با ارزیابی خود از سطح عاطفه (ظرفیت ، تحریک ، کنترل ، آشنایی ، پسندیدن و احساسات اساسی) که در طول فیلم ها احساس شده اند و هم ارزیابی بیرونی از سطح ظرفیت و تحریک ، حاشیه سازی شده اند. |
رویکرد مبتنی بر احساس و معناشناسی برای تشخیص احساس در مکالمات متنی | Arxiv 2018 | 1. مجموعه ای شامل بیش از 30K توییت سه نوبت حاوی چهار احساس شاد ، غمگین ، عصبانی و دیگران را معرفی کنید. 2. چهار نوع مدل شبکه عصبی کانولوشن مبتنی بر توالی را با توجه به استفاده از اطلاعات توالی محصور شده در گفتگو پیشنهاد می کند. |
تشخیص احساسات در رونوشت های نمایش تلویزیونی با شبکه های عصبی کانولوشن مبتنی بر توالی | کارگاه آموزشی AAAI 2018 | 1. یک مجموعه جدید ارائه دهید که حاوی حاشیه نویسی از هفت احساس در مورد اظهارات متوالی در گفتگوهای استخراج شده از نمایش است ، دوستان. |
EmotionLines: مجموعه ای از احساسات از مکالمات چند جانبه | LREC 2018 | در مجموع 29245 جمله از 2000 گفتگو در EmotionLines برچسب گذاری شده اند ، هر عبارت در یکی از 7 احساس برچسب گذاری شده است: شش احساس Ekman + خنثی. |
MELD: یک مجموعه داده چند طرفه چند حالته برای تشخیص احساس در مکالمات | Arxiv 2018 | 1. نسخه به روز شده از EmotionLines. 2. هر سخنی در MELD با احساسات و برچسب احساسات همراه است. گفته ها در MELD شامل چند حالت شامل موارد صوتی و تصویری همراه با متن است. |
Leave a Reply