NLP – مجموعه واژه نامه ها و مجموعه داده ها

NLP – مجموعه واژه نامه ها و مجموعه داده ها

کاغذکنفرانسملاحظات
پایگاه داده SEMAINE: سوابق چندمرحله ای حاوی مکالمات رنگی احساسی بین یک شخص و یک عامل محدودIEEE TAC 20121. به عنوان بخشی از یک رویکرد تکراری برای ایجاد عوامل که می توانند فرد را با یک الگوی شنوندنی مصنوعی حساس (SAL) درگیر کنند ، یک پایگاه داده بزرگ سمعی و بصری معرفی کنید. 
2. این مجموعه داده شامل 150 شرکت کننده است که در مجموع 959 مکالمه با شخصیت های SAL منفرد دارد و هر کدام تقریباً 5 دقیقه به طول می انجامد.
آفتاب پرست ها در مکالمات خیالی: رویکرد جدیدی برای درک هماهنگی سبک زبانی در گفتگوهاCMCL Workshop 20111. مجموعه داده های گفتگوی فیلم کرنل را ارائه دهید
2. هماهنگی قابل توجهی را در بین بسیاری از خانواده های کلمات عملکردی در مجموعه بزرگ فیلمنامه ما پیدا کنید
هنجارهای ظرفیت ، برانگیختگی و تسلط برای 13915 لموی انگلیسیروشهای تحقیق رفتار 20131. چهار خط تحقیق برای رتبه بندی عاطفی کلمات: خود احساسات ؛ تأثیر ویژگیهای عاطفی بر پردازش و حافظه کلمات ؛ برآورد احساسات بیان شده توسط کل پیام ها یا متن ها ؛ تخمین خودکار ارزشهای احساسی کلمات جدید با مقایسه آنها با کلمات معتبر. 
2. مجموعه داده ای متشکل از 13915 جفت لما-VAD ارائه شده است
تحقیق زبانی و تعداد کلمات: LIWC2015www.liwc.netکتابچه راهنمای کاربر برای نرم افزار LIWC را ارائه دهید
پیکره گفتگوی اوبونتو: مجموعه داده های گسترده ای برای تحقیق در سیستم های گفتگوی چند چرخشی بدون ساختارSIGDIAL 2015مجموعه داده ای را شامل 1 میلیون گفتگوی چند نوبت ، با مجموع بیش از 7 میلیون گفتار و 100 میلیون کلمه معرفی کنید.
مدل سازی والنس و برانگیختگی در پست های فیس بوککارگاه آموزشی WASSA 2016مجموعه داده جدیدی از 2895 پست رسانه اجتماعی را که توسط دو حاشیه نویسی آموزش دیده روانشناختی در دو مقیاس جداگانه نه نقطه ای (ظرفیت و برانگیختگی) رتبه بندی شده اند ، معرفی کنید.
بررسی شرکت های موجود برای ساخت سیستم های گفتگوی مبتنی بر دادهArxiv 20171. بررسی گسترده ای از مجموعه داده های عمومی که برای یادگیری داده محور سیستم های گفتگو مناسب است. 
2. درباره خصوصیات مهم این مجموعه داده ها ، چگونگی استفاده از آنها برای یادگیری استراتژیهای متنوع گفتگو و سایر کاربردهای بالقوه آنها بحث کنید. 
3. روش های انتقال یادگیری بین مجموعه داده ها و استفاده از دانش خارجی را بررسی کنید. 4- در مورد انتخاب مناسب معیارهای ارزیابی برای هدف یادگیری بحث کنید.
AMIGOS: مجموعه ای از داده ها برای بررسی تأثیر ، شخصیت و خلق و خو در افراد و گروه هاIEEE TAC 20171. یک مجموعه داده برای تحقیقات چند مدلی در مورد تأثیر ، ویژگی های شخصیتی و خلق و خوی در افراد و گروه ها. 
2. مجموعه داده شامل فیلم ها و سیگنال های عصبی-فیزیولوژیکی است. 
3. احساسات شرکت کنندگان هم با ارزیابی خود از سطح عاطفه (ظرفیت ، تحریک ، کنترل ، آشنایی ، پسندیدن و احساسات اساسی) که در طول فیلم ها احساس شده اند و هم ارزیابی بیرونی از سطح ظرفیت و تحریک ، حاشیه سازی شده اند.
رویکرد مبتنی بر احساس و معناشناسی برای تشخیص احساس در مکالمات متنیArxiv 20181. مجموعه ای شامل بیش از 30K توییت سه نوبت حاوی چهار احساس شاد ، غمگین ، عصبانی و دیگران را معرفی کنید. 
2. چهار نوع مدل شبکه عصبی کانولوشن مبتنی بر توالی را با توجه به استفاده از اطلاعات توالی محصور شده در گفتگو پیشنهاد می کند.
تشخیص احساسات در رونوشت های نمایش تلویزیونی با شبکه های عصبی کانولوشن مبتنی بر توالیکارگاه آموزشی AAAI 20181. یک مجموعه جدید ارائه دهید که حاوی حاشیه نویسی از هفت احساس در مورد اظهارات متوالی در گفتگوهای استخراج شده از نمایش است ، دوستان.
EmotionLines: مجموعه ای از احساسات از مکالمات چند جانبهLREC 2018در مجموع 29245 جمله از 2000 گفتگو در EmotionLines برچسب گذاری شده اند ، هر عبارت در یکی از 7 احساس برچسب گذاری شده است: شش احساس Ekman + خنثی.
MELD: یک مجموعه داده چند طرفه چند حالته برای تشخیص احساس در مکالماتArxiv 20181. نسخه به روز شده از EmotionLines. 2. هر سخنی در MELD با احساسات و برچسب احساسات همراه است. گفته ها در MELD شامل چند حالت شامل موارد صوتی و تصویری همراه با متن است.

Leave a Reply

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *