تشخیص احساسات از طریق ویدیو، تصویر، صوت و متن

اگر مشاغل و کسب و کار ها با استفاده از فناوری های نوین بتوانند احساسات مشتری را درک کنند، می توانند از آن استفاده کنند تا در لحظه مناسب کالای خود را به مصرف کننده بفروشند. حقیقت این است که چنین فناوری ای خیلی دور از واقعیت نیست. هوش احساسی ماشین یک حوزه رو به رشد است که نه تنها در تبلیغات، بلکه در استارت آپ های جدید، امنیت، مراقبت های بهداشتی، گجت های پوشیدنی ، آموزش، دستیار و موارد دیگر می تواند تاثیرات زیادی به همراه داشته باشد.

نرم افزار های مختلفی برای تشخیص حالات احساسی در انسانها وجود دارند. این اپلیکیشن های الگوریتم محور از تفکیک چهره و عکس ها، فیلم ها، متن و گفتار و تشخیص چهره و تجزیه و تحلیل معنایی برای شناسایی حالات احساسی استفاده می کنند. در این گزارش  بیش از ۲۰ نرم افزار شناسایی احساسات را بررسی می کنیم که می توانند در پروژه ها برای تفسیر حالات واقعی افراد استفاده شوند.

اپلیکیشن های تشخیص احساس چگونه کار می کنند؟

تجزیه و تحلیل احساس ترکیبی جالب از روانشناسی و فناوری است. اگرچه مسلما به طور ۱۰۰% دقیق نیست ، اما بسیاری از ابزارهای تشخیص چهره، احساسات انسان را به ۷ دسته اصلی تقسیم می کنند: شادی، غم، عصبانیت، ترس، تعجب، تحقیر و انزجار. با تشخیص احساسات صورت، الگوریتم ها چهره های درون یک عکس یا فیلم را تشخیص می دهند و با تجزیه و تحلیل رابطه بین نقاط صورت، بر اساس پایگاه داده های گردآوری شده ، احساسات را در سطح میکرو حس می کنند.

برای تشخیص احساسات در کلمات نوشتاری، نرم افزار پردازش تجزیه و تحلیل احساسات می تواند متن را تجزیه و تحلیل کند تا نتیجه گیری کند که بر اساس کلمات کلیدی و شاخص آنها یک عبارت به طور کلی مثبت یا منفی است. سرانجام، الگوریتم های صوتی تولید شده اند که گفتار ضبط شده را از نظر لحن و محتوای کلمه تجزیه و تحلیل می کنند.

موارد استفاده از نرم افزار های تشخیص احساسات

یک مورد استفاده واضح در آزمایش های گروهی است. پاسخ کاربران به بازی های ویدئویی، تبلیغات تجاری یا محصولات همگی می توانند در مقیاس بزرگتر، با جمع آوری اطلاعات زیاد به صورت خودکار و در نتیجه کارآمدتر، آزمایش شوند. بنتلی ( Bentley ) در یک کمپین بازاریابی از تشخیص حالت چهره استفاده کرد تا انواع مدل های خودرو را براساس پاسخ های احساسی به محرک های خاص به مشتریان پیشنهاد دهد. همچنین فناوری ای که احساسات شما را آشکار می کند ، برای ردیابی دانش آموزان درگیر در محیط کلاس یا کمک به بیماران اوتیستیک در تعامل بهتر با دیگران پیشنهاد شده است. برخی موارد استفاده عبارتند از:

  • کمک به اندازه گیری بهتر رتبه بندی برنامه های تلویزیونی.
  • افزودن یک لایه امنیتی دیگر به امنیت در مراکز خرید، فرودگاه ها، میادین ورزشی و سایر اماکن عمومی برای تشخیص قصد سو استفاده.
  • تجهیزات قابل پوشیدن که به بیماران اوتیستیک کمک می کنند احساسات را تشخیص دهند
  • پیشخوان ها، بررسی خریدهای مجازی

تشخیص حالت از طریق API های تشخیص احساس

این اپلیکیشن های بینایی رایانه ای از تشخیص چهره، ردیابی چشم و نشانه های خاص وضعیت چهره برای تعیین خلق و خوی سوژه مورد نظر استفاده می کنند. نرم افزار های زیادی وجود دارند که یک تصویر یا فیلم را اسکن می کنند تا چهره ها را تشخیص دهند، اما این نرم افزار هایی که معرفی خواهند شد تلاش بیشتری می کنند تا حالت احساسی را درست تر تشخیص دهند. این کار اغلب ترکیبی از وزن دهی به ۷ احساس اساسی اختصاص داده می شود.

۱نرم افزار Emotient

Emotient برای یک کمپین تبلیغاتی که می خواهد توجه، تعامل و احساسات بینندگان را ردیابی کند نرم افزاری عالی است. نرم افزار تحت وب Emotient می تواند در برنامه ها ادغام شود یا برای کمک به تست های AB استفاده شود. علاوه بر نرم افزار، یک پنل تجزیه و تحلیل نیز وجود دارد .

۲نرم افزار Affectiva

با بررسی ۳،۲۸۹،۲۷۴ چهره تا به امروز ، Affectiva راه حل دیگری برای تشخیص احساسات  در مقیاس گسترده ارائه کرده است. آن ها SDK و API هایی را برای توسعه دهندگان موبایل ارائه می دهند و تجزیه و تحلیل بصری خوبی برای پیگیری عبارات با گذشت زمان ارائه می دهند.

۳نرم افزار EmoVu

محصولات EmoVu که توسط Eyeris تولید می شوند، شامل الگوریتم های یادگیری ماشین و تشخیص میکرو احساسات است که به آژانس های تبلیغاتی اجازه می دهد “میزان درگیری احساسی و اثربخشی محتوای آن ها را بر روی مخاطب مورد نظر خود دقیق اندازه گیری کند. ” EmoVu با داشتن SDK دسک تاپ ، SDK موبایل و API برای کنترل دقیق، پشتیبانی از پلتفرم های گسترده ای را شامل می شود، از جمله بسیاری از ویژگی های ردیابی، مانند موقعیت سر، شیب  ردیابی چشم، باز / بسته شدن چشم و غیره. آن ها یک نسخه آزمایشی رایگان با ایجاد حساب ارائه می دهند.

۴نرم افزار Nviso

Nviso مستقر در سوئیس در حوزه ی تجزیه و تحلیل فیلم های احساسی، با استفاده از فناوری تصویربرداری سه بعدی صورت برای کنترل بسیاری از نقاط مختلف داده صورت برای ایجاد احتمالات برای ۷ احساس اصلی، متخصص دارد. آن ها در سال ۲۰۱۳ توسط IBM برای ارائه محاسبات هوشمندانه مورد تقدیر قرار گرفتند. ممکن است Nviso با ویژگی بین المللی شرکتی خود، گزینه ای برای توسعه دهنده هایی نباشد که به دنبال توانایی سریع پلاگین در بازی ها با پشتیبانی فوری است.

۵نرم افزار Kairos

نرم افزار تجزیه و تحلیل احساسات ارائه شده توسط Kairos یک استارت آپ در حوزه ی تشخیص چهره است. این نرم افزار مقیاس پذیر و تقاضا محور می باشد. شما برای آن ها ویدیو ارسال می کنید، و آن ها مختصاتی از چهره را که لبخند، تعجب، عصبانیت، دوست نداشتن و خواب آلودگی را تشخیص می دهند به شما باز می گردانند. آن ها نسخه آزمایشی رایگان را ارائه می دهند که پاسخ صورت شما را به چند تبلیغ تجاری تجزیه و تحلیل می کند و آن را در قالب نمودار ارائه می کند.

۶نرم افزار Project Oxford مایکروسافت

Project Oxford مایکروسافت، فهرستی از اپلیکیشن های هوش مصنوعی است که بر روی دید رایانه، گفتار و تجزیه و تحلیل زبان متمرکز شده است. سالهای گذشته پس از شهرت  ابزار تشخیص سن پروژه به دلیل “ناسازگاری”، برخی ممکن است تمایلی به امتحان کردن قابلیت های تشخیص احساس مایکروسافت نداشته باشند.

این API فقط با عکس کار می کند. چهره ها را تشخیص می دهد و در JSON با درصد های مضحک خاص برای هر چهره با استفاده از ۷ احساس اصلی و خنثی پاسخ می دهد. اگر اعداد اعشاری را گرد کنید این نرم افزار یک ابزار بسیار ساده و تا حد زیادی بسیار مفید با توجه به شرایط مناسب خواهد بود.

۷نرم افزار Face Reader توسط Noldus

اپلیکیشن Face Reader توسط Noldus که در حوزه دانشگاهی استفاده می شود، مبتنی بر یادگیری ماشین است و با استفاده از آن می توانید پایگاه داده ای از ۱۰،۰۰۰ تصویر ازحالات چهره را استفاده کنید. این اپلیکیشن از ۵۰۰ نقطه اصلی صورت برای تجزیه و تحلیل ۶ حالت اساسی صورت و همچنین حالت خنثی و تحقیر استفاده می کند. Face Reader همچنین جهت نگاه و جهت گیری سر را تشخیص می دهد.

۸نرم افزار Sightcorp

Sightcorp یکی دیگر از ارائه دهندگان فناوری تشخیص چهره است. آنها از پلتفرم گسترده ای پشتیبانی می کند و صدها نقطه از چهره و حالت خیره شدن چشم را ردیابی می کند و در پروژه های خلاقانه، ویترین های موزه و TEDX آمستردام مورد استفاده قرار گرفته است. API آن ها به نام F.A.C.E (که هنوز در مرحله بتا است) یک موتور تجزیه و تحلیل ابری برای تشخیص خودکار احساسات دارد.

۹نرم افزار SkyBiometry

SkyBiometry ابزاری مبتنی بر ابر و تشخیص چهره است که به شما امکان می دهد احساسات را در عکس ها تشخیص دهید. فایلی را بارگذاری کنید و با این کار چهره ها را تشخیص می دهد و حال و هوای بین شاد، غمگین، عصبانی، متعجب، انزجار، ترس و حالت خنثی را با نرخ درصدی برای هر نقطه حس می کند. این نرم افزار به طور دقیق مشخص می کند که شخص لبخند می زند یا نه. یک مزیت Skybiometry این است که این یک شرکت بیومتریک موفق است – بنابراین تیم این شرکت مدت زیادی در این زمینه فعال بوده است.

۱۰نرم افزار Face++

نرم افزار Face++ یک ابزار تشخیص چهره هست که چهره ها را با چهره های ذخیره شده در حافظه ی نرم افزار مقایسه می کند و مناسب برای برچسب گذاری عکس در شبکه های اجتماعی است. این نرم افزار در لیست ما قرار گرفته زیرا تعیین می کند که آیا سوژه مورد نظر در حال خندیدن  است یا خیر.

۱۱نرم افزار Imotions

Imotions یک پلتفرم تحقیقاتی در زمینه بیومتریک است که نرم افزار و سخت افزاری را برای نظارت بر انواع مختلف نشانه های بدنی فراهم می کند. احساسات با فناوری بیان حالات چهره Emotient همگام سازی می شوند و لایه های اضافی را برای تشخیص احساساتی چون گیجی و ناامیدی اضافه می کنند. اپلیکیشن Imotions می تواند برای تجزیه و تحلیل ویدئو های زنده یا فیلم های قبلاً ضبط شده به کار گرفته شود. نرم افزار Imotion توسط هاروارد ، پروکتر و گمبل ، ییل ، نیروی هوایی ایالات متحده استفاده شده است و حتی در یک قسمت از سریال  Mythbusters نیز مورد استفاده قرار گرفت.

۱۲نرم افزار CrowdEmotion

CrowdEmotion نرم افزاری را ارائه می دهد که با استفاده از تشخیص چهره می تواند سری زمانی شش احساس عام جهانی را که توسط روانشناس پاول اکمن تعریف شده است شناسایی کند (خوشحالی ، تعجب ، عصبانیت ، انزجار ، ترس و اندوه). آن ها یک sandbox API همراه با استفاده ماهانه رایگان برای آزمایش زنده ارائه می دهند.

۱۳نرم افزار FacioMetrics

FacioMetrics در دانشگاه کارنگی ملون (CMU) تأسیس شد ، شرکتی است که SDK را برای ترکیب ردیابی صورت، ردیابی ژست و نگاه و تجزیه و تحلیل بیان در برنامه ها فراهم می کند. ویدیوی آزمایشی آن ها برخی موارد استفاده خلاقانه را در سناریوهای واقعیت مجازی بیان می کند. این نرم افزار با استفاده از برنامه Intraface iOS قابل آزمایش است.

نرم افزار Findface

نرم افزار Findface با استفاده از الگوریتم تشخیص چهره NtechLab 7 احساسات اساسی و همچنین ۵۰ ویژگی احساسی پیچیده را تشخیص می دهد. این نرم افزار گویا دارای درجه ای از دقت بالااست که ۷ احساس را تشخیص می دهد: شادی، تعجب، غم، عصبانیت، انزجار، تحقیر و ترس.

نرم افزار های تشخیص احساسات از متن

بسیاری از API های تجزیه و تحلیل احساسات وجود دارد که طبقه بندی یا استخراج موجودیت را ارائه می دهند ، اما API های ذکر شده در زیر به طور خاص با یک متن خلاصه احساسی با توجه به متن ساده پاسخ می دهند. یکی از کلمات کلیدی به کار گرفته شده در اینجا پردازش زبان طبیعی است- استفاده از ماشین آلات برای تشخیص تعامل “طبیعی” انسان، و تحلیل عمیق زبانی – بررسی ساختار جمله و روابط بین کلمات کلیدی برای ایجاد احساسات. می توانید از این API ها برای انجام مواردی مانند اطلاع رسانی تجزیه و تحلیل تعامل در شبکه های اجتماعی ، افزودن ویژگی های جدید به پیام گپ ، انجام تحقیقات هدفمند در اخبار، شناسایی تجارب بسیار مثبت / منفی مشتری یا انتشار بهینه با آزمایش AB استفاده کنید.

۱۴نرم افزار IBM Watson

با استفاده از ابر رایانه IBM Watson ، سامانه ی The Tone Analyzer لحن های عاطفی ، تمایلات اجتماعی و سبک های نوشتاری را از هر متن ساده با هر اندازه ای تشخیص می دهد..  توسعه دهنده ی ابری IBM Watson  همچنین به سایر ابزارهای محاسبات شناختی جالب توجه قدرت می بخشد.

۱۵نرم افزار Receptiviti

با پشتیبانی دهه ها تحقیق در زمینه روانشناسی زبان، نرم افزار تجزیه و تحلیل شخصیت طبیعی زبان Receptiviti از فرایند کلمات هدف و دسته های احساسات مختلف برای استخراج احساسات و شخصیت فرد از متن استفاده می کند. فرایند تجزیه و تحلیل متن زبان و تعداد کلمات ( LIWC ) آن ها حتی توسط IBM Watson استفاده می شود. با استفاده از REST API و SDK در همه زبان های اصلی برنامه نویسی، نرم افزار Receptiviti قدرتمند و قابل استفاده به نظر می رسد.

۱۶نرم افزار AlchemyAPI

نرم افزار Alchemy API تعداد زیادی متن را اسکن می کند تا ارتباط کلمات کلیدی و معنای مثبت / منفی مرتبط با آن ها را برای دریافت احساس نگرش یا نظر فرد مورد نظر تعیین کند. برای دریافت درجه احساس کلی مثبت، ترکیبی از احساس مثبت یا منفی می توانید یک URL وارد کنید. اگرچه این نرم افزار بیشتر برای تعریف طبقه بندی ها و ارتباط کلمات کلیدی است، اما این نرم افزار همچنین ابزار ارزیابی کلی احساسات برای سند سازی نیز می باشد.

۱۷نرم افزار Bitext

اپلیکیشن تحلیل متن Bitext یکی دیگر از ابزارهای تجزیه و تحلیل زبان شناختی عمیق است. می توان از آن برای تحلیل روابط، جملات، ساختار و وابستگی های کلمات برای استخراج حس تعصب با عملکرد “امتیازدهی داخلی” استفاده کرد.

۱۸نرم افزار Mood Patrol

Mood Patrol که توسط کمپانی Soul Hackers Labs در API Mashape ارائه شده است یک اپلیکیشن ساده است که احساسات را از متن استخراج می کند. این نرم افزار برای تجزیه و تحلیل بخشهای کوچک متن برای یافتن نشانه ها، و پاسخ دادن با صفت ها که لحن احساسی را بر اساس ۸ احساس اصلی Plutchik توصیف می کنند ، مناسب است

۱۹نرم افزار Synesketch

نرم افزار Synesketch اساساً پخش کننده آثار هنری iTunes در قالب کلمات نوشتاری است. این نرم افزار یک ابزار متن باز ابتکاری است که متن را در قالب احساسات تجزیه و تحلیل می کند و لحن احساسی را به برخی تجسم های عالی تبدیل می کند. اگر بخواهیم درباره هوش هیجانی صحبت کنیم- “کد [Synesketch] کلمات را احساس می کند” ، متن را در قالب الگوهای تصویری متحرک نمایش می دهد تا احساسات اساسی را نشان دهد. چند برنامه شخص ثالث قبلاً با این نرم افزار متن باز ساخته شده است تا احساسات را از توییت ها، گفتار، شعر و موارد دیگر شناسایی و تجسم کند.

۲۰نرم افزار Tone API

Tone API یک نرم افزار با سرعت بالاست که برای بازاریابان ساخته شده است تا پاسخ احساسی به محتوای آن ها توسط مشتریان را اندازه گیری کند. این ابزار بدنه ی متن را در نظر گرفته و از نظر گستردگی، شدت و مقایسه احساسی با سایر متون آن را تحلیل می کند. به نظر می رسد این نرم افزار یک سرویس جالب برای خودکار کردن تحقیقات داخلی برای بهینه سازی انتشار محتوای هوشمند است.

۲۱نرم افزار Repustate API

نرم افزار Repustate تجزیه و تحلیل احساسات مبتنی بر نظریه زبانشناسی است و نشانه هایی را از  قطبیت، نفی ها، بخشی از گفتار و موارد دیگر برای دستیابی به احساسات آگاهانه از یک سند متنی بررسی می کند.

نرم افزار های تبدیل گفتار به احساسات

در نهایت انسان همچنین از طریق گفتار با ماشین تعامل دارد. تعداد زیادی نرم افزار  تشخیص گفتار در بازار وجود دارد که نتایج آن ها توسط سایر نرم افزار های تجزیه و تحلیل احساسات ذکر شده در بالا قابل پردازش است. شاید به همین دلیل است که یک نرم افزار تحت وب با استفاده ی آسان که بلافاصله احساسات را از صدای ضبط شده تشخیص می دهد چیز نادری است. موارد استفاده برای این فناوری می تواند شامل :

  • نظارت بر مراکز خدمات پشتیبانی مشتری
  • فراهم آوردن گروه های تجزیه و تحلیل هوش هیجانی خودکار

۲۲نرم افزار Good Vibrations

نرم افزار Good Vibrations حال و هوای ناشی از صدای ضبط شده را حس می کند. این API و SDK آن از سیگنال های بیولوژیکی جهانی برای انجام تجزیه و تحلیل در لحظه از احساسات کاربر برای شناسایی احساس استرس ، لذت یا بی نظمی استفاده می کنند. این API تحت وب نیست، اما EMOSpeech یک نرم افزار سازمانی است که به مراکز تماس اجازه می دهد احساسات را تجزیه و تحلیل کنند ، و نرم افزار Audeering احساسات ، لحن و جنسیت را در صدای ضبط شده تشخیص می دهد.

۲۳نرم افزار Vokaturi

ظاهراً نرم افزار Vokaturi می تواند “احساس موجود در صدای گوینده را به همان روشی که انسان می تواند، درک کند.” با استفاده از Open Vokaturi SDK ، توسعه دهندگان می توانند Vokaturi را در برنامه های خود ادغام کنند. با توجه به دارا بودن از یک پایگاه داده ضبط گفتار، نرم افزار Vokaturi درصد احتمالات را برای ۵ حالت احساسی محاسبه می کند: بی طرفی، خوشبختی، غم، عصبانیت و ترس.

نتیجه گیری : آینده ی حوزه ی تشخیص احساسات

هوش احساسی ماشین هنوز در حال تکامل است ، اما آینده به زودی می تواند تبلیغات هدفمندی را ببیند که نه تنها به اطلاعات جمعیتی ما (سن ، جنسیت ، علاقه مندی ها و غیره) بلکه به وضعیت احساسی ما پاسخ دهند. برای تبلیغات در حوزه ی فروش، این اطلاعات می تواند در مواقعی که افراد از لحاظ عاطفی آسیب پذیرتر هستند استفاده شود. اگر کاربر جهت ضبط بصری احساس خود رضایت نداشته باشد، تشخیص احساسات از طریق تشخیص چهره نیز به امری مبهم تبدیل می شود مطمئناً قانون حریم خصوصی داده ها وجود دارد که هر ارائه دهنده اپلیکیشن یا مصرف کننده باید قبل از اجرا از آن ها آگاه باشد. وقتی صحبت از تعامل انسان ماشین است ما فقط در نوک کوه یخ هستیم. اما فناوری های محاسبات شناختی مانند این ها گام های مهیجی در جهت ایجاد هوش هیجانی واقعی ماشین محسوب می شود.

شناسایی احساسات چهره با استفاده از یادگیری عمیق

شرکت ها در حال حاضر ، برای داشتن برآوردی از انگیزه مشتریان در برخورد با برند تجاری و یا محصولاتشان از تجزیه و تحلیل احساسات آن ها استفاده می کنند . شرکت ها با کند و کاو در توییت ها ، مصابحه ها و دیگر منابع به آسانی قادر خواهند بود تا احساسات مشتریان را از زبان طبیعی استخراج کنند . اما زمانی که کاربران آنلاین و در دسترس نیستند چه کار باید کرد؟

فروشندگان و نمایندگان مشتریان در مغازه ها می توانند ابراز احساسات مشتری را هنگامی که عصبانی و یا نا امید است مشاهده کنند ، اما به طور همزمان قادر نیستند تا در همه جا حضور داشته باشند . با این حال ، سال هاست که شرکت ها برای زیر نظر داشتن رفتار  مشتریان از دوربین داخل مغازه ها استفاده می کنند .

به نظر می رسد شرکت ها به سبک اوروِلی ( Orwellian ) از این داده ها برای شناسایی موارد مهم در مغازه ها استفاده می کنند و بدون توجه به حریم شخصی ، راه مشتریان را دنبال و حتی به نگاه خاص آن ها ، توجه می کنند . بنابراین چرا احساسات را از دید خریداران نیز دنبال نکنیم؟

مسئله اصلی این است که ترجمه حرکات ۴۳ ماهیچه صورت به احساسات دشوار است . برای انسان ها آسان است زیرا ما سال ها تمرین داشته ایم ، اما رایانه ها ، جهان را به عنوان شبکه ای از اعداد که نشان دهنده مقادیر پیکسل است ، می بینند . ما قادر هستیم تا با نگاه به تصویر چهره شخصی به آسانی تفاوت بین لبخند و اخم را تشخیص دهیم ، اما این عمل برای یک مدل یادگیری ماشین بسیار مشکل خواهد بود .

برای حل این مشکل ، یک شبکه عصبی عمیق کانولوشنی که در چارچوب یادگیری ماشین Keras اجرا شده است را بررسی می کنیم . 

شبکه عصبی کانولوشنی ( CNN ) چیست؟

https://skymind.ai/wiki/convolutional-network
شناسایی احساسات چهره با استفاده از یادگیری عمیق

شرکت ها در حال حاضر ، برای داشتن برآوردی از انگیزه مشتریان در برخورد با برند تجاری و یا محصولاتشان از تجزیه و تحلیل احساسات آن ها استفاده می کنند . شرکت ها با کند و کاو در توییت ها ، مصابحه ها و دیگر منابع به آسانی قادر خواهند بود تا احساسات مشتریان را از زبان طبیعی استخراج کنند . اما زمانی که کاربران آنلاین و در دسترس نیستند چه کار باید کرد؟

فروشندگان و نمایندگان مشتریان در مغازه ها می توانند ابراز احساسات مشتری را هنگامی که عصبانی و یا نا امید است مشاهده کنند ، اما به طور همزمان قادر نیستند تا در همه جا حضور داشته باشند . با این حال ، سال هاست که شرکت ها برای زیر نظر داشتن رفتار  مشتریان از دوربین داخل مغازه ها استفاده می کنند .

به نظر می رسد شرکت ها به سبک اوروِلی ( Orwellian ) از این داده ها برای شناسایی موارد مهم در مغازه ها استفاده می کنند و بدون توجه به حریم شخصی ، راه مشتریان را دنبال و حتی به نگاه خاص آن ها ، توجه می کنند . بنابراین چرا احساسات را از دید خریداران نیز دنبال نکنیم؟

مسئله اصلی این است که ترجمه حرکات ۴۳ ماهیچه صورت به احساسات دشوار است . برای انسان ها آسان است زیرا ما سال ها تمرین داشته ایم ، اما رایانه ها ، جهان را به عنوان شبکه ای از اعداد که نشان دهنده مقادیر پیکسل است ، می بینند . ما قادر هستیم تا با نگاه به تصویر چهره شخصی به آسانی تفاوت بین لبخند و اخم را تشخیص دهیم ، اما این عمل برای یک مدل یادگیری ماشین بسیار مشکل خواهد بود .

برای حل این مشکل ، ما می خواهیم از یک شبکه عصبی عمیق کانولوشنی که در چارچوب یادگیری ماشین Keras اجرا شده است ، استفاده کنیم . 

شبکه عصبی کانولوشنی ( CNN ) چیست؟
شبکه های عصبی کانولوشنی
https://skymind.ai/wiki/convolutional-network

یک شبکه عصبی کانولوشنی ویژگی هایی از داده های دو بعدی را استخراج و به آن ها وزن اختصاص داده و در نهایت منجر به پیش بینی می شود . برای مثال ، اگر بخواهیم CNN را برای تشخیص اعداد دست نویس آموزش دهیم ، باید مجموعه داده ای از تصاویر ۱۰۰×۱۰۰  پیکسل این اعداد داشته باشیم .

CNN خطوط منحنی و مستقیمی در بخش های ۱۰×۱۰  پیکسلی را شناسایی می کند ، و بعد از تشخیص این ویژگی ها ، این مدل یاد می گیرد که ترکیبی از منحنی ها و خطوط مشخص نشانگر اعداد خاصی است . یک عدد منحنی به خصوص مانند ۸ از اعداد مستقیمی نظیر ۱ یا ۷ قابل تشخیص است . در مورد تشخیص احساسات چهره ، منحنی به طرف بالا که نشان دهنده ی لبخند است، می تواند با خوشحالی مرتبط باشد .

چرا یادگیری عمیق؟

در حال حاضر ، محققان از فاصله بین علائم صورت برای تشخیص احساسات استفاده می کنند . تصویر یک چهره نمایان گر موقعیت های اعضای صورت از قبیل دماغ ، چشم ها ، دهان ، گونه ، و دیگر فضا ها بوده و بنابراین فواصل میان این نقاط حساب شده ، و سپس آستانه هایی برای تشخیص احساسات ایجاد شده است . اگر چهره داخل تصویر در حال لبخند زدن باشد ، موقعیت گونه ها به چشم ها نزدیک تر ، دهان کشیده تر و چشم ها پیچ خورده تر می باشند .

این رویکرد در تنظیمات کنترل شده کارایی دارد ، اما اگر فقط بتوانیم نصف چهره را در عکس ببینیم چه ؟ اگر چهره کمی چرخیده باشد چه ؟ برای به دست آوردن نقاط دقیق چهره ، شما باید تصویر را به صورت مصنوعی جابجا کرده تا چهره در مرکز قرار گیرد و مستقیم به دوربین نگاه کند . با رویکر یادگیری عمیق ، مدل می تواند انعطاف پذیر باشد و ویژگی های صورت را شناسایی کنید بدون این که جهت دار بودن صورت برایتان مهم باشد . تمام آنچه نیاز دارید داده ها هستند .

آیا هوش مصنوعی می تواند احساسات شما را از روی نحوه راه رفتن شما تشخیص دهد؟

سیستم های هوش مصنوعی برای طیف گسترده ای از وظایف از سیستم های تشخیص هویت گرفته تا فعالیت های خودمختار، از تشخیص الگو ها و تشخیص ناهنجاری گرفته تا تحلیل های پیش بینی کننده و سیستم های مکالمه و بسیاری از جنبه های دیگر استفاده می شوند.

یکی از زمینه هایی که هوش مصنوعی توانایی خاص خود را نشان داده است در حوزه تشخیص می باشد، از تشخیص تصویر گرفته تا گفتار و سایر جنبه های تشخیص الگوهای رفتاری. بسیاری از محققان هوش مصنوعی را در مورد جنبه های تشخیص چهره و تحلیل احساسات مبتنی بر متن به کار برده اند، اما یکی از آن ها قدرت یادگیری ماشین را برای استفاده از فرآیند تشخیص در سطح جدیدی به کار گرفته است. آیا می توان وضعیت عاطفی یک انسان را به سادگی از نوع راه رفتنش تعیین کرد؟

Aniket Bera استادیار و پژوهشگر در موسسه مطالعات کامپیوتر پیشرفته دانشگاه مریلند ( UMIACS ) و گروه علوم کامپیوتر است و تحقیقاتش را به عنوان بخشی از گروه الگوریتم های هندسی برای مدل سازی ، حرکت و انیمیشن ( GAMMA ) دنبال می کند. GAMMA ، در دانشگاه مریلند در کالج پارک ، بر روی بسیاری از مسائل تحقیقاتی مختلف ، از جمله یادگیری رفتار چند حالته با استفاده از هوش مصنوعی ، تحقیق در مورد ناوبری ربات ها و وسایل نقلیه خودران و شبیه سازی مبتنی بر فیزیک کار می کند.

تحقیقات فعلی وی متمرکز بر ادراک اجتماعی عوامل هوشمند است. تحقیقات او شامل ترکیبی جدید از روش ها و همکاری ها در زمینه گرافیک رایانه، شبیه سازی مبتنی بر فیزیک، تجزیه و تحلیل آماری و یادگیری ماشین برای تهیه مدل های محاسباتی در زمان معین برای طبقه بندی چنین رفتارهایی و اعتبار سنجی عملکرد آن ها است.

ربات دارای هوش اجتماعی

ربات های دارای هوش اجتماعی

یکی از جالب توجه ترین جنبه های تحقیق روز دنیا ” ربات های دارای هوش اجتماعی ” هستند. پروفسور برا پیش بینی می کند که انسان ها به زودی به استفاده از ربات های اتوماتیک در اماکن عمومی مانند خانه ها، دفاتر، پیاده روها و ساختمان های خود نزدیک خواهند شد. این ربات ها وظیفه انجام طیف گسترده ای از کارها از جمله برنامه های نظارت، تحویل و انبارداری را بر عهده دارند.

در حقیقت، چالش مداوم بیماری همه گیر کنونی یعنی ویروس کووید ۱۹ ،انگیزه در بیمارستان ها و مراکز مراقبت های بهداشتی را برای افزایش تعداد سیستم های رباتیک اتوماتیک در راستای افزایش اقدامات مربوط به مراقبت های بهداشتی را افزایش داده است.

به همین ترتیب، پروفسور آنیکت برا معتقد است که در شرایط این چنینی که برقراری ارتباط نزدیک خطرناک محسوب می شود، بسیار مهم است که این ربات ها به شکلی اجتماعی و بصری همکاری مشترک داشته باشند.  این ربات ها باید احساسات انسانی، تمایلات، مقاصد، مرزهای اجتماعی و انتظارات را درک کنند. در حالی که بسیاری از برنامه های کاربردی رباتیک در حال حاضر بیشتر در انجام وظایفی که متمرکز بر کارآیی یا زمان هستند درگیر می باشند، ربات هایی که دارای هوش اجتماعی یک مؤلفه دیگر از تعامل عاطفی و اجتماعی انسان را در این حوزه اضافه می کنند. افزودن این جنبه به انسان کمک می کند تا در تعامل های رباتیک خود که از نزدیک با آن ها برقرار می کند احساس امنیت، راحتی و دوستانه تری داشته باشد.

یکی از جالب ترین کاربردهای تحقیق در زمینه ربات های دارای هوش اجتماعی، توانایی آن ها در خواندن زبان بدن است. تحقیق در مورد تعیین احساسات از چهره ، امری نسبتاً اثبات شده است. با این وجود موارد بسیاری وجود دارد که حالت چهره می تواند در آن موارد غیرقابل اطمینان باشد، مانند موقعیت هایی که داده های مربوط به صورت فقط تا حدی در دسترس است یا نشانه ها و علائم صورت برای به دست آوردن آن ها چالش برانگیز است..

به عنوان مثال، ممکن است یک شخص به طور مستقیم با ربات روبرو نشود یا شاید فاصله اش از ربات دور باشد. علاوه بر این، تحقیقات روانشناسی اجتماعی نشان می دهد که افراد می توانند حالات چهره خود را تغییر دهند، علامت هایی مبنی بر عواطف کاذب نشان دهند و این که مردم همیشه به صورت خودجوش حالت چهره ای بخصوص از خود بروز نمی دهند. علاوه بر این، مشخص نیست که چه مقدار حالات چهره فرد با رفتار واقعی او گره خورده است.

تشخیص حالات افراد از روی نحوه راه رفتن آن ها

برای پرداختن به این مسائل و همچنین پرداختن به سیستم های توانایی درک وضعیت عاطفی از راه دور، تحقیقات انجام شده توسط آزمایشگاه GAMMA به دنبال سیستم های هوش مصنوعی است که می توانند احساسات را بر اساس راه رفتن فرد تشخیص دهند.

آزمایشگاه حالت چهره فرد را با حرکت بدن وی به عنوان راهی برای بهبود پیش بینی حالات عاطفی انسان ترکیب می کند. به گفته محققان، بر اساس دستاورد های این پژوهش، شیوه راه رفتن چیزی نیست که به راحتی قابل دستکاری باشد. شناسایی افراد بر اساس راه رفتن آن ها با استفاده از سیستم های هوش مصنوعی قبلاً به طور گسترده ای منتشر شده و از صحت لازم برخوردار است.

به این ترتیب، تشخیص راه رفتن و شناسایی مسیرهای پیاده روی همراه با حالت های صورت در معابر، می تواند نحوه ی پیاده روی و وضعیت عاطفی آن ها را پیش بینی کند. پروفسور برا همچنین متذکر می شود که تحقیقات مبتنی بر راه رفتن از بسیاری از مسائل مربوط به حریم خصوصی که سیستم های تشخیص چهره در معرض آن قرار می گیرند، جلوگیری می کند. الگوریتم آزمایشگاه، نحوه گام برداشتن را استخراج می کند و کلیه ویژگی های قابل شناسایی را از بین می برد زیرا همه داده های سطح پیکسل حذف می شوند و فقط موقعیت های مفاصل ذخیره می شوند.

پروفسور برا و محققان و همکارانش ربات ProxEmo را برای نشان دادن چگونگی عملکرد چنین ربات هایی در تشخیص حالت افراد با راه رفتنشان ساخته اند. محققان بر این باورند که سیستم های هوشمند اجتماعی می توانند در بسیاری از کاربرد های مختلف از جمله توسعه تکنیک های خودکار برای درک احساسات انسانی در درمان ، توانبخشی ، تشخیص و نظارت بر ناهنجاری ، درک مخاطبان ، تولید شخصیت برای انیمیشن و فیلم و سایر برنامه ها استفاده شوند.

پروفسور برا همچنین تعدادی دیگر از کاربردهای عملی ربات های دارای هوش اجتماعی را به اشتراک گذاشته است. اگر یک ربات بتواند از حرکات بدنی و راه رفتن های عابران پیاده با استفاده از احساساتشان به عنوان فعالیت های پیش بینی کننده یاد بگیرد، می توانیم برنامه های مؤثرتری را برای تخلیه جمعیت طراحی کنیم تا به مردم کمک کند تا با کارآیی و ایمنی بیشتری از موقعیت های خطرناک فرار کنند. در مثال دیگر، ربات ها می توانند پیش بینی کنند که آیا کسی در هنگام راه رفتن روی یک پل در وضعیت روانی پریشانی است یا نه. یا این که به طور کلی سیگنال های مربوط به سلامت روان فرد را ارزیابی کند.

ربات ها می توانند پیش بینی کنند که آیا یک عابر پیاده هنگام عبور از خیابان امکان دارد که با خودرو ها برخورد کند و خود و رانندگان را در معرض خطر قرار دهد یا نه. ربات ها همچنین می توانند اقدامات جنایتکارانه یا موقعیت های تهدید آمیز مانند سرقت، آدم ربایی، دزدی و یا حمله را شناسایی کنند. با توجه به بیماری همه گیر جهانی کورونا ، ربات های دارای هوش اجتماعی می توانند نیازهای انسانی را بهتر درک کنند و حرکات شبیه سرفه یا حالاتی از بدن را که نشان دهنده درد ناشی از ویروس است را تشخیص دهند و یا فاصله گذاری اجتماعی را در اماکن عمومی اجرا کنند.

چالش های ربات های اجتماعی

در حالی که ما مدت هاست که در می خواهیم در زندگی روزمره خود از ربات ها استفاده کنیم، به طوری که داستان های علمی و فیلم ها نشانه ای از این واقعیت می باشند، واقعیت این است که صنعت رباتیک مدت هاست که تلاش می کند ربات های اجتماعی را به واقعیت تبدیل کند. شرکت های رباتیک مانند Anki ، Jibo و Rethink Robotics پس از ناکامی در ادامه راه خود، در های شرکت خود را بستند. با این حال، استاد برا برای این مسئله پاسخی دارد. وی می گوید برخی محققان صنعت رباتیک می گویند که شرکت های رباتیک به دلیل عدم استفاده واقعی از ” ربات های اجتماعی ” یا عدم استفاده واقعی از چنین ربات هایی شکست خورده اند.

علاوه بر این، وی اظهار داشت که در بسیاری از موارد جنبه ” اجتماعی ” این ربات ها ممکن بود بیش از حد اغراق آمیز شده و انتظارات را بر آورده نکرده باشد.

او معتقد است که در حالی که این ربات ها تأثیرات عاطفی انسان ها را تقلید می کنند، اما در واقع آن ها روحیه یا احساسات کاربر را نمی توانستند به طور موثر ضبط کنند. از نظر او بسیاری از احساسات ما انسان ها غیر کلامی است. آنچه ما می گوییم و این که آن را چگونه می گوییم دو چیز کاملا متفاوت است. بسیاری از این سیستم عامل ها جنبه اساسی رابطه اجتماعی یعنی دو طرفه بودن رابطه را از دست داده اند و از این نظر، استفاده از نشانه های احساسی اضافی از جمله راه رفتن و زبان بدن ممکن است کمک کند تا این نوع ربات های اجتماعی مفید تر و به زنده بودن شبیه تر شوند.

با توجه به این موضوع، پروفسور برا سال ها تجربه در زمینه تحقیق در این زمینه بیش از ۴۰ مقاله تحقیقاتی دارد که به نام وی منتشر شده است. او معتقد است که آینده برای رباتیک و هوش مصنوعی روشن است. از نظر او تعداد فزاینده ای از ربات ها از هوش مصنوعی استفاده کرده اند تا مشکلات واقعی را از کف انبار کارخانه تا اتاق عمل بیمارستان حل کنند. او می خواهد از هوش مصنوعی برای بهتر شناختن جهان استفاده کند و همچنین از این فناوری استفاده کند تا ربات ها باهوش تر و کارآمد تر شوند.

آینده ای که او برای ربات ها متصور است فراتر از خانه و کارخانه است و تا اکتشافات و همکاری ها در مکان های نظامی برای نظارت مداوم یا استفاده در زنجیره های تأمین و حمل و نقل می باشد. این نوع از تیم های غیر متمرکز همکاری با ربات های انسانی برای اکتشاف در مقیاس بزرگ، نقشه برداری و سایر وظایف مربوط به کار های تیمی مناسب هستند زیرا تحقیقات و تعاملات اغلب می توانند به چندین هدف برای ربات ها تقسیم شوند. البته ، همانطور که او می گوید ، چالش واقعی این است که اطمینان حاصل کنیم که این ربات ها در نه فقط در آزمایشگاه ها بلکه در دنیای واقعی نیز عملکرد خوبی داشته باشند.

Artificial intelligence

تعریف ساده ای از هوش مصنوعی و کاربردهای آن

هوش مصنوعی چیست؟ آیا ربات‌ها همان هوش مصنوعی هستند که همه در موردشان صحبت می‌کنند؟ هوش مصنوعی چه کارهایی را انجام می‌دهد؟ آیا آینده نسل بشر در خطر است؟ هوش مصنوعی چگونه فکر می‌کند؟ اگر شما هم جزء کسانی هستید که واژه هوش مصنوعی به گوشتان خورده اما نمی‌دانید که هوش مصنوعی چیست و یا آشنایی شما با هوش مصنوعی از طریق فیلم‌های تخیلی است که دیده‌اید و درک درستی از هوش مصنوعی ندارید، ما در این مقاله قصد داریم تا مفهوم واقعی هوش مصنوعی و هر آن چه که باید در موردش بدانید را به شما بگوییم. پس در ادامه با ما همراه باشید.

تصور شما از هوش مصنوعی چیست؟

خیلی از افراد هنوز هم با شنیدن واژه هوش مصنوعی به ربات ها فکر می کنند و تصور می کنند که منظور از هوش مصنوعی همان ربات های بی احساسی هستند که برای انجام راحت تر کارها طراحی شده اند و قرار است در آینده جای انسان ها را بگیرند. مسئول این نوع تفکر به احتمال زیاد فیلم های علمی و تخیلی است اما واقعیت با آنچه که تصور می شود تفاوت دارد. هوش مصنوعی که امروزه از آن یاد می‌شود در واقع تکنولوژی است که به نحوی قابلیت تفکر دارد. البته این قابلیت تفکر با چیزی که ما به عنوان تفکر انسانی می‌شناسیم تا حد زیادی تفاوت دارد، اما در حقیقت سعی دارد تا از آن تقلید کند.

امروزه شاید هوش مصنوعی به آن شکلی که تصور می‌کنیم وجود نداشته باشد اما باز هم بسیاری از کارهایی که روزانه انجام می‌دهیم، مانند جستجوی اینترنت یا گشت و گذار در صفحات شبکه‌های اجتماعی و …، همه متاثر از هوش مصنوعی است و در حقیقت در این مواقع داریم ازآن استفاده می‌کنیم. انقدر این استفاده نا ملموس است و به آن عادت کرده ایم که در آن لحظه حس نمی‌کنیم که داریم از هوش مصنوعی استفاده می‌کنیم. دلیل اصلی آن این است که نمی‌دانیم هوش مصنوعی واقعا چیست و چه کارهایی انجام می‌دهد. از آنجایی که آینده از آن هوش مصنوعی خواهد بود بهتر است به جای نگران بودن در مورد هوش مصنوعی یاد بگیریم که چه کارهایی را می‌توانیم با آن انجام دهیم و اطلاعاتمان را در این زمینه بیشتر کنیم. پس بیایید از ابتدا ببینیم هوش مصنوعی چیست.

شروع هوش مصنوعی

شروع و سرچشمه هوش مصنوعی به سال های جنگ جهانی دوم بر می گردد. زمانی که نیروهای آلمانی برای رمز نگاری و ارسال ایمن پیام ها از ماشین enigma استفاده می کردند و دانشمند انگلیسی، آلن تورینگ در تلاش برای شکست این کدها برآمد. تورینگ به همراه تیمش ماشین bombe را ساختند که enigma را رمز گشایی می کرد. هر دو ماشین enigma و bombe پایه های یادگیری ماشینی (machine learning) هستند که یکی از شاخه های هوش مصنوعی یا همان Artificial intelligence می باشد. تورینگ ماشینی را هوشمند می دانست که بدون اینکه به انسان حس صحبت با ماشین را بدهد، با او ارتباط برقرار کند و این مسئله پایه علم هوش مصنوعی است یعنی ساخت ماشینی که همانند انسان فکر، تصمیم گیری و عمل کند.

رفته رفته با پیشرفت فناوری و سایر سخت افزارهای مورد نیاز برای توسعه هوش مصنوعی، ابزار هوشمند و سرویس‌های هوشمندی به بازار عرضه شدند که از هوش مصنوعی در بسیاری از فرآیندهایشان استفاده می‌کردند. بسیاری از سرویس‌های معروفی همانند موتورهای جستجو، ماهواره‌ها و … از هوش مصنوعی استفاده می‌کردند. با معرفی گوشی‌های هوشمند و پس از آن گجت‌های هوشمند، هوش مصنوعی گام بلندی را برای ورود به زندگی انسان‌های پشت سر گذاشت.از این زمان به بعد هوش مصنوعی برای انسان‌ها جلوه کاربردی تری پیدا کرد و انسان‌ها بیشتر با واژه هوش مصنوعی و کاربردهای آن آشنا شدند.

تعریف ساده ای از هوش مصنوعی

هوش مصنوعی یا artificial intelligence شاخه ای از علوم رایانه است که هدف اصلی‌اش آن است که ماشین‌های هوشمندی تولید کند که توانایی انجام وظایفی که نیازمند به هوش انسانی است را داشته باشد. هوش مصنوعی در حقیقت نوعی شبیه سازی هوش انسانی برای کامپیوتر است و منظور از هوش مصنوعی در واقع ماشینی است که به گونه ای برنامه نویسی شده که همانند انسان فکر کند و توانایی تقلید از رفتار انسان را داشته باشد.

این تعریف می تواند به تمامی ماشین هایی اطلاق شود که بگونه‌ای همانند ذهن انسان عمل می‌کنند و می‌توانند کارهایی مانند حل مسئله و یادگیری داشته باشند. اساس هوش مصنوعی آن است که هوش انسان و طریق کار آن بگونه ای تعریف شود که یک ماشین بتواند آن را به راحتی اجرا کند و وظایفی که بر آن محول می شود را به درستی اجرا کند. هدف هوش مصنوعی در حقیقت بر سه پایه استوار است: یادگیری،استدلال و درک.

سطوح مختلف هوش مصنوعی

یک سیستم هوش مصنوعی بر اساس آن چه که از دنیای بیرون درک می‌کند و می‌تواند به آن پاسخ دهد، دارای سه سطح می‌باشد. هوش مصنوعی محدود، عمومی و سوپر هوش مصنوعی. در ادامه هر کدام را به تفصیل توضیح می‌دهیم.

هوش مصنوعی محدود (artificial narrow intelligence)

در تاریخچه هوش مصنوعی ، هوش مصنوعی محدود بسیار زودتر از انواع دیگر هوش مصنوعی پدید آمده است. این روزها نمونه های هوش مصنوعی محدود زیاد است. برای مثال رایانه‌هایی که در بازی های پیچیده‌ای مانند شطرنج ، تصمیم گیری هوشمندانه در زمینه تجارت و در انواع دیگر کارهای مهم توانسته‌اند از بهتر عمل کنند نمونه‌هایی از هوش مصنوعی محدود هستند. زمانی که در مورد هوش مصنوعی محدود صحببت می‌کنیم منظورمان سیستم‌های هوشمندی است که در انجام دادن یک وظیفه (task) به خصوص بهتر از انسان عمل می‌کنند. برای مثال سیستم هوشمندی که می‌تواند به صورت خودکار گفتار را به نوشتار تبدیل کند یا سیستم‌های تشخیص چهره که قادرند هویت یک فرد را حتی در شلوغی و سیل عظیمی از جمعیت تشخیص دهند. اگر بخواهیم برخی از کاربرد‌های هوش مصنوعی محدود را مثال بزنیم، عبارتند از:

  • اتومبیل های خود ران که به کمک هوش مصنوعی یاد می‌گیرند که چگونه رانندگی کنند.
  • سیستم‌های پردازش تصویر و تشخیص چهره که می‌توانند کارهای بسیاری را انجام دهند و عملیات تشخیص هویت افراد را انجام دهند.
  • سیستم‌های هوش مصنوعی که به انجام فرآیندهای مالی در بانک‌ها و سایر کسب و کارهای مالی کمک می‌کند.
  • دستیارهای هوشمند که بر اساس نیازهایتان به شما کمک می‌کنند و حتی پروازها و هتل هایتان را از قبل رزرو می‌کنند.
  • و….

هوش مصنوعی عمومی Artificial General Intelligence))

منظور از هوش مصنوعی عمومی ماشینی است که می‌تواند دنیای اطراف خود را همانند یک انسان درک کند و دارای ظرفیت و گنجایش مشابه برای انجام فعالیت‌ها و وظایفی است که یک انسان به طور معمول آن‌ها را انجام می‌دهد. در حال حاضر هوش مصنوعی عمومی وجود ندارد اما رد پای آن را می‌توانیم در داستان های دارای ژانر عملی-تخیلی مشاهده کنیم. از نظر تئوری یک هوش مصنوعی عمومی می تواند هم سطح انسان فعالیت کند و یا حتی در زمینه‌هایی مانند حافظه و … ازاو بهتر عمل کند.

با این سطح از آگاهی و دانش یک ماشین می‌تواند تمام کارهایی که زمانی بر انسان محول می‌شد را بدون نیاز به وجود انسان انجام دهد و با گذشت زمان بیشتر ماشین‌های دارای هوش مصنوعی عمومی می‌توانند در بسیاری از زمینه‌ها جای انسان را پر کنند. خاتمه دادن به نیاز حضور نیروی انسانی در بسیاری از کارها و استفاده از تکنولوژی هوش مصنوعی عمومی یا کامل می‌تواند مانند هر تکنولوژی دیگری هر دو جنبه مثبت و منفی در زندگی اجتماعی و فردی انسان‌ها داشته باشد. اما با همه‌ی این‌ها وجود آن بسیار مفید و در عین حال اجتناب ناپذیر خواهد بود. به کمک هوش مصنوعی عمومی که دارای توانایی‌ها و ظرفیت‌های زیادی برای کمک به بشریت می‌باشد، بسیاری از مشکلاتی انسان امروزی با آن سر و کله می‌زند، همانند تغییرات شدید آب و هوایی، حل خواهد شد.

سیستم‌های هوش مصنوعی عمومی می‌تواند از کارهای عادی تا کارهای بسیار مهم و خطیر را به بهترین شکل انجام دهند. در سطح عمومی آن‌ها می‌توانند کارهایی مثل رانندگی، دستیار شخصی هوشمند با توانایی درک همه‌ی نیازهای کاربر، یک دستیار پزشک و یا سیستم تشخیص بیماری و… باشد. در سطوح بالا این سیستم‌ها می‌توانند کارهایی را انجام دهند که به زندگی و امنیت و جان انسان‌ها بستگی دارد و می‌توانند به خوبی از پس چنین کارهایی بر بیایند.

سوپر هوش مصنوعی

سوپر هوش مصنوعی در واقع عبارتی است که برای هوش مصنوعی استفاده می‌شود که سطح هوش و درک انسانی را پشت سر گذاشته و به نوعی دارای هوش فرا بشری خواهد شد. تا به حال نوز هیچ جامعه‌ای نتوانسته به سوپر هوش مصنوعی دست پیدا کند. در حقیقت رسیدن یا نرسیدن و یا حتی زمان رسیدن به آن در حاله‌ای از ابهام می‌باشد. هم چنین این مسئله که چنین هوش مصنوعی چه کارهایی انجام می‌دهد و یا این مسئله که آیا قرار است تهدیدی برای بشر باشد یا فرصتی برای او، هم مبهم است و بسیاری از صاحب نظران نظرات بسیار متفاوتی را در این مورد دارد وبحثی داغ بین صاحبان غول‌های تکنولوژی می‌باشد. برای رسدن به این سطح از هوش مصنوعی، یک سیستم هوشمند باید تست تورینگ را پشت سر گذاشته باشد و هیچ ماشینی تا به حال به سطحی از درک و شعور و وسعت دانش یک انسان بالغ نرسیده است که از این تست سر بلند بیرون آمده باشد.

تفاوت هوش مصنوعی محدود و عمومی و سوپر هوش مصنوعی در چیست؟

هوش مصنوعی ضعیف جایی است که ما در حال حاضر در آن قرار داریم و هوش مصنوعی عمومی آینده ای است که می‌خواهیم به آن برویم و سوپر هوش مصنوعی آینده‌ای است که برای هوش مصنوعی می‌بینیم که حاصل تکامل و هوشمند شدن هوش مصنوعی است.

هوش مصنوعی محدود به این معنا است که در آن سیستم هوش مصنوعی میزان خاصی از هوش را در یک زمینه خاص به کار ببرد. در حقیقت این سیستم هنوز یک کامپیوتر است اما یک کامپیوتری که در برخی از زمینه‌ها هوشمندتر از انسان عمل می‌کند.

معنای هوش مصنوعی عمومی بسیار پیچیده‌تر است. این واژه به سیستمی اطلاق می شود که می‌توانند همانند یک انسان هر کاری را بکه به او محول می‌شود را انجام دهد. ایده آل هوش مصنوعی عمومی آن است که بتواند به درک تجربی و شناخت کلی از محیط هایی که در آن قرار می‌گیرد داشته باشد و هم چنین بتواند داده‌ها و اطلاعاتی که به او داده می‌شود را با سرعتی چند برابر انسان پردازش نماید. از این رو می‌توانیم بگوییم که سیستم‌های هوش مصنوعی عمومی در بعد دانش ، توانایی شناختی و سرعت پردازش از انسان‌ها قوی‌تر عمل خواهند کرد نکته مهم این است که این سیستم زاده مغز و علم بشر است.

سوپر هوش مصنوعی همان طور که گفته شد زمانی است که هوش مصنوعی به فراتر از توانایی‌های انسان دست خواهد یافت. این سیستم می‌تواند دارای قدرت‌هایی باشد که یک انسان از داشتن آن نحروم است. رسیدن به این سیستم در اثر تکامل یافتن هوش مصنوعی عمومی اتفاق خواهد افتاد و ساخت آن هم می‌تواند به دست بشر باشد و یا اینکه می‌تواند به دست سیتستم‌های هوشمندی باشد که به تکامل دست یافته‌اند.

هوش مصنوعی چگونه آموزش می‌بیند؟

امروزه سیستم‌های هوش مصنوعی به کمک یادگیری ماشین و یادگیری عمیق هوشمند می‌شوند و می‌توانند یاد بیرند و آموزش ببینند. در ادامه هر کدام را معرفی می‌کنیم.

یادگیری ماشین

یادگیری ماشین (Machine Learning) یکی از زیر مجموعه های هوش مصنوعی است که به سیستم ها این امکان را می دهد تا به صورت خودکار یادگیری و پیشرفت داشته باشند بدون اینکه نیاز باید تا یک برنامه نویسی مخصوص به آن یادگیری خاص را انجام داد. تمرکز اصلی یادگیری ماشینی بر توسعه برنامه‌هایی است که بتوانند با دسترسی به داده‌ها، به طور خودکار از آن‌ها برای یادگیری خود سیستم استفاده کنند.

در یادگیری ماشین فرآیند یادگیری با مشاهدات یا داده ها آغاز می شود و سیستم از مثال ها، تجارب مستقیم و یا دستور العمل ها و.. استفاده می‌کند تا به یک الگو مشخص برسد و بر اساس آن الگو شروع به تصمیم گیری و حل مسئله کند. هدف اصلی یادگیری ماشین آن است که به کامپیوتر اجازه بدهیم که بدون دخالت و کمک انسان به طور اتوماتیک یادگیری داشته باشند و بتواند بر اساس مشاهدات و داده‌ها رفتار خود را تنیم کند.

الگوریتم های بسیار مختلفی برای یادگیری ماشین وجود دارد و هر روزه صدها الگوریتم جدید نیز در این زمینه تولید می‌شوند. به طور معمول این الگوریتم‌ها به وسیله سبک یادگیری (learning style) (مانند یادگیری نظارت شده، یادگیری بدون نظارت، یادگیری نیمه نظارت) و یا با توجه به شباهتشان در فرم و عملکرد ( مانند طبقه بندی، برگشت، درخت تصمیم گیری، دسته کردن، یادگیری عمیق و…) گروه بندی می شوند. صرف نظر از هر دو گروه‌بندی، تمام الگوریتم های یادگیری ماشین معمولا در زمینه‌های زیر فعالیت می‌کنند:

نمایش: مجموعه ای از طبقه بندی کننده ها یا زبانی که کامیوتر آن را می فهمد.

ارزشیابی: همچنین معروف به عملکرد هدف/نمره دهی.

بهینه سازی: روش جست و جو؛ اغلب طبقه بندی کننده ای با بالاترین امتیاز.

 هدف اساسی الگوریتم‌های یادگیری ماشین تفسیر موفقیت آمیز داده‌ها و تعمیم یادگیری‌ها به فراتر از نمونه‌های آموزش داده شده است.

یادگیری عمیق

یادگیری عمیق نوعی از یادگیری ماشین و هوش مصنوعی است که در واقع از روشی که ذهن انسان برای یادگیری موضوع خاصی به کار می‌گیرد، تقلید می‌کند. این نوع از یادگیری یکی از عناصر مهم در علم داده می‌باشد که شامل آمار و مدل سازی پیش بینی است. یادگیری عمیق برای دانشمندان داده که وظیفه جمع آوری ، تجزیه و تحلیل و تفسیر مقادیر زیادی از داده ها را دارند، بسیار کاربردی است و روند تحلیل و تفسیر داده‌ها را سریعتر و آسان تر می کند.

به نوعی می توان گفت یادگیری عمیق در واقع همان یادگیری ماشین است به گونه ای که در سطح کارهای پیچیده، نمایش یا انتزاع، عمل یادگیری را برای یک سیستم هوش مصنوعی انجام می‌دهد و به این صورت ماشین درک بهتری از واقعیت های وجودی پیدا می‌کند و می تواند الگوهای مختلف را شناسایی کند. در ساده ترین سطح، یادگیری عمیق را می توان راهی برای خودکار سازی تجزیه و تحلیل پیش بینی‌ها دانست.

برای شناسایی نحوه کار کرد یادگیری عمیق باید با شبکه‌های عصبی آشنا باشید. این نوع از یادگیری در واقع همانند یادگیری به وسیله شبکه‌های عصبی هستند که دارای لایه پنهان زیادی می‌باشند و هر چقدر در این لایه ها جلو تر بروید به مدل های پیچیده‌تر و کامل‌تری می‌رسید.

دسته بندی سیستم‌های هوش مصنوعی

آرند هینتز، استادیار زیست شناسی تلفیقی و علوم کامپیوتر دانشگاه ایالتی میشیگان، هوش مصنوعی را به چهار دسته کلی تقسیم بندی می کند. این دسته بندی شامل سیستم هایی که امروزه وجود دارند تا سیستم های احساسی که هنوز وجود ندارند را در بر می گیرد. این دسته ها به شرح زیر هستند:

نوع اول: ماشین های انفعالی

نمونه این دسته deep blue است که یک برنامه شطرنج بود که در دهه ۱۹۹۰ توانست گری کاسپاروف، قهرمان شطرنج جهان را شکست دهد. deep blue می توانست مهره های روی هر خانه شطرنج را شناسایی کند و حرکت های پیش رو را پیش بینی کند. مشکل برنامه آن بود که نمی توانست تجربه های قبلی خود را به یاد بسپارد و از آن برای حرکت های آینده اش استفاده کند. این برنامه هربار تمام حرکت های استراتژیک ممکن خود و رقیب را بررسی و آنالیز می کرد و بهترین آن ها را انتخاب می کرد. این نوع از هوش مصنوعی و برنامه های این چنینی برای هدف های محدودی قابل استفاده هستند و نمی توانند به راحتی در موقعیت های دیگری کاربرد داشته باشند.

نوع دوم: حافظه محدود

این سیستم هوش مصنوعی برعکس قبلی می تواند از تجارب گذشته برای تصمیمات آینده اش استفاده کند. برخی از کارکرد های تصمیم گیری در ماشین های خود ران از این نوع طراحی هستند. این نوع ماشین ها از مشاهداتشان برای تصمیماتی که در آینده ای نه چندان دور می خواهند بگیرند استفاده می کنند. مثلا اینکه لاینی که در آن در حال رانندگی هستند را عوض کنند. البته این نوع مشاهدات و تجربیات به صورت همیشگی ذخیره نمی شوند.

نوع سوم: تئوری ذهن

این نوع از هوش مصنوعی هنوز وجود ندارد اما اساس این عبارت روانشناختی به تمامی اعتقادات و دانش ها، آرزوها و آمال و نیت هر فرد بر می گردد و تاثیری که هر کدام از آن ها بر تصمیم گیری یک فرد دارد. این هوش مصنوعی قادر به درک و آنالیز این نوع از تصمیم گیری ها می باشد.

نوع چهارم: خود آگاهی

در این دسته سیستم هوش مصنوعی آگاهی از خود و هوشیاری وجود دارد. ماشین های دارای خود آگاهی می توانند بفهمند که در چه سطح و حالتی هستند و می توانند از اطلاعاتی که بدست می آورند احساسات دیگران را نتیجه گیری کنند. البته این نوع از هوش مصنوعی نیز همانند مورد سوم هنوز وجود ندارد.

آیا رباتیک همان هوش مصنوعی است؟

رباتیک در حقیقت حوزه ای از علم و تکنولوژی است که با ربات ها سر و کار دارد و به طور کلی می‌توان گفت ربات‌ها ماشین‌هایی هستند که برای انجام یک سری کارها به صورت اتوماتیک یا نیمه اتوماتیک، از قبل برنامه ریزی شده‌اند. رباتیک علمی است که با طراحی، ساخت و برنامه نویسی انواع ربات‌ها سر و کار دارد و تنها بخش کوچکی از زیر مجموعه آن است که به هوش مصنوعی مربوط می شود و با آن ادغام شده و تشکیل ربات های دارای هوش مصنوعی را می دهد. هوش مصنوعی نیز زیر مجموعه‌ای از علوم کامپیوتر است که به تولید برنامه‌هایی می‌پردازد که وظایفی که نیاز به هوش انسانی دارد را انجام دهند. الگوریتم های هوش مصنوعی دارای یادگیری، درک، حل مسئله، درک زبان طبیعی و یا استدلال منطقی می باشند.

از هوش مصنوعی در دنیا کاربردهای متنوع و فراوانی دارد و این تکنولوژی در زمینه‌های مختلفی برای اتوماتیک کردن و یا هوشمند کردن فرآیندها استفاده می‌شود. برای مثال موتور جستجوگر گوگل از هوش مصنوعی در جستجو ایش استفاده می‌کند تا بهترین و نزدیک‌ترین نتیجه به آن چه که کاربر می‌خواهد را پیدا کند. الگوریتم‌های هوش مصنوعی تنها به منظور کنترل ربات‌ها ساخته نشده‌اند. در واقع زمانی که از هوش مصنوعی برای کنترل یک ربات استفاده می‌کنیم، در حقیقت این هوش مصنوعی تنها یک بخشی از سیستم رباتیکی بزرگتری است که این سیستم بزرگ‌تر خود شامل سنسورها، فعال کننده‌ها و برنامه نویسی‌هایی است که هوش مصنوعی در آن دخیل نمی‌باشد. هوش مصنوعی و رباتیک دو علم کاملا جدا از هم هستند و اصلا به یکدیگر شباهتی ندارند و تنها در برخی از بخش‌ها به منظور هوشمند شدن ربات‌ها از هوش مصنوعی استفاده می‌شود.

کاربرد هوش مصنوعی در کسب و کارهای مختلف

از این علم می توان در کسب و کارهای مختلف استفاده کرد و در هر کسب و کاری منفعت های بسیاری را به همراه خواهد داشت. در ادامه به چند نمونه از این کاربرد ها در هر حوزه می پردازیم:

هوش مصنوعی در حوزه سلامت

مهم ترین نکته در این حوزه بهبود نتایج بیماران و در عین حال کاهش هزینه است. شرکت های فعال در حوزه سلامت می خواهند با استفاده از یادگیری ماشین، روند تشخیص و درمان را بهتر و سریعتر انجام دهند. یکی از شناخته شده ترین فناوری ها در این زمینه سیستم IBM Watson است. این سیستم زبان طبیعی را درک می کند و قادر به پاسخگویی به سوالاتی که از آن پرسیده می شود است. این سیستم تمام اطلاعات مربوط به بیمار از منابع موجود را استخراج می کند تا یک فرضیه ایجاد کند و پس از اطمینان آن را ارائه می دهد. سایر برنامه هایی که هوش مصنوعی دارند مانند چت بات ها، می توانند به بیماران برای برنامه ریزی قرار ملاقات، پاسخ به پرسش ها، صدور صورت حساب کمک کنند و یا به صورت یک دستیار سلامت مجازی به فرد بازخوردهای پزشکی ارائه دهد.

هوش مصنوعی در حوزه کسب و کار

برای کارها و فرآیندهای بسیار تکراری که در هر کسب و کار توسط انسان ها انجام می شود، می توان از فرآیندهای اتوماسیون رباتیک استفاده کرد. الگوریتم های یادگیری ماشین می توانند با analytics و CRM ادغام شوند تا با کشف اطلاعات لازم، بهتر به مشتریان خدمت کنند. از چت بات ها نیز می توان برای ارائه خدمات فوری به مشتریان در وب سایت نیز استفاده کرد.

هوش مصنوعی در حوزه آموزش وپرورش

هوش مصنوعی در این حوزه می تواند به خودکار شدن نمره دهی و درجه بندی دانش آموزان کمک کند و به معلمان زمان بیشتری بدهد. هوش مصنوعی می تواند دانش آموزان را ارزیابی کند و با نیازهای آن ها سازگار باشد و با هر فرد متناسب با سرعت او کار کند. سیستم های مربی هوش مصنوعی می توانند پشتیبانی بیشتری به دانش آموزان ارائه دهند و اطمینان حاصل کنند که روند آموزش آن ها در راه درستی قرار دارد. Artificial intelligence می تواند نحوه یادگیری و مکان یادگیری دانش آموزان را تغییر دهد و حتی برخی از معلمان او را عوض کند.

هوش مصنوعی در حوزه اقتصاد

سیستم های هوش مصنوعی در برنامه های مالی شخصی، مانند Mint یا Turbo Tax، می توانند اطلاعات مالی شخصی هر فرد را جمع آوری کنند و به آن ها مشاوره مالی دهند. از برنامه های دیگر مانند IBM Watson حتی در روند خرید خانه نیز می توان استفاده کرد. امروزه نرم افزارها در وال استریت بخش عظیمی از معاملات را انجام می دهند.

هوش مصنوعی در حوزه قانون و قضا

روند کشف اسناد و مدارک غالبا برای انسان ها بسیار سخت است. اتوماسیون و هوش مصنوعی می تواند به این فرآیند کمک کرده و کارآمدتر از زمان استفاده کند. استارتاپ ها در حال ساخت دستیارهای رایانه ای هستند که پرسش و پاسخ ها را غربال می کند و می توانند با بررسی و طبقه بندی و یک بانک اطلاعاتی ، سؤالات برنامه ریزی شده در زمینه هستی شناسی را پاسخ دهد.

هوش مصنوعی در حوزه تولید

این زمینه ای است که ربات ها هرچه تمام تر می توانند کار را به گردش دربیاورند. ربات های صنعتی می توانند تک تک وظایف محول شده را به طور کامل انجام دهند و جدا از کارکنان انسانی فعالیت کنند.

هوش مصنوعی در برقراری امنیت

از هوش مصنوعی و تکنولوژی پردازش تصویر در برقراری امنیت، ردیابی مجرمان، پیدا کردن هویت خلافکاران و… استفاده می‌شود. این سیستم‌ها قادرند با استفاده از هوش مصنوعی چهره افراد مختلف، موجودیت اشیاء و … را تشخیص دهند و هنگام مشاهده انجام تخلفات یا عملی مجرمانه آن را تشخیص داده و به نهاد مربوطه هشدار دهد.

هوش مصنوعی و تفسیر داده‌ها

کلان داده یا بیگ دیتا (Big Data) عبارتی است که برای توصیف مقادیر بزرگی از داده (اعم از داده های ساختار یافته و بدون ساختار) استفاده می‌شود. از کلان داده ها می‌توان برای استخراج اطلاعات مورد نیاز برای تصمیم گیری‌های مهم و حیاتی استفاده کرد و حرکات استراتژیک و حساس را با دقت بیشتری اجرا نمود. یک دانشمند داده به کمک کلان داده‌ها نه تنها قادر به تجزیه و تحلیل نیازهای افراد می‌باشد بلکه از قوانین حاکم بر بازارها و روندهای مختلف نیز اطلاع می‌یابد. تحلیل مقادیر زیادی داده، بدون هیچ گونه سیستم هوشمند و تنها به وسیله انسان امکان پذیر نیست. زیرا هم حجم داده بسیار گسترده است و هم هر روز بر میزان این حجم افزوده می‌شود. بنابراین مشخص است که با استفاده از هوش مصنوعی در تفسیر کلان داده‌ها است که به بسیاری از مفاهیم جدید می‌رسیم که نتیجه‌اش قابلیت متحول کردن بخش عظیمی از جامعه و زندگی انسان‌ها را دارد.

چالش‌های هوش مصنوعی

به کارگیری هوش مصنوعی نه تنها در ایران بلکه در بسیاری از کشورهای پیشرفته با چالش‌های متعددی مواجه است. چالش عمده ای که کسب و کارها در به کارگیری هوش مصنوعی با آن سر و کار دارند مربوط به افراد و نیروی انسانی، داده‌ها و اطلاعات مورد نیاز و یا ترجیحات و ترازهای تجاری می باشد. در ادامه هر کدام از این چالش‌ها را به طور مختصر بررسی می‌کنیم.

چالش‌های مربوط با داده‌ها و اطلاعات

مشکل مربوط به داده ها احتمالا یکی از مسائلی است اکثر شرکت ها با آن درگیر خواهند بود. هر سیستم هوش مصنوعی به اندازه داده‌هایی که به آن داده می‌شود عملکرد خوبی خواهد داشتدر حقیقت داده عنصر اصلی مورد نیاز تمام راه حل‌هایی است که هوش مصنوعی قرار است پیش روی یک کسب و کار قرار دهد. برخی از مشکلات مربوط به داده و جمع آوری آن عبارتند از:

چگونگی کیفیت و کمیت داده ها

برچسب داده ها

قابل فهم و شرح بودن

Case-specific بودن فرآیند آموزش

جانب داری

مقابله با خطاهای مدل ها

چالش‌های مربوط به افراد و نیروهای انسانی

دو مشکل عمده در رابطه با افراد برای به کارگیری هوش مصنوعی وجود دارد و این دو مشکل یکی نبود درکی از هوش مصنوعی در بین افراد غیر متخصص و کارمندان یک شرکت است و دیگری کمبود متخصصان هوش مصنوعی در حوزه هر کسب و کار می باشد. به کارگیری هوش مصنوعی در یک کسب و کار تا حد زیادی نیاز به مدیریتی آشنا با هوش مصنوعی و درک آن تکنولوژی دارد. متاسفانه هنوز بسیاری از افراد به هوش مصنوعی به صورت یک افسانه نگاه می‌کنند و انتظارات غیر علمی و تا حدی تخیلی از آن دارند و نمی‌دانند که هوش مصنوعی چه تحولی را می‌تواند در کسب و کار آن‌ها ایجاد کند.

چالش‌های درون سازمانی و سیاست‌های درونی هر کسب و کار

در هر کسب و کارو سازمانی برای به کارگیری هوش مصنوعی چند مشکل عمده وجود دارد که ناشی از سیاست‌های داخلی سازمان و تصمیمات درون سازمانی است. این چالش‌ها عبارتند از:

کمبود ترازهای بیزینسی

دشواری در ارزیابی

چالش های ادغام کسب و کار و هوش مصنوعی با یکدیگر

مسائل حقوقی