یادگیری عمیق چیست؟
یادگیری عمیق زیرمجموعه یادگیری ماشین است که در حوزه هوش مصنوعی قرار میگیرد.
تفاوت بین یادگیری عمیق، یادگیری ماشین و هوش مصنوعی
هوش مصنوعی مطالعه چگونگی ساخت ماشینهایی است که قادر به انجام وظایفی هستند که معمولاً به هوش انسانی نیاز دارند.
این تعریف نسبتاً کلی به این معنی است که هوش مصنوعی بسیاری از زمینههای تحقیق را شامل میشود، از الگوریتمهای ژنتیک گرفته تا سیستمهای خبره، و زمینه را برای استدلال در مورد آنچه هوش مصنوعی را تشکیل میدهد فراهم میکند.
در زمینه تحقیقات هوش مصنوعی، یادگیری ماشین در سالهای اخیر از موفقیت چشمگیری برخوردار بوده است. یادگیری ماشین به کامپیوترها اجازه میدهد در زمینههای مختلف از تشخیص چهره تا تشخیص گفتار و زبان، از عملکرد انسان پیشی بگیرند یا به آن نزدیک شوند.
یادگیری ماشین فرایند آموزش دادن به کامپیوتر برای انجام یک کار است، نه برنامهریزی نحوه انجام مرحله به مرحله آن کار. در پایان آموزش، یک سیستم یادگیری ماشین با دریافت داده قادر به پیشبینی دقیق خواهد بود.
این پیشبینیها میتوانند موارد زیادی را در بر گیرند، از جمله تشخیص اینکه آیا میوه موجود در یک عکس موز است یا سیب، تشخیص اجسام در حال حرکت از جلوی ماشین خودران، تفاوت بین اسپم و ایمیل واقعی، یا شناخت دقیق گفتار برای تولید زیرنویس ویدیوهای YouTube.
یادگیری عمیق زیرمجموعهای از یادگیری ماشین است که قابلیتهای آن از چندین جنبه کلیدی با یادگیری ماشین متفاوت است و به کامپیوترها امکان میدهد مجموعهای از مشکلات پیچیده را حل کنند که در غیر اینصورت نمیتوان آنها را حل کرد.
نمونهای از یک کار ساده و کم عمق برای یادگیری ماشین ممکن است پیشبینی چگونگی تغییر بستنی بسته به درجه حرارت محیط باشد. پیشبینی با استفاده از چند ویژگی داده به این روش نسبتاً ساده است و میتواند با استفاده از یک روش یادگیری ماشین کمعمق به نام رگرسیون خطی با نزول شیبدار انجام شود.
مسئله این است که مشکلات زیادی در دنیای واقعی وجود دارد که برای چنین مدلهای سادهای، بیش از حد پیچیده هستند. به عنوان مثال یکی از این مشکلات پیچیده دنیای واقعی، شناخت اعداد دستنویس است.
برای حل این مشکل، کامپیوتر باید بتواند با تنوع زیادی در نحوه ارائه دادهها کنار بیاید. هر رقم بین ۰ تا ۹ را میتوان به روشهای بیشماری نوشت: اندازه و شکل دقیق هر رقم دستنویس بسته به اینکه چه کسی و در چه شرایطی مینویسد، میتواند بسیار متفاوت باشد.
کنار آمدن با تغییرپذیری این ویژگیها و تعاملات بین آنها، از اصلیترین مزایای یادگیری عمیق و شبکههای عصبی عمیق است.
شبکههای عصبی مدلهای ریاضی هستند که برای ساختار آنها از مغز الهام گرفته شده است.
هر نورون در یک شبکه عصبی یک عملکرد ریاضی است که دادهها را از طریق ورودی میگیرد، آنها را به شکل قابل قبولتری تبدیل میکند و سپس از طریق یک خروجی بیرون میکشد. همانطور که در تصویر زیر نشان داده شده است، سلولهای عصبی در یک شبکه عصبی به صورت لایهای مرتب شدهاند.
همه شبکههای عصبی دارای یک لایه ورودی هستند، جایی که دادههای اولیه وارد میشوند و یک لایه خروجی، که پیشبینی نهایی را ایجاد میکند. اما در یک شبکه عصبی عمیق، چندین لایه پنهان نورون بین این لایههای ورودی و خروجی وجود دارد که هر کدام دادهها را به یکدیگر انتقال میدهند. از این رو اصطلاح “عمیق” در “یادگیری عمیق” و “شبکههای عصبی عمیق”، اشاره به تعداد زیادی از لایههای پنهان دارد.
در این مثال، شبکه برای شناسایی ارقام دستنویس، مانند شماره ۲ که در نمودار مشخص شده، آموزش داده شده است. لایه ورودی مقادیر و پیکسلهای تشکیلدهنده یک رقم دستنویس را وارد کرده و لایه خروجی پیشبینی میکند کدام شماره دستنویس است.
در نمودار بالا، هر دایره نشان دهنده یک نورون در شبکه است و نورونها به صورت لایههای عمودی سازمان یافتهاند.
یادگیری عمیق به شما اجازه میدهد تا بتوانید با مشکلات پیچیده جدید مانند شناسایی تصویر، زبان و گفتار و … کنار بیایید، به ماشینها این امکان را میدهد تا یاد بگیرند که چگونه ویژگیهای دادهها به شکلهای انتزاعی ترکیب میشوند. به عنوان مثال در تشخیص چهره، اینکه چگونه پیکسلها خطوط و اشکال را ایجاد میکنند، چگونه آن خطوط و اشکال ویژگیهای صورت را تشکیل میدهند و این ویژگیها صورت چگونه در صورت قرار میگیرند.
چرا به آن یادگیری عمیق گفته میشود؟
همانطور که گفته شد، عبارت “عمیق” به تعداد لایههای پنهان اشاره دارد (معمولا بیش از سه لایه) که در شبکههای عصبی عمیق استفاده میشوند.
یادگیری عمیق چگونه استفاده میشود؟
یادگیری عمیق برای بسیاری از مسائل از جمله شناسایی و تولید تصاویر، گفتار و زبان، در بازیهای مختلف قدیمی یا مدرن مانند Go، Dota 2 و Quake III استفاده میشود.
سیستمهای یادگیری عمیق پایه و اساس خدمات آنلاین نوین هستند. آمازون چنین سیستمهایی را برای درک جملات، زبان و گفتار شما، در دستیار مجازی الکسا به کار گرفته است. گوگل نیز برای ترجمه متن هنگام بازدید از یک وبسایت به زبان خارجی از سیستم یادگیری عمیق استفاده میکند.
اما فراتر از این مظاهر بسیار مشهود یادگیری عمیق، چنین سیستمهایی تقریباً در هر صنعتی کاربرد پیدا میکنند. این کاربردها عبارتند از:
- اتوموبیلهای خودران، هواپیماهای بدون سرنشین و رباتهای خدمترسان
- تشخیص گفتار و زبان در رباتهای چت
- تشخیص چهره برای نظارت در کشورهایی مانند چین
- کمک به رادیولوژیستها برای تشخیص تومورهای اشعه ایکس
- کمک به محققان در ردیابی توالیهای ژنتیکی مربوط به بیماریها و شناسایی مولکولهایی که میتوانند به تولید داروهای موثرتری در مراقبتهای بهداشتی منجر شوند.
- ارائه متن ترجمه دقیق و ترجمه سخنرانی برای جلسات تجاری