تا بهحال مقالات متعددی درباره هوش مصنوعی نوشته شده که این فناوری را از جنبههای مختلفی بررسی کردهاند. اما در اینجا ما قصد داریم نگاهی ساده به این موضوع بیندازیم تا درک روشنی از آنچه که در اطراف ما میگذرد، داشته باشیم.
زمانی که متن یا صوتی را جهت پردازش در اختیار کامپیوتری قرار میدهید، تنها مورد مهم، داده (Data) است. ورودیها تبدیل به صفر و یکهایی میشوند که قابل درک برای کامپیوتر است. برای آنکه هوش مصنوعی حرفهای شما را بفهمد، کافی است آنها را تبدیل به رفتار کنید. در نهایت قادر به درک خروجی دریافتی از آن خواهید بود و همه اینها چیزهایی هستند که بر پایه اصلی به نام پردازش زبان طبیعی (NLP) شکل گرفتهاند.
شما نیازی به این ندارید تا برای تعامل با یک برنامه یادگیری ماشین، دارای مدرکی تخصصی در علوم کامپیوتر باشید. در واقع بیش از آنکه نیازی به یادگیری نحوه صحبت با ماشینها داشته باشید، میلیونها نفر از ما از مزیت یادگیری ماشینها جهتِ صحبت کردن با ما، که توسط شرکتهایی مانند آمازون، اپل، گوگل، مایکروسافت و کمپانیهای بیشمار دیگری محقق شده است، بهره میبریم.
چند سال پیش، قبل از آنکه دستیار هوشمند سیری در سال 2011 راهاندازی شود، انسان و کامپیوترها به زبان مشترکی نمیتوانستند باهم حرف بزنند. اما چه باور کنید یا نه، حالا اگر کامپیوتری را تنها با گفتن «برایم آهنگی از اسکینرد (Skynyrd) پخش کن» خطاب قرار دهید، لحظهای طول نمیکشد که دستور شما را اجرا کند.
چیزی که کامپیوترها پیش از این، از آن بیبهره بودند، وجود شبکههای یادگیری عمیق (Deap Learning) بود تا امکان پردازش زبان طبیعی را برای آنها فراهم سازد. درست است همه چیز به یکباره از سال 2010 دچار تغییر شد، اما ایده پشت دستیارهای هوشمندی مانند سیری حتی بسیار زودتر از آن یعنی در دهه 1940 توسعه پیدا کرد.
حالا اکثر گوشیهای آیفون قدرت پردازش بیشتری از آیبیام مینفریم (IBMmainframe) دارند که در نیم قرن اخیر بسیاری از توسعه دهندگان یادگیری ماشین از آن استفاده میکردهاند و الگوریتمها حتی از بیش از آنچه که چند دهه پیش فکرش را میکردیم، توانمندتر و پیشرفتهتر شدهاند.
این پیشرفتهای تکنولوژیک، انقلابی در یادگیری عمیق بودند و از طریق آن بود که پردازش زبان طبیعی از یک پروسه زمانگیر که در آن فرامین بهطور دستی توسط انسان نوشته میشد، به مرحلهای رسیده است که کامپیوترها بسیار بیشتر از ما انسانها میدانند که چگونه ارتباط برقرار کنند.
نحوه کار آنها میتواند بسته به سیستم مورد استفاده متغیر باشد. نمیتوان بهسادگی همه آن فرایندهایی را که منجر به ارایه یک دستیار هوشهای مصنوعی مانند گوگل اسیستنت میشود، توضیح داد. اما ایده پشتسر آنها آنطور که فکر میکنید، پیچیده نیست.
اما اگر بخواهیم سادهتر توضیح دهیم، ایده اولیه آن در واقع ایجاد یک شبکه عصبی است که میتواند هزاران و میلیونها داده و اطلاعات را دریافت کند. این دادهها میتوانند فایلهای صوتی باشد یا هر چیز دیگری. با تعریف الگوریتمهای مشخصی، کامپیوتر یاد میگیرد که این دادهها را تفسیر کرده و براساس چیزیهایی که یاد گرفته پاسخ شما را بدهد.
یک تعامل متداول بین کامپیوتر-انسان براساس روش NLP ممکن است اینگونه باشد:
- انسان چیزی به کامپیوتر میگوید.
- کامپیوتر صدا یا صوت را دریافت میکند.
- صدا تبدیل به متن (تکست) میشود.
- داده متنی پردازش میگردد.
- داده پردازش شده بهصورت صوت درمیآید.
- کامپیوتر یک فایل صوتی را در پاسخ به درخواست انسان پخش مینماید.
البته اشکال دیگری از مراحل بالا نیز میتواند وجود داشته باشد. شما میتوانید حتی با تعریف یک الگوریتم ساده، فایلهای بزرگ متنی و صوتی را به کلمات و اجزا خاصی تبدیل نمایید.
اما کاربردهای زیادی برای پردازش زبان طبیعی میتوان نام برد از جمله:
- چتباتهایی مانند Woebot از NLP برای فهمیدن پرسشهای انسان بهره برده و به او پاسخ میدهند.
- گوگل سرچ میتواند هر چیزی را که از آن میپرسید، تجزیه و تحلیل کند.
- قابلیت Auto-correct این روزها به لطف یادگیری عمیق و NLP کمتر حوصلهبر است.
- دستیارهای مجازی به قدری در NLP پیشرفت کردهاند که میتوانید بازی Skyrim را بر روی یک اسپیکر هوشمند بازی کنید.
و البته این لیست میتواند ادامه داشته باشد. بخش عمدهای از گجتهای مبتنی بر هوش مصنوعی که در دسترس مردم قرار دارد، در واقع از محصولات NLP هستند.
شما میتوانید با مراجعه به سایتهایی مانند Coursera course و Udacity course درباره پردازش زبان طبیعی و کاربردهای آن بیشتر یاد بگیرید و از سایت artificial intelligence، همه خبرها و تحلیلهای مربوط به آخرین تحولات یادگیری ماشین و هوش مصنوعی را دنبال نمایید.