هوش مصنوعی در گوگل انقلاب تازهای را در دنیای فناوریهای نوین ایجاد کرده است و این جریان تحولگرا با سرعتی مثالزدنی، رو به جلو به پیش میراند! در نوامبر ۲۰۰۷، گوگل با انتشار اندروید، که یک سیستم عامل منبع باز برای تلفنهای همراه بود، زمینه تسلط بر بازار موبایل را فراهم کرد. هشت سال بعد از آن تاریخ، اندروید ۸۰ درصد سهم بازار را در اختیار داشت و اکنون گوگل نیز از همین ترفند استفاده میکند ولی این بار با فناوری هوش مصنوعی!
امروز گوگل اعلام کرده است که دسترسی به پلتفرم منبع باز خود برای یادگیری ماشین، به نام تنسورفلو را به هر کسی که امکان اتصال به کامپیوتر و اینترنت دارد و نیز آگاهی نسبی در زمینه الگوریتمهای یادگیری عمیق داشته باشد، میدهد. این به معنای دسترسی به یکی از قدرتمندترین سیستم عاملهای یادگیری ماشین منبع بازی است که تاکنون ایجاد شده. بیش از ۵۰ محصول گوگل از تنسورفلو استفاده کردهاند تا از یادگیری عمیق (یادگیری ماشین با استفاده از شبکههای عصبی عمیق) به عنوان ابزار کاربردی عملیاتهای خود استفاده کنند؛ از شناسایی چهره شما و دوستانتان در عکسها گرفته تا فیلترهای گوناگون روی موتور جستجوی اصلی گوگل! حالا به زعم همه رهبران اکوسیستم، گوگل به یک شرکت یادگیری ماشین تبدیل شده است. اکنون مهندسان گوگل آنچه را که خدمات ویژه این شرکت است، توسعه میدهند و در اختیار جهانیان قرار میدهند.
معرفی TensorFlow : اندروید هوش مصنوعی!
پلتفرم تنسورفلو که سرویس هوش مصنوعی در گوگل است، کتابخانهای متشکل از تعداد بیشماری از پروندههاست که به محققان و دانشمندان علوم رایانه امکان میدهد تا سیستمهایی را ایجاد کنند که دادههایی همچون عکسها یا فایلهای صوتی را تجزیه میکنند و از کامپیوتر میخواهند بر اساس آن اطلاعات، تصمیمات بعدی را بگیرد. این فرایند، اساس تکنولوژی یادگیری ماشین است: کامپیوترها داده ها را میفهمند، و سپس از آنها برای تصمیمگیری استفاده میکنند. از آنجا که مقیاسبندی دادهها بسیار پیچیده است، یادگیری ماشینی یک هدف اساسی در هوشمندسازی رایانهها دارد. این زمینه وسیعتر و نامشخصتر از هوش مصنوعی است. تنسورفلو به دلیل دقت و سرعت در هضم و خروجی دادههای پیچیده، راهکاری فوقالعاده است و بدون شک میتواند بخشی از ابزارهای هوش مصنوعی در گوگل باشد.
در اینجا جزئیات بیشتر درباره این فناوری آورده شده است: سیستم تنسورفلو از نمودارهای جریان داده استفاده میکند. در این سیستم، دادههایی با ابعاد (مقادیر) چندگانه از محاسبات ریاضی منتقل میشوند. آن دسته از دادههای پیچیده را تنسور مینامند. بیتهای math-y گره نامیده میشوند و نحوه تغییر دادهها از گره به گره، روابط کلی سیستم را در دادهها بیان میکند. این سنسورها از طریق نمودار گرهها عبور میکنند و نام TensorFlow از آنجاست.
هوش مصنوعی در گوگل یا همان منبع باز تنسورفلو به محققان و حتی دانشجویان درجه یک امکان کار با نرمافزار حرفهای را میدهد. البته این امکان فوقالعادهای است، اما تأثیر واقعی آن زمانی است که میتواند تحقیقات هر شرکت یادگیری ماشین را در سراسر هیئت مدیره اطلاع دهد. اکنون سازمانها در هر اندازهای که باشند، از استارتاپهای کوچک گرفته تا شرکتهای بزرگ همتراز گوگل، میتوانند سیستم تنسورفلو را بگیرند، آن را با نیازهای خود سازگار کنند و از آن برای رقابت مستقیم با خود گوگل استفاده کنند. بیش از هر چیز، این نسخه به بزرگترین غول جستجوگر اینترنتی جهان اختیارات بسیاری در زمینه هوش مصنوعی میدهد!
کمی بیشتر از سه ماه پیش، تنسورفلو به یکی از استادان علوم کامپیوتر دانشگاه استنفورد، به نام کریستوفر منینگ داده شد و دانشجویان وی این فرصت را داشتند که با این سیستم کار کنند. فقط بعد از چند هفته که خود منینگ نیز از آن استفاده کرد، تصمیم گرفت که آن را در برنامه درسی خود بگنجاند.
علاوه بر اندروید، او همچنین این پلتفرم را به جیمیل که نرمافزار همگانی ایمیل گوگل است، تشبیه کرد. چرا که در میان همه رقبای سرویسهای پیامرسان الکترونیکی، جیمیل شسته رفتهتر و کاراتر است و در بیشتر برنامهها کاربرد دارد.
منینگ درباره تنسورفلو میگوید: «اینطور نیست که قبل از این هیچ کتابخانه سطح بالایی برای یادگیری عمیق در دسترس نبوده باشد. بلکه کتابخانههای دیگری نیز هستند که توسط سه نهاد دانشگاهی و یک دانشجوی مقطع کارشناسی ارشد ارائه شدهاند. اما تفاوت این کتابخانهها به ویژه Torch و Theano با آنچه به عنوان هوش مصنوعی در گوگل توسعه داده شده، این است که گروههای کوچکی هستند که آنها را بهروزرسانی میکنند و این فرایند اصلا شباهتی به نیروی عظیم توسعهدهندگانی که روی زیرساختهای یادگیری ماشین گوگل کار میکنند، ندارد. منینگ میگوید گرچه تنسورفلو هدیهای بزرگ به جامعه است (پلتفرمی که میتواند زمان بهینهسازی شبکه های عصبی را ۱۰۰ برابر کاهش دهد)، اما حالا کتابخانههای دیگر ممکن است بهطور غیرمستقیم از این پلتفرم منبع باز برای ابزارهای خود استفاده کنند.
جف دین، یکی از برترین مهندسان گوگل و یکی از دو نفری که میتواند به عنوان نویسنده تنسورفلو ذکر شود (دیگری راجات مونگا است)، درباره تخمین پذیرش چنین پلتفرمی در جامعه، تردید دارد. او میگوید در حالی که تنسورفلو محصولی است که گوگل آن را در کار خود بسیار مفید دانسته است، اما آزمون واقعی این است که آیا جامعه آن را به عنوان توانایی عظیمی که از این پس در اختیار خواهد داشت، پذیرش خواهد کرد؟ ایده اولیه تنسورفلو در حقیقت ارائه ابزاری بوده تا کل جامعه بتوانند نه فقط به نوآوری و ایدهپردازی فکر کنند، بلکه با سرعت بیشتری به اجرای ایدههای خود روی آورند.
جف دین در اینباره میگوید: «ما امیدواریم بتوانیم تحقیق در حوزه یادگیری ماشین و توسعه این فناوری را تسریع کنیم. گرچه این یک هدیه بزرگ برای همه دنیاست، اما سناریوی ایدهآل این است که جامعه کاربران نیز آن را به کار گیرند و در توسعه بیشتر یادگیری ماشین از آن استفاده کنند و آنچه را که ساختهاند، با دیگر محققان و گوگل به اشتراک بگذارند. دین میگوید: «جامعه توسعهدهندگان فناوری یادگیری ماشینی واقعاً در پرداخت ایدهها تبحر داشته است و این واقعاً چیز خوبی است، اما این تنها کافی نیست.» وی همچنین خاطر نشان کرد که تنسورفلو به کارآموزانی که در گوگل مشغول به کار هستند برای بازگشت به مدرسه و دانشگاهشان کمک خواهد کرد، زیرا اکنون آنها میتوانند در پروژههایی که ممکن است در طول مدت حضورشان در شرکت به پایان نرسیده است، در سیستمهای اختصاصی خود در خانه بار دیگر دسترسی پیدا کنند.
هوش مصنوعی در گوگل یا سیستم تنسورفلو یک پکیج کامل برای یک محقق یادگیری ماشین خاص است. این سیستم یک کتابخانه کامل و مستقل است که با ابزارها و مجوز Apache 2.0 همراه است، بنابراین میتوان از آن در تنظیمات تجاری استفاده کرد. میتوان آن را روی میز کار یا لپتاپ کامپایل کرد، یا در تلفن همراه مستقر کرد (ابتدا اندروید، طبیعتاً و سپس iOS در دسترس قرار خواهد گرفت). همچنین با آموزش درمورد نحوه اصلاح و بازی با سیستم عامل همراه است. منینگ پیشنهاد میکند که توانایی اجرای الگوریتمهای یادگیری عمیق در دستگاههای تلفن همراه عامل مهمی است که تنسورفلو را از سایر سیستمهای منبع باز جدا میکند.
گوگل برای کسانی که میخواهند از سیستم تنسورفلو به صورتی که الان در دسترس است، استفاده کنند، نسخهای را ارائه میدهد که محققان میتوانند از هماکنون (به عنوان باینری از قبل ساخته شده) استفاده کنند. همچنین یک رابط برنامهنویسی برنامه (API) وجود دارد که توسعهدهندگان نرمافزار میتوانند مدلهای تنسورفلو خود را آموزش و کنترل کنند. این نسخه در دسترس، یک سیستم واقعی است که در اپلیکیشن گوگل و بیش از ۵۰ محصول دیگر استفاده میشود.
توسعه هوش مصنوعی در گوگل و نفوذ به همه بخشها
توسعه یادگیری ماشینی و هوش مصنوعی در گوگل (یا همان شعور ماشین، همانطور که شرکت دوست دارد آن را بنامد) بر بسیاری از محصولاتی که امضای گوگل روی آنهاست تأثیر میگذارد. گوگل این بستر را به روی جهانیان باز کرده است، که به ما فرصتی برابر میدهد تا نگاه کنیم و ببینیم که این شرکت درمورد توسعه سیستمهای یادگیری ماشین چگونه فکر میکند.
از منظر تحولات داخلی، گوگل سه سال گذشته را صرف ساخت یک بستر عظیم برای هوش مصنوعی کرده است و اکنون آنها این محصول خود را در اختیار جهان گذاشتهاند. این شرکت ترجیح میدهد محصول توسعه دادهشده هوش مصنوعی در گوگل با عنوان هوش ماشینی گوگل شناخته شود، چرا که به نظر گوگل، کلمه هوش مصنوعی مفهوم زیادی را به همراه دارد و اساساً آنها در تلاشاند تا هوشمندی واقعی که فقط در ماشینها است را ایجاد کنند.
این همان مدلی است که گوگل سالها در شرکت خود استفاده کرده است: جایی که هر مهندسی که میخواهد با یک شبکه عصبی مصنوعی کار کند، میتواند آن را از سیستم جدا کند و از آن استفاده کند. این نوعی ساختار باز است که به ۱۰۰ تیم در یک شرکت امکان میدهد تکنیکهای قدرتمند یادگیری ماشین را بسازند.
فضای اداری و محیط توسعه هوش مصنوعی در گوگل
محققان Google Photos در یک محیط جذاب و البته بسیار معمولی، در دفتر مرکزی Google View Mountain با چالشهای مربوط به فناوری هوش ماشین روبهرو میشوند. به لحاظ سازمانی، مجموعهای از محققان همیشه در زمینه مشکلات کلی هوش ماشین کار میکنند و این محصولات پس از توسعه نهایی، به محصولات اصلی گوگل مانند برنامه عکس، جستجوی صوتی و خود موتور اصلی جستجو اضافه میشوند. برخی از پروژههایی که در این بخش تعریف میشود، فقط به عنوان تسکی شروع میشوند که گوگل میخواهد در آن بهتر شود. برای مثال، تشخیص دست خط یکی از نمونههایی است که در حال حاضر تیم یادگیری ماشین گوگل روی آن کار میکنند. پیش از این، مهندس جان جیاندرا، معاون فنی گوگل در این باره گفته بود: «ما به عنوان یک شرکت هوشمند، میخواهیم بفهمیم مردم چگونه یک کلمه را مینویسند. این چیزی است که ما میتوانیم برای همیشه روی آن سرمایهگذاری کنیم، حتی اگر محصولی نداشته باشیم.»
اما از آنجا که گوگل در ارائه خدمات بسیار گسترده عمل میکند، معمولاً ابزاری وجود دارد که میتواند از هر عنصر تحقیقاتی استفاده کند. همچنان که تکنیک تشخیص دست خط در نهایت در اپلیکیشن Google Keep، که نرمافزار یادداشتبرداری است، جایگیر شده و مورد استفاده قرار گرفته است.
وقتی این کاربرد مشخص شد، محققان برای کمک به اجرا به تیم محصول پیوستند. تیمهای تولید در گوگل، برنامههای خاصی را توسعه میدهند که همه ما در سراسر دنیا از آن استفاده میکنیم، مانند برنامه عکس یا Google Translate. در تحقیقات کلی، تیمها بر اساس حوزه موردعلاقه خود تقسیمبندی میشوند. یک تیم متمرکز بر آموزش بینایی کامپیوتر است، تیمی دیگر بر روی درک زبان کار میکند، و تیمی دیگر روی بهینهسازی تشخیص صدا کار میکند.
بیش از ۱۰۰۰ محقق در گوگل مشغول کار بر روی این برنامههای هوش ماشینی هستند که بهطور مداوم بین تحقیقات کاربردی و نظری میچرخند. برخی از این محققان بر روی مشکلات سادهتری کار میکنند که به معنای دقیق کلمه، هوش مصنوعی محسوب نمی شود، اما روشهای آماری برای پیشبینی هستند. به گفته سخنگوی گوگل، جیسون فریدنفلدز، شرکت مادر جدید گوگل به نام آلفابت، تأثیر چندانی در نحوه ادامه تحقیقات هوش ماشینی گوگل ندارد. در حالی که تیم تحقیق در Google Proper باقی خواهند ماند، همکاری با Life Science یا Google [x] در برنامههای یادگیری ماشین هیچ مانعی ایجاد نخواهد کرد.
هوش مصنوعی در گوگل و صدایی که از آینده به گوش میرسد!
ستاره در حال رشد در فهرست ابزارهای گوگل، جستجوی صوتی است. حتی اگر دقیقاً ندانید این سرویس چیست، احتمالاً پیش از این با آن برخورد داشتهاید: «این نماد میکروفون کوچک در نوار اصلی جستجوی گوگل است که با فشردن آن، به جای تایپ کردن عبارت مورد جستجوی خود، با گوگل صحبت میکنید و مفهوم مورد جستجو را به گوگل میگویید. همان میکروفون کوچک در برنامه جستجوی گوگل برای آیفون و اندروید نیز ظاهر میشود و در بسیاری از تلفنهای هوشمند در نوار جستجوی اندروید نیز یافت میشود.
اگرچه جستجوی صوتی گوگل به عنوان رقیبی برای Siri تصور میشود، اما جستجوی Google Voice در واقع به دروازهای ثانویه برای پایگاه دانش گسترده گوگل تبدیل شده است و تیم تشخیص گفتار گوگل از آن در محصولات دیگر نیز بهره میبرد و در نهایت محبوبیت بیشتری پیدا میکند.
برای اینکه یک ماشین بتواند گفتار انسان را درک کند، ابتدا باید یاد بگیرد که کلمات و عبارات چگونه به نظر میرسند و چطور تلفظ میشوند. این به معنای دریافت و آموزش دیدن با تعداد زیادی فایلهای صوتی است. این پروندهها توسط الگوریتمهای ماشینی پردازش میشوند. سپس نمودار بزرگی از آن ایجاد میشود که اصوات با صداها، کلمات و عبارات ارتباط دارند. هنگامی که یک کلیپ صوتی به رایانه ارائه میشود، با فشار دادن شکل موج صوتی از طریق نمودار، کلیپ را تجزیهوتحلیل میکند تا راهی پیدا کند که صدا را به بهترین وجه توضیح دهد. پس از پشت سر گذاشتن توالی اصوات، کلمات ایجاد میشوند و سپس جملهها ساخته میشوند.
اما اینکه ماشین بتواند به خوبی از عهده این فرایند برآید، به آن فایلهای صوتی اولیه متکی است که به آن دادههای آموزشی میگویند. این دادههای آموزشی در واقع از میلیونها جستجو صوتی واقعی توسط کاربران گوگل ساخته شده است. هر زمان که یک جستجوی صوتی انجام میدهید، صدا در سرورهای گوگل بارگذاری میشود و اگر تصمیم گرفتهاید که به گوگل اجازه استفاده از آن را بدهید، میتواند در بانک کلیپهای مورد استفاده برای آموزش دستگاه ادغام شود.
اما قبل از استفاده، دادهها چند مرحله را طی میکنند. اول (و مهمتر از همه برای شما)، جمعآوری اطلاعات است؛ این به معنای اطلاعات مربوط به زمان استفاده شما از سرویس، دادههای مکانی شما، مشخصات کاربری شما و در حقیقت همه چیز است! سپس شکل موج خام برای یک پیامرسان انسانی ارسال میشود، زیرا الگوریتم برای ارتباط با کلیپ به متن معتبری نیاز دارد. هر کلیپ به این فراداده احتیاج دارد و یک کلیپ «بد» واقعاً چیزی است که به درستی رونویسی نشده است. حتی مواردی وجود دارد که محققان سروصدای مصنوعی به آن اضافه میکنند تا دستگاه بفهمد کلمات مختلف در شرایط مختلف چگونه به نظر میرسند.
سرویس Inbox جیمیل به TensorFlow مجهز شده است!
چندی پیش، گوگل اعلام کرد که شروع به استفاده از یادگیری ماشین در سرویس ایمیل خود کرده است (در برنامه Inbox، جدا از Gmail پیاده شده است). طبق گفته الکس گاولی، مدیر محصول جیمیل، این محصول روی تنسورفلو ساخته شده است. این ویژگی، پاسخ هوشمند یا Smart Reply نامیده میشود و طی آن، یک شبکه عصبی مکررا ایمیل شما را میخواند و برای ایمیل شما سه پاسخ بالقوه در نظر میگیرد و به شما نمایش میدهد تا بتوانید از آنها برای پاسخ سریع استفاده کنید. شما یکی را انتخاب میکنید و ایمیل ارسال میشود.
نکته مورد بحث این است که در واقع هیچ شخصی در گوگل ایمیلهای شما را نمی خواند! چرا که نگرانیها درباره حفظ حریم شخصی از سوی گوگل قابل درک است. موضوع این است که اطلاعات مربوط به انتخاب شما برای مدل جهانی ارسال میشود. این ارسال باعث میشود این مدل بتواند چگونه پاسخ دادن را یاد بگیرد.
سرویس Smart Reply یا پاسخ هوشمند همچنین به ما نشان میدهد که چگونه محصولات یادگیری ماشین در گوگل ساخته میشوند. تیم Inbox این ویژگی را در صندوق دریافت نامه جیمیل به کار گرفتند تا برخی ایدههای درست و نادرست را به بوته آزمایش گذارند.
نگاهی به محصولات فعلی هوش مصنوعی در گوگل
از دستیارهای گوشیهای هوشمند گرفته تا شناسایی و ترجمه تصویر، هوش مصنوعی در گوگل تعداد بیشماری از قابلیتهای فناوری هوش مصنوعی و یادگیری ماشین را در برنامههای خود که روزانه توسط میلیونها نفر استفاده میشود، به کار گرفته است.
منبع: هوشیو