شماره اول خبرنامه هوش‌مصنوعی دومان

خبر نامه هوش‌مصنوعی دومان
خبر نامه هوش‌مصنوعی دومان

۱. رگولاتوری هوش‌مصنوعی در اتحادیه اروپا: به دنبال افزایش نگرانی‌ها درباره خطرات هوش‌مصنوعی، پارلمان اتحادیه اروپا پیش‌نویس قانون هوش‌مصنوعی موسوم به The AI Act را تصویب کرد. نوشتن این قانون از سال ۲۰۲۱ آغاز شده است و تا عملیاتی شدن آن چند سالی باقی مانده است. قانون The AI Act براساس سطح ریسک سیستم‌های مبتنی بر هوش‌مصنوعی را به چهار دسته تقسیم می‌کند.

۲. معرفی دستاوردهای جدید Meta AI: اگر چه مدل زبانی LLaMA که توسط متا (فیس‌بوک سابق) معرفی شد در سایه GPT4 و Bard توجه چندانی را به خود جلب نکرد ولی در روزهای اخیر با کاسته شدن از تب‌و‌تاب مدل‌های بزرگ زبانی، متا از فرصت‌های مختلف برای معرفی دستاوردهای خود استفاده کرده است. در این مقاله تعدادی از دستاوردهای جدید زیرمجموعه تحقیقاتی متا در حوزه‌ هوش‌مصنوعی (با نام Meta AI) معرفی می‌شود.

۳. لندن به دنبال ایفای نقش در هیاهوی هوش‌مصنوعی: اخیرا بازگشایی اولین دفتر OpenAI خارج از خاک آمریکا در لندن اعلان شد. با این خبر OpenAI در کنار سایر شرکت‌های به نام نظیر Deepmind و Meta AI در فهرست شرکت‌های فعال هوش‌مصنوعی در لندن قرار گرفت. لندن همواره یکی از مراکز بزرگ اقتصادی دنیا بوده است. در حال حاضر نیز به نظر می‌رسد سیاست‌مداران انگلیس اهمیت موضوع را به خوبی دانسته و می‌خواهند آینده این کشور را با هوش‌مصنوعی پیوند بزنند. دولت انگلستان تنها به جذب سرمایه و استعداد اکتفا نکرده بلکه اهداف بزرگ‌تری را در سر می‌پروراند.

۴. شبکه‌های GAN چگونه برای تولید تصویر به‌کار می‌روند؟ این روزها با داغ شدن پیشرفت‌های هوش‌مصنوعی یکی از سرگرمی‌های مورد توجه تولید تصاویر جعلی است. روش‌های مختلفی برای پیاده‌سازی سرویس‌های مولد تصویر ارائه شده است. یکی از این روش‌های رایج شبکه‌ GAN نام دارد. در این مقاله ساختار شبکه GAN بررسی شده است. همچنین در انتهای آن محتوای آموزشی بیشتر درباره GAN و نحوه پیاده‌سازی آن با Pytorch و Tensorflow معرفی می‌شود.

۵. گوگل DeepMind را برای رقابت با ChatGPT به میدان می‌فرستد: اخیراً Demis Hassabis مدیرعامل DeepMind اعلام کرد که این شرکت به زودی مدل LLM جدیدی به نام Gemini را منتشر می‌کند. این مدل با ChatGPT رقابت کرده و حتی از آن برتری خواهد داشت. طبق این خبر Gemini علاوه‌بر تحلیل متن توانایی حل مساله را نیز دارد. به نظر می‌رسد مدیران گوگل رضایت کافی از انتشار چت‌بات Bard را نداشته‌ و می‌خواهند با ایده جدید وارد میدان رقابت شوند. به گفته Demis Hassabis استفاده از یادگیری تقویتی در Gemini منجر به بهبود این مدل در اجرای دستوراتی شده است که مدل‌های معمولی LLM در اجرای آن به چالش می‌خورند.

۶. سورس کد مدل DragGAN منتشر شد: این مدل با استفاده از شبکه GAN امکان دست‌کاری تصویر را فراهم می‌سازد. به عنوان مثال با استفاده از آن می‌توان دهان گربه را در عکس باز کرد و یا می‌توان زاویه تصویر نسبت به یک شی را تغییر داد. برای جزئیات بیشتر به این مقاله و برای بررسی سورس کد آن به این لینک مراجعه کنید.

۷. گوگل نتایج مدلی به نام AudioPaLM را منتشر کرد: این مدل توانایی صحبت کردن و شنیدن را دارد! به عبارت دیگر این مدل می‌تواند متن و یا صوت را به عنوان ورودی دریافت کرده و خروجی متنی یا صوتی ارایه دهد. برای جزئیات بیشتر و دیدن نتایج به این لینک مراجعه کنید.


اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. همچنین از طریق این لینک می‌توانید در کانال تلگرام این خبرنامه عضو شوید.