بنجیو و تیمش چارچوب تعیین معیار GNN را معرفی می‌کنند.


منتشرشده در: مجله Syncedreview به تاریخ ۵ مارچ ۲۰۲۰
نویسنده: Fangyu Cai
لینک مقاله اصلی:https://medium.com/syncedreview/yoshua-bengio-and-team-introduce-gnn-benchmarking-framework-64553de9de54


یک مطالعه جدید یک چارچوب گراف شبکه عصبی (GNN) تکرارپذیر را برای مطالعه و کمی کردن تاثیر پیشرفت‌های نظری GNNها معرفی می‌کند. در زمینه تجزیه و تحلیل و یادگیری از داده‌های روی گراف، GNNها به یک ابزار ضروری تبدیل شده‌اند. با برنامه‌های امیدوار کننده در حوزه‌های مختلف مانند شیمی، فیزیک، علوم اجتماعی، نمودارهای دانش، توصیه، و علوم اعصاب، چگونگی مطالعه و ساخت GNNهای قوی‌تر یک موضوع داغ است.

بدون یک معیار استاندارد، حتی تعریف آنچه یک GNN "قدرتمند" می‌سازد دشوار است. در مقاله تعیین معیار شبکه‌های عصبی گراف، محققان یک چارچوب تعیین معیار GNN انعطاف‌پذیر پیشنهاد کرده‌اند که می‌تواند نیازهای محققان برای اضافه کردن مجموعه داده‌ها و مدل‌های جدید را نیز برآورده کند. این تیم شامل یوشع بنجیو و محققان از دانشگاه فنی نانیانگ، دانشگاه لویولا مری‌مونت، مایلا، دانشگاه مونترال و CIFAR است.

طراحی یک معیار منصفانه در ابتدا نیازمند تعریف مجموعه داده‌های نماینده، واقع گرایانه و مقیاس بزرگ است. محققان مجموعه داده‌های CORA و TU محبوب را رد کردند. پروفسور خاویر برسون، یکی از نویسندگان، توضیح داد: «هدف ما شناسایی روندها و بلوک‌های ساختمانی خوب برای GNN ها بود.» چنین تحلیلی با مجموعه داده‌های CORA و TU کوچک امکان پذیر نبود (تمام GNN ها همانند NNهای غیرگراف عمل می‌کنند) اگرچه بیشتر کارهای منتشر شده قبلی بر مجموعه داده‌های کوچک متمرکز شده‌اند - CORA و TU تنها چند صد نمودار دارند - اجتناب‌ناپذیر بود که محققان با محدودیت‌هایی در این مورد مواجه شوند.

محققان مجموعه‌ای از مجموعه داده‌های مقیاس متوسط با ۱۲ تا ۷۰ هزار گراف با اندازه متغیر ۹ - ۵۰۰ گره از مدلسازی ریاضی (مدل‌های بلوک تصادفی)، دید کامپیوتری (ابر پیکسل)، بهینه‌سازی ترکیبی (مساله فروشنده دوره‌گرد) و شیمی (حلالیت مولکول‌ها) را برای بررسی معماری‌های مختلف GNN برای تفاوت‌های واضح و از نظر آماری معنی‌دار در هنگام مقایسه عملکرد پیشنهاد در نظر گرفتند.

مساله دیگر در مجموعه داده‌های کوچک بیش‌برازش است. مجموعه داده‌های کوچک زمانی مفید هستند که محققان ایده‌های جدید را توسعه می‌دهند، اما در دراز مدت طراحی و توسعه مدل‌های GNNهای بالغ و پیشرفته تنها مشکل برازش بیش از حد را بدتر خواهد کرد. مجموعه داده‌های کوچک نیز می‌توانند دلیل عدم تکرارپذیری نتایج تجربی باشند. بدون تنظیمات آزمایشی استاندارد مانند توافق بر سر آموزش، اعتبار سنجی و جداسازی تست و پروتکل‌های ارزیابی، مقایسه عملکرد معماری GNNهای جدید ناعادلانه خواهد بود.

در این مطالعه، محققان آزمایش‌ها عددی را با محک‌زنی منبع باز پیشنهادی گره چارچوب، یال، طبقه‌بندی گراف و رگرسیون گراف انجام دادند. در تجزیه و تحلیل طبقه‌بندی گراف با مجموعه داده‌های TU و طبقه‌بندی گراف با مجموعه داده‌های SuperPixel، محققان به این نتیجه رسیدند که NN های گراف - ندانم‌گرا نیز همانند GNNها در مجموعه داده‌های کوچک عمل می‌کنند. علاوه بر این، آزمایش رگرسیون گراف با مجموعه داده مولکولی ZINC نشان داد، برسون اظهار داشت: «همانطور که انتظار می‌رفت، NN گراف برای مجموعه داده‌های بزرگ‌تر بهتر از NN های غیر گراف عمل می‌کند … هیچ چیز جدید و روشن‌تری وجود ندارد، اما نشان دادن تجربی آن مهم بود.»

همچنین آزمایش‌ها عددی نشان دادند که اتصالات مانده عملکرد را بهبود می‌بخشند و یک بلوک ساختمان مهم برای طراحی GNNهای عمیق هستند. با بررسی نتایج GNNهای عمیق برای گراف‌های مجموعه آزمایش ZINC، CLUSTER و TSP، محققان مشاهده کردند که وقتی تعداد لایه‌ها عملکرد همه مدل‌ها به جز GIN را افزایش می‌دهد. آن‌ها همچنین نتیجه گرفتند که «کانولوشن گراف، انتشار ناهمسان‌گرد، اتصالات مانده و لایه‌های نرمال سازی بلوک‌های سازنده جهانی برای توسعه GNP های قوی و مقیاس پذیر هستند.»


تیم تحقیقاتی زیر ساخت معیار باز برای ارزیابی GNNها در گیت‌هاب را براساس PyTorch و DGL منتشر کرده‌است.


این مقاله توسط مترجم تخصصی هوش مصنوعی و به صورت خودکار ترجمه شده و با حداقل ویرایش و بازبینی انسانی منتشر شده است.