MindMover.Academy
MindMover.Academy
خواندن ۶ دقیقه·۳ سال پیش

9 پایان نامه یادگیری ماشین در مقطع دکترا

هدف از تحقیقات انجام شده در این پایان نامه ها ، کشف و توسعه تکنیک های دقیق و قابل سنجش و یادگیری ماشینی برای تحقیقات و زمینه های مختلف است. در ادامه به 9پایان نامه با استفاده از الگوهای مختلف یادگیری ماشین می پردازیم.

Fitting Convex Sets to Data: Algorithms and Applications

این پایان نامه یادگیری ماشین مربوط به مشکل هندسی یافتن یک مجموعه محدب است که بیشترین تطابق را با مجموعه داده داده شده دارد. سوال جامع برای تحلیل داده ها که در طیف وسیعی از کاربردهای علمی و مهندسی با تمرکز بر دو مورد خاص ایجاد می شود ، عمل می کند:

(1) یک چالش کلیدی که در حل مشکلات معکوس بوجود می آید، بد بودن به دلیل عدم وجود اندازه گیری است. روشهای برجسته ای برای پرداختن به چنین مسائلی مبتنی بر  بهینه سازی با یک تابع محدب است تا ساختار مورد نظر را در راه حل القا کند. این توابع معمولاً با استفاده از دانش قبلی در مورد داده ها انتخاب می شوند. این پایان نامه همچنین مشکل یادگیری توابع محدب را مستقیماً از داده ها می گیرد که در آن ما تخصص کافی برای انتخاب تابع پنالتی نداریم. راه حل بر این است که مشکل یادگیری عملکرد پنالتی را به یک کار مناسب تبدیل کند.

(ii) مشکل برازش مجموعه های محدب توصیف شده با توجه به مقدار بهینه عملکردهای خطی که در جهات مختلف ارزیابی شده اند

Sampling for Streaming Data

پیشرفت در فناوری اکتساب داده ها، تجزیه و تحلیل حجم زیادی از داده های جریان (streaming data) را با چالش مواجه می کند. نمونه گیری یک ابزار طبیعی و در عین حال قدرتمند برای تجزیه و تحلیل چنین مجموعه داده هایی به دلیل دقت برآورد مناسب و هزینه محاسباتی پایین است. متأسفانه، روشهای نمونه گیری و ویژگیهای آماری آنها برای جریان داده ها (time series data)، به ویژه جریانهای سری زمانی ، به خوبی مطالعه نشده است. در همین حال، برآورد ساختار وابستگی داده های سری زمانی جریان چند بعدی در زمان واقعی چالش برانگیز است. با حجم زیادی از داده های جریان، مشکل وقتی پیچیده تر می شود که داده های چند بعدی به صورت ناهموار در گره های توزیع شده جمع آوری شوند، که ما را محبور می کند تا از داده های نماینده از جریانها نمونه برداری کنیم. این پایان نامه یادگیری ماشین مجموعه ای از روش های نمونه گیری مبتنی بر امتیاز را برای جریان داده های سری های زمانی ارائه می دهد. مطالعات شبیه سازی و تجزیه و تحلیل داده های واقعی برای اعتبار سنجی روش های پیشنهادی انجام می شود. تجزیه و تحلیل نظری رفتارهای مجانبی برآورد کننده حداقل مربعات بر اساس نمونه های فرعی توسعه یافته است.

Model Selection and Estimation for High-dimensional Data Analysis

هدف این پایان نامه توسعه روش های آماری قابل تکرار است که توضیحات مکانیکی پدیده مشاهده شده در تجزیه و تحلیل داده های بزرگ را ارائه می دهد. این تحقیق شامل دو بخش است: انتخاب متغیر و برآورد مدل. بخش اول نحوه اندازه گیری و تفسیر مفید بودن یک متغیر ورودی با استفاده از رویکردی به نام “یادگیری اهمیت متغیر” را بررسی می کند و ابزارهایی (روش شناسی و نرم افزار) را ایجاد می کند که می تواند به طور گسترده مورد استفاده قرار گیرد. دو معیار اهمیت متغیر ، اندازه گیری پارامتری SOIL و اندازه گیری غیر پارامتری CVIL ، با استفاده از ایده  ترکیب مدل و cross-validation، پیشنهاد شده است.

بخش دوم بر چگونگی برآورد اثر یک متغیر ورودی در مواردی که تعامل دو متغیر ورودی وجود دارد ، تمرکز می کند. میزان حداقل همگرایی برای تخمین رگرسیون در مدلهای خطی پراکنده با ابعاد بالا با فعل و انفعالات دو طرفه مورد بررسی قرار گرفته و یک برآوردگر تطبیقی ​​ایجاد می کند که بدون در نظر گرفتن شرایط واقعی و شاخصهای پراکنده به حداقل همگرایی برسد.

Asymptotics and Interpretability of Decision Trees and Decision Tree Ensembles

درخت تصمیم (Decision tree) یک درخت دوتایی است که بصورت بازگشتی فضای متغیر را در امتداد جهت مختصات تقسیم می کند تا مستطیل های بزرگ را به عنوان واحدهای پیش بینی اولیه برای برازش مقادیر ثابت در هر یک از آنها ایجاد کند. مجموعه درخت تصمیم چندین درخت تصمیم را به صورت موازی یا متوالی ترکیب می کند تا انعطاف پذیری و دقت مدل را افزایش داده و واریانس پیش بینی را کاهش دهد.

این پایان نامه تجزیه و تحلیل در مورد مجانب درختی از دیدگاه گره های پایانی درخت ، مجموعه های درختی و مدل هایی که به ترتیب مجموعه های درختی را شامل می شوند ارائه می دهد. این مطالعه چند چارچوب یادگیری مرتبط با درخت را معرفی می کند که ضمانت ها و تفسیرهای آماری قابل اثبات را ارائه می دهد. مطالعه بر روی شاخص جینی (Gini index) مورد استفاده در الگوریتم درخت ، توزیع محدود آن را آشکار می کند و منجر به ایجاد یک آزمایش تقسیم بهتر می شود که به اندازه گیری بهینه نامشخص تقسیم درخت تصمیم کمک می کند.

Statistical approaches for spatial prediction and anomaly detection

این پایان نامه شرح سه پروژه است. در ابتدا با یک روش برای پیش بینی فضایی و برآورد پارامتر برای داده های نامنظم و non-Gaussian شروع می شود. با جایگزینی منطقی احتمال با یک احتمال تجربی در مدل سلسله مراتبی Bayesian ، می توان توزیع های تقریبی خلفی برای میانگین و پارامترهای کوواریانس را بدست آورد. با توجه به ماهیت پیچیده مدل سلسله مراتبی (hierarchical model)، روش های استاندارد زنجیره مارکوف مونت کارلو (Markov chain Monte Carlo) را نمی توان برای نمونه از توزیع های پسین استفاده کرد. برای غلبه بر این مسئله ، از یک الگوریتم متوالی کلی مونت کارلو استفاده شده است.

پروژه دوم بر تشخیص ناهنجاری داده های عملکردی (functional data) تمرکز می کند. با تقریب هر تابع به عنوان مجموع درجه پایین توابع پایه خطی ، ضرایب برای هر مبنا در هر تابع مقایسه می شود. ایده این است که اگر دو تابع مشابه باشند ، ضرایب مربوطه آنها نباید تفاوت قابل توجهی داشته باشد. این پروژه با استفاده از روش پیشنهادی برای تشخیص رفتارهای غیرعادی کاربران ابر رایانه در NREL به پایان می رسد.

روژه نهایی توسعه پروژه دوم به داده های دو بعدی است. این پروژه با هدف تشخیص مکان و ناهنجاری های زمانی از داده های حرکت زمین از یک کابل فیبر نوری با استفاده از سنجش آکوستیک توزیع شده (DAS) انجام می شود.

Structured Tensors and the Geometry of Data

این پایان نامه یادگیری ماشین داده ها را تجزیه و تحلیل می کند تا درک کمی از جهان ایجاد کند. جبر خطی پایه الگوریتم هایی است که قدمت آن برای استخراج ساختار از داده ها به صد سال پیش می رسد. فناوری های مدرن داده های متعددی را ارائه می دهد که در آن می توان متغیرها یا عوامل متعددی را به طور همزمان مقایسه کرد. برای سازماندهی و تجزیه و تحلیل چنین مجموعه داده هایی می توانیم از یک تنسور ، آنالوگ مرتبه بالاتر ماتریس استفاده کنیم. با این حال ، بسیاری از چالش های نظری و عملی در گسترش جبر خطی تا تنظیم تنسورها بوجود می آید. بخش اول پایان نامه به بررسی و توسعه نظریه جبری تنسورها می پردازد. بخش دوم پایان نامه سه الگوریتم برای داده های تنسور ارائه می دهد. الگوریتم ها از ساختار جبری و هندسی برای تضمین بهینه استفاده می کنند.

برای ادامه مطالب و دانلود منابع لطفا به صفحه آکادمی مراجعه نمایید.

https://mindmover.academy/machine-learning-for-phd/



machine learning
” هدف ما آموزش آنلاین تخصص های روز دنیا ویژه بازار کار٬ ارتقاء شغلی و کسب و کار با بهترین کیفیت و امکانات قابل دسترس است.”
شاید از این پست‌ها خوشتان بیاید