نشریه پلاک ۰۱·۷ ماه پیشDeepSeek R1 در یک نگاهمدلهای R1-Zero و R1 نسل اول مدلهای استدلالی شرکت DeepSeek هستند که در واقع برای رسیدن به قابلیتهای استدلالی پیشرفته، از روشهای خاصی در…
Matin Mohamadi | متین محمدی + منفرد·۷ ماه پیشپشت صحنه LLM هایکی از دوستانم که اصلاً تو خط تکنولوژی نیست، ازم میپرسید ChatGPT چطوری کار میکنه. منم سعی کردم یه توضیح ساده و سریع بدم. گفتم اینجا هم بذ…
داده پردازان ارتباط گستر ویونا·۱ سال پیشکاربردها و چالشهای یادگیری تقویتییادگیریتقویتی (reinforcement learning) - بخش سوم
داده پردازان ارتباط گستر ویونا·۱ سال پیشیادگیریتقویتی (reinforcement learning) - بخش دومتوی این مطلب یادگیری تقویتی رو یاد میگیریم.
داده پردازان ارتباط گستر ویونا·۱ سال پیشیادگیری تقویتی - بخش اولیادگیری تقویتی روشی در یادگیری ماشین است که عاملها از طریق پاداش و جریمه، بهترین تصمیمها را برای رسیدن به اهداف یاد میگیرند.
مصطفی جعفرزاده·۱ سال پیشBuild Your Own Chatbot: Reinforcement Learning and Professional Security in AI ProjectsIntroduction:In the current era, artificial intelligence (AI) has become an integral part of advanced systems. From customer services to da…
احسان عزیزی·۱ سال پیشیادگیری تقویتی یا Reinforcement Learning چیست ؟در چشمانداز همیشه در حال تکامل هوش مصنوعی، یادگیری تقویتی (RL) بهعنوان یک رویکرد پیشگامانه ظهور کرده است که ماشینها را قادر میکند ازطری…
محمدمهدی آقاجانیدرoverfit.ir·۳ سال پیشهوش مصنوعی با فیدبکهای واقعی!در این نوشته قصد داریم قلب چت جی پی تی یعنی روش آموزش اون رو توضیح بدیم...
سینا مرادی·۳ سال پیشمدل هوشمصنوعی ChatGPT چیست؟ آیا انقلابی جدید در راه است؟رونمایی از مدل جدید شرکت OpenAI واکنشهای بسیاری در پی داشت و برخی آنرا به انقلابی تشبیه کردند. با من همراه باشید تا آن را بررسی کنیم...