رویا کوسه لو·۱ ماه پیشیادگیری تقویتی از بازخورد انسانی (RLHF): مغز دوم ChatGPTدر دنیای هوش مصنوعی، ChatGPT نه تنها یک مدل زبانی قدرتمند است، بلکه نتیجهای از ترکیب هوشمندانه دادههای عظیم، الگوریتمهای پیشرفته و بازخو…
رویا کوسه لو·۱ ماه پیشرازهای پشتصحنه ChatGPT؛ چگونه با یادگیری از انسانها یاد میگیرد؟در چند سال گذشته، ChatGPT یکی از شگفتیهای دنیای فناوری شده است — ابزاری که میتواند با شما گفتوگو کند، مقاله بنویسد، کدنویسی کند و حتی ای…
سعید غلامحسینی·۲ ماه پیشوقتی فهمیدم تریدرِ واقعی شاید یه انسان نباشه…از اون لحظه فهمیدم دادهها هم میتونن فکر کنن. از همونجا سفری شروع شد بین ترید، هوش مصنوعی و یادگیری.سالها معامله میکردم.با چارت، کندل،…
سعید غلامحسینی·۲ ماه پیش🤖 تریدو چطور از اشتباهات خودش درس میگیره؟جایی که یادگیری واقعی شروع میشه...🧩 یه نگاه کوتاه به مسیرمون تا اینجاقبل از اینکه بریم سراغ امروز، یه مرور کوتاه کنیم 👇📘 مقاله ۱: هوش م…
حمیدرضا مازندرانی·۳ ماه پیشیادگیری تقویتی، راهی به سوی هوش مصنوعی جامع؟یادگیری تقویتی در چند دهه گذشته راه پرفرازونشیبی را پیموده است، راهی که امروز هموارتر و چشمنوازتر از گذشته به نظر میرسد. اما این راه به ک…
Mohammad Shojaei·۶ ماه پیشچگونه هوش مصنوعی یاد میگیرد اشتباهات خود را اصلاح کندتحلیل و بررسی مقاله «بازاندیشی، تلاش مجدد، پاداش: خودبهبودی مدلهای زبانی بزرگ از طریق یادگیری تقویتی»(Reflect, Retry, Reward: Self-Improvi…
نشریه پلاک ۰۱·۷ ماه پیشDeepSeek R1 در یک نگاهمدلهای R1-Zero و R1 نسل اول مدلهای استدلالی شرکت DeepSeek هستند که در واقع برای رسیدن به قابلیتهای استدلالی پیشرفته، از روشهای خاصی در…
پیمان محمدی·۱۰ ماه پیشنقشه راه یادگیری هوش مصنوعی در شاخههای مختلفهوش مصنوعی (AI) به شاخههای متنوعی تقسیم میشود که هر یک مسیر یادگیری مخصوص به خود را دارند. در اینجا، نقشه راه کامل را یاد میگیرید
داده پردازان ارتباط گستر ویونا·۱ سال پیشکاربردها و چالشهای یادگیری تقویتییادگیریتقویتی (reinforcement learning) - بخش سوم
داده پردازان ارتباط گستر ویونا·۱ سال پیشیادگیریتقویتی (reinforcement learning) - بخش دومتوی این مطلب یادگیری تقویتی رو یاد میگیریم.