علیرضا مدنی·۸ ماه پیشآموزش بهینه از لحاظ محاسباتی در مدلهای زبان بزرگ (Chinchilla)در این پست به بررسی مقاله Training Compute-Optimal Large Language Models می پردازیم. این مقاله به بررسی اندازهی بهینه مدل و تعداد توکنها…
علیرضا مدنی·۹ ماه پیشChronos: جدیدترین مدل پیشبینی سری زمانی توسط آمازونحوزه پیشبینی سریهای زمانی اخیراً با پیشرفتهای زیادی در زمینه مدلهای بنیادی پیشبینی همراه بوده است.این حرکت با انتشار مدل TimeGPT در اک…
علیرضا مدنی·۱۰ ماه پیشتولید تصویر در مدلهای Stable Diffusion (بخش دوم)تولید تصویر با هوش مصنوعی با استفاده از مدل پخش پایدار Stable Diffusion نقطه عطف مهمی است که مدلی با کیفیت تصویر بالا در دسترس قرار داد.
علیرضا مدنی·۱۰ ماه پیشتولید تصویر در مدلهای Stable Diffusion (بخش اول)تولید تصویر با هوش مصنوعی با استفاده از مدل پخش پایدار Stable Diffusion نقطه عطف مهمی است که مدلی با کیفیت تصویر بالا در دسترس قرار داد.
علیرضا مدنی·۱ سال پیشالگوهای عاطفی در داستاننویسیمحققان دانشگاه آدلاید با پردازش بیش از ۱۳۰۰ رمان، ۶ الگوی تکراری را در داستانگویی شناسایی کردند.این الگوها عبارتند از:
علیرضا مدنی·۱ سال پیشسیستم رتبهبندی بیزیفراتر از محاسبهی احتمال برنده شدن در لاتاری یا پیشبینی میزان احتمال ابتلا به بیماری، کاربردهای دیگری هم برای قضیهی بیز وجود داره. یه نمو…
علیرضا مدنی·۱ سال پیشپیشبینیهای هیجانانگیز هوش مصنوعی برای سال 2024سال 2023 سال پررونقی برای هوش مصنوعی بود. پیشبینی کردن آینده همیشه خطرناکه، ولی خب، یه تلاشی بکنیم
علیرضا مدنی·۱ سال پیشمدل جدید FunSearch :DeepMind برای کشف الگوریتم های جدیدFunSearch یک روش هوشمندانه برای کشف الگوریتمهای جدید با ترکیب روشهای تکاملی با مدلهای زبان بزرگ (LLM) در ریاضیات و علوم کامپیوتر است.
علیرضا مدنی·۱ سال پیش(RAG)retrieval-augmented generation چیست؟RAG یک چارچوب هوش مصنوعی است که مدلهای زبان بزرگ (LLM) را قادر میسازد تا اطلاعات دقیق و بهروز را از منابع دانش خارجی بازیابی کنند
علیرضا مدنی·۱ سال پیشترکیب متخصصان Mixture of Expertsترکیب متخصصان Mixture of Experts یا MoEs مدل جدید llm در پردازش زبان طبیعی nlp هستند که از چندین مدل کوچکتر برای انجام پردازش استفاده می کن…