علیرضا مدنی·۶ ماه پیشردیابی افکار مدل زبان بزرگ LLMپژوهشگران Anthropic متوجه شدند مدلهای زبانی بزرگ فقط کلمه بعدی را پیشبینی نمیکنند بلکه مثل مغز انسان استراتژی و الگوی فکری را میسازند.
علیرضا مدنی·۲ سال پیشآموزش بهینه از لحاظ محاسباتی در مدلهای زبان بزرگ (Chinchilla)در این پست به بررسی مقاله Training Compute-Optimal Large Language Models می پردازیم. این مقاله به بررسی اندازهی بهینه مدل و تعداد توکنها…
علیرضا مدنی·۲ سال پیشChronos: جدیدترین مدل پیشبینی سری زمانی توسط آمازونحوزه پیشبینی سریهای زمانی اخیراً با پیشرفتهای زیادی در زمینه مدلهای بنیادی پیشبینی همراه بوده است.این حرکت با انتشار مدل TimeGPT در اک…
علیرضا مدنی·۲ سال پیشتولید تصویر در مدلهای Stable Diffusion (بخش دوم)تولید تصویر با هوش مصنوعی با استفاده از مدل پخش پایدار Stable Diffusion نقطه عطف مهمی است که مدلی با کیفیت تصویر بالا در دسترس قرار داد.
علیرضا مدنی·۲ سال پیشتولید تصویر در مدلهای Stable Diffusion (بخش اول)تولید تصویر با هوش مصنوعی با استفاده از مدل پخش پایدار Stable Diffusion نقطه عطف مهمی است که مدلی با کیفیت تصویر بالا در دسترس قرار داد.
علیرضا مدنی·۲ سال پیشالگوهای عاطفی در داستاننویسیمحققان دانشگاه آدلاید با پردازش بیش از ۱۳۰۰ رمان، ۶ الگوی تکراری را در داستانگویی شناسایی کردند.این الگوها عبارتند از:
علیرضا مدنی·۲ سال پیشسیستم رتبهبندی بیزیفراتر از محاسبهی احتمال برنده شدن در لاتاری یا پیشبینی میزان احتمال ابتلا به بیماری، کاربردهای دیگری هم برای قضیهی بیز وجود داره. یه نمو…
علیرضا مدنی·۲ سال پیشپیشبینیهای هیجانانگیز هوش مصنوعی برای سال 2024سال 2023 سال پررونقی برای هوش مصنوعی بود. پیشبینی کردن آینده همیشه خطرناکه، ولی خب، یه تلاشی بکنیم
علیرضا مدنی·۲ سال پیشمدل جدید FunSearch :DeepMind برای کشف الگوریتم های جدیدFunSearch یک روش هوشمندانه برای کشف الگوریتمهای جدید با ترکیب روشهای تکاملی با مدلهای زبان بزرگ (LLM) در ریاضیات و علوم کامپیوتر است.
علیرضا مدنی·۲ سال پیش(RAG)retrieval-augmented generation چیست؟RAG یک چارچوب هوش مصنوعی است که مدلهای زبان بزرگ (LLM) را قادر میسازد تا اطلاعات دقیق و بهروز را از منابع دانش خارجی بازیابی کنند