در دهلیزهای سیلیکونولی، جایی که ایدهها به سرعت نور متولد میشوند و میمیرند، زمزمههایی به گوش میرسید. زمزمههایی از یک نیروی جدید، یک موج عظیم که در حال شکلگیری بود و وعده دگرگونی تمام صنایع را میداد: هوش مصنوعی. این زمزمهها، مانند بادهایی که قبل از طوفان میوزند، خبر از یک تغییر پارادایم میدادند. تغییری که میتوانست امپراتوریهای تکنولوژی را به لرزه درآورد و سلسلههای جدیدی را بر تخت بنشاند. در این میان، نام یک شرکت بیش از همه شنیده میشد: انویدیا.
انویدیا که زمانی بیشتر به خاطر کارتهای گرافیک قدرتمندش برای گیمرها شناخته میشد، حالا به یک نام مقدس در میان محققان هوش مصنوعی تبدیل شده بود. بنیانگذار و مدیرعامل کاریزماتیک آن، جنسن هوانگ، با چشمانی که برق آینده را در خود داشت، سالها پیش مسیر شرکت را به سمت پردازش موازی هدایت کرده بود. این یک قمار جسورانه بود. در حالی که غولهای صنعت نیمههادی، مانند اینتل، همچنان بر پردازندههای مرکزی (CPU) متمرکز بودند، انویدیا به قدرت نهفته در واحدهای پردازش گرافیکی (GPU) ایمان آورده بود.
هوانگ معتقد بود که GPU ها، با توانایی انجام هزاران عملیات همزمان، میتوانند کلید گشایش قفل پتانسیل هوش مصنوعی باشند. این بینش، در ابتدا با تردیدهایی مواجه شد. بسیاری معتقد بودند که GPU ها فقط برای بازیهای کامپیوتری مناسب هستند و نمیتوانند در محاسبات پیچیده هوش مصنوعی، نقشی ایفا کنند؛ اما هوانگ، با پشتکار و ایمان به چشمانداز خود، به توسعه معماری CUDA پرداخت. CUDA، پلتفرمی بود که به برنامهنویسان اجازه میداد از قدرت GPU ها برای کاربردهایی فراتر از گرافیک استفاده کنند.
با ظهور یادگیری عمیق و شبکههای عصبی پیچیده، ورق برگشت. مدلهای زبانی بزرگ (LLM) که میتوانستند متن تولید کنند، تصاویر را تشخیص دهند و حتی به زبانهای مختلف ترجمه کنند، به شدت به قدرت پردازشی GPUها وابسته بودند. ناگهان، انویدیا در مرکز یک انقلاب تکنولوژیک قرار گرفت. سهام این شرکت، سر به فلک کشید. سرمایهگذاران، هجوم آوردند تا در این موج صعودی سهیم باشند. انویدیا، به نماد عصر هوش مصنوعی تبدیل شده بود.
فصل دوم: اژدهای خفته بیدار میشود
در آن سوی دنیا، در سرزمین اژدها، چین، یک شرکت نوپا به نام دیپسیک (DeepSeek)، با بلندپروازیهایی به همان اندازه بزرگ، در حال شکلگیری بود. دیپسیک، مانند بسیاری از شرکتهای فعال در حوزه هوش مصنوعی، در ابتدا به شدت به سختافزار انویدیا متکی بود. GPUهای قدرتمند انویدیا، قلب تپنده مدلهای زبانی دیپسیک بودند؛ اما دیپسیک، با یک چالش غیرمنتظره روبرو شد: تحریمهای ایالات متحده.
دولت آمریکا، با هدف محدود کردن دسترسی چین به فناوریهای پیشرفته، صادرات GPUهای پیشرفته انویدیا به چین را ممنوع کرد. این یک ضربه سنگین برای دیپسیک بود. به نظر میرسید که رویای آنها برای رقابت در لیگ برتر هوش مصنوعی، در حال نابودی است؛ اما این محدودیت، جرقهای برای یک نوآوری بزرگ شد.
مدیران دیپسیک، در یک نشست اضطراری، به دنبال راه حلی برای برونرفت از این بحران بودند. آنها نمیتوانستند به سختافزار انویدیا دسترسی داشته باشند، اما میدانستند که هوش مصنوعی، فقط به سختافزار محدود نمیشود. یکی از مهندسان جوان، با صدایی لرزان، ایدهای را مطرح کرد: «اگر نتوانیم به سختافزار قویتر دسترسی پیدا کنیم، باید نرمافزار خودمان را قویتر کنیم.»
این ایده، در ابتدا با تردیدهایی مواجه شد. آیا واقعاً ممکن بود با بهینهسازی نرمافزار، کمبود سختافزار را جبران کرد؟ اما تیم دیپسیک، مصمم بود که این ایده را امتحان کند. آنها به جای تمرکز بر خرید GPUهای جدید، سرمایهگذاری هنگفتی در تحقیق و توسعه الگوریتمهای جدید کردند.
دیپسیک، به سراغ تکنیکی به نام Mixture of Experts (MoE) رفت. MoE، یک رویکرد هوشمندانه برای طراحی شبکههای عصبی بود. در این روش، به جای اینکه یک شبکه عصبی بزرگ و یکپارچه داشته باشیم، از چندین شبکه عصبی کوچکتر و تخصصیتر استفاده میشود. هر کدام از این شبکههای کوچک، در یک حوزه خاص تخصص دارند. یک «دروازهبان» هوشمند، وظیفه دارد که ورودیها را بررسی کند و آنها را به شبکه متخصص مربوطه هدایت کند.
این رویکرد، مزایای زیادی داشت. اول اینکه، باعث میشد که فقط بخشهای لازم از شبکه عصبی، در هر لحظه فعال باشند. این امر، به طور چشمگیری مصرف انرژی و زمان پردازش را کاهش میداد. دوم اینکه، MoE اجازه میداد که شبکههای عصبی، بسیار بزرگتر و پیچیدهتر شوند، بدون اینکه به سختافزار فوقالعاده قدرتمندی نیاز داشته باشند.
دیپسیک، ماهها به طور شبانهروزی بر روی توسعه مدلهای زبانی مبتنی بر MoE کار کرد. آنها از GPUهای قدیمیتر و ارزانتر استفاده میکردند، اما با بهینهسازی الگوریتمها، توانستند به نتایجی شگفتانگیز دست یابند. مدلهای زبانی دیپسیک، نه تنها با مدلهای مبتنی بر سختافزار انویدیا رقابت میکردند، بلکه در برخی موارد، حتی از آنها پیشی میگرفتند.
این یک پیروزی بزرگ برای دیپسیک بود. آنها نشان داده بودند که نوآوری نرمافزاری، میتواند معادلات را در دنیای هوش مصنوعی تغییر دهد؛ اما این تازه آغاز ماجرا بود. انویدیا که حالا با یک رقیب جدی و غیرمنتظره روبرو شده بود، نمیتوانست ساکت بنشیند.
موفقیت دیپسیک، زنگ خطر را برای انویدیا به صدا درآورد. جنسن هوانگ که به تیزهوشی و رقابتجویی معروف بود، به سرعت واکنش نشان داد. انویدیا، سرمایهگذاری در تحقیق و توسعه نرمافزار را افزایش داد و به دنبال راههایی برای بهینهسازی الگوریتمهای خود بود.
نبرد بین انویدیا و دیپسیک، به یک جنگ تمامعیار تبدیل شد. هر دو شرکت، به طور مداوم مدلهای زبانی جدیدی را معرفی میکردند که ادعا میکردند از رقیب برتر هستند. این رقابت، باعث پیشرفت سریعتر فناوری هوش مصنوعی شد؛ اما این نبرد، فراتر از رقابت بین دو شرکت بود. این یک نبرد بین دو فلسفه بود: فلسفه سختافزارمحور انویدیا و فلسفه نرمافزارمحور دیپسیک.
درسهایی برای عصر جدید
داستان نبرد انویدیا و دیپسیک، درسهای ارزشمندی برای عصر هوش مصنوعی دارد. این داستان نشان میدهد که:
نبرد بین انویدیا و دیپسیک، هنوز به پایان نرسیده است. این دو غول تکنولوژی، همچنان در حال رقابت برای تسلط بر بازار هوش مصنوعی هستند؛ اما این داستان، یک چیز را به وضوح نشان میدهد: آینده هوش مصنوعی، غیرقابل پیشبینی است. در این دنیای پرشتاب، هیچ شرکتی نمیتواند به موفقیتهای گذشته خود تکیه کند. تنها راه بقا، نوآوری مستمر و انطباق با تغییرات است.
این نبرد، یادآور داستان داوود و جالوت است. دیپسیک، مانند داوود، با سلاحهای غیرمتعارف (نوآوری نرمافزاری) به جنگ جالوت (انویدیا) رفت؛ اما آیا داوود میتواند جالوت را شکست دهد؟ این سوالی است که آینده به آن پاسخ خواهد داد.