
با توجه به نتایج ارزیابیهای انجامشده، هوش مصنوعی Tülu 3 در 10 معیار مختلف مرتبط با ایمنی و دقت، عملکرد بسیار خوبی داشته است. این مدل به طور میانگین امتیاز 80.7 را به دست آورده که از امتیاز 75.9 برای DeepSeek v3 بیشتر است و اختلاف کمی با امتیاز 81.6 مربوط به GPT-4o دارد. این نشان میدهد که مدل جدید Ai2 به یکی از رقابتیترین گزینهها در بین مدلهای هوش مصنوعی متنباز تبدیل شده است.
در حالی که مدلهای دیگری مانند DeepSeek v3 و Llama 3.1 نیز بهعنوان مدلهای متنباز معرفی شدهاند، تفاوت اصلی هوش مصنوعی Tülu 3 در سطح شفافیت و میزان دسترسی کاربران به دادههای آموزشی و کدهای زیربنایی آن است. برخلاف برخی دیگر از مدلهای متنباز که تنها کد مدل یا وزنهای از پیش آموزشدیده را ارائه میکنند، Ai2 تمام کدها، دادههای آموزشی و ابزارهای مربوط به آموزش مدل را در دسترس عموم قرار داده است.