در دنیای پرشتاب هوش مصنوعی، هر روز شاهد معرفی مدلهای جدیدی هستیم که مرزهای تواناییهای ماشینها را جا به جا میکنند. یکی از تازهترین و بحث برانگیزترین این مدلها، هوش مصنوعی Llama 4 از شرکت متا است که با ویژگیهای منحصر به فرد خود، توجه بسیاری را به خود جلب کرده است.
معرفی هوش مصنوعی Llama 4: نسل جدید مدلهای زبانی متا
Llama 4 نسل جدید مدلهای زبانی توسعه یافته توسط شرکت Meta (فیسبوک سابق) است که در سال ۲۰۲۵ معرفی شد. این مدلها ادامه دهنده مسیر موفق سری Llama 2 هستند، اما با ارتقاء چشمگیر در دقت، توان پردازشی و ظرفیت پردازش متنهای طولانیتر. از جمله نسخههای Scout برای پردازش طولانی، Maverick برای مکالمه و برنامهنویسی، و نسخههای آزمایشی همچون Behemoth با دو تریلیون پارامتر که هنوز در حال آموزش هستند. Llama 4 بهویژه با بهره گیری از معماری نوآورانه MoE (Mixture of Experts)، موفق شده تعادلی میان قدرت و بهرهوری ایجاد کند.
یکی از ویژگیهای منحصر به فرد این نسل، استفاده از پنجره زمینه تا ۱۰ میلیون توکن است که امکان درک متون بسیار طولانی را فراهم میکند. همچنین متا با در دسترس قرار دادن مدلهای Llama 4 در پلتفرمهایی مانند WhatsApp، Instagram و Hugging Face، به دنبال تلفیق این هوش مصنوعی قدرتمند با زندگی روزمره کاربران و توسعه دهندگان است. هرچند که این مدلها با مجوزی نسبتا محدود منتشر شدهاند، اما همچنان نقش مهمی در آینده هوش مصنوعی مولد ایفا میکنند.
مدلهای اصلی هوش مصنوعی Llama 4 کدامند؟
Llama 4 Scout
این مدل با ۱۰۹ میلیارد پارامتر که با بهره گیری از پنجره زمینه ۱۰ میلیون توکنی، توانایی پردازش متون طولانی را دارد. هوش مصنوعی Llama 4 با استفاده از معماری MoE (Mixture of Experts) طراحی شده است.
Llama 4 Maverick
مدلی با ۴۰۰ میلیارد پارامتر که در زمینههای استدلال و کدنویسی عملکردی در سطح مدلهای پیشرفتهای مانند GPT-4o دارد. این مدل نیز از معماری MoE بهره میبرد و در بنچمارکهای مختلف، نتایج قابلتوجهی کسب کرده است.
Llama 4 Behemoth
این مدل هوش مصنوعی Llama 4 با ۲ تریلیون پارامتر که هنوز در مرحله آموزش قرار دارد. متا ادعا میکند این مدل در بنچمارکهای حوزه STEM از رقبایی مانند GPT-4.5 پیشی میگیرد.
- دوشنبه ۱۷ شهریور ۰۴ ۱۴:۵۴ ۱ بازديد
- ۰ ۰
- ۰ نظر