متا و مایکروسافت Llama 2، یک LLM منبع باز را برای استفاده تحقیقاتی و تجاری برای عموم منتشر کردند. Llama 2 یک مدل زبان رگرسیون خودکار است که از معماری ترانسفورماتور بهینه شده استفاده می کند. نسخههای تنظیمشده از تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) استفاده میکنند تا با اولویتهای انسان برای مفید بودن و ایمنی هماهنگ شوند. بر روی 2 تریلیون داده از منابع عمومی در دسترس از قبل آموزش داده شده است. مقادیر Model Parallel (MP) در حالی که مدل در حال ساخت است تنظیم میشود. مدل 13B به 2، GPU نیاز دارد. این مدل در واقع بین دو مدل 7B و 70B است. اگر نیاز به انجام کاری دارید که به دقت بالایی نیاز دارد، مانند ترجمه اسناد قانونی یا تهیه گزارش های پزشکی، ممکن است بخواهید از یک مدل بزرگتر استفاده کنید.