Llama 2 13B

انتشار محتوا: ۱۹ آبان ۱۴۰۲ ساعت ۱۰:۳۴:۵۶ قبل از ظهر

متا و مایکروسافت Llama 2، یک LLM منبع باز را برای استفاده تحقیقاتی و تجاری برای عموم منتشر کردند. Llama 2 یک مدل زبان رگرسیون خودکار است که از معماری ترانسفورماتور بهینه شده استفاده می کند. نسخه‌های تنظیم‌شده از تنظیم دقیق نظارتی (SFT) و یادگیری تقویتی با بازخورد انسانی (RLHF) استفاده می‌کنند تا با اولویت‌های انسان برای مفید بودن و ایمنی هماهنگ شوند. بر روی 2 تریلیون داده از منابع عمومی در دسترس از قبل آموزش داده شده است. مقادیر Model Parallel (MP) در حالی که مدل در حال ساخت است تنظیم میشود. مدل 13B به 2، GPU نیاز دارد. این مدل در واقع بین دو مدل 7B و 70B است. اگر نیاز به انجام کاری دارید که به دقت بالایی نیاز دارد، مانند ترجمه اسناد قانونی یا تهیه گزارش های پزشکی، ممکن است بخواهید از یک مدل بزرگتر استفاده کنید.

آخرین به روز رسانی: ۲۶ آبان ۱۴۰۲ ساعت ۰۱:۵۶:۱۱ بعد از ظهر

تعداد مشاهده: 77