متا، از پشگامان فناوری، به تازگی از جدیدترین نسخه مدلهای هوش مصنوعی مولد خود به نام Llama 3 رونمایی کرده است. این نسخه شامل دو مدل جدید از خانواده Llama 3 میباشد و مدلهای دیگر در آیندهای نزدیک عرضه خواهند شد.
Llama 3 بر پایه نسل قبلی خود، Llama 2، ساخته شده است و از قدرت پردازشی و قابلیتهای جدیدی بهره میبرد. این مدلها میتوانند متن، کد و تصاویر را با کیفیت و دقت بالاتری تولید کنند.
متا هنوز جزئیات کامل راجع به Llama 3 را منتشر نکرده است، اما گفته میشود که این مدلها در زمینههای مختلفی مانند ترجمه، نوشتن خلاقانه و تولید کد کاربرد خواهند داشت.
Llama 3 8B شامل 8 میلیارد پارامتر و Llama 3 70B شامل 70 میلیارد پارامتر است. این تعداد پارامتر به طور قابل توجهی بیشتر از مدلهای Llama 2 8B و Llama 2 70B است و به این مدلها قدرت پردازش و تولید متن به مراتب بهتری میدهد.
متا ادعا کرده است Llama 3 8B و Llama 3 70B با توجه به تعداد پارامترهایشان، جزو بهترین مدلهای هوش مصنوعی مولد موجود در حال حاضر هستند. این مدلها بر روی دو سری به تعداد 24000 پردازنده گرافیکی سفارشی آموزش دیدهاند که نشاندهنده سرمایهگذاری قابل توجه متا در این زمینه است.
هوش مصنوعی Llama 3 چه کاربردهایی دارد؟
- تولید متن: Llama 3 میتواند متن با کیفیت بالا در قالبهای مختلف مانند مقالات خبری، داستانها، شعر و کد تولید کند.
- ترجمه: Llama 3 میتواند متن را به طور دقیق و روان بین زبانهای مختلف ترجمه کند.
- پاسخ به سوالات: Llama 3 میتواند به سوالات شما به روشی جامع و آموزنده پاسخ دهد.
- خلاصهسازی: Llama 3 میتواند متنهای طولانی را به طور خلاصه و دقیق ارائه دهد.
Llama 3: ادعای هوش مصنوعی پیشرفته، با چه پشتوانهای؟
متا ادعا میکند که مدلهای زبانی جدیدش، Llama 3، یک جهش بزرگ در هوش مصنوعی هستند. اما این ادعا چگونه ثابت میشود؟
متا به عملکرد Llama 3 در معیارهای محبوب هوش مصنوعی مانند MMLU (برای سنجش دانش)، ARC (برای سنجش مهارت) و DROP (برای سنجش استدلال) اشاره میکند.
همانطور که کارشناسان گفتهاند، مفید بودن و اعتبار این معیارها مورد بحث است. با این حال، آنها به عنوان روشهای استاندارد برای ارزیابی مدلهای هوش مصنوعی توسط شرکتهایی مانند متا استفاده میشوند.
حال این معیارها را دقیقتر بررسی کنیم :
- MMLU: این معیار بر روی مجموعه دادهای از سوالات و پاسخها ارزیابی میشود. Llama 3 در این معیار عملکرد خوبی داشته، اما این نشاندهنده هوش واقعی آن نیست.
- ARC: این معیار بر روی مجموعه دادهای از وظایف مانند دستورالعملها و خلاصهسازیها ارزیابی میشود. Llama 3 در این معیار نیز عملکرد خوبی داشته، اما توانایی آن در انجام وظایف دنیای واقعی را به طور کامل نشان نمیدهد.
- DROP: این معیار بر روی مجموعه دادهای از تکههای متن ارزیابی میشود و توانایی مدل را در استدلال و درک روابط بین کلمات و جملات میسنجد. Llama 3 در این معیار عملکرد قابل قبولی داشته، اما هنوز جای پیشرفت دارد.
Llama 3 8B، جدیدترین مدل زبانی متا، با عملکرد چشمگیر خود در 9 معیار هوش مصنوعی، رقبای خود را پشت سر گذاشته است. این مدل 8 میلیارد پارامتری، از مدلهای مشابه مانند Mistral 7B از Mistral و Gemma 7B از Google که هر دو 7 میلیارد پارامتر دارند، پیشی گرفته است.
Llama 3 8B در معیارهای زیر عملکرد برتر را نشان داده است:
- MMLU: سنجش دانش
- ARC: سنجش مهارت
- DROP: سنجش استدلال
- GPQA: پاسخ به سوالات در حوزههای زیست شناسی، فیزیک و شیمی
- HumanEval: ارزیابی تولید کد
- GSM-8K: حل مسائل کلمات ریاضی
- MATH: معیار سنجش ریاضی
- AGIEval: حل مسئله
- BIG-Bench Hard: ارزیابی منطقی عقلانی
مزایای Llama 3 8B:
- عملکرد برتر: Llama 3 8B در 9 معیار هوش مصنوعی عملکردی بهتر از مدلهای مشابه نشان داده است.
- قدرت پردازش: 8 میلیارد پارامتر این مدل به آن قدرت پردازش و تولید متن به مراتب بهتری میدهد.
- کاربردهای متنوع: Llama 3 8B میتواند برای تولید متن، ترجمه، پاسخ به سوالات و خلاصهسازی متن استفاده شود.
Llama 3 8B نیز با عملکرد چشمگیر خود در 9 معیار هوش مصنوعی، رقبای خود را به چالش کشیده است.
با این حال، Mistral 7B و Gemma 7B، مدلهای مشابه از Mistral و Google، هنوز در میدان رقابت هستند. این دو مدل که به ترتیب در سپتامبر سال گذشته منتشر شدهاند، در برخی از معیارهای ذکر شده توسط متا تنها چند درصد از Llama 3 8B فاصله دارند.
اما متا ادعا میکند که Llama 3 70B، مدل بزرگتر این سری، با مدلهای شاخص هوش مصنوعی مولد مانند Gemini 1.5 Pro، جدیدترین نسخه از سری Gemini گوگل، قابل رقابت است.
Llama 3 70B، مدل زبانی بزرگ توسعه یافته توسط متا، در معیارهای MMLU، HumanEval و GSM-8K، Gemini 1.5 Pro، مدل پیشرو گوگل، را پشت سر میگذارد.
اگرچه Llama 3 70B به قدرتمندی Claude 3 Opus، بهترین مدل شرکت Anthropic، نیست، اما از Claude 3 Sonnet، دومین مدل ضعیفتر در سری Claude 3، در پنج معیار (MMLU، GPQA، HumanEval، GSM-8K و MATH) عملکرد بهتری دارد.
Llama 3 متا، رقیب
Llama 3 متا، رقیب سرسخت GPT-3.5
علاوه بر این، متا مجموعه آزمایشی اختصاصی خود را برای سنجش عملکرد مدلهای زبانی در طیف گستردهای از وظایف، از جمله کدنویسی، نوشتن خلاقانه، استدلال، خلاصهسازی و … ارائه کرده است. جالب توجه است که مدل Llama 3 با 70 میلیارد پارامتر، در مقایسه با مدلهای Mistral Medium از Mistral، GPT-3.5 از OpenAI و Claude Sonnet، عملکرد برتر را به نمایش گذاشت. با این حال، متا اذعان میکند که برای حفظ بیطرفی، تیمهای توسعهدهنده مدلهای این شرکت به مجموعه داده دسترسی نداشتهاند. با توجه به اینکه این مجموعه توسط خود متا طراحی شده است، تفسیر نتایج ارائه شده نیازمند احتیاط و ظرافت خواهد بود.
بهبود کیفیت مدلهای لاما 3:
متا اعلام کرده است که مدلهای جدید لاما 3 پیشرفتهای کیفی قابل توجهی نسبت به نسل قبلی خود، لاما 2، ارائه میکنند. این پیشرفتها شامل موارد زیر است:
- هدایتپذیری بیشتر: مدلهای جدید به احتمال زیاد دستورالعملها را دنبال میکنند و وظایف را طبق دستور انجام میدهند.
- کاهش امتناع از پاسخگویی: لاما 3 کمتر از لاما 2 به سوالات “نمیدونم” یا “اطلاعات کافی ندارم” پاسخ میدهد.
- دقت بالاتر: لاما 3 در پاسخ به سوالات چالشبرانگیز، بهویژه در زمینههای تاریخ، علوم، مهندسی، و کدگذاری، عملکرد بهتری دارد.
پیشرفتهای اخیر تا حدی به خاطر استفاده از یک مجموعه داده بسیار بزرگتر حاصل شده است. این مجموعه داده شامل 15 تریلیون توکن (معادل 750 میلیارد کلمه) است که هفت برابر اندازه مجموعه داده لاما 2 میباشد.
متا جزئیات دقیقی در مورد منابع این مجموعه داده ارائه نمیدهد، اما میگوید که از “منابع عمومی” جمعآوری شده است. این مجموعه داده شامل چهار برابر کد بیشتر از مجموعه داده لاما 2 و 5 درصد متن غیرانگلیسی (به 30 زبان) برای ارتقای عملکرد در زبانهای غیر از انگلیسی است.
علاوه بر این، متا از دادههای مصنوعی – دادههایی که توسط هوش مصنوعی تولید میشوند – برای آموزش مدلهای لاما 3 بر روی اسناد طولانیتر استفاده کرده است. این رویکرد تا حدی بحثبرانگیز است، زیرا میتواند منجر به مشکلات عملکردی در مدلها شود.
هوش مصنوعی جدید متا با ادعای پیشرفت در دقت و تنوع
متا در همکاری با مایکروسافت، مدل هوش مصنوعی جدید خود را معرفی کرده است که مدعی است در مقایسه با رقبای خود، از جمله ChatGPT، دقت و تنوع بیشتری ارائه میدهد. این مدل بر روی مجموعه دادههای عظیم متن و کد آموزش دیده است و میتواند برای انجام طیف گستردهای از وظایف، از جمله تولید متن، ترجمه زبانها و نوشتن انواع مختلف محتوای خلاقانه، مورد استفاده قرار گیرد.
تمرکز بر تنوع دادهها:
یکی از ویژگیهای کلیدی Llama 3، تمرکز بر تنوع دادهها است. متا ادعا میکند که این مدل با استفاده از مجموعه دادههای متنوعتر از متن و کد، میتواند تفاوتهای ظریف زبانی و الگوها را بهتر درک کند و در نتیجه در انجام وظایف مختلف عملکرد بهتری داشته باشد.
مزیت رقابتی :
بسیاری از شرکتهای هوش مصنوعی، دادههای آموزشی را به عنوان یک مزیت رقابتی تلقی میکنند و به همین دلیل، اطلاعات مربوط به آن را به طور عمومی به اشتراک نمیگذارند. با این حال، عدم شفافیت در مورد دادههای آموزشی میتواند چالشهایی را به همراه داشته باشد.
ملاحظات اخلاقی:
برخی از گزارشها نشان دادهاند که متا در تلاش برای پیشی گرفتن از رقبای خود، از دادههای دارای حق چاپ، مانند کتابهای الکترونیکی، برای آموزش مدلهای هوش مصنوعی خود استفاده کرده است. این موضوع انتقاداتی را در مورد اخلاقیات این روش به همراه داشته است.
سمیت و سوگیری:
علاوه بر تنوع دادهها، سمیت و سوگیری دو چالش رایج دیگر در مدلهای هوش مصنوعی هستند. Llama 3 نیز از این قاعده مستثنی نیست. با این حال، متا ادعا میکند که در Llama 3 برای کاهش سمیت و سوگیری تلاش کرده است.
با وجود پیشرفتهای چشمگیر در هوش مصنوعی، این فناوری هنوز در مراحل ابتدایی خود قرار دارد. Llama 3 گامی مهم در جهت توسعه مدلهای هوش مصنوعی قدرتمندتر و متنوعتر است، اما هنوز چالشهای زیادی برای حل شدن باقی مانده است.
متا با ابزارهای جدید به دنبال افزایش کیفیت و ایمنی مدلهای هوش مصنوعی است
متا در تلاش برای ارتقای کیفیت و ایمنی مدلهای هوش مصنوعی خود، گامهای جدیدی برداشته است.
هدف از این بهروزرسانیها چیست؟
- کاهش سوء استفاده: این ابزارها برای جلوگیری از استفاده از مدلهای Llama 3 و سایر مدلهای هوش مصنوعی متا برای مقاصد مخرب، مانند تولید محتوای مضر یا انتشار اطلاعات نادرست، طراحی شدهاند.
- افزایش امنیت: Code Shield، ابزار جدید متا، کد مدلهای هوش مصنوعی را برای شناسایی و رفع آسیبپذیریهای امنیتی احتمالی اسکن میکند.
با وجود این پیشرفتها، هنوز چالشهایی در زمینه ایمنی و کیفیت مدلهای هوش مصنوعی وجود دارد.
- فیلتر کردن کامل غیرممکن است: هیچ فیلتری نمیتواند تمام محتوای مضر را به طور کامل از بین ببرد.
- محدودیت ابزارها: ابزارهایی مانند Llama Guard و CyberSecEval تنها تا حدی میتوانند از سوء استفاده جلوگیری کنند.
- نیاز به آزمایش و نظارت بیشتر: عملکرد مدلهای Llama 3 در شرایط واقعی باید به دقت رصد و مورد آزمایش قرار گیرد، به خصوص از نظر نگرانیهای مربوط به حریم خصوصی و سوگیری.
Llama 3 هوش مصنوعی قدرتمند متا، در دسترس همگان
متا از Llama 3، جدیدترین مدل زبانی خود رونمایی کرد که به عنوان دستیار هوش مصنوعی، فیسبوک، اینستاگرام، واتساپ، مسنجر و وب استفاده خواهد شد.
این مدلها که هماکنون قابل دانلود هستند، به زودی در طیف گستردهای از پلتفرمهای ابری از جمله AWS، Databricks، Google Cloud، Hugging Face، Kaggle، WatsonX IBM، Microsoft Azure، NVIDIA NIM و Snowflake نیز در دسترس خواهند بود. نسخههای بهینه شده برای سختافزار از AMD، AWS، Dell، Intel، Nvidia و Qualcomm نیز در آینده ارائه خواهند شد.
با وجود دسترسی گسترده، Llama 3 را نمیتوان به طور کامل متنباز در نظر گرفت. متا محدودیتهایی را برای استفاده از این مدلها اعمال کرده است:
- توسعهدهندگان نمیتوانند از Llama 3 برای آموزش مدلهای تولیدی دیگر استفاده کنند.
- توسعهدهندگان برنامههایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید مجوز ویژهای را از متا دریافت کنند که به صلاحدید این شرکت اعطا میشود.
Llama 3 علیرغم محدودیتها، پتانسیل تبدیل شدن به ابزاری قدرتمند برای طیف گستردهای از کاربردها را دارد.
مدلهای مختلف هوش مصنوعی لاما
مدلهای زبانی هوش مصنوعی موسوم به لاما، به زودی با قابلیتهای خیرهکنندهای پا به عرصه هوش مصنوعی خواهند گذاشت. طبق گفتهی متا، این شرکت در حال آموزش نسل جدیدی از این مدلها با نام Llama 3 است که بیش از 400 میلیارد پارامتر دارند. این حجم عظیم از پارامترها به لاما 3 قدرتهای خارقالعادهای میبخشد که نسلهای قبلی این قابلیت را نداشتند.
قابلیتهای جدید لاما 3 شامل موارد زیر میشود:
- مکالمه به چندین زبان: لاما 3 میتواند به طور روان و طبیعی به زبانهای مختلف صحبت کند و به سوالات و درخواستهای شما به هر زبانی که مایل باشید پاسخ دهد.
- درک تصاویر: لاما 3 میتواند محتوای تصاویر را درک کند و ارتباط آن را با متن بفهمد. این قابلیت زمینههای جدیدی را برای کاربردهای هوش مصنوعی مانند نوشتن شرح تصویر و دستهبندی عکسها میگشاید.
- دریافت اطلاعات بیشتر: لاما 3 قادر به دریافت اطلاعات از منابع مختلف مانند وب، کتابها و مقالات علمی است. این قابلیت به آن کمک میکند تا دانش خود را در زمینههای مختلف به روز نگه دارد و پاسخهای دقیقتر و کاملتری به شما ارائه دهد.
نسخههای باز لاما 3 مانند Idefics2 از Hugging Face در دسترس عموم قرار خواهند گرفت تا محققان و توسعهدهندگان بتوانند از آنها در پروژههای خود استفاده کنند.
هوش مصنوعی چند زبانه و چند منظوره متا در راه است
طبق گفته شرکت متا این کمپانی در حال ارتقای مدل زبانی قدرتمند خود به نام Llama 3 به سطوح جدیدی است. هدف آنها در آینده نزدیک این است که Llama 3 را به گونهای ارتقا دهند که:
- به چندین زبان مسلط شود: Llama 3 قادر خواهد بود به طور روان و طبیعی به زبانهای مختلف صحبت کند و به سوالات و درخواستهای شما به هر زبانی که مایل باشید پاسخ دهد.
- تواناییهای چندوجهی پیدا کند: این مدل هوش مصنوعی نه تنها میتواند متن را تولید کند، بلکه قادر به درک و پاسخ به انواع مختلف دادهها مانند تصاویر، کدها و فرمولها خواهد بود.
- زمینه مکالمه را طولانیتر نگه دارد: Llama 3 میتواند به جای فراموش کردن صحبتهای قبلی، مکالمات را در زمینه طولانیتری به خاطر بسپارد و بر اساس آن پاسخهای دقیقتر و مرتبطتری ارائه دهد.
- عملکرد کلی مدل زبانی بزرگ را ارتقا دهد: این شامل بهبود مهارتهایی مانند استدلال، کدنویسی و پاسخ به سوالات به روشی جامع و آموزنده میشود.