هوش مصنوعی | شهریور ۶, ۱۴۰۲

هوش مصنوعی برای درک تصاویر و مکالمات

علی‌بابا دو مدل هوش مصنوعی برای درک تصاویر و مکالمات پیچیده که Qwen-VL و Qwen-VL-Chat نام دارند را به‌طور متن باز منتشر کرد.

براساس گزارش CNBC،کمپانی چینی علی بابا اخیراً دو هوش مصنوعی برای درک تصاویر و مکالمات با نام‌های Qwen-VL و Qwen-VL-Chat را معرفی کرده است. براساس مدل زبان بزرگ این شرکت که Tongyi Qianwen نام دارد توسعه یافت و اوایل سال جاری میلادی عرضه شد.

موارد استفاده از هوش مصنوعی علی‌بابا

به گفته این شرکت، مدل زبانی Qwen-VL قادر است به سؤالات تشریحی و نامحدودی درباره تصاویر مختلف پاسخ دهد و همچنین قادر به ایجاد کپشن یا شرح تصویر برای آن‌ها است.

مدل زبانی Qwen-VL-Chat نیز برای «تعاملات پیچیده‌تر» مناسب است. این مدل از هوش مصنوعی می‌تواند براساس تصاویر کاربران داستان یا عکس ایجاد کند. همچنین معادلات ریاضی موجود در تصاویر را حل کند و به چندین سری سؤالات تخصصی پاسخ دهد و مقاله بنویسد.

علی‌بابا این ابزار هوش مصنوعی را به‌صورت متن‌باز در اختیار محققان، پژوهشگران و مشتریان در سراسر دنیا قرار می دهد. با این کار صرفه‌جویی قابل‌توجهی در وقت، هزینه و منابع صورت خواهد گرفت و همچنین کمک می‌کند تا کاربران بیشتری را برای مدل هوش مصنوعی خود جذب کند.

«دنیل ژنگ»، مدیرعامل علی‌بابا که دفتر مرکزی آن در شهر شرقی «هانگژو» چین قرار دارد در زمان معرفی LLM خود گفت که این فناوری تغییرات بزرگی را در نحوه تولید، انجام کارها و زندگی ما ایجاد خواهد کرد. LLM بر پایه‌ی حجم بسیار زیادی از مجموعه‌ داده‌های بزرگی توسعه یافت و در چت‌بات‌ها کاربرد دارد

از زمان افزایش محبوبیت هوش مصنوعی (AI) در اواخر سال ۲۰۲۲، فناوری هوش مصنوعی مولد بیشتر روی پاسخ به متن تمرکز داشته است. نسخه‌ی جدید ChatGPT نیز می‌تواند همچون Qwen-VL-Chat تصاویر را بفهمد و در قالب متن پاسخ دهد. ChatGPT که اواخر سال گذشته در دسترس قرار گرفت، چت‌باتی است که اینترنت را متحول کرد.

منبع: دیجیاتو