شرکت علی‌بابا، غول تکنولوژی چینی‌ها پس از موفقیت خیره‌کننده هوش مصنوعی Qwen، به‌تازگی از مدل جدیدی به نام هوش مصنوعی QVQ-Max رونمایی کرده که یک مدل استدلال‌گر تصویری است. نکته جذاب این مدل در توانایی آن برای درک محتوای عکس‌ها و ویدیوها و سپس تحلیل و استدلال بر اساس آن اطلاعات برای ارائه راه‌حل‌هاست.

هوش مصنوعی QVQ-Max

درباره هوش مصنوعی QVQ-Max

علی‌بابا اعلام کرده که با این مدل، فاصله میان مدل‌های متنی هوش مصنوعی و اطلاعات دنیای واقعی را پر کرده است. علی‌بابا می‌گوید هوش مصنوعی QVQ-Max می‌تواند ببیند، بفهمد و درباره دنیای اطراف فکر کند. این مدل در تجزیه‌وتحلیل تصاویر، شناسایی عناصر خاص در تصویر، طراحی تصویرسازی، تولید سناریوهای ویدیویی و ایفای نقش، عملکرد بسیار خوبی دارد.

مانند سایر چت‌بات‌های هوش مصنوعی، مدل QVQ-Max می‌تواند در کار، تحصیل یا زندگی شخصی به شما کمک کند؛ اما به لطف توانایی‌های تصویری‌ خاصی که دارد، حتی در حل مسائل ریاضی و فیزیک همراه با نمودار یا راهنمایی مرحله‌به‌مرحله در آشپزی بر اساس تصاویر دستور پخت نیز کاربرد دارد!

علی‌بابا گفته هوش مصنوعی QVQ-Max فقط نسخه اولیه این مدل است و حتما قرار است در آینده آپدیت‌های ویژه‌ای دریافت کند. به‌طور مثال علی‌بابا قصد دارد تعاملات مدل را از حالت صرفا متنی فراتر ببرد و امکان استفاده از ابزارها و تولید محتوای تصویری را نیز به آن بیفزاید.

برای شروع استفاده از QVQ-Max کافی است وارد سایت chat.qwen.ai شوید، از منوی بالای سمت چپ روی «مدل‌ها» کلیک کرده، گزینه «Expand more models» را بزنید و QVQ-Max را انتخاب کنید. سپس وارد چت‌باکس شوید و مکالمه را آغاز کنید؛ یادتان نرود یک فایل تصویری هم ارسال کنید تا ببینید این مدل چه توانایی‌هایی دارد.