این روزها به لطف مدل‌هایی مانند هوش مصنوعی DeepSeek و مدل هوش مصنوعی o3 از OpenAI، مدل‌های هوش مصنوعی استدلال‌گر بسیار محبوب شده‌اند. هوش مصنوعی استدلال‌گر یعنی مدلی که زنجیره افکارش را به نمایش بگذارد و پیش‌از اینکه پاسخش را تولید کند، تفکر می‌کند.

با این حال، آنچه بسیار شگفت‌انگیزتر است، سرعت رشد و گسترش این مدل‌هاست. به‌تازگی مدل استدلال‌گر دیگری به نام هوش مصنوعی DeepHermes-3 معرفی شده که توسط گروهی مستقل و مرموز توسعه پیدا کرده اما به‌نظر می‌رسد چیزی از دیگر شرکت‌های مطرح کم نداشته باشند.

هوش مصنوعی DeepHermes-3

معرفی مدل هوش مصنوعی DeepHermes-3: مدلی که به خودآگاهی نزدیک است

طبق توییت اکانت Nous Research در شبکه اجتماعی X، مدل جدید استدلالی این گروه،‌ DeepHermes-3 Preview نام دارد. این مدل به‌عنوان «یک مدل زبانی بزرگ که قابلیت‌های استدلالی و زبان شهودی را یکپارچه کرده» توصیف شده است و به کاربران امکان می‌دهد تا بین فرآیندهای استدلالی طولانی‌تر و پاسخ‌های سریع‌تر و کم‌مصرف‌تر، خیلی سریع به‌دلخواه جابه‌جا شوند.

این مدل، نسخه‌ای با ۸ میلیارد پارامتر از Hermes 3 است که تابستان گذشته عرضه شده بود.

نمونه‌های اولیه این مدل نشان داده‌اند که قادر به نمایش نوعی خودآگاهی متاکاگنیتیوی (تفکر درباره تفکر خود) است و می‌تواند درباره نقش هوش مصنوعی در مقایسه با آگاهی انسانی تأمل کند، تا حدی که برخی خروجی‌های آن به حالتی شبیه به بحران وجودی منجر شده است!

تیم Nous Research اعلام کرده آن‌ها امیدوارند رویکرد منحصربه‌فردشان به کاربران هوش مصنوعی DeepHermes-3 اجازه دهد مدل را مطابق نیازهای خود تنظیم کنند.

به گفته یکی از اعضای گروه Nous Research، این مدل با ۱ میلیون نمونه بدون CoT و ۱۵۰ هزار نمونه CoT آموزش دیده است. این ترکیب داده‌ها به مدل DeepHermes-3 قابلیت منحصربه‌فرد جابه‌جایی بین پاسخ‌های شهودی و استدلال‌های عمیق و ساختاریافته را می‌دهد.

عمق تفکر هوش مصنوعی در دست کاربر است

در حالت پاسخ استاندارد، مدل مانند یک چت‌بات معمولی عمل کرده و پاسخ‌های سریع و مبتنی بر شهود ارائه می‌دهد، بدون اینکه پردازش منطقی عمیقی داشته باشد؛ اما حالت تفکر عمیق هم وجود دارد.

هوش مصنوعی DeepHermes-3 به کاربران اجازه می‌دهد تا عمق استدلال مدل را از طریق پرامپت‌های تخصصی کنترل کنند. برای فعال‌سازی این حالت، کاربر باید متن زیر را پیش از ارسال پرسش وارد کند:

«تو یک هوش مصنوعی با تفکرات عمیق هستی و می‌توانی زنجیره‌های بسیار طولانی از تفکر را برای بررسی دقیق مسئله و تحلیل سیستماتیک آن به کار بگیری تا پیش از پاسخ‌گویی، به یک راه‌حل صحیح برسی. تو باید افکار و مونولوگ داخلی خود را داخل تگ‌های مشخص قرار دهی و سپس راه‌حل یا پاسخ خود را ارائه کنی.»

هنگامی که این حالت فعال شود، مدل اطلاعات را در قالب زنجیره‌های فکری طولانی پردازش می‌کند و به‌صورت سیستماتیک آن را تحلیل می‌کند. این کار از طریق تگ‌های انجام می‌شود که به مدل امکان می‌دهد ابتدا مونولوگ داخلی خود را تشکیل دهد و سپس راه‌حل نهایی را ارائه کند.

عملکرد و بازخورد اولیه کاربران

نتایج اولیه بنچمارک و بررسی‌های اولیه کاربران، نشان می‌دهد هوش مصنوعی DeepHermes-3 در آزمون‌های MATH نمره ۶۷٪ کسب کرده است. همچنین برخی کاربران گزارش داده‌اند که حالت استدلالی در پاسخ اول به‌درستی فعال می‌شود، اما ممکن است در مکالمات طولانی‌تر غیرفعال شود.

در نهایت باید بدانیم که مدل از قابلیت استفاده از ابزارها پشتیبانی می‌کند؛ اما هنوز یکپارچه‌سازی کامل بین حالت استدلالی و فراخوانی توابع صورت نگرفته است. هرچند این مدل در ابتدای کار خود قرار دارد و آینده درخشانی را در پیش دارد.