این روزها به لطف مدلهایی مانند هوش مصنوعی DeepSeek و مدل هوش مصنوعی o3 از OpenAI، مدلهای هوش مصنوعی استدلالگر بسیار محبوب شدهاند. هوش مصنوعی استدلالگر یعنی مدلی که زنجیره افکارش را به نمایش بگذارد و پیشاز اینکه پاسخش را تولید کند، تفکر میکند.
با این حال، آنچه بسیار شگفتانگیزتر است، سرعت رشد و گسترش این مدلهاست. بهتازگی مدل استدلالگر دیگری به نام هوش مصنوعی DeepHermes-3 معرفی شده که توسط گروهی مستقل و مرموز توسعه پیدا کرده اما بهنظر میرسد چیزی از دیگر شرکتهای مطرح کم نداشته باشند.

معرفی مدل هوش مصنوعی DeepHermes-3: مدلی که به خودآگاهی نزدیک است
طبق توییت اکانت Nous Research در شبکه اجتماعی X، مدل جدید استدلالی این گروه، DeepHermes-3 Preview نام دارد. این مدل بهعنوان «یک مدل زبانی بزرگ که قابلیتهای استدلالی و زبان شهودی را یکپارچه کرده» توصیف شده است و به کاربران امکان میدهد تا بین فرآیندهای استدلالی طولانیتر و پاسخهای سریعتر و کممصرفتر، خیلی سریع بهدلخواه جابهجا شوند.
این مدل، نسخهای با ۸ میلیارد پارامتر از Hermes 3 است که تابستان گذشته عرضه شده بود.
نمونههای اولیه این مدل نشان دادهاند که قادر به نمایش نوعی خودآگاهی متاکاگنیتیوی (تفکر درباره تفکر خود) است و میتواند درباره نقش هوش مصنوعی در مقایسه با آگاهی انسانی تأمل کند، تا حدی که برخی خروجیهای آن به حالتی شبیه به بحران وجودی منجر شده است!
تیم Nous Research اعلام کرده آنها امیدوارند رویکرد منحصربهفردشان به کاربران هوش مصنوعی DeepHermes-3 اجازه دهد مدل را مطابق نیازهای خود تنظیم کنند.
به گفته یکی از اعضای گروه Nous Research، این مدل با ۱ میلیون نمونه بدون CoT و ۱۵۰ هزار نمونه CoT آموزش دیده است. این ترکیب دادهها به مدل DeepHermes-3 قابلیت منحصربهفرد جابهجایی بین پاسخهای شهودی و استدلالهای عمیق و ساختاریافته را میدهد.
عمق تفکر هوش مصنوعی در دست کاربر است
در حالت پاسخ استاندارد، مدل مانند یک چتبات معمولی عمل کرده و پاسخهای سریع و مبتنی بر شهود ارائه میدهد، بدون اینکه پردازش منطقی عمیقی داشته باشد؛ اما حالت تفکر عمیق هم وجود دارد.
هوش مصنوعی DeepHermes-3 به کاربران اجازه میدهد تا عمق استدلال مدل را از طریق پرامپتهای تخصصی کنترل کنند. برای فعالسازی این حالت، کاربر باید متن زیر را پیش از ارسال پرسش وارد کند:
«تو یک هوش مصنوعی با تفکرات عمیق هستی و میتوانی زنجیرههای بسیار طولانی از تفکر را برای بررسی دقیق مسئله و تحلیل سیستماتیک آن به کار بگیری تا پیش از پاسخگویی، به یک راهحل صحیح برسی. تو باید افکار و مونولوگ داخلی خود را داخل تگهای مشخص قرار دهی و سپس راهحل یا پاسخ خود را ارائه کنی.»
هنگامی که این حالت فعال شود، مدل اطلاعات را در قالب زنجیرههای فکری طولانی پردازش میکند و بهصورت سیستماتیک آن را تحلیل میکند. این کار از طریق تگهای انجام میشود که به مدل امکان میدهد ابتدا مونولوگ داخلی خود را تشکیل دهد و سپس راهحل نهایی را ارائه کند.
عملکرد و بازخورد اولیه کاربران
نتایج اولیه بنچمارک و بررسیهای اولیه کاربران، نشان میدهد هوش مصنوعی DeepHermes-3 در آزمونهای MATH نمره ۶۷٪ کسب کرده است. همچنین برخی کاربران گزارش دادهاند که حالت استدلالی در پاسخ اول بهدرستی فعال میشود، اما ممکن است در مکالمات طولانیتر غیرفعال شود.
در نهایت باید بدانیم که مدل از قابلیت استفاده از ابزارها پشتیبانی میکند؛ اما هنوز یکپارچهسازی کامل بین حالت استدلالی و فراخوانی توابع صورت نگرفته است. هرچند این مدل در ابتدای کار خود قرار دارد و آینده درخشانی را در پیش دارد.