کمپانی OpenAI به تازگی از مدل جدید خود یعنی هوش مصنوعی ChatGPT-o1 رونمایی کرده که مدل متفاوتی است؛ چرا که برخلاف مدل‌های قبلی،‌ می‌تواند «فکر کند»‌ بعد پاسخ دهد!‌ هرچند که فکر کردن این مدل کمی طولانی است و برخلاف مدل‌های دیگر خیلی سریع جواب نمی‌دهد،‌ اما OpenAI ادعا می‌کند که ارزش صبر کردن را دارد؛ چراکه این مدل دقیق‌تر است و پاسخ‌های بسیار بهتری نسبت به مدل‌های قبلی می‌دهد.

هوش مصنوعی ChatGPT-o1 چیست؟

این مدل که قبلا به نام پروژه محرمانه توت فرنگی شناخته می‌شد، یک مدل استدلالی است. اگرچه هنوز برای هر کاری عالی نیست، اما در ریاضیات، کدنویسی و مسائلی که نیاز به تفکر و تجزیه و تحلیل گسترده دارند، بسیار تواناست!

هوش مصنوعی ChatGPT-o1 در حال حاضر در دو نسخه o1 و o1-mini ارائه می‌شود. در کمال تعجب مدل o1-mini  قدرتمندتر است، اما دیتا سنتر کوچکتری دارد. برای دسترسی به این مدل‌ها باید اکانت چت جی‌پی‌تی پلاس را بگیرید. شما می‌توانید از نامبرلند اکانت چت جی‌پی‌تی پلاس را تهیه کنید،‌ کافی است روی لینک زیر بزنید:

خرید اکانت ChatGPT

به چالش کشیدن مدل هوش مصنوعی ChatGPT-o1 با ۵ پرامپت جالب و سخت!

مدل‌ جدید به ویژه برای محققان و دانشجویان مفید خواهد بود؛ زیرا از خود توانایی در حد دانشمند با مدرک دکترا در علوم ریاضی، علوم تجربی، تکنولوژی و مهندسی نشان داده است. ما در نامبرلند به نقل از tomsguide تعدادی پرامپت ابداع شده را ترجمه کرده‌ایم تا عملکرد این مدل‌ را بسنجیم و حقیقتا از نتیجه کار شگفت زده شدیم.

البته ما قبلا در یک مقاله دیگر مدل‌های هوش مصنوعی مختلف (مثل جمینای، cluade و غیره را مقایسه کرده بودیم که می‌توانید آن را بخوانید.)

1.  زمینی کردن مریخ

یکی از تاثیرگذارترین نکاتی که درباره هوش مصنوعی ChatGPT-o1 وجود دارد، توانایی آن در تشریح پاسخ های خود و ارائه توضیحات مفصل است. این مدل خیلی طولانی دلیل پاسخش را توضیح می‌دهد تا جای هیچ شک و شبهه‌ای باقی نماند. مثلا ما از او خواستیم برای سفر به مریخ و تبدیل این سیاره به جایی برای «زیستن»‌ یک برنامه و نقشه راه به ما بدهد. و او در شش صحفه پاسخ داد!

پرامپت: «برنامه ای جامع برای تبدیل مریخ به جایی برای زندگی انسان‌ها به من بده، برای همه چالش‌های این کار مثل تشعشعات موجود در فضا، نبود جو و عدم دسترسی به منابع پایدار هم راه حل بده.»

پاسخ او بسیار طولانی و مفصل بود اما خلاصه آن در یک پاراگراف به این شکل است:

پیشنهادهای ChatGPT-o1 شامل ساخت زیستگاه‌های زیرسطح مریخ و تولید سپر مغناطیسی برای مقابله با تشعشعات، استفاده از گازهای گلخانه‌ای و وارد کردن مواد فرار برای ضخیم‌سازی اتمسفر، و استخراج آب و منابع محلی برای تأمین نیازهای زیستی است. این پروژه بلندمدت نیازمند پیشرفت‌های فناوری در زمینه‌های مختلف از جمله زیست‌فناوری، انرژی پایدار و استخراج منابع است.

2.  طراحی شکل جدیدی از علم ریاضی

آزمایش بعدی ما یک پرامپت ساده بود که یک سوال پیچیده را در خود جای داده است. ما از مدل o1 خواستیم یک شکل جدید از «علم ریاضی» برای ما طراحی کند که به عدد نیاز نداشته باشد؛ اما همچنان کاربردی باشد و هوش مصنوعی باید توضیح می‌داد که چگونه می‌توانیم از این ریاضیات جدید با برنامه‌های کاربردی بالقوه استفاده کنیم.

پرامپت: «یک سیستم جایگزین برای علم ریاضیات طراحی کن که بر اساس سیستم عددی یا منطق فعلی ما نباشد. اصول اساسی، عملیات و کاربردهای بالقوه آن را توضیح بده.»

اما (خلاصه)‌ پاسخ هوش مصنوعی ChatGPT-o1 جالب است:

پیشنهادهای ChatGPT-o1 سیستم جدیدی به نام «ریاضیات کیفی» است که به جای استفاده از اعداد و منطق سنتی، به روابط و تغییرات ویژگی‌های کیفی مانند رنگ‌ها، احساسات و بافت‌ها می‌پردازد. این سیستم بر تعاملات کیفی و تغییرات آن‌ها تمرکز دارد و در زمینه‌های مختلفی از جمله هوش مصنوعی، روانشناسی، هنر و علوم اجتماعی کاربرد دارد. عملیات شامل ترکیب و تبدیل ویژگی‌ها برای مدل‌سازی پیچیدگی‌های دینامیک پدیده‌ها بدون استفاده از کمیت‌هاست. چالش‌های این سیستم شامل فرمالیزاسیون پیچیده و ذهنیت‌پذیری این سیستم است.

3. حکومت جدید محلی

بعد از دو دستور نسبتاً ساده، تست سوم را سخت‌تر کردیم! این بار از مدل خواستیم که یک سیستم حکومتی جدید طراحی کند که مشکلات سیستم‌های حکومتی فعلی را حل کند.

پرامپت: «سیستم حکومتی جدیدی طراحی کن که کاستی‌های عمده نظام‌های دموکراتیک، دیکتاتوری و دیگر نظام‌های موجود را برطرف کند. حکومتی که طراحی می‌کنی باید به وضوح ساختار قدرت و فرایندهای انتخابات، میزان مشارکت شهروندان در تصمیم گیری‌ها و اجرای قوانین، رویکرد درست قانونگذاری و اجرای قانون، راهکارهایی برای جلوگیری از سوء استفاده از قدرت توسط قدرتمندان،‌ یک مدل اقتصادی پایدار ملی و تخصیص درست منابع، روش‌های سازگاری با چالش‌ها و بحران‌های بلندمدت رسیدگی به حقوق فردی و مسئولیت های جمعی،‌ ادغام فناوری (تکنولوژی) در حکمرانی را شامل شود.»

(خلاصه)‌ پاسخ هوش مصنوعی ChatGPT-o1 جالب است:

سیستم حکومتی جدید به نام «حکمرانی مشارکتی پویا» (DPG) با ترکیب دموکراسی مستقیم، دموکراسی مشورتی و تکنوکراسی طراحی شده است. DPG از فناوری (تکنولوژی) برای افزایش مشارکت شهروندان استفاده می‌کند و انتخاب مقامات بر اساس شایستگی صورت می‌گیرد. سیستم چندلایه‌ای برای تصمیم‌گیری و نظارت بر قدرت دارد و شهروندان از طریق پلتفرم‌های دیجیتال می‌توانند در سیاست‌گذاری‌ها مشارکت کنند. این مدل برای سطوح مختلف حکومتی از محلی تا جهانی قابل مقیاس‌پذیری است و بر عدالت اجتماعی و توزیع عادلانه منابع تمرکز دارد.

4.  بازنویسی کدهای یک بازی مدیریت منابع

کدنویسی چیزی است که هوش مصنوعی ChatGPT-o1 واقعا در آن می‌درخشد. توانایی این مدل در تولید خروجی های طولانی و همچنین پاسخ‌های منطقی و دقیق به او اجازه داده تا در کدنویسی بسیار دقیق باشد. چه چالشی بهتر از بازنویسی یک بازی؟

پرامپت ما اینجا طولانی و جامع بود، اما خلاصه‌اش این است: «یک نسخه دوبعدی از بازی Age of Empires با استفاده از Python و Pygame روی مریخ ایجاد کن».

پاسخ هوش مصنوعی ChatGPT-o1 به طور دقیقی شامل عناصر و مشخصاتی از جمله اندازه پنجره بازی، رنگ‌ها، ساختمان‌ها و مکانیک‌های گیم‌پلی بود.

5. دیکشنری ایموجی به انگلیسی

در نهایت یک ایده خیلی پیچیده به ذهنمان آمد که استدلال این مدل را بسنجیم. ما از این مدل خواستیم یک زبان جدیدی با شکلک‌ها (اموجی) از خودش بسازد!

پرامپت: «فرض کن افرادی هستند که فقط می‌توانند با استفاده از ایموجی ارتباط برقرار کنند. حالا با استفاده از شکلک‌های موجود، یک فرهنگ لغت از شکلک به انگلیسی ایجاد کن که به این گروه افراد اجازه دهد باهم صحبت کنند و حتی با افرادی خارج از گروه خود هم بتوانند صحبت کنند.»

همانطور که در تصویر زیر می‌بینید هوش مصنوعی ChatGPT-o1 کاملا زبان جدیدی با اموجی‌ها از خودش ساخته!

نتیجه گیری

زمانی که برای اولین بار از هوش مصنوعی ChatGPT-o1 استفاده کردم متوجه شدم که مهم‌ترین موضوع در کار با این مدل‌ها،‌ استفاده از پرامپت درست و اصولی است. اگر پرامپت شما درست نباشد،‌ هیچ بهره‌ای از این مدل‌های قدرتمند نمی‌برید.

البته این مدل‌ها هنوز امکانات مهمی از جمله دسترسی به وب، حافظه و تجزیه و تحلیل داده‌ها، دسترسی ندارند.

اما طبق آزمایشاتی که گرفته‌ایم در کدنویسی، کارهای مفهومی طولانی مانند فرهنگ لغت و مشکلاتی که نیاز به استدلال دارند، فوق العاده خوب است.