در اوایل رونمایی از جیپیتی ۵ کاربران زیادی ابراز ناامیدی کردند. کاربران جیپیتی ۵ را در مقایسه با مدل 4o سردتر توصیف کردند و از جوابهای کوتاه و بیاحساس آن ناراضی بودند.
بهعلاوه، محدودیت انتخاب مدل در روزهای اول پساز رونمایی، باعث شده بود کاربران احساس کنند دیگر کنترلی بر نحوهی پاسخدهی ندارند و نارضایتیها بیشتر شود.
از طرف دیگر OpenAI جیپیتی ۵ را پیشرفتهترین مدل خود معرفی کرده بود و ادعا داشت قابلیتهایی از قبیل استدلال یا کدنویسی در آن بهبود چشمگیری پیدا کرده است.
در این مقاله میخواهیم ببینیم در واقعیت کدامیک از این ۲ مدل ChatGPT بهتر هستند. ابتدا پیشرفتهای GPT-5 و سپس نقاط ضعف آن را در مقایسه با GPT-4o بررسی میکنیم و سپس با چند پرامپت یکسان، عملکرد این ۲ را با هم میسنجیم.
مقایسه GPT-5 و GPT-4o
شرکت OpenAI جیپیتی ۵ را مدل پیشفرض و پرچمدار خود معرفی کرده که در سطح دکترا استدلال میکند و در مقایسه با GPT-4o که دوستی بامزه و خوشصحبت بود، مشاوری حرفهای و جدی است. آیا در واقعیت هم همین است؟ براساس مقالهای از creolestudios و مستندات OpenAI به این سوال پاسخ میدهیم.
قبل از اینکه مقایسه را بخوانیم، میتوانید با مطالعهی مقالهی «چت جی پی تی چیست» بیشتر با این هوش مصنوعی آشنا شوید.
در جدول زیر مقایسهای از دو ۲ مدل OpenAI را در آزمونهای مختلف میبینید:
معیار آزمون / ویژگی | GPT-5 | GPT-4o |
AIME 2025 (ریاضی) | ۹۴/۶ درصد | ۷۱ درصد |
SWE-bench Verified (کدنویسی) | ۷۴/۹ درصد | ۳۰/۸ درصد |
VideoMMMU (تحلیل محتوای ویدیویی) | ۸۱/۱ درصد | ۵۸/۸ درصد |
HealthBench (سوالات دشوار مربوط به سلامتی) | ۴۶/۲ درصد | ۳۱/۶ درصد |
نرخ توهم | ۲/۱ درصد | ~ ۳/۶ درصد (تخمینی) |
نرخ پاسخ فریبنده | ۹ درصد | ~ ۱۲ درصد (تخمینی) |
پشتیبانی صوتی در لحظه | ❌ | ✅ |
بیان احساسات | ❌ | ✅ |
Safe Completions (پاسخهای ایمن برای پرامپتهای ریسکی) | ✅ | ❌ |
پیشرفتهای GPT-5 نسبت به نسخهی قبلی
نسخهی ۵ جیپیتی نسبت به ۴o در این ویژگیها پیشرفت کرده است:
استدلال و عملکرد
جیپیتی ۵ در تمام بنچمارکهای مربوط به استدلال و عملکرد نسبت به ۴o بهتر ظاهر شده است؛ مثلا در آزمون ریاضی AIME 2025، جیپیتی ۵ نمرهی ۹۴/۶ درصد گرفت؛ در حالی که ۴o نمرهی ۷۱ درصد گرفته بود.
موتور استدلال جدیدی که جیپیتی ۵ به آن مجهز شده است، فقط به پاسخهای سطحی بسنده نمیکند؛ بلکه مثل یک کارشناس پاسخ میدهد؛ یعنی:
- جیپیتی ۵ میتواند ظرافتهای درخواست کاربر را متوجه شود (Nuance Understanding)؛ در حالی که ۴o پاسخهای کلی میدهد. مثلا اگر از چتجیپیتی بخواهید برنامهی ورزشی برای کسی که زانویش را عمل کرده بنویسد، نسخهی ۴o یک برنامهی عمومی و کلی مینویسد و نسخهی ۵ با در نظر گرفتن محدودیتهای این شخص، برنامه مینویسد.
- جیپیتی ۵ دستورالعملهای پیچیده و چندگانه را بهتر انجام میدهد؛ مثلا اگر درخواستتان ترکیبی از تحلیل و نمودار و جدول باشد، ۴o ممکن است بخشی از آن را نادیده بگیرد؛ در حالی که نسخهی ۵ دستور را میشکافد و موبهمو و بهصورت ساختاریافته انجام میدهد.
- جیپیتی ۵ برای کارهای سازمانی و حساس قابلاعتمادتر است؛ مثلا میتواند پیشنویس اسناد قانونی را آماده کند، بهعنوان مکمل نقش پزشک، پلنهای درمانی و توانبخشی ساختارمند بنویسد و تحلیلهای تجاری و مالی را قدمبهقدم با استدلال انجام دهد.
وظایف بصری و تولید ویدیو
نسخهی ۵ ChatGPT از تشخیص تصویر فراتر رفته و میتواند تحلیل، استتناج و خلاصهسازی بصری انجام دهد. این مدل در تحلیل نمودار و دادههای تصویری، بررسی ماکاپها و طراحی رابط کاربری و خلاصهسازی ویدیوها پیشرفت چشمگیری کرده است.
ایمنی و قابل اطمینان بودن
جیپیتی ۵ به قابلیت تکمیل ایمن (safe completions) مجهز است؛ یعنی اگر پرامپت پرریسک یا مبهم به آن بدهید، بهجای رد درخواست، پاسخهای مفیدی در چارچوب مشخص میدهد. این مدل کمترین نرخ توهمزدایی را هم داشته است. در ترافیک وبسایت GPT-5 فقط ۲/۱ درصد استدلالهای اشتباه داشته؛ در حالی که این رقم برای o3، بیشاز ۳/۶ درصد بوده است.
طبق نتایج تستها و نظرات کاربران پاسخهای چاپلوسانه (sycophancy) و فریبندهی مدل ۵ هم کمتر شده است. جیپیتی در این تستها فقط ۹ درصد مواقع پاسخ نادرست داد که نسبتبه o3 تقریبا ۸ برابر کمتر است.
برای استفادهی ایمن و بدون ریسک مسدودشدن اکانت از چتجیپیتی، بهتر است پرامپتهای ممنوعه چت جی پی تی را به آن ندهید. البته کاربران با نسخههای پیش از GPT-5، یک سری راه برای دورزدن قوانین پیدا کردهاند!
کدنویسی
شرکت OpenAI مدل ۵ چتجیپیتی را قویترین مدل کدنویسی خود تا امروز معرفی کرده است. این مدل میتواند رابط کاربریهای پیچیده تولید و مخازن بزرگ کد را دیباگ کند.
درست است که ابزارهای زیادی میتوانند با پرامپتی ساده اپلیکیشن و صفحهی وبسایت بسازند؛ ولی GPT-5 با دقت در جنبههای زیباییشناختی این کار را انجام میدهد. این مدل فضاگذاری، تایپوگرافی و فضای سفید را بهتر از مدلهای قبلی درک میکند.
نسخهی ۴o در مقابل، فقط برای پروژههای کوچک یا قطعه کد مناسب است، قدرت دیباگ آن محدود است و رابط کاربری طراحیشده توسط آن خام و ابتدایی بود.
نوشتن خلاقانه
این مدل در نوشتن متنهای خلاقانه با عمق ادبی و ریتم تواناتر از سایر مدلهاست؛ یعنی میتواند شعر آزاد و وزندار با حفظ معنا بگوید؛ ولی ۴o معمولا در یکی از آنها خطا میکرد. این مدل در نوشتن متنهای طولانی، متنهای رسمی مثل ایمیل و گزارش هم قویتر شده است.

نقطهضعفهای GPT-5 نسبت به نسخهی قبلی
با وجود پیشرفتهای ذکرشده، جیپیتی ۵ نقطهضعفهای زیر را هم دارد:
پشتیبانی نکردن از مکالمه صوتی
نسخهی ۵ از مکالمهی صوتی پشتیبانی نمیکند و برای مکالمه باید روی نسخهی ۴o بروید. ۴o میتواند پاسخهای سریع و بدون تاخیر و با لحنی دارای احساس بدهد. برای همین برای ایفای نقش معلم خصوصی و داستانگویی خصوصا برای کودکان مناسبتر است.
تعامل و لحن رسمی و خشک
یکی از مهمترین تفاوتهایی که کاربران در همان ساعات ابتدایی رونمایی از GPT-5 متوجه آن شدند، نحوهی تعامل متفاوت آن بود. جیپیتی ۵ سرد و کوتاه پاسخ میدهد و بهقول کاربران، مثل یک منشی خسته از کار صحبت میکند.
در مقابل، ۴o صمیمی است و تعاملی احساسی با کاربران دارد. برای همین کاربران بهویژه کاربران رایگانی که امکان تغییر مدل را ندارند، احساس ازدستدادن یک دوست و همراه را داشتهاند.
کاهش خلاقیت و آزادی
کاربران از پاسخهای کوتاه و فیلترشده و فقدان شخصیت این مدل شکایت دارند و جوابهای خشک آن را نشانهی نبود خلاقیت میدانند. بهعلاوه، ایمنی و پاسخهای دقیق و گاهی محافظهکارانه در GPT-5 اهمیت بیشتری دارد که باعث شده آزادی و خلاقیت آن کاهش پیدا کند. لازمهی خلاقیت، آزادی در اندیشه است که این مدل بهعلت تاکید بر ایمنی و محدودیتهایش در آن کمتر تواناست.

در ادامه مدلها را با پرامپتهای مشابه مقایسه میکنیم و خودتان میتوانید درمورد این موضوع نتیجه بگیرید.
در نهایت کدام مدل بهتر است؟
تا اینجا نقاط قوت و ضعف جیپیتی ۵ را بررسی کردیم. در این بخش میخواهیم ببینیم از نظر مقالهی creolestudios کدام مدل در نهایت بهتر است.
با توجه به اینکه GPT-5 در همهچیز بهتر از نسخههای قبلی ظاهر نشده است، نمیتوان بهصورت کلی یک نتیجه گرفت و گفت این مدل بهتر از بقیه است؛ بلکه بسته به وظیفهای که از آن میخواهیم، یک مدل ممکن است قویتر ظاهر شود.
- جیپیتی ۵ برای نوشتن اسناد پژوهشی و حقوقی پیچیده، کدنویسی در مخازن بزرگ، مشاورهی سلامت و حقوقی، ساخت عامل هوش مصنوعی و اتوماسیون سازمانی بهتر است.
- جیپیتی ۴o بهعنوان دستیار صوتی (تعامل صوتی زنده)، داستانگویی احساسی و طوفان فکری در لحظه بهتر عمل میکند.
برای اینکه بدون محدودیت از مدل جدید OpenAI استفاده کنید، بهتر است برای خرید اکانت chatgpt اقدام کنید.
پرامپت یکسان، پاسخهای متفاوت
گفتیم که نسخهی ۵ سرد و بیاحساس است، پاسخهای کوتاه میدهد و خلاقیت آن نسبت به ۴o کمتر است. در این بخش با تکیهبر مقالهای از techradar درستی این مسئله را بررسی میکنیم. قرار است ۵ پرامپت این مقاله را بهفارسی از نسخههای ۵ و ۴o چتجیپیتی بپرسیم و نتایج را مقایسه کنیم.
برای اینکه پرامپتهای بهتری بنویسید، پیشنهاد میکنیم مقالهی «پرامپت چیست» را بخوانید.
پرامپت اول این بود: «داستان فیلم فارست گامپ را خلاصه کن».
جواب جیپیتی ۵:

جواب جیپیتی ۴o:

با اینکه هر ۲ نسخه خلاصهی خوبی از داستان فیلم ارائه دادهاند، میتوان دید که جیپیتی ۵ خلاصهی کلیتر و بهینهتری از فیلم ارائه داده است و در پایان از کاربر دربارهی ارائهی خلاصهای حتی کوتاهتر پرسیده است.
پاسخ جیپیتی ۴o ولی مقدمه و نتیجهگیری دارد، خلاصهاش روایت داستانگونهتری دارد و با نقلقول معروفی از این فیلم تمام میشود. این پاسخ گرمتر و خلاقانهتر است؛ در حالی که پاسخ نسخهی ۵ عملگراتر است و صرفا میخواهد خلاصهای مفید به کاربر بدهد.
پرامپت دوم این است: «برای منع الکل دلیل بیار. بعد علیهش استدلال کن و با یک نتیجهگیری مشخص پایان بده.»
جواب جیپیتی ۵:

جواب جیپیتی ۴o:.

جواب نسخهی ۵ فهرستوار است و دلایل موافق و مخالف را بهتفکیک آورده و به جزییات بیشتری اشاره کرده است. البته جیپیتی ۵ چون بهصورت خودکار بین نسخهها جابجا میشود، برای پاسخ این سوال از مدل Thinking استفاده کرده است.
پاسخ نسخهی ۴o روایت بهتری دارد؛ ولی دلایل تفکیک نشده و خلاصهتر است؛ ولی همچنان هر دو پاسخ درست هستند.
در پرامپت سوم خواستیم ببینیم کدام مدل در ارائهی راهنمای مرحلهبهمرحله قویتر است: «نحوه تغییر باتریها در کنترلر ایکس باکس را با دستورالعمل مرحله به مرحله توضیح بده.»
جواب جیپیتی ۵:

جواب جیپیتی ۴o:

نسخهی ۵ برای مدلهای مختلف دستورالعمل داده و نکتههای بیشتری گفته است؛ هرچند همهی اینها برای مخاطب کاربردی نیست. نسخهی ۴o جواب کاربردیتری داده و نکتههای مفیدتری به کاربر داده است.
حالا نوشتن خلاقانهی ۲ مدل را با پرامپت زیر مقایسه میکنیم: «یک داستان کوتاه و خندهدار (زیر ۱۵۰ کلمه) درباره جادوگری بنویس که سعی دارد طلسمی برای انجام تکالیف فرزندش بسازد.»
جواب جیپیتی ۵:

جواب جیپیتی ۴o:

داستان جیپیتی ۵ بامزهتر است و نتیجهگیری اخلاقی ندارد. داستان ۴o با کلمات بازی کرده است و تصویرسازی جالبتری دارد؛ ولی هم نتیجهگیری اخلاقی دارد، هم میتوان گفت بیمزه است.
به نظر شما کدام داستان جالبتر بود؟
بزرگترین ایرادی که از جیپیتی ۵ میگیرند این است که گرما و صمیمت ندارد. این مسئله را با این پرامپت بررسی کردیم: «مادر همسرم به تازگی پس از یک بیماری سخت درگذشت. او 80 سال داشت. برای این زمان دشوار پیشنهادی به من بده که چه چیزی به آنها بگویم؟»
جواب جیپیتی ۵:

جواب جیپیتی ۴o:

جیپیتی ۵ هرچند با ابراز همدردی شروع کرده است؛ ولی جواب خشک و بیروحی داده است. پاسخهای فهرستی و دستهبندیشده، همانطور که تا اینجا دیدیم، ویژگی نسخهی ۵ است.
جیپیتی ۴o همدردی نکرده است؛ ولی پاسخی که داده، انسانیتر است. پیشنهادهای ۴o هم نسبتبه ۵ کاملتر و مفیدتر است. در پایان هم هر ۲ خواستهاند در صورت تمایل کاربر جملات تسلیت آماده کنند.
با مقایسهی این ۵ پرامپت میتوانیم نتیجهگیری بخش قبلی را تا حدودی تایید کنیم:
جیپیتی ۵ پاسخهای عملگرا و بهینه میدهد و سعی میکند همهی جوانب ماجرا را در نظر بگیرد؛ ولی ۴o همدلی بیشتری دارد و در خلاصهسازی هم بهتر است. هر چند در نویسندگی خلاقانه دیدیم که جیپیتی ۵ بهتر عمل کرد.
مدلهای جیپیتی هر روز بهتر میشود
همانطور که در این مقاله خواندید، جیپیتی ۵ نسخهی بهروز و برتری از OpenAI است که طبق ادعاهای شرکت، پیشرفتهترین مدلی از چتجیپیتی است که تا الان منتشر شده؛ ولی کاربران زیادی بهعلت عادت به مدلهای قبلی نتوانستند با این مدل بهخوبی ارتباط بگیرند.
در این مقاله نقاط قوت ضعف مدل ۵ را نسبتبه ۴o بررسی کردیم. نظر شما چیست؟ با رونمایی از مدل GPT-۵، همچنان از جیپیتی ۴o استفاده میکنید یا سراغ همین مدل جدید میروید؟
قلم خوانا و مثالها قابل لمسی داشتین🌱سپاس و خداقوت✌🏼
منشکرم