نتیجه را باور نمی‌کنید! مقایسه‌ی کامل GPT-5 و GPT-4o با پرامپت‌های یکسان + جدول

در اوایل رونمایی از جی‌پی‌تی ۵ کاربران زیادی ابراز ناامیدی کردند. کاربران جی‌پی‌تی ۵ را در مقایسه با مدل 4o سردتر توصیف کردند و از جواب‌های کوتاه و بی‌احساس آن ناراضی بودند.

به‌علاوه، محدودیت انتخاب مدل در روزهای اول پس‌از رونمایی، باعث شده بود کاربران احساس کنند دیگر کنترلی بر نحوه‌ی پاسخ‌دهی ندارند و نارضایتی‌ها بیشتر شود.

از طرف دیگر OpenAI جی‌پی‌تی 5 را پیشرفته‌ترین مدل خود معرفی کرده بود و ادعا داشت قابلیت‌هایی از قبیل استدلال یا کدنویسی در آن بهبود چشمگیری پیدا کرده است.

در این مقاله می‌خواهیم ببینیم در واقعیت کدام‌یک از این ۲ مدل ChatGPT بهتر هستند. ابتدا پیشرفت‌های GPT-5 و سپس نقاط ضعف آن را در مقایسه با GPT-4o بررسی می‌کنیم و سپس با چند پرامپت یکسان، عملکرد این ۲ را با هم می‌سنجیم.

مقایسه GPT-5‌ و GPT-4o

شرکت OpenAI جی‌پی‌تی ۵ را مدل پیش‌فرض و پرچم‌دار خود معرفی کرده که در سطح دکترا استدلال می‌کند و در مقایسه با GPT-4o که دوستی بامزه و خوش‌صحبت بود، مشاوری حرفه‌ای و جدی است. آیا در واقعیت هم همین است؟ براساس مقاله‌ای از creolestudios و مستندات OpenAI به این سوال پاسخ می‌دهیم.

قبل از اینکه مقایسه را بخوانیم، می‌توانید با مطالعه‌ی مقاله‌ی «چت جی پی تی چیست» بیشتر با این هوش مصنوعی آشنا شوید.

در جدول زیر مقایسه‌ای از دو ۲ مدل OpenAI را در آزمون‌های مختلف می‌بینید:

معیار آزمون / ویژگی	GPT-5	GPT-4o
AIME 2025 (ریاضی)	۹۴/۶ درصد	۷۱ درصد
SWE-bench Verified (کدنویسی)	۷۴/۹ درصد	۳۰/۸ درصد
VideoMMMU (تحلیل محتوای ویدیویی)	۸۱/۱ درصد	۵۸/۸ درصد
HealthBench (سوالات دشوار مربوط به سلامتی)	۴۶/۲ درصد	۳۱/۶ درصد
نرخ توهم	۲/۱ درصد	~ ۳/۶ درصد (تخمینی)
نرخ پاسخ فریبنده	۹ درصد	~ ۱۲ درصد (تخمینی)
پشتیبانی صوتی در لحظه	❌	✅
بیان احساسات	❌	✅
Safe Completions (پاسخ‌های ایمن برای پرامپت‌های ریسکی)	✅	❌

پیشرفت‌های GPT-5 نسبت به نسخه‌ی قبلی

نسخه‌ی ۵ جی‌پی‌تی نسبت به ۴o در این ویژگی‌ها پیشرفت کرده است:

استدلال و عملکرد

چت‌جی‌پی‌تی ۵ در تمام بنچمارک‌های مربوط به استدلال و عملکرد نسبت به ۴o بهتر ظاهر شده است؛ مثلا در آزمون ریاضی AIME 2025، جی‌پی‌تی ۵ نمره‌ی ۹۴/۶ درصد گرفت؛ در حالی که ۴o نمره‌ی ۷۱ درصد گرفته بود.

موتور استدلال جدیدی که جی‌پی‌تی 5 به آن مجهز شده است، فقط به پاسخ‌های سطحی بسنده نمی‌کند؛ بلکه مثل یک کارشناس پاسخ می‌دهد؛ یعنی:

چت‌جی‌پی‌تی ۵ می‌تواند ظرافت‌های درخواست کاربر را متوجه شود (Nuance Understanding)؛ در حالی که ۴o پاسخ‌های کلی می‌دهد. مثلا اگر از چت‌جی‌پی‌تی بخواهید برنامه‌ی ورزشی برای کسی که زانویش را عمل کرده بنویسد، نسخه‌ی ۴o یک برنامه‌ی عمومی و کلی می‌نویسد و نسخه‌ی ۵ با در نظر گرفتن محدودیت‌های این شخص، برنامه می‌نویسد.
جی‌پی‌تی ۵ دستورالعمل‌های پیچیده و چندگانه را بهتر انجام می‌دهد؛ مثلا اگر درخواستتان ترکیبی از تحلیل و نمودار و جدول باشد، ۴o ممکن است بخشی از آن را نادیده بگیرد؛ در حالی که نسخه‌ی ۵ دستور را می‌شکافد و موبه‌مو و به‌صورت ساختاریافته انجام می‌دهد.
جی‌پی‌تی ۵ برای کارهای سازمانی و حساس قابل‌اعتمادتر است؛ مثلا می‌تواند پیش‌نویس اسناد قانونی را آماده کند، به‌عنوان مکمل نقش پزشک، پلن‌های درمانی و توان‌بخشی ساختارمند بنویسد و تحلیل‌های تجاری و مالی را قدم‌به‌قدم با استدلال انجام دهد.

وظایف بصری و تولید ویدیو

نسخه‌ی ۵ ChatGPT از تشخیص تصویر فراتر رفته و می‌تواند تحلیل، استتناج و خلاصه‌سازی بصری انجام دهد. این مدل در تحلیل نمودار و داده‌های تصویری، بررسی ماکاپ‌ها و طراحی رابط کاربری و خلاصه‌سازی ویدیوها پیشرفت چشمگیری کرده است.

ایمنی و قابل اطمینان بودن

چت‌جی‌پی‌تی ۵ به قابلیت تکمیل ایمن (safe completions) مجهز است؛ یعنی اگر پرامپت پرریسک یا مبهم به آن بدهید، به‌جای رد درخواست، پاسخ‌های مفیدی در چارچوب مشخص می‌دهد. این مدل کمترین نرخ توهم‌زدایی را هم داشته است. در ترافیک وبسایت GPT-5 فقط ۲/۱ درصد استدلال‌های اشتباه داشته؛ در حالی که این رقم برای o3، بیش‌از ۳/۶ درصد بوده است.

طبق نتایج تست‌ها و نظرات کاربران پاسخ‌های چاپلوسانه (sycophancy) و فریبنده‌ی مدل ۵ هم کمتر شده است. جی‌پی‌تی در این تست‌ها فقط ۹ درصد مواقع پاسخ نادرست داد که نسبت‌به o3 تقریبا ۸ برابر کمتر است.

برای استفاده‌ی ایمن و بدون ریسک مسدودشدن اکانت از چت‌جی‌پی‌تی، بهتر است پرامپت‌های ممنوعه چت جی پی تی را به آن ندهید. البته کاربران با نسخه‌های پیش از GPT-5، یک سری راه برای دورزدن قوانین پیدا کرده‌اند!

کدنویسی

شرکت OpenAI مدل ۵ چت‌جی‌پی‌تی را قوی‌ترین مدل کدنویسی خود تا امروز معرفی کرده است. این مدل می‌تواند رابط کاربری‌های پیچیده تولید و مخازن بزرگ کد را دیباگ کند.

درست است که ابزارهای زیادی می‌توانند با پرامپتی ساده اپلیکیشن و صفحه‌ی وبسایت بسازند؛ ولی GPT-5 با دقت در جنبه‌های زیبایی‌شناختی این کار را انجام می‌دهد. این مدل فضاگذاری، تایپوگرافی و فضای سفید را بهتر از مدل‌های قبلی درک می‌کند.

نسخه‌ی ۴o‌ در مقابل،‌ فقط برای پروژه‌های کوچک یا قطعه کد مناسب است، قدرت دیباگ آن محدود است و رابط کاربری طراحی‌شده توسط آن خام و ابتدایی بود.

نوشتن خلاقانه

این مدل در نوشتن متن‌های خلاقانه با عمق ادبی و ریتم تواناتر از سایر مدل‌هاست؛ یعنی می‌تواند شعر آزاد و وزن‌دار با حفظ معنا بگوید؛ ولی ۴o معمولا در یکی از آن‌ها خطا می‌کرد. این مدل در نوشتن متن‌های طولانی، متن‌های رسمی مثل ایمیل و گزارش هم قوی‌تر شده است.

بیشتر بخوانید: چت جی پی تی 4 چیست

نقطه‌ضعف‌های GPT-5 نسبت به نسخه‌ی قبلی

با وجود پیشرفت‌های ذکرشده، جی‌پی‌تی ۵ نقطه‌ضعف‌های زیر را هم دارد:

پشتیبانی نکردن از مکالمه صوتی

نسخه‌ی ۵ از مکالمه‌ی صوتی پشتیبانی نمی‌کند و برای مکالمه باید روی نسخه‌ی ۴o بروید. ۴o می‌تواند پاسخ‌های سریع و بدون تاخیر و با لحنی دارای احساس بدهد. برای همین برای ایفای نقش معلم خصوصی و داستان‌گویی خصوصا برای کودکان مناسب‌تر است.

بیشتر بخوانید: چت جی پی تی صوتی

تعامل و لحن رسمی و خشک

یکی از مهم‌ترین تفاوت‌هایی که کاربران در همان ساعات ابتدایی رونمایی از GPT-5‌ متوجه آن شدند، نحوه‌ی تعامل متفاوت آن بود. جی‌پی‌تی ۵ سرد و کوتاه پاسخ می‌دهد و به‌قول کاربران، مثل یک منشی خسته از کار صحبت می‌کند.

در مقابل، ۴o صمیمی است و تعاملی احساسی با کاربران دارد. برای همین کاربران به‌ویژه کاربران رایگانی که امکان تغییر مدل را ندارند، احساس ازدست‌دادن یک دوست و همراه را داشته‌اند.

کاهش خلاقیت و آزادی

کاربران از پاسخ‌های کوتاه و فیلترشده و فقدان شخصیت این مدل شکایت دارند و جواب‌های خشک آن را نشانه‌ی نبود خلاقیت می‌دانند. به‌علاوه، ایمنی و پاسخ‌های دقیق و گاهی محافظه‌کارانه در GPT-5 اهمیت بیشتری دارد که باعث شده آزادی و خلاقیت آن کاهش پیدا کند. لازمه‌ی خلاقیت، آزادی در اندیشه است که این مدل به‌علت تاکید بر ایمنی و محدودیت‌هایش در آن کمتر تواناست.

در ادامه مدل‌ها را با پرامپت‌های مشابه مقایسه می‌کنیم و خودتان می‌توانید درمورد این موضوع نتیجه بگیرید.

در نهایت کدام مدل بهتر است؟

تا اینجا نقاط قوت و ضعف جی‌پی‌تی 5 را بررسی کردیم. در این بخش می‌خواهیم ببینیم از نظر مقاله‌ی creolestudios کدام مدل در نهایت بهتر است.

با توجه به اینکه GPT-5 در همه‌چیز بهتر از نسخه‌های قبلی ظاهر نشده است، نمی‌توان به‌صورت کلی یک نتیجه گرفت و گفت این مدل بهتر از بقیه است؛ بلکه بسته به وظیفه‌ای که از آن می‌خواهیم، یک مدل ممکن است قوی‌تر ظاهر شود.

جی‌پی‌تی ۵ برای نوشتن اسناد پژوهشی و حقوقی پیچیده، کدنویسی در مخازن بزرگ، مشاوره‌ی سلامت و حقوقی، ساخت عامل هوش مصنوعی و اتوماسیون سازمانی بهتر است.
جی‌پی‌تی ۴o به‌عنوان دستیار صوتی (تعامل صوتی زنده)، داستان‌گویی احساسی و طوفان فکری در لحظه بهتر عمل می‌کند.

پرامپت یکسان، پاسخ‌های متفاوت

گفتیم که نسخه‌ی ۵ سرد و بی‌احساس است، پاسخ‌های کوتاه می‌دهد و خلاقیت آن نسبت به ۴o کمتر است. در این بخش با تکیه‌بر مقاله‌ای از techradar درستی این مسئله را بررسی می‌کنیم. قرار است ۵ پرامپت این مقاله را به‌فارسی از نسخه‌های ۵ و ۴o چت‌جی‌پی‌تی بپرسیم و نتایج را مقایسه کنیم.

برای اینکه پرامپت‌های بهتری بنویسید،‌ پیشنهاد می‌کنیم مقاله‌ی «پرامپت چیست» را بخوانید.

پرامپت اول این بود: «داستان فیلم فارست گامپ را خلاصه کن».

جواب جی‌پی‌تی ۵:

جواب جی‌پی‌تی ۴o:

با اینکه هر ۲ نسخه خلاصه‌ی خوبی از داستان فیلم ارائه داده‌اند، می‌توان دید که جی‌پی‌تی 5 خلاصه‌ی کلی‌تر و بهینه‌تری از فیلم ارائه داده است و در پایان از کاربر درباره‌ی ارائه‌ی خلاصه‌ای حتی کوتاه‌تر پرسیده است.

پاسخ جی‌پی‌تی ۴o ولی مقدمه و نتیجه‌گیری دارد، خلاصه‌اش روایت داستان‌گونه‌تری دارد و با نقل‌قول معروفی از این فیلم تمام می‌شود. این پاسخ گرم‌تر و خلاقانه‌تر است؛ در حالی که پاسخ نسخه‌ی ۵ عملگراتر است و صرفا می‌خواهد خلاصه‌ای مفید به کاربر بدهد.

پرامپت دوم این است: «برای منع الکل دلیل بیار. بعد علیهش استدلال کن و با یک نتیجه‌گیری مشخص پایان بده.»

جواب جی‌پی‌تی ۵:

جواب جی‌پی‌تی ۴o:.

جواب نسخه‌ی ۵ فهرست‌وار است و دلایل موافق و مخالف را به‌تفکیک آورده و به جزییات بیشتری اشاره کرده است. البته جی‌پی‌تی 5 چون به‌صورت خودکار بین نسخه‌ها جابجا می‌شود، برای پاسخ این سوال از مدل Thinking استفاده کرده است.

پاسخ نسخه‌ی ۴o روایت بهتری دارد؛ ولی دلایل تفکیک نشده و خلاصه‌تر است؛ ولی همچنان هر دو پاسخ درست هستند.

در پرامپت سوم خواستیم ببینیم کدام مدل در ارائه‌ی راهنمای مرحله‌به‌مرحله قوی‌تر است: «نحوه تغییر باتری‌ها در کنترلر ایکس باکس را با دستورالعمل مرحله به مرحله توضیح بده.»

جواب جی‌پی‌تی ۵:

جواب جی‌پی‌تی ۴o:

نسخه‌ی ۵ برای مدل‌های مختلف دستورالعمل داده و نکته‌های بیشتری گفته است؛ هرچند همه‌ی این‌ها برای مخاطب کاربردی نیست. نسخه‌ی ۴o جواب کاربردی‌تری داده و نکته‌های مفیدتری به کاربر داده است.

حالا نوشتن خلاقانه‌ی ۲ مدل را با پرامپت زیر مقایسه می‌کنیم: «یک داستان کوتاه و خنده‌دار (زیر ۱۵۰ کلمه) درباره جادوگری بنویس که سعی دارد طلسمی برای انجام تکالیف فرزندش بسازد.»

جواب جی‌پی‌تی ۵:

جواب جی‌پی‌تی ۴o:

داستان جی‌پی‌تی ۵ بامزه‌تر است و نتیجه‌گیری اخلاقی ندارد. داستان ۴o با کلمات بازی کرده است و تصویرسازی جالب‌تری دارد؛ ولی هم نتیجه‌گیری اخلاقی دارد، هم می‌توان گفت بی‌مزه است.

به نظر شما کدام داستان جالب‌تر بود؟

بزرگ‌ترین ایرادی که از جی‌پی‌تی ۵ می‌گیرند این است که گرما و صمیمت ندارد. این مسئله را با این پرامپت بررسی کردیم: «مادر همسرم به تازگی پس از یک بیماری سخت درگذشت. او 80 سال داشت. برای این زمان دشوار پیشنهادی به من بده که چه چیزی به آن‌ها بگویم؟»

جواب جی‌پی‌تی ۵:

جواب جی‌پی‌تی ۴o:

جی‌پی‌تی ۵ هرچند با ابراز همدردی شروع کرده است؛ ولی جواب خشک و بی‌روحی داده است. پاسخ‌های فهرستی و دسته‌بندی‌شده، همان‌طور که تا اینجا دیدیم، ویژگی نسخه‌ی ۵ است.

جی‌پی‌تی ۴o همدردی نکرده است؛‌ ولی پاسخی که داده، انسانی‌تر است. پیشنهادهای ۴o هم نسبت‌به ۵ کامل‌تر و مفیدتر است. در پایان هم هر ۲ خواسته‌اند در صورت تمایل کاربر جملات تسلیت آماده کنند.

با مقایسه‌ی این ۵ پرامپت می‌توانیم نتیجه‌گیری بخش قبلی را تا حدودی تایید کنیم:

جی‌پی‌تی ۵ پاسخ‌های عملگرا و بهینه می‌دهد و سعی می‌کند همه‌ی جوانب ماجرا را در نظر بگیرد؛ ولی ۴o همدلی بیشتری دارد و در خلاصه‌سازی هم بهتر است. هر چند در نویسندگی خلاقانه دیدیم که جی‌پی‌تی ۵ بهتر عمل کرد.

مدل‌های جی‌پی‌تی هر روز بهتر می‌شود

همان‌طور که در این مقاله خواندید، جی‌پی‌تی ۵ نسخه‌ی به‌روز و برتری از OpenAI است که طبق ادعاهای شرکت، پیشرفته‌ترین مدلی از چت‌جی‌پی‌تی است که تا الان منتشر شده؛ ولی کاربران زیادی به‌علت عادت به مدل‌های قبلی نتوانستند با این مدل به‌خوبی ارتباط بگیرند.

در این مقاله نقاط قوت ضعف مدل ۵ را نسبت‌به ۴o بررسی کردیم. نظر شما چیست؟ با رونمایی از مدل GPT-5، همچنان از جی‌پی‌تی ۴o استفاده می‌کنید یا سراغ همین مدل جدید می‌روید؟

جی‌پی‌تی ۵ از جی‌پی‌تی ۴o از همه نظر بهتر است؟ مقایسه ۲ مدل با پرامپت‌های یکسان