سه سال پیش در ۳۰ نوامبر ۲۰۲۲ (۹ آذر ۱۴۰۱) چت‌بات ChatGPT به‌عنوان یک پروژه‌ی پژوهشی معرفی شد و دوره‌ای را در زندگی بشر کلید زد که با کشف انرژی برق یا اختراع اینترنت مقایسه می‌شود. این تأثیر به‌حدی عمیق است که امروز دیگر نمی‌توانیم زمانی را تصور کنیم که هوش مصنوعی در زندگی و کار ما نقشی نداشته باشد.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

چت جی‌پی‌تی ظرف دو ماه از رونمایی اولین مدل، بیش از ۱۰۰ میلیون کاربر فعال ماهانه جذب کرد و رکورد سریع‌ترین رشد پلتفرم‌های آنلاین را به‌خود اختصاص داد. موفقیت اولیه ChatGPT موج توجه جهانیان به هوش مصنوعی را به‌همراه داشت.

همه‌ی نگاه‌ها به صفحه‌ای خیره‌ شده بود که فقط یک نوار ساده در آن دیده می‌شد و باید سوال خودت را از هوش مصنوعی می‌پرسیدی. مردم تعجب کرده بودند که این سایت ساده چگونه می‌تواند مانند یک انسان با آن‌ها گفتگو کند و به هر سوالی جواب بدهد.

GPT 3.5: آغاز انقلاب هوش مصنوعی

اولین نسخه‌ی عمومی ChatGPT

اولین نسخه از ChatGPT بر پایه‌ی مدل GPT 3.5 بنا شده بود؛ مدلی که درک مطلوبی از خواست کاربر داشت و پاسخ‌هایی روان و کاربردی ارائه می‌داد. خیلی زود قابلیت مکالمه‌ی طبیعی این چت‌بات میلیون‌ها کاربر را جذب کرد.

OpenAI کار روی مدل‌های هوش مصنوعی را از سال ۲۰۱۸ با معرفی مدل GPT 1 شروع کرد. GPT مخفف عبارت Generative Pre-trained Transformer به‌معنای مبدل پیش‌آموزش‌دیده‌ی مولد است. در اوایل سال ۲۰۱۹ نیز مدل GPT 2 معرفی شد.

شهرت OpenAI از انتشار GPT 3 در اواسط ۲۰۲۰ به اوج خودش رسید در همین موقع بود که ابزاری ناگهان به ترند فضای مجازی تبدیل شد؛ Dall-E، می‌توانست پرامپت متنی کاربر را به عکس تبدیل کند. نسخه‌ی اول Dall-E چندان تعریفی نداشت و وضوح آن نهایتا به ۲۵۶ در ۲۵۶ پیکسل می‌رسید. با معرفی GPT 3.5، ابزار تصویرساز Dall-E2 نیز رونمایی شد که قدرت بسیار بیشتری در خلق تصاویر داشت.

عکس با Dall-e. پرامپت: «جوانی در حال باز کردن پرتالی به روم باستان به‌کمک کومودور ۶۴»

GPT 3.5 گاهی با اطمینان پاسخ‌های نادرست یا جعلی تولید می‌کرد که این توهم‌زایی، باعث نگرانی‌هایی شده بود. ترس از تقلب، دیپ‌فیک و سوءاستفاده از این فناوری موجب شد از همان ابتدا بحث‌های اخلاقی و ضرورت نظارت بر هوش مصنوعی مطرح شود.

GPT 4: جهش در توانایی‌ها

در مارس ۲۰۲۳، مدل GPT 4 عرضه شد و جهشی چشمگیر در قابلیت‌های ChatGPT پدید آورد. GPT 4 با معماری بزرگ‌تر، آزمون‌های دشوار را با موفقیت پشت سر گذاشت و در تولید کدهای پیچیده و حل مسائل پیشرفته عملکرد بهتری نسبت‌به GPT-3.5 داشت.

استقبال عمومی و تجاری از GPT 4 خیره‌کننده بود؛ مایکروسافت این مدل را به‌عنوان ستون اصلی دستیار هوشمند کوپایلت به‌کار گرفت و سرویس‌های زیادی با ChatGPT یکپارچه شدند. با این حال، GPT 4 همچنان گاهی دچار اشتباه یا سوگیری می‌شد.

در اواخر سال ۲۰۲۳، افزونه‌های تعاملی به ChatGPT اضافه شدند تا این مدل بتواند جست‌وجوی وب انجام دهد(Web Search)، کد اجرا کند (Canvas) و از پایگاه‌های دانش بیرونی بهره بگیرد (Deep Research). به کمک این ابزارها، ChatGPT از یک ربات گفتگومحور به دستیاری برای کارهای پیچیده‌تری نظیر تحلیل داده و برنامه‌ریزی ارتقا یافت.

حدود یک‌سال پس از معرفی GPT 4 (در اسفند ۱۴۰۱)، مدل GPT 4 Turbo در آبان ۱۴۰۲ رونمایی شد. چند ماه بعد از این اتفاق، اولین نسخه از ابزار ویدیوساز OpenAI موسوم‌به Sora چشم به جهان گشود. سورا قادر بود علاوه‌بر تبدیل متن به ویدیو، عکس را هم متحرک کند و صحنه‌های واقع‌گرایانه بسازد.

GPT 4o: هوش عالم‌گیر OpenAI

میراموراتی- مدیرمحصول سابق OpenAI

در بهار ۲۰۲۴، GPT-4o منتشر شد که سرعت پاسخ‌دهی را بالا برد و با پنجره‌ی محتوایی بسیار بزرگ، امکان پردازش گفتگوهای طولانی و اسناد حجیم را فراهم کرد. علاوه‌بر این، امکان چت صوتی و ویدیویی نیز به این مدل افزوده شد. در همین زمان، قابلیت شخصی‌سازی مدل به‌وجود آمد تا کاربران بتوانند دستورالعمل‌ها و تنظیمات دلخواه خود را به هوش مصنوعی اضافه کنند یا حتی GPT-های اختصاصی بسازند.

OpenAI با رونمایی از مدل 4o اعلام کرد که کاربران برای ساخت عکس با هوش مصنوعی، دیگر نیازی به مراجعه به Dall-E ندارند و می‌توانند این‌کار را مستقیما از طریق ChatGPT انجام دهند.

با وجود این پیشرفت‌ها و استقبال گسترده، GPT-4o متهم شد که بیش از حد چاپلوسی می‌کند و پاسخ‌های نادرستِ توهم‌آمیز می‌دهد. نگرانی‌هایی درباره‌ی حریم خصوصی، استفاده‌ی بدون مجوز از اطلاعات دارای حق نشر و انتقاداتی در مورد سانسور محتوا همگی بحث‌های زیادی را در جامعه به‌وجود آوردند و سیاست‌گذاران را به فکر وضع مقررات برای هوش مصنوعی انداخت.

GPT 5 و مسیر آینده

مدل هوش مصنوعی GPt 5

مدل‌های GPT 5 و GPT 5.1 که در سال ۲۰۲۵ منتشر شدند، پیشرفته‌ترین هوش مصنوعی فعلی OpenAI محسوب می‌شوند. GPT 5.1 نسبت‌به GPT 4o بسیار منطقی‌تر شده و از قدرت درک و استدلال بالاتری برخوردار است.

خالق ChatGPT در مهر ۱۴۰۴ مدل ویدیوساز سورا ۲ را نیز به کلکسیون ابزارهای خود اضافه کرد تا با خلق ویدیوهای واقعی صدادار، هوش از سر کاربران بپراند. علاوه‌بر این، استارتاپ سم آلتمن اقدام به تولید اپلیکیشن جداگانه‌ی سورا ۲ کرد که ویژگی Cameo آن (ساخت آواتار از شخصیت‌های معروف) جنجالی شد.

ChatGPT اکنون همه‌چیز دارد. از قابلیت ساخت عکس با تنظیم ابعاد و استایل‌های مختلف، تا راهنمایی خرید آنلاین و اتصال مستقیم با پلتفرم‌هایی نظیر گیت‌هاب و Canva و اسپاتیفای و گوگل‌درایو. این ابزار محبوب عامل‌محورتر (Agentic) شده و کارهای بسیاری مانند کدنویسی را به‌طور خودکار انجام می‌دهد.

GPT 5.1 توانایی بسیار خیره‌کننده‌ای در زمینه‌ی کدنویسی دارد. OpenAI همزمان با رونمایی از این مدل، قابلیت‌هایی نظیر Codex برای کدنویسی پیشرفته، Agent Builder برای توسعه‌ی ایجنت‌های هوش مصنوعی و چت گروهی را به ChatGPT اضافه کرد.

ChatGPT ما را با دنیای هوش مصنوعی آشنا کرد، اما اکنون رقبای سرسختی همچون جمنای و پرپلکسیتی و کلود را درمقابل خودش دارد. این چت‌بات اکنون بیش از ۸۰۰ میلیون کاربر فعال ماهانه دارد و به‌نظر می‌رسد که همچنان به‌عنوان بهترین پلتفرم AI برای کاربران عمومی باقی خواهد ماند. اگرچه هزینه‌های سرسام‌آور زیرساخت، OpenAI را مجبور به نمایش تبلیغات در ChatGPT خواهد کرد.