گوگل امروز با انتشار یک سند رسمی، از تغییر پارادایم در تکامل عامل‌های هوش مصنوعی پرده برداشت؛ گذار از ابزار هوش مصنوعی که صرفاً به تولید محتوا، پاسخ به سوالات و انجام کارهای پراکنده می‌پردازد، به‌سمت دسته‌ی جدیدی از نرم‌افزارها که قادر به حل مسئله و اجرای وظایف به‌صورت یکپارچه و مستقل هستند. 

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

سند گوگل، ظهور نسل جدیدی از عامل‌های هوش مصنوعی (AI Agents) را نوید می‌دهد که قادر به برنامه‌ریزی، اقدام و حل مسائل پیچیده برای رسیدن به اهداف مشخص هستند. این چارچوب جدید، مسیر ساخت و استقرار سیستم‌های هوشمندی را روشن می‌سازد که می‌توانند بدون هدایت لحظه‌به‌لحظه‌ی انسان، وظایف چندمرحله‌ای را به سرانجام برسانند.

یک عامل هوش مصنوعی فراتر از یک مدل زبانی عمل می‌کند و یک برنامه‌ی کاربردی کامل محسوب می‌شود که معماری آن از چهار جزء حیاتی تشکیل شده است: مغز، دست، سیستم عصبی و پاها.

مدل زبانی بزرگ به عنوان «مغز» سیستم، وظیفه‌ی استدلال و تصمیم‌گیری را بر عهده دارد و ابزارها، همچون «دست‌ها»، به این مغز امکان تعامل با دنیای واقعی را می‌دهند.

لایه ارکستراسیون به مثابه «سیستم عصبی»، دو بخش قبل را به هم متصل و فرایند را مدیریت می‌کند. در نهایت، لایه‌ی استقرار (پیکره و پاها)، این سیستم را به یک سرویس قابل اتکا و در دسترس در محیط عملیاتی تبدیل می‌کند. 

این ساختار در یک چرخه‌ی عملیاتی پنج مرحله‌ای کار می‌کند: عامل ابتدا مأموریت را دریافت و سپس محیط را برای جمع‌آوری اطلاعات اسکن می‌کند، راه حل را می‌اندیشد، اقدام لازم را انجام می‌دهد و در نهایت نتیجه را مشاهده و فرایند را تکرار می‌کند. 

براساس توضیحات گوگل، توانمندی ایجنت‌های هوش مصنوعی در یک طیف تکاملی قرار می‌گیرد که از سطح صفر، یعنی «سیستم استدلال مرکزی» که یک مدل زبانی «کور» اما دانشمند و فاقد ابزار است، آغاز می‌شود. در سطح اول، «حل‌کننده‌ی متصل» با استفاده از ابزارهایی مانند جستجو، به اطلاعات بی‌درنگ دسترسی پیدا می‌کند. در سطح بالاتر، «حل‌کننده‌ی استراتژیک» ظهور می‌کند که قادر است اهداف پیچیده را به یک برنامه‌ی عملیاتی چندمرحله‌ای تبدیل کند. 

چشم‌انداز بعدی در سیستم‌های «چندعاملی» نهفته است؛ جایی که به جای یک عامل همه‌کاره، «تیمی از متخصصان» هوشمند با یکدیگر همکاری می‌کنند. در این مدل، یک عامل مدیر، وظایف را به عاملان تخصصی دیگر محول می‌کند. مرز نهایی این فناوری، «سیستم‌های خودتکامل‌یابنده» است که می‌توانند برای رفع کاستی‌های خود، ابزارها یا حتی عامل‌های جدیدی خلق کنند.

استقرار این عامل‌ها در محیط‌های سازمانی چالش‌های جدیدی به‌همراه دارد. از آنجا که این سیستم‌ها برخلاف نرم‌افزارهای سنتی، ماهیتی احتمالاتی دارند و خروجی آن‌ها کاملاً قابل پیش‌بینی نیست، روش‌های آزمون و خطای مرسوم برای آن‌ها کارایی ندارد. برای مقابله با این عدم قطعیت، گوگل یک رویکرد ساختاریافته به نام «Agent Ops» را معرفی می‌کند که تکامل‌یافته‌ی DevOps و MLOps است و بر کیفیت، حاکمیت، و امنیت تأکید دارد. 

مفاهیم جدیدی مانند «هویت عامل» به‌عنوان یک اصل امنیتی برای اعطای دسترسی‌های مشخص و نیاز به یک «پلتفرم کنترل مرکزی» برای جلوگیری از پراکندگی و هرج‌ومرج عامل‌ها در سطح سازمان، از ارکان اصلی این رویکرد هستند.

چشم‌انداز آینده‌ی این فناوری در پروژه‌های پیشرفته‌ی گوگل مانند «Co-Scientist» که اکتشافات علمی را تسریع می‌بخشد و «AlphaEvolve» که الگوریتم‌های محاسباتی جدید کشف می‌کند، به وضوح دیده می‌شود. این مثال‌ها نشان می‌دهند که ایجنت‌های هوشمند صرفاً یک اتوماسیون گردش کار پیشرفته نیستند، بلکه در حال تبدیل شدن به «اعضای جدید، توانا و تطبیق‌پذیر تیم‌ها» هستند که می‌توانند به شکلی خلاقانه و مستقل، در حل بزرگ‌ترین چالش‌ها با انسان همکاری کنند.

پیشنهاد می‌کنیم خبر مربوط به انتخاب Vibe coding به‌عنوان واژه سال 2025 را بخوانید.