آمازون امسال می‌خواهد در رقابت مدل‌های هوش مصنوعی، جدی‌تر از قبل ظاهر شود و از این عرصه هم جا نماند. اکنون AWS، نسل جدید مدل‌ اختصاصی این شرکت با نام Nova 2 را رونمایی کرده است.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

اولین مدل Nova سال گذشته معرفی شد؛ این مدل که با تکیه‌بر زیرساخت‌های پردازش ابری AWS توسعه یافته بود، توانایی بالایی در استدلال داشت و عملکرد آن در سطح مدل‌هایی مانند o3-mini از OpenAI و R1 از شرکت هوش مصنوعی چینی DeepSeek سنجیده می‌شد.

طبق گزارش CNBC، شرکت AWS، زیرمجموعه‌ی آمازون در زمینه‌ی پردازش ابری، اکنون طی رویداد سالانه‌ی AWS re:Invent، مدل جدید Nova 2 را در قالب مجموعه‌ای شامل سه مدل چندرسانه‌ای با قدرت پردازش متن، تصویر و ویدیو، یک مدل مکالمه‌‌محور و یک مدل سازمانی قابل شخصی‌سازی روانه‌ی میدان کرده است.

AWS تلاش می‌کند با معرفی Nova 2، رهبری خود را در بازار هوش مصنوعی سازمانی حفظ کند؛ بازاری که هر روز رقابتی‌تر می‌شود و شرکت‌ها به‌دنبال مدل‌هایی قابل‌اعتماد، امن و سفارشی‌سازی‌شده هستند.

مَت گارمن، مدیرعامل AWS، در سخنرانی خود گفت که استقبال از Nova فراتر از انتظار بوده و ده‌ها هزار مشتری، از برندهای بزرگ بازاریابی گرفته تا شرکت‌های فناوری مانند Infosys و Blue Origin اکنون از این هوش مصنوعی استفاده می‌کنند.

قابلیت‌‌های مدل‌ هوش مصنوعی Nova 2

چهار مدل Nova 2 قابلیت‌های متفاوتی دارند و گستره‌ی وسیعی از نیازهای سازمانی را پوشش می‌دهند:

  • Nova 2 Lite: یک مدل استدلالی کم‌هزینه‌ است که برای انجام وظایف روزمره طراحی شده و می‌تواند متن، تصویر و ویدیو را پردازش کند. این مدل پیش از پاسخ‌دادن فکر می‌کند و برای کاربردهای عمومی مناسب است.
  • Nova 2 Pro: مدل استدلالی پیشرفته‌ای است که متن، تصویر، ویدیو و صدا را در سطح عمیق‌تری تحلیل می‌کند و برای کارهای پیچیده‌تر مانند کدنویسی طراحی شده است. این مدل رقیب مستقیم Claude Sonnet 4.5 محسوب می‌شود.
  • Nova 2 omni: مدلی همه‌کاره با توان پردازش ورودی‌های چندرسانه‌ای (متن، تصویر، ویدیو، صدا) و تولید خروجی به‌صورت متن و تصویر به‌شمار می‌رود.
مقایسه Nova 2 با مدل‌های دیگر
امتیاز Nova 2 Lite در مقایسه‌با سه مدل دیگر

علاوه‌بر این، مدل جدیدی تحت عنوان Nova 2 Sonic نیز امسال معرفی شد. Sonic یک مدل تبدیل گفتار به‌ گفتار برای ساخت سامانه‌های مکالمه‌ای روان و طبیعی است و بیشتر شبیه دستیارهای صوتی عمل می‌کند.

آمازون می‌گوید:

Nova 2 Sonic در هریک از زبان‌های پشتیبانی‌شده، صداهای احساسی و زنده‌ای از صدای مرد و صدای زن، با بیان طبیعی، ریتم مکالمه‌ی انسانی و قدرت مدیریت قطع‌کردن صحبت توسط کاربر ارائه می‌دهد.

ارزیابی‌های مبتنی بر ترجیح انسانی نشان می‌دهد شنوندگان در بیشتر مواقع، خروجی Nova 2 Sonic را از نظر تجربه شنیداری، به مدل‌های پیشتاز دیگر ترجیح می‌دهند. مدل صوتی Nova 2 Sonic در معیار Big Bench Audio که برای سنجش توان استدلال با ورودی صوتی استفاده می‌شود، از بسیاری از مدل‌های مکالمه‌ای مشهور عملکرد بهتری نشان داده است.

امکان ساخت مدل‌های سفارشی با Nova Forge

بخش مهمی از سخنرانی گارمن به معرفی سرویس جدید Nova Forge اختصاص داشت؛ خدمتی که به شرکت‌ها اجازه می‌دهد نسخه‌های شخصی‌سازی‌شده و پیشرفته‌ای از مدل‌های Nova را بسازند.

هزینه‌ی دسترسی سالانه‌ به Nova Forge، حدود ۱۰۰ هزار دلار اعلام شده است. سازمان‌ها از این طریق می‌توانند به مدل‌های ازپیش‌آموزش‌دیده، نیمه‌آموزش‌دیده یا آموزش در آینده دسترسی پیدا کنند و آن‌ها را با داده‌های اختصاصی خود تکمیل کنند.

گارمن توضیح داد که شرکت‌ها هنگام تلاش برای تزریق داده‌های اختصاصی به مدل‌های از پیش آموزش‌دیده معمولاً با چالش فراموشی دانش پایه‌ای مدل روبه‌رو می‌شوند؛ مشکلی که Nova Forge تلاش می‌کند آن را با آموزش مدل در آینده حل کند. او این فرایند را به یادگیری زبان تشبیه کرد: «اگر از کودکی یاد بگیری، راحت است. اما یادگیری در بزرگسالی بسیار سخت‌تر می‌شود. آموزش مدل‌ها هم همین‌طور است.»

شرکت‌هایی مانند Reddit، سونی و Booking.com از جمله نخستین مشتریان Nova Forge هستند؛ سازمان‌هایی که می‌خواهند مدل‌های هوش مصنوعی متناسب با داده‌ها و نیازهای خودشان بسازند.

آمازون در حالی مدل جدید خود را رونمایی می‌کند که اعلام وضعیت قرمز در OpenAI نشان از سخت‌تر شدن رقابت در عرصه‌ی هوش مصنوعی دارد.