زمانی ساخت یک مدل هوش مصنوعی «توانایی استدلال و تفکر»‌ داشته باشد یک رویا بود،؛ اما امروز توسعه چنین مدلی بسیار ساده و ارزان شده است. تیم چینی NovaSky توانسته فقط با ۴۵۰ دلار یک مدل استدلال‌گر به نام Sky-T1-32B- توسعه دهد که در حدی پیشرفته است که با نسخه اولیه مدل هوش مصنوعی o1 شرکت OpenAI رقابت می‌کند!

مدل استدلال‌گر به نام Sky-T1-32B-

شاهکار جدید چینی‌ها:‌ توسعه هوش مصنوعی Sky-T1 در زمان کم و با هزینه کم!

تیم NovaSky یک تیم چینی است که به‌تازگی مدل استدلالی جدیدی به نام Sky-T1-32B-Preview را معرفی کرده که در بسیاری از معیارهای اصلی مدل o1 از خالق چت جی‌پی‌تی جلو می‌زند.

آن‌ها در یک پست وبلاگی نوشته‌اند:
«مدل هوش مصنوعی Sky-T1 به‌طور شگفت‌انگیزی با هزینه‌ای کمتر از ۴۵۰ دلار آموزش داده شد و ثابت کرد که بازتولید قابلیت‌های استدلالی سطح بالا با هزینه‌ای مقرون‌به‌صرفه و کارآمد امکان‌پذیر است.»

ممکن است مبلغ ۴۵۰ دلار خیلی ارزان به نظر نرسد؛ اما تا همین چند وقت پیش،‌ آموزش مدلی با این عملکرد هزینه‌های میلیون دلاری داشت.

استفاده از داده‌های آموزشی مصنوعی (داده‌هایی که توسط مدل‌های دیگر تولید می‌شوند) به کاهش هزینه‌ها کمک کرده است.

برخلاف اکثر مدل‌های هوش مصنوعی، مدل‌های استدلالی به‌طور مؤثر توانایی بررسی و ارزیابی پاسخ‌های خود را دارند و به این ترتیب برخی از مشکلات رایج در سایر مدل‌ها دیگر رخ نمی‌دهد. این مدل‌ها برای رسیدن به راه‌حل‌ها زمان بیشتری نیاز دارند؛ اما در عوض در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل‌اعتمادتر هستند.

تیم NovaSky اعلام کرده است که برای تولید داده‌های اولیه آموزشی مدل Sky-T1 از یک مدل استدلالی دیگر به نام مدل هوش مصنوعی QwQ-32B-Preview شرکت Alibaba استفاده کرده‌اند و سپس داده‌ها را به‌صورت دقیق انتخاب کرده است. همچنین از نسخه کوچک مدل GPT-4 شرکت OpenAI برای بازسازی داده‌ها به فرم قابل استفاده‌تر بهره برده است.

جالب‌تر اینکه آموزش مدل Sky-T1 با ۳۲ میلیارد پارامتر فقط حدود ۱۹ ساعت زمان برده!

طبق اعلام تیم NovaSky، مدل هوش مصنوعی Sky-T1 عملکرد بهتری نسبت به نسخه پیش‌نمایش مدل o1 دارد؛‌ اما این ادعای آن‌هاست و باید بررسی شود.