زمانی ساخت یک مدل هوش مصنوعی «توانایی استدلال و تفکر» داشته باشد یک رویا بود،؛ اما امروز توسعه چنین مدلی بسیار ساده و ارزان شده است. تیم چینی NovaSky توانسته فقط با ۴۵۰ دلار یک مدل استدلالگر به نام Sky-T1-32B- توسعه دهد که در حدی پیشرفته است که با نسخه اولیه مدل هوش مصنوعی o1 شرکت OpenAI رقابت میکند!

شاهکار جدید چینیها: توسعه هوش مصنوعی Sky-T1 در زمان کم و با هزینه کم!
تیم NovaSky یک تیم چینی است که بهتازگی مدل استدلالی جدیدی به نام Sky-T1-32B-Preview را معرفی کرده که در بسیاری از معیارهای اصلی مدل o1 از خالق چت جیپیتی جلو میزند.
آنها در یک پست وبلاگی نوشتهاند:
«مدل هوش مصنوعی Sky-T1 بهطور شگفتانگیزی با هزینهای کمتر از ۴۵۰ دلار آموزش داده شد و ثابت کرد که بازتولید قابلیتهای استدلالی سطح بالا با هزینهای مقرونبهصرفه و کارآمد امکانپذیر است.»
ممکن است مبلغ ۴۵۰ دلار خیلی ارزان به نظر نرسد؛ اما تا همین چند وقت پیش، آموزش مدلی با این عملکرد هزینههای میلیون دلاری داشت.
استفاده از دادههای آموزشی مصنوعی (دادههایی که توسط مدلهای دیگر تولید میشوند) به کاهش هزینهها کمک کرده است.
برخلاف اکثر مدلهای هوش مصنوعی، مدلهای استدلالی بهطور مؤثر توانایی بررسی و ارزیابی پاسخهای خود را دارند و به این ترتیب برخی از مشکلات رایج در سایر مدلها دیگر رخ نمیدهد. این مدلها برای رسیدن به راهحلها زمان بیشتری نیاز دارند؛ اما در عوض در حوزههایی مانند فیزیک، علوم و ریاضیات قابلاعتمادتر هستند.
تیم NovaSky اعلام کرده است که برای تولید دادههای اولیه آموزشی مدل Sky-T1 از یک مدل استدلالی دیگر به نام مدل هوش مصنوعی QwQ-32B-Preview شرکت Alibaba استفاده کردهاند و سپس دادهها را بهصورت دقیق انتخاب کرده است. همچنین از نسخه کوچک مدل GPT-4 شرکت OpenAI برای بازسازی دادهها به فرم قابل استفادهتر بهره برده است.
جالبتر اینکه آموزش مدل Sky-T1 با ۳۲ میلیارد پارامتر فقط حدود ۱۹ ساعت زمان برده!
طبق اعلام تیم NovaSky، مدل هوش مصنوعی Sky-T1 عملکرد بهتری نسبت به نسخه پیشنمایش مدل o1 دارد؛ اما این ادعای آنهاست و باید بررسی شود.