دنیای تکنولوژی هرروز خبرهای شگفت‌انگیز و حیرت‌آوری به خود می‌بیند. در هفته‌های گذشته، هوش مصنوعی DeepSeek سروصدای زیادی ایجاد کرد؛ چراکه چینی‌ها مدعی بودند با هزینه‌ای اندکی، مدلی بسیار قدرتمند و در حد رقابت با آخرین نسخه ChatGPT ساخته‌اند. هرچند ادعای چینی‌ها بعدا رد شد؛ اما محققان هوش مصنوعی دانشگاه استنفورد و واشنگتن موفق شدند یک مدل هوش مصنوعی «استدلال‌گر» را با هزینه‌ای کمتر از ۵۰ دلار توسعه دهند! این اتفاق یک پدیده در دنیای تکنولوژی است؛ چراکه نشان می‌دهد با روش‌هایی می‌توان مدل هوش مصنوعی توسعه داد و هزینه‌ها را در حد چند ساندویچ پایین آورد!

هوش مصنوعی s1

توسعه مدل هوش مصنوعی استدلال‌گر با هزینه بسیار ارزان! چرا و چگونه؟

به گزارش techchrunch، محققان هوش مصنوعی دانشگاه استنفورد و واشنگتن مدل هوش مصنوعی s1 را در سرویس‌های ابری آموزش دادند.

این مدل در آزمایش‌های مربوط به توانایی‌های ریاضی و کدنویسی، عملکردی مشابه مدل‌های پیشرفته‌ای مانند o1 از OpenAI و R1 از DeepSeek دارد.

مدل s1 به همراه داده‌ها و کدهای مورد استفاده برای آموزش آن، در GitHub منتشر شده است.

روش آموزش هوش مصنوعی s1

تیم تحقیقاتی این مدل را با استفاده از یک مدل پایه آماده کردند؛ سپس با روش استخراج دانش (distillation) آن را بهینه‌سازی کردند. به گفته نامبرلند در این روش، توانایی‌های استدلالی یک مدل هوش مصنوعی از طریق آموزش بر روی پاسخ‌های آن مدل استخراج می‌شود.

هوش مصنوعی s1 براساس یک مدل کوچک از آزمایشگاه هوش مصنوعی Qwen (متعلق به علی‌بابا) توسعه یافته که به‌طور رایگان در دسترس است. برای آموزش s1، محققان مجموعه‌ای شامل ۱۰۰۰ پرسش منتخب ایجاد کردند که همراه با پاسخ‌های آن‌ها و همچنین فرایند فکری مدل Gemini 2.0 Flash Thinking Experimental ارائه شده بود.

آموزش این مدل کمتر از ۳۰ دقیقه با استفاده از ۱۶ کارت گرافیک Nvidia H100 زمان برد.

به گفته نیکلاس موئنیگهوف، محقق استنفورد که روی این پروژه کار کرده، هزینه اجاره این پردازش‌ها امروز حدود ۲۰ دلار خواهد بود.

این رویکرد در مقایسه با یادگیری تقویتی که چینی‌ها برای آموزش هوش مصنوعی DeepSeek R1 استفاده کردند، ارزان‌تر است!

آیا سرمایه‌گذاری‌های هنگفت در هوش مصنوعی هنوز توجیه دارد؟

ساخت مدل‌های هوش مصنوعی پیشرفته با هزینه‌ای اندک، پرسش‌های مهمی ایجاد کرده است. اگر یک تیم کوچک از پژوهشگران بتواند مدلی مشابه یک مدل چند میلیون دلاری را با هزینه‌ای ناچیز بازآفرینی کند، پس مزیت رقابتی شرکت‌های بزرگ چه خواهد بود؟ پاسخ به این سوال ساده است:

با اینکه تقطیر مدل‌های هوش مصنوعی روشی ارزان و مؤثر برای بازآفرینی قابلیت‌های مدل‌های بزرگ است؛ اما نمی‌تواند مدل‌های کاملاً جدید و نوآورانه ایجاد کند.

بنابراین برای رسیدن به نسل بعدی هوش مصنوعی، همچنان سرمایه‌گذاری‌های عظیم مورد نیاز خواهد بود.

پیش از این هم چند دانشجوی دانشگاه برکلی با هزینه 30 دلار توانستند یک مدل هوش مصنوعی توسعه بدهند تا همین موضوع را اثبات کنند.