دنیای تکنولوژی هرروز خبرهای شگفتانگیز و حیرتآوری به خود میبیند. در هفتههای گذشته، هوش مصنوعی DeepSeek سروصدای زیادی ایجاد کرد؛ چراکه چینیها مدعی بودند با هزینهای اندکی، مدلی بسیار قدرتمند و در حد رقابت با آخرین نسخه ChatGPT ساختهاند. هرچند ادعای چینیها بعدا رد شد؛ اما محققان هوش مصنوعی دانشگاه استنفورد و واشنگتن موفق شدند یک مدل هوش مصنوعی «استدلالگر» را با هزینهای کمتر از ۵۰ دلار توسعه دهند! این اتفاق یک پدیده در دنیای تکنولوژی است؛ چراکه نشان میدهد با روشهایی میتوان مدل هوش مصنوعی توسعه داد و هزینهها را در حد چند ساندویچ پایین آورد!

توسعه مدل هوش مصنوعی استدلالگر با هزینه بسیار ارزان! چرا و چگونه؟
به گزارش techchrunch، محققان هوش مصنوعی دانشگاه استنفورد و واشنگتن مدل هوش مصنوعی s1 را در سرویسهای ابری آموزش دادند.
این مدل در آزمایشهای مربوط به تواناییهای ریاضی و کدنویسی، عملکردی مشابه مدلهای پیشرفتهای مانند o1 از OpenAI و R1 از DeepSeek دارد.
مدل s1 به همراه دادهها و کدهای مورد استفاده برای آموزش آن، در GitHub منتشر شده است.
روش آموزش هوش مصنوعی s1
تیم تحقیقاتی این مدل را با استفاده از یک مدل پایه آماده کردند؛ سپس با روش استخراج دانش (distillation) آن را بهینهسازی کردند. به گفته نامبرلند در این روش، تواناییهای استدلالی یک مدل هوش مصنوعی از طریق آموزش بر روی پاسخهای آن مدل استخراج میشود.
هوش مصنوعی s1 براساس یک مدل کوچک از آزمایشگاه هوش مصنوعی Qwen (متعلق به علیبابا) توسعه یافته که بهطور رایگان در دسترس است. برای آموزش s1، محققان مجموعهای شامل ۱۰۰۰ پرسش منتخب ایجاد کردند که همراه با پاسخهای آنها و همچنین فرایند فکری مدل Gemini 2.0 Flash Thinking Experimental ارائه شده بود.
آموزش این مدل کمتر از ۳۰ دقیقه با استفاده از ۱۶ کارت گرافیک Nvidia H100 زمان برد.
به گفته نیکلاس موئنیگهوف، محقق استنفورد که روی این پروژه کار کرده، هزینه اجاره این پردازشها امروز حدود ۲۰ دلار خواهد بود.
این رویکرد در مقایسه با یادگیری تقویتی که چینیها برای آموزش هوش مصنوعی DeepSeek R1 استفاده کردند، ارزانتر است!
آیا سرمایهگذاریهای هنگفت در هوش مصنوعی هنوز توجیه دارد؟
ساخت مدلهای هوش مصنوعی پیشرفته با هزینهای اندک، پرسشهای مهمی ایجاد کرده است. اگر یک تیم کوچک از پژوهشگران بتواند مدلی مشابه یک مدل چند میلیون دلاری را با هزینهای ناچیز بازآفرینی کند، پس مزیت رقابتی شرکتهای بزرگ چه خواهد بود؟ پاسخ به این سوال ساده است:
با اینکه تقطیر مدلهای هوش مصنوعی روشی ارزان و مؤثر برای بازآفرینی قابلیتهای مدلهای بزرگ است؛ اما نمیتواند مدلهای کاملاً جدید و نوآورانه ایجاد کند.
بنابراین برای رسیدن به نسل بعدی هوش مصنوعی، همچنان سرمایهگذاریهای عظیم مورد نیاز خواهد بود.
پیش از این هم چند دانشجوی دانشگاه برکلی با هزینه 30 دلار توانستند یک مدل هوش مصنوعی توسعه بدهند تا همین موضوع را اثبات کنند.
برو بابا ۵۰ دلار دیگه الکیه
مگه میشه