هوش مصنوعی چینی DeepSeek این روزها بسیار سروصدا کرده و حتی باعث ریزش سنگین بازار بورس آمریکا هم شد. علت ریزش بازارها و هیاهوهای فراوان هوش مصنوعی DeepSeek به هزینه توسعه بسیار پایین آن برمیگردد. چینیها مدعی هستند با هزینه بسیار بسیار کمتر از چیزی که تصور میشده، توانستهاند مدل خود را توسعه دهند. هرچند دنیای تکنولوژی همیشه یک غافلگیری جدید دارد و به نظر میرسد که این فناوری را میتوان حتی ارزانتر نیز توسعه داد! چند دانشجوی دانشگاه برکلی موفق شدهاند یک مدل هوش مصنوعی مشابه هوش مصنوعی چینی DeepSeek توسعه دهند که ظاهرا کل هزینه آن تنها ۳۰ دلار بوده است!

توسعه مدلهای هوش مصنوعی با هزینه بسیار کم!
به نقل از dailycal، تیمی از دانشجویان مقطع دکتری دانشگاه برکلی موفق شدند نسخهای کوچکتر از مدل DeepSeek را توسعه دهند و آن را با نام «TinyZero» در GitHub منتشر کردند تا همه بتوانند آن را تست کنند.
البته TinyZero مانند نسخه اصلی DeepSeek نیست و از قدرت 671 میلیارد پارامتر آن بهره نمیبرد؛ اما سرپرست این تیم میگوید این مدل هسته رفتاری مدل هوش مصنوعی deepseek را بازآفرینی کرده است.
مدل TinyZero یک نسخه سبک و محدود است که تنها برای وظایف خاص مانند حل معماهای عددی و ضرب کاربرد دارد.
رویکرد آنها برای آموزش این مدل «یادگیری تقویتی» یا «reinforcement learning» است؛ روشی که در آن هوش مصنوعی از حدسهای تصادفی شروع کرده و بهمرور، با جستوجو و اصلاح پاسخهای خود، مهارتش را بهبود میبخشد. به این ترتیب پس از تولید خروجیهای تصادفی و بیمعنا، مدل خودش یاد میگیرد اشتباهاتش را اصلاح کند.
ادعایی که اثبات آن دشوار است، اما پیام مهمی دارد
تأیید دقیق هزینهی واقعی توسعهی این مدل دشوار است؛ چراکه حتی ساعات کاری یک دانشجوی دکتری نیز ارزش بیشتری از ۳۰ دلار دارد. با این حال، این خبر نشان میدهد که هر ادعایی، یک مثال نقض هم دارد. ابتدا چینیها ادعا کردند با هزینه بسیار کمی توانستند deepseek را توسعه دهند؛ اما خیلی زود چند دانشجو همان کار را با هزینه خیلی پایینی تکرار کردند! هدف این پروژه بررسی امکان توسعه مدلهای هوش مصنوعی با هزینه کمتر بوده است.
صرفنظر از این که آیا این مدل واقعاً با ۳۰ دلار ساخته شده یا نه، وقتی فناوریهای مهم در دسترس عموم قرار گیرند، همیشه کسی پیدا میشود که آنها را بهینهسازی کند و بهبود بخشد؛ و این یک اتفاق بسیار مثبت است.
همانطور که گوشیهای هوشمند امروزی با توان پردازشی بسیار بسیار کمتر از رایانههای دهه ۲۰۰۰ عملکردی بهمراتب بهتر ارائه میدهند، در دنیای هوش مصنوعی نیز این روند با سرعتی حتی بیشتر در حال وقوع است.