مدتها در صنعت هوش مصنوعی تصور میشد که «بزرگتر، بهتر است» یعنی مدلهای دارای پارامترهای بیشتر، حجم بزرگتر و نیاز به قدرت محاسباتی بیشتر، بهتر هستند. این فرضیه این روزها به چالش کشیده شده و مایکروسافت با انتشار مدل هوش مصنوعی Phi-4 نشان داده که قدرت واقعی هوش مصنوعی تنها در اندازه آن نیست، بلکه در بهرهوری آن نهفته است.
معرفی هوش مصنوعی Phi-4
مایکروسافت بهتازگی مدل جدید Phi-4 را معرفی کرده است که میتواند بهطور همزمان متن، تصاویر و گفتار را پردازش کند، درحالیکه به قدرت پردازشی بسیار کمتری نسبت به مدلهای موجود نیاز دارد. هوش مصنوعی Phi-4 در حقیقت خودش شامل دو مدل کوچکتر Phi-4-Multimodal و Phi-4-Mini میشود و گامی بزرگ در توسعه مدلهای زبانی کوچک (SLM) محسوب میشوند؛ مدلهایی که قابلیتهایی ارائه میدهند که پیشتر تنها در سیستمهای هوش مصنوعی بسیار بزرگتر یافت میشد.
هوش مصنوعی Phi-4 برای دیتاسنترهای غولهای فناوری ساخته نشده، بلکه برای دنیای واقعی طراحی شده است؛ جایی که قدرت پردازشی محدود است، حریم خصوصی اهمیت بالایی دارد، و نیاز به پردازش هوش مصنوعی بهصورت محلی و بدون اتصال دائمی به فضای ابری احساس میشود.
به گفته venturebeat، مدل Phi-4-Multimodal با تنها 5.6 میلیارد پارامتر و مدل Phi-4-Mini با 3.8 میلیارد پارامتر، عملکردی بهتر از رقبای هماندازه خود دارند و حتی در برخی وظایف، با مدلهایی که دو برابر بزرگتر هستند، برابری میکنند یا از آنها پیشی میگیرند.
آنچه Phi-4-Multimodal را متمایز میکند، استفاده از تکنیک نوآورانه «ترکیب LoRA» است که به آن امکان میدهد ورودیهای متنی، تصویری و صوتی را در یک مدل واحد پردازش کند.
این نوآوری به مدل اجازه میدهد که بدون افت عملکرد، قابلیتهای زبانی قدرتمند خود را حفظ کند و همزمان قابلیتهای بینایی و تشخیص گفتار را نیز اضافه نماید؛ یعنی چالشی که بسیاری از مدلهای چندوجهی با آن مواجه بودهاند در مدل هوش مصنوعی Phi-4 حل شده است!
مایکروسافت بهتازگی هم دو قابلیت مهم و باارزش هوش مصنوعی کوپایلوت را رایگان کرده است.