مدت‌ها در صنعت هوش مصنوعی تصور می‌شد که «بزرگ‌تر، بهتر است» یعنی مدل‌های دارای پارامترهای بیشتر، حجم بزرگ‌تر و نیاز به قدرت محاسباتی بیشتر، بهتر هستند. این فرضیه این روزها به چالش کشیده شده و مایکروسافت با انتشار مدل‌ هوش مصنوعی Phi-4 نشان داده که قدرت واقعی هوش مصنوعی تنها در اندازه آن نیست، بلکه در بهره‌وری آن نهفته است.

معرفی هوش مصنوعی Phi-4

مایکروسافت به‌تازگی مدل جدید Phi-4 را معرفی کرده است که می‌تواند به‌طور هم‌زمان متن، تصاویر و گفتار را پردازش کند، درحالی‌که به قدرت پردازشی بسیار کمتری نسبت به مدل‌های موجود نیاز دارد. هوش مصنوعی Phi-4 در حقیقت خودش شامل دو مدل کوچک‌تر Phi-4-Multimodal و Phi-4-Mini می‌شود و گامی بزرگ در توسعه مدل‌های زبانی کوچک (SLM) محسوب می‌شوند؛ مدل‌هایی که قابلیت‌هایی ارائه می‌دهند که پیش‌تر تنها در سیستم‌های هوش مصنوعی بسیار بزرگ‌تر یافت می‌شد.

هوش مصنوعی Phi-4 برای دیتاسنترهای غول‌های فناوری ساخته نشده‌، بلکه برای دنیای واقعی طراحی شده‌ است؛ جایی که قدرت پردازشی محدود است، حریم خصوصی اهمیت بالایی دارد، و نیاز به پردازش هوش مصنوعی به‌صورت محلی و بدون اتصال دائمی به فضای ابری احساس می‌شود.

به گفته venturebeat، مدل Phi-4-Multimodal با تنها 5.6 میلیارد پارامتر و مدل Phi-4-Mini با 3.8 میلیارد پارامتر، عملکردی بهتر از رقبای هم‌اندازه خود دارند و حتی در برخی وظایف، با مدل‌هایی که دو برابر بزرگ‌تر هستند، برابری می‌کنند یا از آن‌ها پیشی می‌گیرند.

آنچه Phi-4-Multimodal را متمایز می‌کند، استفاده از تکنیک نوآورانه «ترکیب LoRA» است که به آن امکان می‌دهد ورودی‌های متنی، تصویری و صوتی را در یک مدل واحد پردازش کند.

این نوآوری به مدل اجازه می‌دهد که بدون افت عملکرد، قابلیت‌های زبانی قدرتمند خود را حفظ کند و هم‌زمان قابلیت‌های بینایی و تشخیص گفتار را نیز اضافه نماید؛ یعنی چالشی که بسیاری از مدل‌های چندوجهی با آن مواجه بوده‌اند در مدل هوش مصنوعی Phi-4 حل شده است!

مایکروسافت به‌تازگی هم دو قابلیت مهم و باارزش هوش مصنوعی کوپایلوت را رایگان کرده است.