» هوش مصنوعی و رباتیک » علی‌بابا مدل‌های متن‌باز جدید Qwen 3.5 را منتشر کرد؛ رقیب Claude Sonnet 4.5
علی‌بابا مدل‌های متن‌باز جدید Qwen 3.5 را منتشر کرد؛ رقیب Claude Sonnet 4.5

علی‌بابا مدل‌های متن‌باز جدید Qwen 3.5 را منتشر کرد؛ رقیب Claude Sonnet 4.5

اسفند ۸, ۱۴۰۴ 1011

تیم توسعه هوش مصنوعی علی‌بابا سری جدید مدل‌های زبانی Qwen 3.5 را معرفی کرد که امکانات مدل‌های پیشرفته و گران‌قیمت را به صورت رایگان و محلی به کامپیوترهای شخصی می‌آورد.

سری Qwen 3.5 مجموعه‌ای از چهار مدل زبانی بزرگ است که عملکردی معادل یا بهتر از رقبای پولی خود ارائه می‌دهند و توسعه‌دهندگان سه نسخه از آنها را به صورت کاملاً متن‌باز منتشر کرده‌اند. علی‌بابا نسخه‌های Qwen 3.5 با ۳۵ میلیارد پارامتر، ۱۲۲ میلیارد پارامتر و ۲۷ میلیارد پارامتر را تحت لایسنس آپاچی ۲.۰ برای استفاده تجاری رایگان در پلتفرم‌های هاگینگ فیس و مدل‌اسکوپ قرار داده است. مدل Qwen3.5-Flash نیز فقط به‌صورت API با قیمتی بسیار پایین‌تر از مدل‌های آمریکایی در دسترس است.

این مدل‌های رایگان در بنچمارک‌های مستقل توانسته‌اند مدل‌های قدرتمندی مانند GPT-5 Mini و کلود سونت ۴.۵ را به‌راحتی شکست دهند.

مدل‌های متن‌باز جدید Qwen 3.5
علی‌بابا مدل‌های متن‌باز جدید Qwen 3.5 را منتشر کرد؛ رقیب Claude Sonnet 4.5

مدل‌های Qwen 3.5 مناسب برای اجرا روی سیستم‌های شخصی

مهندسان علی‌بابا این مدل‌ها را بر پایه معماری پیشرفته متخصصان ترکیبی طراحی کرده‌اند تا با کمترین درگیری سخت‌افزاری، بالاترین سرعت و دقت را به کاربران ارائه دهند. برای مثال، نسخه پرچمدار ۳۵ میلیارد پارامتری، در هر لحظه فقط ۳ میلیارد پارامتر را برای پردازش کلمات فعال می‌کند.

این معماری از ۲۵۶ متخصص مختلف بهره می‌برد که پردازش‌ها را بین خود تقسیم می‌کنند. علاوه‌براین، تیم سازنده این مدل‌ها را به گونه‌ای فشرده‌سازی کرده است که حتی با کاهش شدید حجم اطلاعات، دقت آنها تقریباً هیچ افتی را تجربه نمی‌کند و کیفیت خروجی حفظ می‌شود.

برای اجرای مدل‌های بزرگ Qwen 3.5 نیاز به سیستم‌های نسبتاً قوی دارید؛ برای مثال برای اجرای قدرتمندترین نسخه متن‌باز این هوش مصنوعی باید یک کارت گرافیک دارای ۳۲ گیگابایت VRAM داشته باشید. هرچند ممکن است هرکسی چنین کارت گرافیکی نداشته باشد، اما همچنان اجرای چنین مدل بسیار قدرتمندی با چنین سیستمی بسیار قابل توجه است. این مدل می‌تواند پنجره محتوای یک میلیون توکنی (خواندن و نوشتن فایل‌های طولانی) را پردازش کند و تا پیش‌ازاین باید سرورهای غول‌پیکر می‌داشتید تا آن را اجرا کنید.

فناوری فشرده‌سازی بی‌نظیر علی‌بابا به توسعه‌دهندگان مستقل امکان می‌دهد تا بدون نیاز به زیرساخت‌های سروری گران‌قیمت، مجموعه داده‌های بزرگ را در سیستم‌های خانگی پردازش کنند. همچنین مدل ۲۷ میلیارد پارامتری این خانواده برای کارایی بالاتر بهینه‌سازی شده است و می‌تواند ۸۰۰ هزار توکن را به‌راحتی مدیریت کند.

به این نوشته امتیاز بدهید!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  • ×