راهکار چین برای شکست آمریکا در رقابت هوش مصنوعی

توسط: admin

توسعه مدل‌های موسوم به «هوش مصنوعی استدلالی» آسان‌تر و ارزان‌تر می‌شود.

به گزارش ایسنا به نقل از تک کرانچ، شرکت آمریکایی «نوآاسکای» (NovaSky) که حاصل همکاری گروهی از پژوهشگران «دانشگاه کالیفرنیا برکلی» (UC Berkeley) است، مدل «Sky-T۱-۳۲B-Preview» را منتشر کرد. این یک مدل استدلالی است که با نسخه o۱ شرکت «اوپن‌ای‌آی» (OpenAI) در تعدادی از معیار‌های کلیدی رقابت می‌کند. به نظر می‌رسد Sky-T۱ اولین مدل استدلالی منبع باز واقعی است.

این گروه پژوهشی، مجموعه داده‌های مورد استفاده برای آموزش مدل و کد آموزشی آن را منتشر کردند. آنها در یک پست وبلاگ نوشتند: نکته قابل توجه این است که Sky-T۱-۳۲B-Preview با کمتر از ۴۵۰ دلار آموزش داده شد. این نشان می‌دهد که می‌توان توانایی‌های استدلالی سطح بالا را به صورت مقرون‌به‌صرفه و کارآمد تکرار کرد.

۴۵۰ دلار ممکن است چندان مقرون‌به‌صرفه به نظر نرسد، اما چندی پیش بود که آموزش یک مدل با عملکرد قابل مقایسه با Sky-T۱، میلیون‌ها دلار هزینه به بار آورد. داده‌های آموزشی مصنوعی یا داده‌های آموزشی تولید شده توسط مدل‌های دیگر، به کاهش هزینه‌ها کمک کرده‌اند. مدل «Palmyra X ۰۰۴» که به تازگی توسط شرکت هوش مصنوعی «رایتر» (Writer) منتشر شده و تقریبا به طور کامل روی داده‌های مصنوعی آموزش دیده، طبق گزارش‌ها فقط ۷۰۰ هزار دلار برای توسعه هزینه داشته است.

برخلاف بیشتر مدل‌های هوش مصنوعی، مدل‌های استدلالی به طور مؤثر خود را مورد بررسی قرار می‌دهند تا از برخی تله‌هایی که معمولا به مدل‌ها آسیب می‌رسانند، اجتناب کنند. مدل‌های استدلالی در مقایسه با مدل‌های غیر استدلالی معمولی، کمی بیشتر زمان می‌خواهند تا به راه حل برسند. نکته مثبت این است که این مدل‌ها در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

پژوهشگران نوآاسکای گفتند که از مدل استدلال دیگری به نام «QwQ-۳۲B-Preview» برای تولید داده‌های آموزشی اولیه Sky-T۱ استفاده کرده‌اند. سپس، پژوهشگران به مدیریت ترکیب داده‌ها پرداختند و از GPT-۴o-mini شرکت اوپن‌ای‌آی استفاده کردند تا داده‌ها را به صورت قالب قابل اجرا درآورند. آموزش Sky-T۱ با ۳۲ میلیارد پارامتر حدود ۱۹ ساعت با استفاده از پردازنده گرافیکی H۱۰۰ شرکت «انویدیا» (Nvidia) طول کشید.

به گفته گروه نوآاسکای، Sky-T۱ در مجموعه‌ای از چالش‌های ریاضی سطح رقابتی، بهتر از نسخه پیش‌نمایش اولیه o۱ عمل می‌کند و پیش‌نمایش o۱ را در مجموعه‌ای از مشکلات دشوار یک ارزیابی کدنویسی شکست می‌دهد.