افشاگری از تقلب در آموزش مدل‌های زبانی

گزارش‌ها حاکی از آن است که نیروهای آموزش‌دهنده هوش مصنوعی، وظیفه آموزش مدل‌ها را به خود چت‌جی‌پی‌تی می‌سپارند، اقدامی که کارشناسان آن را تهدیدی جدی برای عملکرد نسل‌های آینده هوش مصنوعی می‌دانند.

به گزارش سرویس ترجمه خبرگزاری ایمنا، گروهی از افشاگران به نشریه New Scientist اعلام کرده‌اند که نیروهای انسانی آموزش‌دهنده فعال در حوزه آموزش مدل‌های جدید هوش مصنوعی، که وظیفه دارند با انجام مکالمات و آزمون‌های باکیفیت، داده‌های ارزشمندی برای بهبود این مدل‌ها فراهم کنند، به طور گسترده در حال دور زدن این وظیفه و سپردن آن به ربات‌های گفت‌وگو مانند چت‌جی‌پی‌تی هستند. این اقدام نگرانی‌های جدی را درباره کاهش کارایی و مفیدبودن نسل‌های آینده مدل‌های زبانی بزرگ برانگیخته است.

شرکت‌های فعال در حوزه هوش مصنوعی برای تأمین داده‌های آموزشی باکیفیت، به نیروهای آموزش‌دهنده‌ای تکیه دارند که با انجام مکالمات هدفمند با مدل‌ها، به بهبود عملکرد آن‌ها کمک می‌کنند. اما این نیروها که اغلب از طریق شرکت‌های واسطه‌ای و با دستمزد پایین و بدون قراردادهای تمام‌وقت استخدام می‌شوند، انگیزه زیادی برای میان‌بر زدن دارند. یکی از این نیروهای آموزش‌دهنده به نام آلیس می‌گوید: «استفاده از چت‌جی‌پی‌تی برای انجام وظایف آموزشی بسیار رایج است و با وجود دستورالعمل‌های صریح شرکت‌ها و تلاش آن‌ها برای شناسایی متخلفان، امکان مقابله با این تخلف وجود ندارد.» او تأکید می‌کند که با رعایت نکات ساده‌ای مانند حذف نشانه‌های متنی مشخصه خروجی ربات‌ها، به‌راحتی می‌توان از شناسایی فرار کرد.

باب، نیروی آموزش‌دهنده دیگری که در پلتفرم آموزشی Outlier فعالیت داشته، می‌گوید: «مدیریت شرکت در برخورد با تخلفات، میان مماشات و برخورد شدید سرگردان بود. برای نظارت، از نرم‌افزاری استفاده می‌کردند که به‌طور تصادفی از صفحه‌نمایش نیروها عکس می‌گرفت، اما آن‌ها با پنهان کردن پنجره‌های چت‌جی‌پی‌تی، از دید بازرسان پنهان می‌شدند. شرکت Outlier که زیرمجموعه Scale AI است، به درخواست ما برای اظهارنظر پاسخ نداد.»

افشاگری از تقلب در آموزش مدل‌های زبانی

کارول، نیروی آموزش‌دهنده دیگری که در چندین پلتفرم فعالیت داشته، اعلام کرده است: «در ابتدا برای جلوگیری از اشتباه و اخراج از پروژه، از ربات‌ها برای بررسی کار خود استفاده می‌کرده، اما پس از مدتی انجام تمام وظایف از جمله سناریوسازی و تولید فایل‌های مرتبط را به مدل‌های زبانی سپرده است.» او اذعان دارد که نگران است این کار باعث تضعیف کیفیت هوش مصنوعی شود و می‌گوید استفاده از خود مدل‌ها برای آموزش یکدیگر، ارزش داده‌ها را کاهش می‌دهد.

مارک لی از دانشگاه بیرمنگام بریتانیا هشدار می‌دهد که تحقیقات نشان داده است آموزش تکراری مدل‌های هوش مصنوعی بر روی محتوای تولیدشده توسط خودشان، به فروپاشی مدل منجر می‌شود و توانایی‌های آن به شدت کاهش می‌یابد. البته به گفته او، تا زمانی که درصدی از داده‌های انسانی در فرایند آموزش وجود داشته باشد، از فروپاشی کامل جلوگیری می‌شود، اما بدون شک این تقلب‌ها عملکرد مدل‌ها را در انجام وظایف انسان‌گونه تحت تأثیر قرار داده و کیفیت نهایی آن‌ها را پایین‌تر از حد انتظار خواهد آورد.

در نهایت، نیروهای آموزش‌دهنده معترض تأکید می‌کنند که اگر شرکت‌ها به دنبال داده‌های باکیفیت هستند، باید قراردادهای منصفانه‌ای با نیروها منعقد کنند و آن‌ها را با دستمزد ناچیز و اشتغال موقت، به سمت چنین میان‌برهایی سوق ندهند.

کد مطلب 982186

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.