طوفان مدل‌های زبانی در جهان علم

با ظهور ابزارهای هوش مصنوعی (AI) جدید و پیشرفته‌تر در هر هفته، محققان به سرعت به سمت استفاده از این فناوری‌ها حرکت کرده‌اند، از ویرایش مقالات تا نوشتن کدها و تولید فرضیه‌ها، انتخاب‌های متعددی برای محققان وجود دارد.

به گزارش خبرگزاری ایمنا به نقل از نیچر، ظهور مدل‌های زبانی بزرگ (LLMs) و ابزارهای هوش مصنوعی تولیدی تحولی چشمگیر در حوزه تحقیقات علمی ایجاد کرده است، این مدل‌ها که توانایی تولید پاسخ‌هایی مشابه انسان را دارند از ویرایش متون گرفته تا حل مسائل پیچیده ریاضی و شبیه‌سازی کامپیوترهای کوانتومی، کاربردهای گسترده‌ای یافته‌است. با این حال، این فناوری‌ها همچنان نیازمند نظارت انسانی هستند و در بعضی موارد دچار خطا می‌شوند، در ادامه به بررسی برخی از مهم‌ترین ابزارهای هوش مصنوعی در این حوزه پرداخته می‌شود.

مدل استدلال‌گر o3-mini

شرکت OpenAI از زمان معرفی ChatGPT در سال ۲۰۲۲، تحولات قابل توجهی در حوزه مدل‌های زبانی رقم زده است، این فناوری ابتدا به‌عنوان یک ابزار نوشتاری و جست‌وجوی اطلاعات شناخته می‌شد، اما نسخه‌های پیشرفته‌تر آن، از جمله o1 و o3، دامنه وسیع‌تری از کاربردها را فراهم کرده است. آخرین نسخه این مدل، o3-mini که به‌صورت رایگان در دسترس کاربران ثبت‌نام‌شده قرار گرفته از روش «فرایند زنجیره‌ای فکر» بهره می‌برد و در حل مسائل علمی و ریاضی عملکرد برجسته‌ای دارد.

سایمون فریدر، ریاضیدان و محقق هوش مصنوعی در دانشگاه آکسفورد اظهار کرد: مدل o3-mini در تحلیل مفاهیم جدید و اثبات‌های ریاضی عملکرد قابل توجهی دارد.

وی افزود: حتی پیشرفته‌ترین مدل‌های هوش مصنوعی نیز هنوز قادر به رقابت با توانایی‌های یک ریاضیدان انسانی نیستند.

مدل چندمنظوره DeepSeek-R1

مدل DeepSeek-R1 که توسط شرکت چینی DeepSeek توسعه پیدا کرده است، قابلیت‌هایی مشابه مدل o1 ارائه می‌دهد، اما با هزینه‌ای کمتر از طریق API در دسترس قرار دارد. این مدل به‌دلیل بهره‌مندی از «وزن‌های باز»(Open Weight) به محققان این امکان را می‌دهد که آن را دانلود کرده و متناسب با پروژه‌های تحقیقاتی خود سفارشی‌سازی کنند.

اندرو وایت، شیمیدان و متخصص هوش مصنوعی گفت: مدل R1 دریچه‌ای جدید را گشوده است که به جوامع علمی با منابع محدود اجازه می‌دهد مدل‌های استدلالی تخصصی خود را توسعه دهند، با این حال، این مدل با چالش‌هایی نیز روبه‌رو است، فرایند طولانی تفکر آن منجر به کاهش سرعت پردازش شده و برخی ملاحظات امنیتی موجب شده است که برخی کشورها استفاده از آن را ممنوع کنند، همچنین ادعاهایی بر پایه بهره‌گیری از مدل‌های OpenAI در آموزش DeepSeek موجب شده است که برخی محققان با احتیاط بیشتری به سمت استفاده از این فناوری بروند.

مدل کارآمد و قابل اعتماد Llama

مدل Llama که توسط Meta AI توسعه یافته، به‌دلیل قابلیت دانلود و سفارشی‌سازی، در میان محققان محبوبیت بالایی دارد، این مدل در حوزه‌هایی همچون پیش‌بینی ساختار بلوری مواد و شبیه‌سازی خروجی کامپیوترهای کوانتومی مورد استفاده قرار گرفته است.

یکی از مزایای این مدل، قابلیت استفاده آفلاین و نبود وابستگی به سرورهای مرکزی است، اما نیاز به دریافت مجوز از Meta برای دسترسی به آن، برای برخی کاربران محدودیت‌هایی ایجاد کرده است.

به گزارش ایمنا، گسترش مدل‌های زبانی بزرگ و ابزارهای هوش مصنوعی تولیدی، امکان پیشرفت‌های چشمگیری در حوزه‌های علمی و تحقیقاتی را فراهم کرده است، با این حال چالش‌هایی همچون صحت اطلاعات، امنیت داده‌ها و محدودیت‌های دسترسی، همچنان مورد توجه محققان و سیاست‌گذاران قرار دارد.

کد خبر 841379

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.