به گزارش خبرگزاری ایمنا به نقل از نیچر، ظهور مدلهای زبانی بزرگ (LLMs) و ابزارهای هوش مصنوعی تولیدی تحولی چشمگیر در حوزه تحقیقات علمی ایجاد کرده است، این مدلها که توانایی تولید پاسخهایی مشابه انسان را دارند از ویرایش متون گرفته تا حل مسائل پیچیده ریاضی و شبیهسازی کامپیوترهای کوانتومی، کاربردهای گستردهای یافتهاست. با این حال، این فناوریها همچنان نیازمند نظارت انسانی هستند و در بعضی موارد دچار خطا میشوند، در ادامه به بررسی برخی از مهمترین ابزارهای هوش مصنوعی در این حوزه پرداخته میشود.
مدل استدلالگر o3-mini
شرکت OpenAI از زمان معرفی ChatGPT در سال ۲۰۲۲، تحولات قابل توجهی در حوزه مدلهای زبانی رقم زده است، این فناوری ابتدا بهعنوان یک ابزار نوشتاری و جستوجوی اطلاعات شناخته میشد، اما نسخههای پیشرفتهتر آن، از جمله o1 و o3، دامنه وسیعتری از کاربردها را فراهم کرده است. آخرین نسخه این مدل، o3-mini که بهصورت رایگان در دسترس کاربران ثبتنامشده قرار گرفته از روش «فرایند زنجیرهای فکر» بهره میبرد و در حل مسائل علمی و ریاضی عملکرد برجستهای دارد.
سایمون فریدر، ریاضیدان و محقق هوش مصنوعی در دانشگاه آکسفورد اظهار کرد: مدل o3-mini در تحلیل مفاهیم جدید و اثباتهای ریاضی عملکرد قابل توجهی دارد.
وی افزود: حتی پیشرفتهترین مدلهای هوش مصنوعی نیز هنوز قادر به رقابت با تواناییهای یک ریاضیدان انسانی نیستند.
مدل چندمنظوره DeepSeek-R1
مدل DeepSeek-R1 که توسط شرکت چینی DeepSeek توسعه پیدا کرده است، قابلیتهایی مشابه مدل o1 ارائه میدهد، اما با هزینهای کمتر از طریق API در دسترس قرار دارد. این مدل بهدلیل بهرهمندی از «وزنهای باز»(Open Weight) به محققان این امکان را میدهد که آن را دانلود کرده و متناسب با پروژههای تحقیقاتی خود سفارشیسازی کنند.
اندرو وایت، شیمیدان و متخصص هوش مصنوعی گفت: مدل R1 دریچهای جدید را گشوده است که به جوامع علمی با منابع محدود اجازه میدهد مدلهای استدلالی تخصصی خود را توسعه دهند، با این حال، این مدل با چالشهایی نیز روبهرو است، فرایند طولانی تفکر آن منجر به کاهش سرعت پردازش شده و برخی ملاحظات امنیتی موجب شده است که برخی کشورها استفاده از آن را ممنوع کنند، همچنین ادعاهایی بر پایه بهرهگیری از مدلهای OpenAI در آموزش DeepSeek موجب شده است که برخی محققان با احتیاط بیشتری به سمت استفاده از این فناوری بروند.
مدل کارآمد و قابل اعتماد Llama
مدل Llama که توسط Meta AI توسعه یافته، بهدلیل قابلیت دانلود و سفارشیسازی، در میان محققان محبوبیت بالایی دارد، این مدل در حوزههایی همچون پیشبینی ساختار بلوری مواد و شبیهسازی خروجی کامپیوترهای کوانتومی مورد استفاده قرار گرفته است.
یکی از مزایای این مدل، قابلیت استفاده آفلاین و نبود وابستگی به سرورهای مرکزی است، اما نیاز به دریافت مجوز از Meta برای دسترسی به آن، برای برخی کاربران محدودیتهایی ایجاد کرده است.
به گزارش ایمنا، گسترش مدلهای زبانی بزرگ و ابزارهای هوش مصنوعی تولیدی، امکان پیشرفتهای چشمگیری در حوزههای علمی و تحقیقاتی را فراهم کرده است، با این حال چالشهایی همچون صحت اطلاعات، امنیت دادهها و محدودیتهای دسترسی، همچنان مورد توجه محققان و سیاستگذاران قرار دارد.



نظر شما