اخیراً دو تن از پیشگامان هوش مصنوعی، مردم را به چالش کشیدهاند تا با طرح سؤالاتی، به آزمایش قابلیتهای مدلهای زبانهای بزرگی (LLM) مثل Google Gemini و OpenAI's o۱ بپردازند.
Scale AI متخصص درزمینهٔ تهیه حجم وسیعی از دادههایی که LLM ها در آن آموزش میبینند، با همکاری مرکز ایمنی هوش مصنوعی (CAIS) در ابتکار عملی متفاوت و خاص، طرحی به نام آخرین آزمون انسانیت (Humanity’s Last Exam) را راهاندازی کرده است.
Scale و CAIS جایزهای ۵ هزار دلاری را برای کسانی که ۵۰ سؤال برتر منتخب این آزمون را طراحی کنند، تعیین کردند و دراینباره اعلام نمودند که هدف از این کار، آزمایش این موضوع است که ببینیم که چقدر به سیستمهای هوش مصنوعی در سطح متخصص، با استفاده از بزرگترین و گستردهترین ائتلاف کارشناسان در تاریخ نزدیک هستیم.