ایران پرسمان | هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! دانش و فناوری

بزرگنمايي:

ایران پرسمان - ایسنا / گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-4»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.
به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود 46 درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.
«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.
پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس 1500 سال پس از آن دوره در مصر ظاهر شد.
چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.
به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.
چانونا گفت: اگر 100 بار به شما A و B و 1 بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.
پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.
«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.
با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.
در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

دوشنبه ۱ بهمن ۱۴۰۳ - ۲۳:۰۴:۱۸
۷ بازديد
ایران پرسمان

https://www.iranporseman.ir/Fa/News/1211116/

عضو مجمع: نسل جوان سرعت ما را نمی‌پذیرد

اختصاص منابع نفتی به هوش مصنوعی

مشاور ترامپ: ماه آینده درباره ایران تصمیمات مهمی خواهیم گرفت

هدیه روسی-ایرانی به تحلیف ترامپ

آخرين مطالب

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! دانش و فناوری

نظرات شما

ساير مطالب

گزارش آکسیوس از شروع زودهنگام ترامپ

چوب حراج بر ناوگان نیروی دریایی سلطنتی بریتانیا

شوخی ترامپ با کلاه ملانیا

سناریوهای ترور

ابوطالبی: چرا باید به سمت مذاکرات با آمریکا رفت؟

اقتصاددان آمریکایی: تورم ترامپ را پیروز کرد

ورود ترامپ به کاخ‌ سفید با طوفانی از تغییرات

بازرگان؛ نخست‌وزیری با رای اعتماد مردم در خیابان

پیش بینی قیمت طلا و سکه 2 بهمن 1403

کسری دولت بیش از 115 همت؛ آژیر تورم بلند شد

همتی: روابط مالی ما با تاجیکستان به یک میلیارد دلار خواهد رسید

حضور مدیرکل بنیاد مازندران در مرکز سامد

تشییع و تدفین شهدای عدالت در قم

تقویت همکاری‌ها در راستای ترویج فرهنگ ایثار و شهادت به دانش‌آموزان تاثیرگذار است

برگزاری همایش تخصصی و آموزشی مددکاران بنیاد با حضور مدیر کل بنیاد سمنان

خانواده‌های شهدا باید پیشگام در حوزه ترویج فعالیت‌های قرآنی باشند

این فیلم بدلکاری نیست، یک ماجرای واقعی است!

عجیب ترین سالادی که در کلکته می توان امتحان کرد

ماسنا؛ بنایی دیدنی در قلب پاریس

هنر نقاشی دیواری سه بعدی

در این کارگاه بسیار ابتدایی یک قطعه بسیار حیاتی برای دوچرخه تولید می شود!

گوناگون/ آسمان سوراخ شد

گوناگون/ حراج یک کلاه‌خود باستانی

کبریت ایرانی از نگاه هوش مصنوعی!

این مار‌های عجیب الخلقه پرواز می‌کنند

رویت یوزپلنگ در پناهگاه حیات وحش میاندشت جاجرم

هفت خوان رستم‌ از نگاه هوش مصنوعی

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

شعر انتخابی سید اکبر سلیمانی در رقابت شاعران فصل سوم

مرز در عقل و جنون باریک است

پاسخ ابوطالبی به اینکه چرا باید به سمت مذاکرات مستقیم با آمریکا حرکت کرد؟

فارس: ظریف در «اجلاس داووس» ماموریت مذاکراتی پنهان دارد؟

مجید انصاری: در تدوین قوانین باید از ذی‌نفعانش نظرخواهی‌ شود

سرلشکر باقری: ایران در رزمایش بین المللی دریایی پاکستان شرکت خواهد کرد

ویژگی‌های خارق‌العاده «ابابیل 5»

ترامپ: نام خلیج مکزیک را عوض می کنیم و به خلیج آمریکا تغییر می دهیم

ادعای عجیب ترامپ در خصوص حادثه ترورش

شاخ و شانه‌کشی ترامپ برای پاناما و چین

ترامپ: از فضانوردان خود می‌خواهیم پرچم ما را در مریخ به اهتزار درآورند

ترامپ: سیاست دولت را برای مهندسی نژاد مردم پایان می‌دهم

ترامپ: به حفاری برای سوخت‌های فسیلی ادامه خواهیم داد

ترامپ: به توافق سبز و قانون خودروهای برقی پایان می‌دهیم

عنوان جدید وب‌سایت کاخ سفید: آمریکا بازگشت

ترامپ: میراث من این خواهد بود که یک صلح ساز خواهم بود

نتانیاهو به ترامپ تبریک گفت

ترامپ نیامده طوفان به پا کرد؛ فوری‌ترین دستورات رئیس‌جمهور جدید آمریکا چه بود؟

چشم‌انداز مقاومت فلسطین در غزه

پشت پرده تحرکات احمدی نژادی ها

کولاک دستورات ترامپ در روز اول

طعم شیرین بازگشت به خانه در روز اول آتش‌بس

تبليغات