ChatGPT در اواخر سال ۲۰۲۲ منتشر شد و تنها در ماه اول، بیش از ۱۰۰ میلیون کاربر بدست آورد. از آن زمان، بحثهای زیادی وجود داشته که هوش مصنوعی چگونه میتواند ابعاد مختلف جامعه، از اشتغال و ارتباطات گرفته تا آموزش را در سالهای آینده متحول کند. اکنون مقاله جدیدی به بررسی تاثیر هوش مصنوعی بر آموزش پرداخته است.
این روزها دستیاران هوش مصنوعی به طور فزایندهای توسط دانشجویان در آموزش عالی استفاده میشوند. اگرچه این ابزارها فرصتهایی را برای بهبود آموزش فراهم میکنند، اما چالشهای مهمی را نیز در مسیر ارزیابی و نتایج یادگیری قرار میدهند.
تاکنون مطالعه جامعی در مورد تأثیر بالقوه این دستیاران هوش مصنوعی بر روشهای ارزشیابی مورد استفاده توسط مؤسسات آموزشی، انجام نشده بود. اکنون محققان دانشکده علوم کامپیوتر و ارتباطات EPFL در مقاله جدیدی که در مجله معتبر PNAS منتشر شده، مطالعهای در مقیاس بزرگ، در ۵۰ درس ارائه شده در EPFL انجام دادهاند تا عملکرد فعلی مدل های زبانی بزرگ را در دورههای آموزش عالی ارزیابی کنند. این دروس، از ۹ دوره کارشناسی، کارشناسی ارشد و آنلاین، که طیف گستردهای از رشتههای STEM (علوم، فناوری، مهندسی و ریاضیات) از جمله علوم کامپیوتر، ریاضیات، زیستشناسی، شیمی، فیزیک و علوم مواد را پوشش میدهند، انتخاب شدند. آنتوان بوسلوت (Antoine Bosselut)، یکی از نویسندگان این مقاله و رئیس آزمایشگاه پردازش زبان طبیعی (NLP) و عضو مرکز هوش مصنوعی EPFL میگوید:
ما خوششانس بودیم که تعداد زیادی از استادان و دستیاران آموزشی EPFL به ما کمک کردند تا بزرگترین مجموعه دادهها را شامل مواد درسی، ارزیابیها و امتحانات جمعآوری کنیم. ما این دادهها را شبیه به روشهایی که دانشجویان واقعاً آنها را به مدلها میدهند، تنظیم کردیم و سپس پاسخها را از مدلها گرفتیم و متوجه شدیم که مدلها بسیار خوب پاسخ میدهند.
محققان با تمرکز بر GPT-3.5 و GPT-4، از هشت استراتژی پرامپتنویسی برای تولید پاسخ استفاده کردند و دریافتند که GPT-4 به طور متوسط به ۶۵.۸ درصد سوالات به درستی پاسخ میدهد و حتی میتواند پاسخ صحیح را حداقل در یک استراتژی پرامپتنویسی برای ۸۵.۱ درصد سوالات ارائه دهد. آنا سوتنیکوا (Anna Sotnikova) نویسنده مشترک مقاله میگوید:
ما از نتایج شگفتزده شدیم. هیچکس انتظار نداشت که دستیاران هوش مصنوعی در بسیاری از دروس به چنین درصد بالایی از پاسخهای صحیح دست یابند. نکته مهم این است که ۶۵ درصد سوالاتی که به درستی پاسخ داده شدهاند با استفاده از ابتداییترین استراتژی، یعنی استراتژی بدون دانش، به دست آمدند. بنابراین هر کس، بدون درک موضوع از نظر فنی و با یک سطح دانش معمولی میتواند به ۸۵ درصد موفقیت دست یابد و این واقعاً شوکهکننده است.
تاثیر هوش مصنوعی بر آموزش ، یادگیری و توسعه مهارت دانشجویان
محققان مشکلات آسیبپذیری مربوط به استفاده از این دستیاران هوش مصنوعی توسط دانشجویان را بررسی کردند: از یک سو، آسیبپذیری ارزیابی یا اینکه آیا ارزیابیهای سنتی میتوانند توسط این سیستمها به بازی گرفته شوند. از سوی دیگر، آسیبپذیری آموزشی یا اینکه آیا میتوان از این سیستمها برای دور زدن مسیرهای شناختی معمولی که دانشجویان برای یادگیری مهارتهای تحصیلی مورد نیاز خود طی میکنند، استفاده کرد.
محققان بر این باورند که نتایج این مطالعه، در مورد چگونگی اطمینان از اینکه دانشجویان قادر به یادگیری مفاهیم مورد نیاز برای درک موضوعات پیچیدهتر هستند، ایجاد سوال میکند. بوسلوت میگوید:
یکی از نگرانیها این است که اگر این مدلها به اندازهای که ما نشان میدهیم توانمند باشند، دانشجویانی که از آنها استفاده میکنند ممکن است در فرآیند یادگیری مفاهیم جدید، میانبر بزنند. شاید در مورد آنچه که ما باید در وهله اول آموزش دهیم تا بتوانیم بهترین همافزایی را بین فناوریهای موجود و وظایف دانشجویان در دهههای آینده داشته باشیم، بحث کنیم.
یکی دیگر از نکات کلیدی توسعه دستیارهای هوش مصنوعی این است که آنها بدتر نمیشوند، بلکه فقط بهتر میشوند. در این تحقیق که یک سال پیش به پایان رسید، برای همه دروس از یک مدل استفاده شد که به عنوان مثال در سوالات ریاضی مشکل داشت. اکنون مدلهای خاصی برای ریاضی وجود دارند. به گفته محققان، در نتیجه اگر این مطالعه امروز دوباره اجرا میشد، نرخ موفقیت حتی بالاتر میرفت.
تاکید بر ارزیابیهای پیچیده و آموزش تطبیقی
بوسلوت میگوید:
ما در کوتاهمدت، باید به دنبال ارزیابیهای سختتر باشیم؛ نه به معنای دشواری سؤال، بلکه به معنای پیچیدگی خود ارزیابی، که در آن از مهارتهای متعددی که در طول دوره آموخته شده و تمام آنها در یک ارزیابی کلنگر جمع میشوند، استفاده شود. مدلها هنوز واقعاً برای برنامهریزی و کار به این شکل طراحی نشدهاند و در نهایت، ما واقعاً فکر میکنیم که یادگیری مبتنی بر پروژه برای دانشجویان بهتر است.
پیر دیلنبورگ (Pierre Dillenbourg)، معاون امور آکادمیک در EPFL میگوید:
هوش مصنوعی، موسسات آموزش عالی را به طرق مختلف به چالش میکشد، به عنوان مثال: چه مهارتهای جدیدی برای فارغ التحصیلان آینده مورد نیاز است؟ چگونه میتوانیم دانش را اندازهگیری کنیم؟ این نوع سوالات تقریبا در هر جلسه مدیریتی در EPFL مطرح میشوند. بنابراین مهم است که تیمهای ما پروژههایی را آغاز کنند که پاسخهای مبتنی بر شواهد به این سوالات ارائه میدهند.
واضح است که سیستمهای آموزشی در درازمدت، نیاز به تطبیق دارند و محققان میخواهند این پروژه در حال انجام را به اساتید نزدیکتر کرده و توصیههای مفید به آنها ارائه دهند. بئاتریز بورخس (Beatriz Borges)، دانشجوی دکترای NLP و یکی از نویسندگان مقاله میگوید:
این تنها شروع کار است و من فکر میکنم ماشینحسابها مثال خوبی برای توصیف وضعیت فعلی مدل های زبانی بزرگ هستند. زمانی که ماشین حسابها معرفی شدند، نگرانیهای مشابهی وجود داشت که بچهها دیگر ریاضیات را یاد نگیرند. در حال حاضر، ماشین حساب معمولا در مراحل اولیه آموزش، مجاز نیست، اما در دبیرستان و مقاطع بالاتر، در حالی که دانشآموزان در حال یادگیری مهارتهای پیشرفتهتری هستند، از ماشینحسابها برای انجام کارهای سطح پایینتر استفاده میشود. من فکر میکنم که ما شاهد انطباق و تغییر تدریجی مشابهی خواهیم بود و به درک درستی از آنچه این سیستمها میتوانند و نمیتوانند برای ما انجام دهند خواهیم رسید.