ChatGPT đã bước vào lớp học: Làm thế nào mà các mô hình ngôn ngữ lớn có thể biến đổi giáo dục


Các nhà nghiên cứu, giáo viên và công ty đang thử nghiệm các cách để biến đổi các mô hình ngôn ngữ lớn nổi tiếng nhưng dễ bị lỗi thành các đối tác suy nghĩ đáng tin cậy, chính xác cho việc học tập.

Tháng trước, nhà tâm lý học giáo dục Ronald Beghetto đã yêu cầu một nhóm học viên sau đại học và các chuyên gia giảng dạy thảo luận công việc của họ theo một cách khác thường. Ngoài việc nói chuyện với nhau, họ cũng trò chuyện với một nhóm chatbot tập trung vào sự sáng tạo mà Beghetto đã thiết kế và sẽ sớm được lưu trữ trên nền tảng do viện ông quản lý, Đại học Bang Arizona (ASU).

Các chatbot dựa trên công nghệ trí tuệ nhân tạo (AI) tương tự như ChatGPT nổi tiếng. Beghetto nhắc các chatbot đóng các vai trò khác nhau để khuyến khích sự sáng tạo - ví dụ, bằng cách cố ý thách thức một số giả định của ai đó. Một học viên đã thảo luận về các chủ đề luận án khác nhau với các chatbot. Giảng viên nói về cách thiết kế các lớp học.
Phản hồi vô cùng tích cực. Một người tham gia cho biết họ đã từng cố gắng sử dụng ChatGPT để hỗ trợ học tập nhưng không thấy nó hữu ích - không giống như các chatbot của Beghetto. Người khác hỏi: "Những thứ này sẽ có sẵn khi nào?". Các bot đã giúp người tham gia tạo ra nhiều khả năng hơn so với những gì họ có thể cân nhắc khác.
Nhiều giáo viên lo ngại rằng sự nổi lên của ChatGPT sẽ giúp học sinh dễ dàng gian lận trong bài tập. Tuy nhiên, Beghetto, đến từ Tempe, và những người khác đang khám phá tiềm năng của các mô hình ngôn ngữ lớn (LLM), chẳng hạn như ChatGPT, như các công cụ để nâng cao giáo dục.

Việc sử dụng LLM để đọc và tóm tắt các đoạn văn dài có thể tiết kiệm thời gian cho học sinh và giáo viên và giúp họ tập trung vào thảo luận và học tập. Khả năng thảo luận một cách trôi chảy về hầu hết các chủ đề của ChatGPT đưa ra triển vọng sử dụng LLM để tạo ra một trải nghiệm giáo dục cá nhân hóa, dựa trên đối thoại. Một số giáo viên coi chúng như các đối tác suy nghĩ tiềm năng có thể tốn ít chi phí hơn gia sư nhưng - không giống con người - luôn sẵn sàng.

"Gia sư một-một là can thiệp đơn lẻ hiệu quả nhất cho việc giảng dạy, nhưng nó rất tốn kém và không thể mở rộng," Theodore Gray, đồng sáng lập Wolfram Research, một công ty công nghệ ở Champaign, Illinois, nói. “Mọi người đã cố gắng sử dụng phần mềm, và nói chung không hiệu quả lắm. Giờ đây, có một khả năng thực sự rằng người ta có thể tạo ra phần mềm giáo dục hoạt động rất tốt." Gray cho biết Wolfram Research hiện đang phát triển một gia sư dựa trên LLM nhưng tiết lộ ít chi tiết.

Các đối tác AI như vậy có thể được sử dụng để dẫn dắt học sinh thông qua một bài toán từng bước một, kích thích tư duy phản biện hoặc - như trong trường hợp thử nghiệm của Beghetto - tăng cường sự sáng tạo và mở rộng các khả năng đang được xem xét của người dùng. Jules White, giám đốc Sáng kiến về Tương lai của Học tập và Trí tuệ Nhân tạo Sinh học tại Đại học Vanderbilt ở Nashville, Tennessee, gọi ChatGPT là "khung ngoài cho tâm trí".

Các rủi ro là thực tế

Kể từ khi công ty California OpenAI ra mắt ChatGPT vào tháng 11 năm 2022, phần lớn sự chú ý về việc sử dụng nó trong giáo dục đã tiêu cực. LLM hoạt động bằng cách học cách các từ và cụm từ liên quan đến nhau từ dữ liệu huấn luyện chứa hàng tỷ ví dụ. Để phản hồi lời nhắc của người dùng, chúng sau đó tạo ra câu, bao gồm cả câu trả lời cho một câu hỏi bài tập, và thậm chí toàn bộ bài luận.

Không giống như các hệ thống AI trước đây, các câu trả lời của ChatGPT thường được viết tốt và dường như được nghiên cứu tốt. Điều này gây lo ngại rằng học sinh đơn giản sẽ có thể nhờ ChatGPT làm bài tập về nhà cho họ, hoặc ít nhất là họ có thể trở nên phụ thuộc vào chatbot để có được câu trả lời nhanh chóng, mà không cần hiểu lý do.
ChatGPT cũng có thể dẫn học sinh vào con đường sai lầm. Bất chấp thành công xuất sắc trong hàng loạt bài kiểm tra kinh doanh, pháp lý và học thuật, bot nổi tiếng với tính giòn vỡ, sai lầm nếu câu hỏi được đặt khác đi một chút, và thậm chí nó còn bịa đặt, một vấn đề được gọi là ảo giác.

Wei Wang, nhà khoa học máy tính tại Đại học California, Los Angeles, phát hiện ra rằng GPT-3.5 - công nghệ cung cấp phiên bản miễn phí của ChatGPT - và bản kế nhiệm của nó, GPT-4, đã sai rất nhiều khi được kiểm tra trên các câu hỏi về vật lý, hóa học, khoa học máy tính và toán học lấy từ sách giáo khoa và các bài kiểm tra cấp đại học. Wang và các đồng nghiệp của cô đã thử nghiệm các cách khác nhau để đặt câu hỏi cho hai bot GPT. Họ phát hiện ra rằng phương pháp tốt nhất là sử dụng GPT-4, và bot của nó có thể trả lời khoảng một phần ba các câu hỏi sách giáo khoa một cách chính xác theo cách đó (xem 'Lỗi sách giáo khoa của AI'), mặc dù nó đạt điểm 80% trong một bài kiểm tra.


Quyền riêng tư là một trở ngại khác: học sinh có thể không thoải mái làm việc thường xuyên với LLM sau khi nhận ra rằng mọi thứ họ gõ vào chúng đều được OpenAI lưu trữ và có thể được sử dụng để huấn luyện các mô hình.

Chấp nhận LLM


Nhưng bất chấp những thách thức, một số nhà nghiên cứu, giáo viên và công ty thấy tiềm năng rất lớn trong ChatGPT và công nghệ LLM cơ bản của nó. Giống như Beghetto và Wolfram Research, họ hiện đang thử nghiệm cách tốt nhất để sử dụng LLM trong giáo dục. Một số sử dụng các lựa chọn thay thế cho ChatGPT, một số tìm cách giảm thiểu sai sót và ảo giác, và một số cải thiện kiến ​​thức cụ thể chủ đề của LLM.

"Có các ứng dụng tích cực không?" Collin Lynch, nhà khoa học máy tính chuyên về hệ thống giáo dục tại Đại học bang Bắc Carolina ở Raleigh hỏi. "Hoàn toàn có. Có những rủi ro không? Có những rủi ro và lo ngại rất lớn. Nhưng tôi nghĩ có cách để giảm thiểu chúng."
Xã hội cần giúp học sinh hiểu được điểm mạnh và rủi ro của LLM, thay vì chỉ cấm họ sử dụng công nghệ, ông Sobhi Tawil, giám đốc tương lai học tập và đổi mới của UNESCO, cơ quan giáo dục của Liên Hợp Quốc tại Paris, nói. Vào tháng 9, UNESCO đã công bố một báo cáo có tựa đề Hướng dẫn cho Trí tuệ Nhân tạo Sinh học trong Giáo dục và Nghiên cứu. Một trong những khuyến nghị chính của nó là các tổ chức giáo dục cần xác nhận các công cụ như ChatGPT trước khi sử dụng chúng để hỗ trợ việc học.

Các công ty đang tiếp thị các trợ lý thương mại, chẳng hạn như MagicSchool và Eduaide, dựa trên công nghệ LLM của OpenAI và giúp giáo viên lập kế hoạch các hoạt động bài học và đánh giá công việc của học sinh. Các học giả đã sản xuất các công cụ khác, chẳng hạn như PyrEval, do nhóm nhà khoa học máy tính Rebecca Passonneau của Đại học Bang Pennsylvania ở State College tạo ra, để đọc bài luận và trích xuất các ý tưởng chính.


Với sự giúp đỡ của nhà tâm lý học giáo dục Sadhana Puntambekar tại Đại học Wisconsin-Madison, PyrEval đã chấm điểm các bài luận vật lý được viết trong các lớp khoa học của khoảng 2.000 học sinh trung học cơ sở mỗi năm trong 3 năm qua. Các bài luận không được cho điểm theo phương pháp truyền thống, nhưng PyrEval cho phép giáo viên nhanh chóng kiểm tra xem các bài tập có bao gồm các chủ đề chính hay không và cung cấp phản hồi trong chính lớp học, điều mà nếu không sẽ là không thể, Puntambekar nói.

Điểm số của PyrEval cũng giúp học sinh phản ánh về công việc của mình: nếu AI không phát hiện một chủ đề mà học sinh nghĩ rằng họ đã bao gồm, điều đó có thể cho thấy ý tưởng cần được giải thích rõ ràng hơn hoặc họ đã mắc các lỗi khái niệm hoặc ngữ pháp nhỏ, cô ấy nói. Nhóm hiện đang yêu cầu ChatGPT và các LLM khác thực hiện cùng một nhiệm vụ và so sánh kết quả.

Giới thiệu gia sư AI

Các tổ chức khác sử dụng AI để trợ giúp học sinh trực tiếp. Đó là cách tiếp cận của công cụ giáo dục dựa trên LLM phổ biến nhất ngoài chính ChatGPT; gia sư AI và trợ giảng Khanmigo. Công cụ này là kết quả của sự hợp tác giữa OpenAI và tổ chức phi lợi nhuận giáo dục Khan Academy ở Mountain View, California. Sử dụng GPT-4, Khanmigo cung cấp các lời khuyên cho học sinh khi họ làm bài tập, tiết kiệm thời gian cho giáo viên.
Khanmigo hoạt động khác với ChatGPT. Nó xuất hiện dưới dạng chatbot pop-up trên màn hình máy tính của học sinh. Học sinh có thể thảo luận về vấn đề mà họ đang làm việc với nó. Công cụ tự động thêm một lời nhắc trước khi gửi truy vấn của học sinh đến GPT-4, hướng dẫn bot không đưa ra câu trả lời mà thay vào đó hãy hỏi nhiều câu hỏi.
Kristen DiCerbo, giám đốc học tập trưởng của học viện, gọi quá trình này là "đấu tranh có ích". Nhưng cô thừa nhận rằng Khanmigo vẫn đang ở giai đoạn thử nghiệm và có một ranh giới mỏng manh giữa câu hỏi hỗ trợ học tập và câu hỏi quá khó khiến học sinh bỏ cuộc. “Thử thách là tìm ra ranh giới đó ở đâu,” cô nói.

Khanmigo lần đầu tiên được giới thiệu vào tháng 3, và hơn 28.000 giáo viên và học sinh Mỹ từ 11-18 tuổi đang thử nghiệm trợ lý AI này trong năm học này, theo Học viện Khan. Người dùng bao gồm các thuê bao riêng lẻ cũng như hơn 30 khu học chánh. Cá nhân trả 99 đô la Mỹ mỗi năm để bao gồm chi phí tính toán của LLM, và các khu học chánh trả 60 đô la mỗi năm cho mỗi học sinh để truy cập. Để bảo vệ quyền riêng tư của học sinh, OpenAI đã đồng ý không sử dụng dữ liệu Khanmigo để đào tạo.

Nhưng liệu Khanmigo có thực sự cách mạng hóa giáo dục hay không vẫn chưa rõ ràng. LLM được đào tạo để chỉ bao gồm từ có khả năng xuất hiện tiếp theo trong câu, không kiểm tra sự thật. Do đó, chúng đôi khi mắc sai lầm. Để cải thiện độ chính xác, lời nhắc mà Khanmigo gửi đến GPT-4 hiện bao gồm các câu trả lời đúng để hướng dẫn, DiCerbo nói. Nó vẫn mắc lỗi, tuy nhiên, và Học viện Khan yêu cầu người dùng báo cáo khi nó xảy ra.
Lynch nói Khanmigo dường như hoạt động tốt. Nhưng ông cảnh báo: "Tôi chưa thấy xác nhận rõ ràng."

Nói chung hơn, Lynch nhấn mạnh rằng điều cốt yếu là bất kỳ chatbot nào được sử dụng trong giáo dục cần được kiểm tra cẩn thận về ngữ điệu cũng như độ chính xác - và nó không xúc phạm hoặc làm nhục học sinh, hoặc khiến họ cảm thấy lạc lối. “Cảm xúc là chìa khóa để học tập. Bạn có thể hợp pháp phá hủy sự quan tâm của ai đó đến việc học bằng cách giúp đỡ họ theo cách tồi tệ, "Lynch nói.

DiCerbo lưu ý rằng Khanmigo phản ứng khác nhau với mỗi học sinh trong mỗi tình huống, điều mà cô hy vọng khiến bot hấp dẫn hơn các hệ thống gia sư trước đây. Học viện Khan dự kiến sẽ chia sẻ nghiên cứu về hiệu quả của Khanmigo vào cuối năm 2024 hoặc đầu năm 2025.

Các công ty gia sư khác đang cung cấp LLM như trợ lý cho học sinh hoặc đang thử nghiệm chúng. Công ty công nghệ giáo dục Chegg ở Santa Clara, California, đã ra mắt một trợ lý dựa trên GPT-4 vào tháng 4. Và Tập đoàn Giáo dục TAL, một công ty gia sư Trung Quốc có trụ sở tại Bắc Kinh, đã tạo ra một LLM có tên MathGPT mà họ tuyên bố chính xác hơn GPT-4 trong việc trả lời các câu hỏi cụ thể về toán học. MathGPT cũng nhằm mục đích giúp học sinh bằng cách giải thích cách giải quyết vấn đề.

Tăng cường khả năng truy xuất

Một cách tiếp cận khác để tạo ra một đối tác học tập AI là kết hợp LLM với các bộ tri thức bên ngoài, tập trung - chẳng hạn như một cuốn sách giáo khoa hoặc một tập hợp các bài báo khoa học - đã được kiểm chứng nghiêm ngặt. Mục tiêu của phương pháp sinh có tăng cường khả năng truy xuất (RAG) này là để né tránh sự bất khả thi trong việc xác minh hàng tỷ nguồn văn bản tạo nên khả năng đối thoại của một LLM.

Công ty AI Merlyn Mind ở Thành phố New York đang sử dụng RAG trong LLM mã nguồn mở Corpus-qa của mình, nhằm mục đích giáo dục. Giống như ChatGPT, LLM của Merlyn Mind ban đầu được đào tạo trên một lượng lớn văn bản không liên quan đến giáo dục cụ thể - điều này mang lại khả năng đối thoại của nó.

Nhưng không giống ChatGPT, khi LLM trả lời một truy vấn, nó không chỉ dựa vào những gì nó đã học trong quá trình đào tạo. Thay vào đó, nó cũng tham khảo một tập hợp thông tin cụ thể, giúp giảm thiểu ảo giác và các lỗi khác, ông Satya Nitta, giám đốc điều hành của công ty, nói. Merlyn Mind cũng tinh chỉnh LLM của mình để "thú nhận" nếu chúng không có phản hồi chất lượng cao và làm việc để tạo ra câu trả lời tốt hơn, và do đó chống lại ảo giác trong nhiều trường hợp, ông Nitta nói.

RAG cũng được sử dụng bởi ASU, là một trong những trường đại học tiên phong nhất về việc áp dụng LLM, theo Claire Zau, phó chủ tịch của GSV Ventures, một nhà đầu tư vào các công ty công nghệ giáo dục ở Thành phố New York. Sau khi ban đầu phát hành hạn chế để thử nghiệm, ASU đã ra mắt một hộp công cụ vào tháng 10 cho phép các thành viên giảng viên thử nghiệm LLM trong giáo dục thông qua giao diện web. Điều này bao gồm quyền truy cập vào sáu LLM, bao gồm GPT-3.5, GPT-4 và Bard của Google, cũng như các khả năng RAG.

Các công cụ sẽ cho phép nhiều nhà nghiên cứu hơn, chẳng hạn như Beghetto, xây dựng các chatbot cho sinh viên của họ tương tác. Sau hội thảo ban đầu, Beghetto dự định sử dụng các bot trong một khóa học mà ông đang phát triển. ASU lưu trữ các phiên bản an toàn của LLM trong đám mây riêng của mình để giảm thiểu lo ngại về quyền riêng tư, Elizabeth Reilley, giám đốc điều hành tăng tốc AI của ASU, có trụ sở tại Phoenix, nói.

Reilley cho biết các bot đã có tác động tích cực đến giáo dục tại ASU. Ví dụ, cô ấy nói, một bot được tạo ra để sử dụng trong khóa học hóa học cơ bản của ASU sử dụng RAG để kết hợp GPT-3.5 với tài liệu khóa học PDF và PowerPoint. Cô đưa ra ví dụ về một bài kiểm tra tưởng tượng một học sinh yêu bóng chày hỏi LLM để giải thích các tương tác lưỡng cực-lưỡng cực trong các phân tử dựa trên môn thể thao đó. Câu trả lời là một lời giải thích chính xác, cô ấy nói, đã kết hợp "một ẩn dụ bóng chày để làm cho nó có ý nghĩa hơn một chút".
Việc sử dụng một LLM tổng quát kết hợp với RAG khác với các cách tiếp cận học máy trước đây, nhằm mục đích huấn luyện một hệ thống AI để mô phỏng một chuyên gia khoa học, Danielle McNamara, giám đốc điều hành viện kỹ thuật học tập của ASU tại Tempe nói. Những công cụ đó thiếu khả năng tổng quát, chẳng hạn như khả năng kết hợp bóng chày vào các khái niệm hóa học, có thể giúp học sinh. McNamara và các đồng nghiệp giờ đây dự định nghiên cứu mức độ hiệu quả của các chatbot và công cụ LLM mà ASU sử dụng.

Các tổ chức khác cũng đang chấp nhận LLM, bao gồm Đại học Vanderbilt ở Nashville, Tennessee, đã cung cấp cho sinh viên trong một số khóa học quyền truy cập vào phiên bản trả phí của ChatGPT, bao gồm quyền truy cập vào các công cụ plug-in chuyên dụng. Các nhà nghiên cứu tại Đại học Sư phạm Đông Hoa ở Thượng Hải đã tạo ra một LLM giáo dục chuyên dụng có tên EduChat kết hợp đánh giá bài luận, gia sư dựa trên đối thoại và hỗ trợ cảm xúc trong một chatbot. Nhóm đã chia sẻ công cụ dưới dạng mã nguồn mở. Mặc dù EduChat vẫn ở giai đoạn đầu, nó đáng chú ý vì là một LLM giáo dục chuyên dụng chứ không phải là sự thích ứng của một mô hình đa mục đích hiện có, như ChatGPT hoặc Bard.

Nó có bắt kịp không?

Một câu hỏi quan trọng xung quanh việc sử dụng AI trong giáo dục là ai sẽ được truy cập vào nó, và liệu các dịch vụ trả phí như Khanmigo có làm trầm trọng thêm bất bình đẳng hiện có trong nguồn lực giáo dục hay không. DiCerbo nói Học viện Khan hiện đang tìm kiếm các nhà từ thiện và trợ cấp để giúp trang trải chi phí tính toán và cung cấp quyền truy cập cho các trường thiếu nguồn lực, đã ưu tiên các trường này trong giai đoạn thử nghiệm. “Chúng tôi đang nỗ lực để đảm bảo rằng sự chênh lệch kỹ thuật số không xảy ra,” cô ấy nói.
Một thách thức khác là làm thế nào để đảm bảo thông tin do LLM cung cấp không có định kiến, và các mô hình xem xét kiến thức và quan điểm từ các nhóm đại diện kém. Những thông tin đó vắng mặt trong phần lớn văn bản mà LLM được đào tạo. Sean Dudley, phó chủ tịch liên kết về công nghệ nghiên cứu của ASU, có trụ sở tại Tempe, nói rằng RAG cho phép nền tảng LLM của ASU cung cấp cho người dùng nguồn gốc của câu trả lời của nó. Điều này không loại bỏ vấn đề thiên vị, nhưng anh hy vọng rằng nó sẽ cung cấp tính minh bạch và cơ hội để học sinh xem xét một cách phê phán thông tin đến từ đâu. “Một phần nhiệm vụ của chúng tôi là hỏi ai đã bị bỏ lại,” Dudley nói.

Liệu lời hứa của LLM cho giáo dục cuối cùng có vượt qua các rủi ro hay không vẫn chưa rõ ràng. Lynch chấp nhận rằng chúng là những công cụ mạnh mẽ, nhưng anh cũng tìm cách giữ cho điểm yếu của chúng được chú ý. “Không phải chỉ trong một đêm chúng ta đã học được cách bay,” anh nói.

Anh ví sự chú ý mà chúng thu hút giống như trước đây dành cho các khóa học trực tuyến mở rộng lớn và các ứng dụng giáo dục của các thế giới ảo 3D được gọi là siêu vũ trụ. Cả hai đều không có sức mạnh tạo bước đột phá như một số người từng dự đoán, nhưng cả hai đều có công dụng của chúng. “Theo một nghĩa nào đó, điều này cũng sẽ tương tự như vậy. Nó không tệ. Nó không hoàn hảo. Nó không phải là tất cả. Đó là một thứ mới," anh nói.
Tawil, người đã làm việc trong lĩnh vực giáo dục tại UNESCO hơn hai thập kỷ, nói rằng việc hiểu rõ giới hạn của AI là điều cốt yếu. Đồng thời, LLM giờ đây đã gắn bó chặt chẽ với các nỗ lực của con người đến mức ông nói cần thiết phải suy nghĩ lại cách dạy và đánh giá việc học. “Nó định nghĩa lại những gì làm nên con người, điều gì đặc biệt về trí thông minh của chúng ta.”

Tác giả: Andy Extance
Nature 623, 474-477 (2023)
doi: https://doi.org/10.1038/d41586-023-03507-3
References
OpenAI. Preprint at https://arxiv.org/abs/2303.08774 (2023).
Wang, X. et al. Preprint at https://arxiv.org/abs/2307.10635 (2023).
UNESCO. Guidance for Generative AI in Education and Research (UNESCO, 2023).
Gao, Y., Sun, C. & Passonneau, R. J. In Proc. 23rd Conf. Comput. Natural Language Learning 404–418 (2019).
Singh, P. et al. In Proc. Int. Conf. Learning Sciences 1521–1524 (2022).
Dan, Y. et al. Preprint at https://arxiv.org/abs/2308.02773 (2023).





Đăng nhận xét

[blogger]

MKRdezign

Biểu mẫu liên hệ

Tên

Email *

Thông báo *

Được tạo bởi Blogger.
Javascript DisablePlease Enable Javascript To See All Widget