栏目分类
热点资讯
成人网有哪些
你的位置:大桥未久种子 > 成人网有哪些 > 欧美童模写真 卢宇 等|生成式东谈主工智能的拔擢应用与瞻望——以ChatGPT系统为例
欧美童模写真 卢宇 等|生成式东谈主工智能的拔擢应用与瞻望——以ChatGPT系统为例

发布日期:2024-11-17 08:22    点击次数:114

欧美童模写真 卢宇 等|生成式东谈主工智能的拔擢应用与瞻望——以ChatGPT系统为例

卢宇 等|生成式东谈主工智能的拔擢应用与瞻望——以ChatGPT系统为例

【选录】生成式东谈主工智能(Generative Artificial Intelligence)旨在欺诈东谈主工智能本事自动化生成文本、图像、视频、音频等多模态数据,受到拔擢界限的无为珍惜。其中,ChatGPT系统因其细密的天然谈话贯穿和生成智商,体现出较高的多界限应用后劲。本研究以ChatGPT行为主要对象,基于其四项中枢智商,即启发性内容生成智商、对话情境贯穿智商、序列任求实行智商和标准谈话解析智商,探讨在教师教学、学习过程、拔擢评价、学业辅导四个方面的潜在拔擢应用。在此基础上,在真确系统中进行了习题生成、自动解题、辅助批阅等拔擢应用的初步考据。终末,本文进一步探讨了以ChatGPT为代表的生成式东谈主工智能在拔擢应用中所濒临的局限和对拔擢的启示。

【环节词】生成式东谈主工智能;ChatGPT;大谈话模子;东谈主工智能拔擢应用

一、

媒介

2017年7月由国务院印发的《新一代东谈主工智能发展运筹帷幄》中提议了我国对东谈主工智能发展的政策运筹帷幄,明确指出要收拢东谈主工智能发展的紧要历史机遇(国务院, 2017)。2022年11月,生成式东谈主工智能系统ChatGPT淡雅发布(OpenAI, 2022),赶紧成为拔擢界限珍惜和接洽的焦点。生成式东谈主工智能(Generative Artificial Intelligence)指通过东谈主工智颖悟系本事,自动化生成文本、图像、视频、音频等多类型内容。频年来,跟着东谈主工智能本事、算力水平与可获取数据量的提高,生成式东谈主工智能本事依托谈话、图像以及多模态大模子(Foundation Model),不错竣事较好的内容生成效果(Bommasani et al., 2021),并在传媒、零卖、法律、医疗、金融等界限缓慢运转提供专科化与个性化内容生成服务。

针对生成式东谈主工智能本事,国表里产业界与学术界皆开展了较多的前期研发与插足。国内以百度为代表的AI企业用功于于研发基于大模子的生成式东谈主工智能系统,并竣事快速落地。举例,ERNIE 3.0(Zhang et al., 2019)是基于知识增强的大谈话模子,通过增强学习通识性知识,可进行具备知识可靠性的高质料文本创作;ERNIE-ViLG 2.0(Ho et al., 2020)行为多模态大模子,可通过输入翰墨描绘,生成具备较好明晰度、可控性与创造性的图像,并基于扩散模子增强图文环节信息获取以及进行降噪过程优化。国际以OpenAI公司为典型代表,在跨模态内容生成、天然谈话内容生成等界限,皆作念出了引颈性孝顺。举例,DALL·E 2(OpenAI, 2022)跨模态生成系统可依据用户翰墨描绘,生成、膨胀、修改和万般性迁徙生成原创高清图片;GPT系列的东谈主工智能系统不错生成文本类内容,缓慢靠近竣事类东谈主的谈话贯穿与交互智商,并于近期推出了基于大谈话模子的多轮对话系统ChatGPT。

ChatGPT系颐养经问世,便激勉了产业界和学术界的无为珍惜,用户界限赶紧突出一亿,并在互联网界限赶紧竣事落地应用。微软“必应”搜索已运转借助ChatGPT,为用户提供结构化整合搜索适度、建议及聊天等功能,权贵提高了搜索效用、改善了用户体验。在智能性方面,斯坦福学者依据心智表面测试发现GPT-3.5(ChatGPT的同源模子)可惩处100%的巧合迁徙任务以及85%的巧合内容任务,很是于9岁儿童的水平(Kosinski, 2023);在专科考试方面,ChatGPT过甚同源居品可基本通过谷歌L3级软件工程师水平测试、好意思国执业大夫阅历考试、好意思国功令考试中的把柄和侵权举止测试、好意思国宾夕法尼亚大学沃顿商学院MBA运营管制课程考试等。

ChatGPT在文本类内容生成、荆棘文情境贯穿等方面所发达出的绝顶性能,对拔擢界限也产生了巨大影响和深切的启示真谛,并可能促进和催化从拔擢理念到拔擢实践的深档次变革。弥远受本事条目制约的启发式教学与个性化响应等潜在智能拔擢应用也运转成为可能。本研究将以ChatGPT为主要研究对象,基于其本事维度的中枢智商分析其在拔擢中的潜在应用,在对部分应用进行初步考据的基础上,探讨其局限性及对拔擢的启示。

二、

ChatGPT轮廓

(一)历史演变

东谈主工智能界限的研究指标是通过模拟东谈主类智能,使机器梗概像东谈主类相通念念考和行动。科学家并从效法东谈主类谈话交互的角度提议了著名的“图灵测试”。东谈主工智能发展初期,主要珍惜知识形式化表征与标识化推理,但一直难以处理复杂多变且具有较强歧义性的东谈主类天然谈话。进入21世纪,研究东谈主员运转尝试构建基于统计推断和机器学习本事的天然谈话处理模子。天然这些模子不错提高典型天然谈话处理任务的性能,然则仍然难以深入分析和准确生成东谈主类的天然谈话。跟着深度学习本事的发展,对东谈主类天然谈话进行高维分散式表征和隐含特征索要渐渐成为可能,东谈主工智能本事在多项天然谈话处理任务上的发达也有了极大提高。2017年谷歌公司提议Transformer(Vaswani et al., 2017)模子,促使天然谈话处理模子的参数目得到大幅膨胀。在此基础上,研究东谈主员提议了预西宾谈话模子的观念,即基于大界限语料库并欺诈自监督学习本事西宾谈话模子,以提高机器对天然谈话的贯穿智商,并由此开启了天然谈话处理界限的大模子时期。

2018年6月,好意思国OpenAI公司提议了基于Transformer的预西宾谈话模子(Generative Pre-trained Transformer)GPT-1。GPT-1(Radford et al., 2018)基于自转头理念,领受12个Transformer解码器,构建从左向右单向预测的谈话模子,参数目达1.17亿。GPT-1的构建领先基于大型语料库进行无监督的预西宾,然后通过有监督的微调本事为卑劣天然谈话处理任务提供惩处决议。同庚10月,谷歌推出了基于自编码理念的BERT(Bidirectional Encoder Representations from Transformers)模子,基于多层的Transformer编码器,领受从控制双向进行填空学习的方式开展西宾(Devlin et al., 2019)。2019年2月,OpenAI发布了GPT-2模子(Radford et al., 2019),其中枢境念与GPT-1相似,但领受了更多的Transformer解码器和更大的语料库进行西宾,参数目达15亿。GPT-2在多项天然谈话处理任务上均有较为出色的发达。同庚谷歌进一步提议了T5(Raffel et al., 2019)模子,并在机器翻译与知识问答等任务上发达出更好的性能。2020年5月,OpenAI推出GPT-3(Brown et al., 2020),其参数目相较GPT-2提高了两个数目级,达到1,750亿。参数目的提高使GPT-3在对话生成、文本选录、机器翻译等任务上展现出了绝顶的性能。2022岁首,OpenAI在GPT-3的基础上推出InstructGPT(Ouyang et al., 2022),并于同庚11月推出其同源模子ChatGPT,在文本生成以及天然谈话交互等任务上竣事了较为惊东谈主的跨越。

(二)干系本事

为竣事高质料的生成内容,以ChatGPT为代表的GPT系列系统,主要触及了五项环节本事和架构。

1. Transformer模子

该模子是ChatGPT等系统的基本组成单位,践诺上是一种基于自郑重力机制的深度神经相聚,主要包含编码器妥协码器两部分。编码器主要包括一个自郑重力子层和一个全联结前馈神经相聚子层:前者计较输入序列中不同位置之间的依赖关捆绑构并进行特征示意,后者则对重生成的特征示意进行处理,生成最终的表征向量。解码器的基本结构与编码器访佛,但针对编码器的输出加多了新的多头郑重力层,并加入了掩码设定,以缜密解码过程中后继位置信息泄漏。Transformer模子梗概高效捕捉序列数据中不同位置之间的依赖关系,并处理任意长度的天然谈话序列数据。

2. 基于Transformer的基本架构

GPT系列系统基于Transformer模子组成其基本系统架构,由于ChatGPT系统的具体本事结构信息现在并莫得被无缺败露,咱们以其前身GPT-3为例进行先容。如图1所示,GPT-3主淌若由96层的Transformer 解码器组成,其中每层的解码器包含掩码多头郑重力机制子层和全联结前馈神经相聚子层,单词的镶嵌维度和荆棘文窗口长度均进行了膨胀,且领受疏淡郑重力模式提高运行效用。模子西宾的过程基于自转头念念想,即给定上文内容预测下文单词或给定下文内容预测上文单词。此外,针对不同天然谈话处理任务,GPT-3弯曲不同形式的文本语料进行模子西宾。举例,针对机器翻译任务,西宾数据会弯曲成访佛“翻译成英文:他来自中国。He is from China.”形式的文本。这些本事与念念想获胜匡助GPT系列系统缓慢具备了优秀的文本生成智商。

图1 GPT-3模子的基本架构

3. 基于东谈主类响应的强化学习(Reinforcement Learning from Human Feedback, RLHF)本事

该本事是ChatGPT内容生成智商提高的环节(Christinao et al., 2017)。RLHF本事包含三个标准:第一步是监督式微调,其中枢境念是欺诈允洽东谈主类预期的少许标注数据对预西宾模子参数进行养息,初步优化文本生成模子;第二步是构建奖励模子,中枢指标是通过对监督式微调生成的多个适度进行东谈主工排序标识,西宾奖励函数模子,用于强化学习模子输出适度的自动化评价;第三步是欺诈近端策略优化(Proximal Policy Optimization, PPO)算法,聚拢奖励模子对文本生成模子的适度进行自动评估,并领受强化学习对文本生成模子进行优化,使其最终具备生成允洽东谈主类预期的文本的智商(Schulman et al., 2017)。

天堂在线

4. 指示微调(Instruction Tuning)本事

该本事不错辅助ChatGPT等系统生成高质料的文本(Wei et al., 2021)。指示微调是一项谈话模子西宾本事,通过将预设的指示描绘与生成文本相聚拢,构建西宾数据,从而微调文本生成模子的参数。其中枢念念想是将天然谈话处理干系任务转变为基于指示描绘的文本生成问题。基于指示描绘,不错促使模子贯穿指示任务,从而生成预期文本。举例,用户输入“判断这句话的对错:三角形的内角和为360度”,其中“判断这句话的对错”是指示描绘,指示任务是对“三角形的内角和为360度”进行正误判断,从而生成预期的谜底文本“该句话失实”。

5. 念念维链(Chain of Thought)本事

该本事通过一系列前后关联的指示,不错辅助ChatGPT等系统完成复杂推理任务(Wei et al., 2022)。谈话模子天然在对东谈主类天然谈话表征和建模上取得了权贵进展,但在复杂逻辑问题推理上,仍较难达到高亢的效果。念念维链本事不错针对性地狡计模子的指示输入,促使模子将单标准推理任务拆解为包含多个中间标准的任务。其中,每一个中间标准由一个相对节略的指示输入行为领导,其适度代表了多标准任务的逻辑分析过程。念念维链本事不错领导文本类内容生成,辅助模子生成和惩处复杂逻辑推理任务。

同期,为惩处文本生成过程中产生与用户预期不符的举止问题,举例虚拟事实、生成有偏见或无益文本、不撤职用户指示等,ChatGPT等系统的本事研发撤职3H基本原则,即匡助性(Helpful)——模子应匡助用户惩处问题、真确性(Honest)——模子弗成虚拟信息或误导用户、无害性(Harmless)——模子弗成对东谈主或环境酿成躯壳、心境或社会性的伤害(Askell et al., 2021;Ouyang et al., 2022)。

(三)中枢智商

上述干系本事与基本原则的科学合理使用,促使ChatGPT等系统在天然谈话贯穿与内容生成方面,炫耀出以下四项较为杰出的中枢智商。

1. 启发性内容生成智商

ChatGPT等系统梗概基于给定的主题或在多轮对话过程中识别的荆棘文信息,生成有启发性和创意性的文本,包括诗词、故事、评述等。这些文本不仅不错成为用户的创作素材,也不错在念念维广度上为用户带来启发。

2. 对话情境贯穿智商

ChatGPT等系统梗概基于多轮对话中的荆棘文信息,进行语义贯穿和推理,捕捉用户意图与对话情境,生成允洽逻辑的连贯性回答,为用户带来细密的交互体验。

3. 序列任求实行智商

ChatGPT等系统梗概基于用户的序列指示描绘,贯穿指示之间的关联关系,缓慢对任务进行鼓励,完成基于组合指示的复杂任务,从而较好地实行用户给出的多标准序列任务。

4. 标准谈话解析智商

ChatGPT等系统梗概根据多种编程谈话的语法章程、数据结构、算法构建与编程表率,对代码标准进行结构与算法分析,并根据用户任务需求自动生成允洽任务要求的代码标准或错因解析。

上述四项中枢智商体现了现时生成式东谈主工智能界限的挫折漏洞和价值,也为其在拔擢界限的应用提供了诸多可能性。

三、

潜在拔擢应用

基于现时ChatGPT系统所具备的启发性内容生成、对话情境贯穿、序列任求实行、标准谈话解析四项中枢智商,咱们从教、学、评、辅四个典型拔擢枢纽,梳理了不同中枢智商不错救济的潜在拔擢应用,如图2所示。

图2 ChatGPT的潜在拔擢应用

(一)教师教学

ChatGPT等系统不错为教师教学提供多种形态的匡助和服务。基于启发性内容生成智商,ChatGPT等系统不错依据教师的教学指标生成创作型教学素材,辅助教师狡计有鼎新性的教学举止;基于对话情境贯穿智商,ChatGPT等系统不错在课堂教学中充任助教变装,根据现时教学举止情境,为教师提供教学过程的交互式救济;基于序列任求实行智商,ChatGPT等系统不错依据教学场景与个体教师的教学需求,生成个性化教学决议;基于标准谈话解析智商,ChatGPT等系统不错为教师提供编程课程案例,救济典型问题过甚变形的示例性代码生成与讲明。

具体而言,在辅助教师生成个性化教学决议的过程中,ChatGPT等系统不错依据教师的教学需求,分标准生成多种适切的教学狡计,为教师在备课过程中提供念念路启发与多种备选决议,提高教师的备课效用与讲课质料。举例,在中学语文课程《荷塘月色》的教案狡计过程中,教师不错领先要求系统制作一份基础决议,包括教学主题、教学指标、教学内容、教学标准、教学表率、教学评价、教学资源等模块。在此基础上,教师不错络续要求系统加多互动枢纽,并自动生成朱自清生平小测验、荷塘故事续写等真谛教学举止,供我方参考和采纳性补充到教案中。教师也不错要求系统加多课外拓展素材,系统则会从作家的其他代表作品、书信与日志、故土文化等方面提供参考教学资源。

(二)学习过程

ChatGPT等系统也不错为学习过程提供细密的救济和服务。基于启发性内容生成智商,ChatGPT等系统不错自动生成范文段落示例或启发性念念路指示,为学生提供创意写稿素材,以东谈主机协同共创方式辅助学生写稿;基于对话情境贯穿智商,ChatGPT等系统不错识别学生学习情境,聚拢学科专科知识,为学生提供基于情境的学科知识问答;基于序列任求实行智商,ChatGPT等系统不错依据学生的学习需求与知识掌持情况,为学生提供动态教学支架与响应,并优化其学习旅途;基于标准谈话解析智商,ChatGPT等系统不错聚拢学生践诺需求与编程任务,为学生推选干系代码片断与运行解析,匡助其高效贯穿标准的狡计念念路与编写方式。

具体而言,在救济学生学科知识问答的过程中,ChatGPT系统不错基于多轮对话,为学生提供从风景分析、知识点教导、应用影响等多档次服务。举例,系统不错为学生解答“苹果会落地”的物理学旨趣是地球引力作用,并进一步为学生教导牛顿通顺定律的知识点。如果学生络续发问“这些旨趣和定律的用途”,系统不错准确贯穿其问题指向,并从日常生涯到航空航天等角度进行解答并作念合理膨胀。

(三)拔擢评价

ChatGPT等系统还不错针对性完成拔擢评价的多项任务。基于启发性内容生成智商,ChatGPT等系统不错为学生作品和谜底进行客不雅点评,领导学生发掘作品优点并提供改进念念路;基于对话情境贯穿智商,ChatGPT等系统不错对学生的谈话抒发智商进行评测,通过分析学生对话过程中的词汇、语法、句子结构,以及不雅点抒发与事件描绘方式,给出针对性的响应建议;基于序列任求实行智商,ChatGPT等系统不错依据测试科目、查考指标、题目类型等组卷需求,自动生成多种备选测试题目,救济教师智能组卷;基于标准谈话解析智商,ChatGPT等系统不错进行高效代码响应与评价,改进代码失实并提议优化建议。

具体而言,在为学生提供标准代码评价中,ChatGPT等系统不错通过自动识别标准谈话、数据结构、函数类型与代码结构,举座评价典型算法标准的编写正误,并提供对于代码表自便、复杂度等多个维度的细颗粒度响应与评价。举例,学生输入指示“请对底下这段代码进行评价响应”并提供代码,系统不错指出该典型算法是否编写正确,并提供针对性建议与改进代码示例。此外,系统还不错从函数定名方式、函数功能扫视、参数正当性闇练、复返值狡计、变量定名等方面提供改进指示。

(四)学业辅导

ChatGPT等系统还不错尝试完成较为复杂和专科的学业辅导任务。基于启发性内容生成智商,ChatGPT等系统不错生成针对性资源和素材,领导学生从不同角度对知识点进行贯穿,辅助提高学生的知识探究与鼎新智商;基于对话情境贯穿智商,ChatGPT等系统不错依据历史对话信息贯穿学生的践诺辅导需求,聚拢现时学习内容,为学生提供个性化学习救济;基于序列任求实行智商,ChatGPT等系统不错针对学生的疑难问题进行分标准解析,匡助学生贯穿问题求解的要点与难点;基于标准谈话解析智商,ChatGPT等系统不错生成多维度代码讲明注解,包括参数确立、算法念念路、逻辑关系等,匡助学生贯穿标准内涵与功能,辅助提高学生编程智商。

具体而言,在为学生生成知识探究与鼎新素材的过程中,ChatGPT等系统除不错生成以事实为依托的素材外,还不错生成基于假定的启发性素材,领导学生从不同维度解构知识,培养学生的念念辨智商与探究意志。举例,当学生发问“如果荆轲刺秦王成效了,将会发生什么”,系统不错基于这种假定,为学生分析秦国事否还能颐养六国以及中国历史的多种可能发展走向,启发学生对历史问题进行深入念念考。

四、

拔擢应用初步考据

本研究从教师教学、学习过程与拔擢评价三个维度,分别中式题生疏成、自动解题与辅助批阅三个具体拔擢应用,对系统进行初步考据。所选用的系统是2023年2月最新版块的ChatGPT。

(一)题生疏成

如表1所示,当用户给出数学应用题生成的指示后,系统不错自动生成允洽指示要求且具备合理情境信息的题目过甚谜底,即通过小明购买生果的情境确立查考乘法与加法的运算。在此基础上,如果给出篡改情境的指示,系统会进一步生成小明购买文具的情境并探员商酌的数学知识点。终末,如果络续用中语给出“请再出一起访佛的英文习题”的指示,系统不错生成描绘明晰且查考知识点商酌的英文题目,而其具体情境不错有所不同。

表1 习题生成示例

经过多轮测试,系统不错延续生成质料和难度均适中的多学科、厚情境习题,且大多数生成的题目包含参考谜底,便于在拔擢践诺场景中使用。同期,通过给出后续指示,不错对所生成习题的细节性信息进行修改,并不错生成多语种题目。由此可见,在教师教学的应用维度,系统初步具备了依据教学指标生成创作型教学素材的应用智商,不错辅助教师完成包括题生疏成在内的多项具体教学任务。

(二)自动解题

如表2所示,用户输入一起触及加法、除法、百分比等干系知识的数学问题,系统不错自动生成解答内容。在解答内容中,系统率先指出已知条目,即盐的质料为2克,然后解析盐和水的总质料为202克,进而给出质料占比的具体计较公式并计较出正确适度。终末,系统用表率的语句正面回答了该数学问题。

表2 自动解题示例

为更好地考据系统的自动解题智商,咱们从Multiarith数据集(Roy & Dan, 2016)中中式了50谈习题组成测试集。Multiarith数据集是一个多标准算法数据集,包含600谈小学级别的情状类数学题。通过调用InstructGPT干系模子接口进行延续测试,咱们发现系统解题的平均准确率约为68%。该适度仍是明显高于GPT-3的准确率,且解答失实的原因大多是源于对情境中所需知识性知识的误判。咱们进一步对系统解题过程中的推理翰墨进行分析,发现所生成的翰墨合理且易懂,大幅度突出了之前GPT-3的逻辑抒发智商。举例,GPT-3生成的解题念念路平素会存在失实的因果关系和推理,但ChatGPT系统仍是不错给出无缺明晰的解题逻辑,且在环节标准上均配有计较公式和描绘。

通过以上试验,咱们不错初步考据系统仍是具有较好的自动解题功能,所生成的解题适度具有一定的准确性与可读性,其逻辑抒发明晰且形式丰富。由此可见,在学习过程维度,系统仍是初步具备了完成个性化学科知识问答与支架式教学响应等拔擢应用的智商。另外需要指出的是,对于具有较为复杂情境的题目,ChatGPT系统自动解题和响应智商还有待提高。

(三)辅助批阅

如表3所示,用户输入一起无缺的题目过甚失实解答,系统不错根据用户指示,自动判断谜底正误并给出具体响应,从而完成辅助批阅的基本任务。在生成的辅助批阅文本中,系统率先明确给出了正确与否的判断,然后用合理准确的谈话给出了失实原因的分析,即指出桃树数目“不是只是是苹果树数目的1/5”,而应是“苹果树数目的1/5加上苹果树数目”。在此基础上,系统不错络续自动给出合理的解题过程与正确的谜底。

表3 辅助批阅示例

咱们进一步对题目内容和谜底进行篡改并测试,发现系统不错延续输出访佛的辅助批阅适度。由此可见,系统仍是具有题目谜底正误判断和错因分析等基本功能,即具备了对学生作品和习题谜底进行客不雅点评和判断的智商。这种会诊性评价智商具有很高的拔擢应用价值,是构建全经过自动化拔擢评价服务的环节性本事保险和基础。

五、

局限与启示

(一)局限与问题

以ChatGPT为代表的生成式东谈主工智能系统仍然濒临诸多局限。领先,系统仍然难以充分贯穿信息和分析信息内在的逻辑关系,因此很容易生成不对理的内甘愿者犯事实性的失实。举例ChatGPT会相配天然地回答诸如“诸葛亮是如何击败秦始皇”或“林黛玉初见曹雪芹的情状”,所给出的失实且极端的谜底体现了该本事并弗成像东谈主类相通无缺贯穿知识体系与内在推测。这种事实性的失实也容易误导不具备专科知识或干系知识的学习者,引起学习迷航与认识阻难。

其次,生成式东谈主工智能的过程仍然是黑箱,所生成的内容不具备可讲明注解性与明确的依据。举例让ChatGPT 写出“低时刻复杂度的字符串匹配”代码,即使所生成的长段代码不错运行且适度看似正确,但由于其中代码生成的开始和算法依据皆不明晰,代码中幽微的逻辑失实或标准冗余也难以精准识别,因此难以获胜应用于挫折的课程实践和高犀利的考试任务中。

另外,生成式东谈主工智能在中语语境和翰墨上的贯穿和抒发智商总体上要弱于英文。举例对于“苹果比梨多1/6”这么含义的语句,ChatGPT常常会生成“苹果是梨的1/6”或“苹果是梨的1/6倍”这么的失实或不允洽中语谈话风俗的表述。这种智商差距源于预西宾语料中以英文为主的现实情况,也因此可能导致非英语母语的学习者贯穿挫折以致贯穿失实。

同期,生成式东谈主工智能本事也可能被坏心欺诈,酿成较为严重的安全隐患。举例,不错用多步指示的方式,领导系统给出“如何入室盗窃”或“如何制造伤东谈主器具”这类问题的危急谜底。这些危急信息如果被各学段学习者获取和传播,会带来较为严重的青少年问题和社会危害。另外,生成式东谈主工智能本事的数据源本人复杂且浩大,其生成的内容可能有知识产权问题,且容易产生法律风险。举例在模子西宾和微调过程中,ChatGPT等居品所需的大界限数据集不可幸免要触及万般受法律保护的知识产权类数据,这些未经文章权东谈主授权的数据的使用以及所生成的相应内容,存在扰乱他东谈主文章权或专利权的风险。

终末,需要指出的是,以ChatGPT为代表的生成式东谈主工智能天然在拔擢界限有无为的应用远景,但并非在通盘场景皆有挫折应用后劲和作用。举例在拔擢智能化管制与服务中,平素需要依靠准确的数据援救和透明的决策模子,很难节略依赖“黑箱式”的生成式东谈主工智能本事。另外,生成式东谈主工智能的模子西宾、测试与卑劣任务适配,均需要较大界限的计较资源和存储资源进行救济,这种高资本对于很是一部分拔擢业务是难以承受的。因此,东谈主工智能生成内容本事的拔擢应用范围和场景也有一定的局限性,应幸免在拔擢界限盲目引申和普及。

(二)启示与瞻望

1. 鼓励拔擢理念变革

天然以ChatGPT为代表的东谈主工智能生成内容仍然存在诸多局限,但其所具备的中枢智商已运转对拔擢理念产生获胜影响和启示作用。我国现阶段拔擢仍疼爱通过无数回想、识别和闇练而获取知识,冷漠通过分析念念考而发现并掌持知识的表率与技巧。生成式东谈主工智能本事已缓慢流露出高效积聚知识与合理使用知识的基本智商,不错意想将替代和超越只可获取和存储知识的低阶念念维脑力做事者。因此,拔擢应该愈加侧重于培养学生的高阶念念维智商,尤其是跨学科多元念念维智商、批判性念念维智商与创造性念念维智商。唯有具备较强的跨学科多元念念维智商,学生才智领悟和分手现实寰宇的复杂问题和情境,并最终完成东谈主工智能难以布置的践诺任务;唯有具备细密的批判性念念维智商,学生才智对知识和技巧有超越东谈主工智能模子的深入贯穿和分析,并充分领悟到东谈主工智能本事的局限过甚器具属性;唯有具备一定的创造性念念维智商,学生才智充分挖掘和证据自身在特定界限的鼎新后劲和作用,幸免被智能机器在专科界限节略替代。同期,新本事条目下的拔擢,需要加快教师队伍的不雅念转变,让一线拔擢使命者充分领悟到本事变革所带来的社会需求变革,充分调节教师在拔擢理念变革过程中的积极性和创造力。

2. 鼎新教学方式与内容

在疼爱高阶念念维智商培养的拔擢理念驱动下,生成式东谈主工智能本事与居品对教学方式与教学内容的影响也会渐渐流露,并饰演不同的变装和证据不同的作用。在教学方式上,需要荧惑教师积极鼎新课堂教学方式,将干系本事纳入不同学科的教学过程中,丰富课堂举止内容过甚真谛性。举例,通过确立具备细密交互智商的东谈主工智能助教,提供及时机器响应以致东谈主机辩白环境,荧惑学生与机器助教开展共创性学习,延续性获取所需的个性化学习信息与资源,从而培养学生高阶念念维智商和自主学习智商。在教学内容上,需要积极养息不同学科的培养指标和教学要求,愈加强调学科中枢修养导向的教学内容确立。举例现时东谈主工智能生成内容本事仍是具备细密的多谈话代码生成与调试智商,低级标准员的社会单干可能将缓慢消除。因此,对于基础拔擢与作事拔擢阶段的编程类教学,需要愈加强调计较念念维、东谈主工智能修养与算法念念维的培养,减少对于标准谈话中语法细节的回想性学习。

3. 荧惑拔擢与本事互促共进

东谈主工智能生成内容干系本事的演进速率相配快。以GPT系列为例,从第一代GPT-1到现在的ChatGPT经历了四代更新,每一代的性能皆有明显提高,但更新换代的时刻不及五年。因此,不错意想愈加智能化和东谈主性化的生成式东谈主工智能本事与居品将会在短期内出现,其在天然谈话处理等任务上的性能将进一步提高,也将具备更优秀的内容贯穿、生成与泛化智商。因此,拔擢需要积极稳妥东谈主工智能本事的快速发展,对其持有愈加洞开和包容的作风,荧惑拔擢使命者秉持本事向善理念,研究和使用干系本事和器具,配合完成万般教学任务。同期,需要充分领悟这类新本事不再是“拍照搜题”或“换脸软件”,而可能成为改日拔擢的挫折组成部分并对拔擢界限具有深切的变革性真谛。另外,拔擢界限也需要高度珍惜生成式东谈主工智能本事的潜在安全与伦理风险,针对拔擢界限的应用场景,鼓励制定干系法律规章,形成本事与拔擢双螺旋式的互促共进。当通用东谈主工智能仍是缓慢接近东谈主类社会,拔擢行为东谈主类漂后跨越的基石,应该缓慢布置挑战且充满自信。

参考文件

朝上滑动有瞻念看

国务院. (2017-07-20). 新一代东谈主工智能发展运筹帷幄(国发〔2017〕35号). 中华东谈主民共和国中央东谈主民政府网站. -07/20/content5211996.htm

Askell, A., Bai, Y., Chen, A., Darin, D., Ganguli, D., Henighan, T., Jones, A., Joseph, N., Mann, B., DasSarma, N., Elhage, N., Hatfield-Dodds, Z., Hernandez, D., Kernion, J., Ndousse, K., Olsson, C., Amodei, D., Brown, T., Clark, J., ... Olah, C.(2021). A general language assistant as a laboratory for alignment. arXiv preprint arXiv, 2112.00861.

Bommasani, R., Hudon, D. A., Adeli, E., Altman, R., Arora, S., Arx, S., Bernstein, M., Bohg, J., Bosselut, A., Brunskill, E., Brynjolfsson, E., Buch, S., Card, D., Castellon, R., Chatterji, N., Chen, A., Creel, K., Davis, J., Demszky, D., ... Liang, P.(2021). On the opportunities and risks of foundation models. arXiv preprint arXiv, 2021:2108.07258.

Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., Neelakantan, A., Shyam, P., Sastry, G., Askell, A., Agarwal, S., Herbert-Voss, A., Krueger, G., Henighan, T., Child, R., Ramesh, A., Ziegler, D., Wu, J., Winter, C., ... Amodei, D.(2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.

Christiano, P. F., Leike, J., Brown, T., Martic, M., Legg, S., & Amodei, D.(2017). Deep reinforcement learning from human preferences. Advances in neural information processing systems, 30.

Devlin, J., Chang, W., Lee, K., & Toutanova, K.(2019). Bert: Pre-training of deep bidirectional transformers for language understanding. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 4171-4186.

Ho, J., Jain, A., & Abbeel, P. (2020). Denoising diffusion probabilistic models. Advances in Neural Information Processing Systems, 33, 6840-6851.

Kosinski, M. (2023). Theory of Mind May Have Spontaneously Emerged in Large Language Models. arXiv preprint arXiv, 2302.02083.

OpenAI. (2022-04-06). DALL·E 2. OpenAI. https://openai.com/dall-e-2/

OpenAI. (2022-11-30). ChatGPT: Optimizing Language Models for Dialogue.OpenAI. https://openai.com/blog/chatgpt/

Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., ... Lowe, R.(2022). Training language models to follow instructions with human feedback. arXiv preprint arXiv, 2203.02155.

Roy, S., & Dan, R. (2015). Solving general arithmetic word problems. Proceedings of the Conference on Empirical Methods in Natural Language Processing, 15, 1743-1752.

Radford, A., Narasimhan, K., Salimans, T., & Sutskever, I.(2018). Improving language understanding by generative pre-training.

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I.(2019). Language models are unsupervised multitask learners. OpenAI blog, 1(8), 9.

Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., Zhou, Y., Li, Wei., & Liu, P. (2019). Exploring the limits of transfer learning with a unified text-to-text transformer. Journal of Machine Learning Research, 21, 1-67.

Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O.(2017). Proximal policy optimization algorithms. arXiv preprint arXiv, 1707.06347.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30.

Wei, J., Bosma, M., Zhao, Y., Guu, K., Yu, W., Lester, B., Du, N., Dai, A. M., & Le, V. (2021). Finetuned language models are zero-shot learners. International Conference on Learning Representations, 10.

Wei, J., Wang, X., Schuurmans, D., Bosma, M., Chi, E., Le, Q., & Zhou, D. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems, 36.

Zhang, Z., Han, X., Liu, Z., Jiang, X., Sun, M., & Liu, Q. (2019). ERNIE: Enhanced Language Representation with Informative Entities. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, 1441-1451.

Educational Application and Prospect of Generative Artificial Intelligence:

Taking ChatGPT System as An Example

Yu Lu, Jinglei Yu, Penghe Chen, Muyun Li

Abstract: Generative Artificial Intelligence aims to automate the generation of multimodal data such as text, image, video, and audio using artificial intelligence technology, and has received wide attention in education field. Among them, ChatGPT, a text content generation system, reflects high potentials for multi-domain applications due to its good natural language understanding and generation capabilities. In this study, ChatGPT is used as the main object to explore the potential educational applications in four areas of teacher teaching, learning process, educational evaluation, and academic tutoring, based on its four core capabilities, namely, inspiring content generation capability, dialogue context understanding capability, sequential task execution capability, and programming language analysis capability. Based on this, preliminary validation of educational applications such as exercise generation, automatic problem solving, and assisted grading are conducted on the real system. Finally, the limitations faced by AIGC systems represented by ChatGPT in educational application areas and the implications for education are further explored.

Keywords: Generative Artificial Intelligence; ChatGPT; Large Language Model; artificial intelligence application in education

作家简介

卢宇,北京师范大学拔擢学部改日拔擢高精尖鼎新中心副教会。

余京蕾,北京师范大学拔擢学部拔擢本事学院博士研究生。

陈鹏鹤,北京师范大学拔擢学部改日拔擢高精尖鼎新中心讲师(通信作家:chenpenghe@bnu.eu.cn)。

李沐云,北京师范大学拔擢学部拔擢本事学院硕士研究生。

基金相貌:本文系北京市拔擢科学“十四五”运筹帷幄2021年度要点课题“东谈主工智能驱动的新一代智能导学系统构建研究”(课题编号:CHAA21036)的研究效果。



丁香成人网 成人网有哪些 中国成人网 最新成人网 熟女人妻网