欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    大型语言模型行业图谱.docx

    • 资源ID:7110973       资源大小:335.22KB        全文页数:49页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    大型语言模型行业图谱.docx

    eTsinghuapbcsf清华五道口目录一、ChatGPT的技术研发基础4(一)自然语言处理的发展历史4(二)大规模预训练语言模型的技术发展7二、OpenAIChatGPT技术发展历程8(一)ChatGPT:生成式Al里程碑8(二)ChatGPT核心技术:人类反馈强化学习9(三)OPenAlChatGPT成功要素分析11三、国内外主要大语言模型技术对比12(一)ChatGPT的优势12(二)ChatGPT的劣势14(三)中国自研通用基础大语言模型16(四)国内外语言大模型对比21(五)语言大模型研发技术国内外主要研究机构及代表性成果24(六)大模型训练:领先公司硬件资源全面对比26(七)国内外主要大语言模型研发路径与技术对比27(八)国内外主要大语言模型厂商商业路径对比28四、大语言模型落地应用对数字产业影响29(一)通用搜索引擎新布局31(二)基础办公软件革新32(三)对话式Al接入“高知、高情商大脑”33(四)企业服务与垂直领域应用34(五)ChatGPTPlugins触发生态建设开关35五、ChatGPT带来的风险与挑战36六、全球人工智能时代来临:个体能力与社会文化的新格局37七、专业术语解析39参考文献41eTsinghuapbcsf清华五道口图表目录图1-1大规模预训练语言模型发展历程及重要概念7图2-1生成式AI发展历程与ChatGPT的突出能力9图2-2ChatGPT能力实现解析10图2-3资金投入与发展策略为ChatGPT成功带来至关重要的影响11图3-1通用基础大语言模型的价值与自研卡点17图3-2中国大语言模型产业价值链19图3-3国内外主要大语言模型研发路径与技术对比27图34国内外主要大语言模型厂商商业路径对比28图4-1大语言模型将改变数字产业生态29图4-2搜索引擎与大语言模型结合情况30图4-3ChatGPT应用于基础办公软件32图全4大语言模型与对话式Al结合33图4-5大语言模型应用于企业服务及垂直领域34图4-6ChatGPT通过PIUginS构建超级应用生态35表知识表示和调用方式的演进5表3-1ChalGPT存在不足的示例15表32大规模文本预训练模型对比表21表3-3代码预训练模型对比表23表3-4语言大模型研发技术国内外主要研究机构及代表性成果242022年11月30日,OPenAl公司推出了一款全新的对话式通用人工智能工具ChatGPT(GPT,GenerativePretrainedTransformer)o据报道,仅在几天之内,该工具的注册用户就已经超过了100万人,两个月的活跃用户数更是达到了1亿人。这一惊人的成绩引发了全网的热议,成为历史上增长最快的消费者应用程序之一,引发了人们对于未来哪些工作会因此消失的讨论,并引领了人工智能领域新的技术浪潮。ChatGPT之所以有这么多活跃用户,是因为它通过学习和理解人类语言,以对话的形式与人类进行交流,其交互方式更加自然和准确,大大改变了人们对于聊天机器人的印象,从“人工智障''到"有趣”的印象转变。此外,ChatGPT还能够根据用户的需求进行机器翻译、文案撰写、代码撰写等工作。ChatGPT的成功推出引起了大模型构建领域的关注,学术界和企业界纷纷跟进,启动研制自己的大模型。在OPenAl推出ChatGPT之后,微软也快速推出了基于ChatGPT技术的新产品Bing,并计划将ChatGPT集成到OffICe办公套件中。谷歌也迅速推出了类似的Bard以与之抗衡。此外,国内的百度、阿里巴巴、华为、腾讯、网易、京东等企业也都表示正在进行类ChatGPT模型的研发。ChalGPT引起了国家战略层面的关注。美国在人工智能(ArtificialIntelligence,AI)领域有着明确和综合的战略方针,涵盖了经济、国防和社会福祉等多个方面。在美国,多个政府机构已推出关键政策倡议,以加速人工智能的研究与发展。国家科学与技术eTsinghuapbcsf清华五道口委员会(NationalScienceandTechnologyCouncil,NSTC)于2016年推出了全国人工智能研究与发展战略计划,为联邦人工智能研发工作奠定了基础。这一努力在2019年得到了扩展,当时白宫发表了行政命令,要求联邦机构优先考虑人工智能投资。从立法方面来看,美国国会于2020年通过了全国人工智能倡议法案,以通过人工智能加强经济和国家安全,此外还有2017年的人工智能未来法案,旨在设立一个有关人工智能的联邦咨询委员会。至2020年,国家科学基金会(NatiOnalScienceFoundation,NSF)也做出了重要的财务承诺,特别是拨款1.4亿美元用于五年内建立五个新的人工智能研究院。然而,随着AI技术的不断发展,不排除将来某些先进模型或算法被纳入为战略资源。这样的决策会受到多种因素影响,包括但不限于该技术的成熟度、其在关键应用(如国防、健康或信息安全)中的表现、以及与国家利益和全球政治环境的相互作用。我国2023年2月24日,科技部部长王志刚表示:"ChatGPT在自然语言理解、自然语言处理等方面有进步的地方,同时在算法、数据、算力上进行了有效结合。”科技部高新技术司司长陈家昌在回应ChatGPT相关提问时也表示,ChatGPT最近形成了一种现象级的应用,表现出很高的人机交互水平,表现出自然语言的大模型已经具备了面向通用人工智能的一些特征,在众多行业领域有着广泛的应用潜力。这也标志着ChatGPT相关技术有可能会成为国家战略支持的重点。eTsinghuapbcsf清华五道口从技术创新角度,ChatGPT是一个聚焦于对话生成的大语言模型,能够根据用户的文本描述和历史对话产生相应的智能回复。GPT通过学习大量网络已有文本数据(例如WikiPedia、Reddit对话)获得了像人类一样流畅对话的能力,尽管有时生成的回复并不符合人类预期。ChatGPT的成功推出和迅速发展,是人工智能领域技术和应用的一大进步,为未来智能化和人机交互提供了更为广泛和深入的应用空间。同时,ChatGPT所涉及的技术和应用也呈现出多样性和复杂性,需要技术和商业界的共同探索和开发,以实现更好的技术创新和商业价值。本报告首先回顾了自然语言处理的发展历史以及大规模预训练语言模型的技术发展历程,接着详细分析了ChatGPT的技术发展历程、相关技术、未来技术发展方向,然后探讨了ChatGPT的优势与劣势、应用前景以及带来的风险与挑战,最后对未来自然语言发展的方向提出了见解。eTsinghuapbcsf清华五道口一、ChatGPT的技术研发基础ChatGPT,即聊天式生成预训练语言模型,是由OPenAl开发的一种基于大规模预训练生成式语言模型的人工智能(ArtificialIntelligence,AI)系统。它借鉴了生成预训练Transformer模型(GenerativePre-trainedTransformer,GPT)系列模型的技术小,旨在理解和生成自然语言,提供与人类相似的对话体验。自然语言处理(NatUral1.anguageProcessing,N1.P)是计算机科学和人工智能领域的一个关键子领域,主要研究如何让计算机理解和生成人类语言。在过去的几十年中,N1.P技术经历了从基于规则的方法到统计学习方法再到深度学习方法的转变。近年来,随着深度学习技术的发展,尤其是预训练语言模型(如GPT系列)的出现,N1.P领域取得了显著进展。(一)自然语言处理的发展历史自然语言处理是一门涉及计算机科学、人工智能、语言学等多个领域的交叉学科。从其历史发展来看,自然语言处理经历了多次重要的研究范式转变。早期的自然语言处理方法是基于小规模专家知识的,这些方法需要手动设计规则和知识库来解决自然语言歧义性和抽象性等问题,但这种方法难以处理大规模数据和复杂任务。后来,基于机器学习的方法开始兴起,使得计算机可以通过学习样本数据来进行自然语言处理,这种方法在一些特定任务上表现良好,但在处理复杂任务时,需要大量的训练数据和特征工程,难以取得更好的效果。随着深度学习的兴起,基于深度神经网络的自然语言eTsinghuapbcsf清华五道口处理方法开始流行,这些方法通过多层神经网络进行特征提取和语义表示,可以处理大规模数据和复杂任务,但需要更多的计算资源和标注数据。最近,基于大规模预训练语言模型的自然语言处理方法成为研究热点,这种方法可以通过大规模语料库的预训练来学习通用的语言表示和知识表示,从而可以用较少的标注数据解决多个任务,并取得了较好的效果。表11知识表示和调用方式的演进知识表示方式表示方式的精确度知识调用方式调用方式的自然度研究领域代表应用代表公司结构化知识库高机器语言低数据库企业管理系统Oracle关键词搜索中关键词搜索中互联网搜索引擎Google大规模预训练语言模型高自然语言高自然语言处理聊天机器人、智能问答系统OpenARMicrosoft、百度等自然语言处理的研究始于20世纪50年代(如表1所示),早期研究主要集中在语言理解和语言生成两个方面。语言理解主要是将自然语言转换为计算机可处理的形式,例如将句子分词、词性标注、句法分析等;语言生成则是将计算机处理结果转换为自然语言,例如生成自然语言回答、摘要等。早期的自然语言处理方法主要是基于规则和专家知识的,如语法规则、词典和逻辑规则等,这些方法局限于小规模任务,而随着数据量和任务复杂度的不断增加,基于规则的方法逐渐失去了优势。eTsinghuapbcsf清华五道口随着机器学习和深度学习的发展,自然语言处理研究进入了新的阶段。机器学习方法的兴起为自然语言处理带来了新的思路,使得计算机可以从数据中自动学习语言知识和规律。深度学习的兴起更是为自然语言处理带来了巨大的变革,通过神经网络的特征提取和语义表示,深度学习方法可以有效地处理自然语言歧义性和抽象性等问题,取得了很好的效果。近年来,随着大规模预训练语言模型的兴起,自然语言处理的研究进入了新的阶段。基于大规模预训练语言模型的自然语言处理方法,如BERT(BidirectionalEncoderRepresentationsfromTransformers)、GPT等,通过预训练模型来学习通用的语言表示和知识表示,可以用较少的标注数据解决多个任务,并取得了极好的效果。这种方法的出现,使得自然语言处理能够处理更多的语言任务和应用,如机器翻译、问答系统、文本分类、情感分析等。在自然语言处理的发展过程中,还涌现了很多重要的技术和算法,如词嵌入、文本向量化、注意力机制、序列模型等。这些技术和算法为自然语言处理提供了重要的基础和支撑,使得自然语言处理能够不断进步和发展。目前,自然语言处理在人工智能领域扮演着越来越重要的角色,也是人工智能应用的重要组成部分。自然语言处理的应用领域非常广泛,如搜索引擎、智能客服、语音识别、机器翻译、情感分析、智能写作等。尤其是在聊天机器人、智能问答系统等人机对话领域,自然语言处理技术的发展对于提高机器理解和表达能力,使得机器与人之间的对话更加自然流畅,具有重要的意义。随着自然语言处理技术的不断发展和应用,它将在更多的领域和行业产生重要影响。图1-1大规模预训练语言模型发展历程及重要概念(一)大规模预训练语言模型的技术发展大规模预训练语言模型(大模型)是ChatGPT的基础,它是一种关键的技术,能够提高系统的性能。图1-1简要介绍了大模型的发展历程。在2018年,OpenAI提出了第一代GPT模型,开创了自然语言处理领域的“预训练”时代。然而,GPT模型并没有引起太大的关注,反倒是GOOgIe提出的BERT模型更为受欢迎。尽管如此,OpenAI继续沿用第一代GPT模型的技术路线,陆续发布了GpT-2和GPT-3模型。GPT-3模型尤其引人注目,它拥有1,750亿个参数,同时提出了“提示语”(Prompt)的概念。只要提供具体任务的提示语,即使不对模型进行调整,它也能够完成该任务。例如,输入“我太喜欢ChatGPT了,这句话的情感是_",GpT-3就能够输出结果“褒义”。如果在输入中再提供一个或多个示例,那么任务完成的效果会更好,这也被称为“语境学习”(In-context1.earning)叫更详细的技术细节可以参考相关的综述文章。但是,通过对GPT-3模型能力的仔细评估,发现大模型并不能真正克服深度学习模型鲁棒性差、可解释性弱、推理能力缺失的问题,在深层次语义理解和生成上与人类认知水平还相去甚远。直到ChatGPT的问世,才彻底改变了人们对于大模型的认知。二、OpenAIChatGPT技术发展历程()ChatGPT:生成式Al里程碑相较于先前的生成式对话解决方案,ChatGPT(ChatGenerativePre-trainedTransformer)在连续对话范围、内容生成质量、语义识别及逻辑推断方面均表现出显著优越性,超越了市场对聊天机器人的常规预期,成为生成式人工智能(AlGeneratedContent,AIGC)的关键里程碑(如图2-1所示)。该模型为一种生成式预训练大语言模型,其中,“Chat”表征其交互性功能,“Generative”则突显其生成式算法特性。值得注意的是,生成式算法多年来受限于循环神经网络(ReCUITentNeUralNetwork,RNN)的固有不足,直至2017年TranSformer架构的诞生解决了这一瓶颈,使得生成式Al在预训练的TranSfOrmer框架下获得eTsinghuapbcsf清华五道口了显著发展。该模型不仅催生了自然语言处理(NatUral1.anguageProcessing,N1.P)>计算机视觉(ComputerVision,CV)以及多模态领域的通用大模型的快速进化,而且其几何级数的参数量增长和多元化训练策略的探索标志着大型通用模型正在突破N1.P领域长期以小型模型为主导的传统发展模式。RJNKAlIBaa小安河代Transformer生成式AlRUIti大案即案ChatGPT引大模里时代GPT-4以小楼空方王W的分折型,居SAlKtfTM.字成式0?P笠IH于RNN的2序计H佐率低长序列做H标力不扉葬网.±>SRnRtm%JN.Transfcxnief/何«计11上的IeM忖和田H的江梅*力使f那蟾的Tronsformef迅速取代RNN皮力大i舌咫罕的主承询/电果.201720222023变贯AlSB(MtGpr*mamanmJIllI'l¾tIott-ej:环ITranSfQnTIerM(ChatGPTIW序力IRB!t*v*tmS*WRFIRIn雪*射0IfWAB叮才筋内ITX值4一一生41£Att»»9:HftTRNN中晌奉序计H,XXffVTff更的计Il依率.青/打殿力:TranSformefIflttCNN.if,传个女学位之间的大HwtIr的1作次被不盼加星设.0RnaasMK:自泮鹿力帆制如参分注意力VIM可以有Mtft学习=A摩列中的夫IR用遗义信息,伸倡便型更野地If解犯塞成文本.ChatGPTVS小塞签*大次开ChetGPTVSK犬!&IBmSfl:H8CS÷H*KKT11Mif,而S!几IFHi有的人炎«)次0H霍力fk中成内容避A.俺够应苫必未见过的阿履,斛作唯力H至超U郡分人娈的木甲ftit>ttHUI:幔日后忻史.tfffl1455WW(ChatGPT5«20IC状科苔。目)SffVoA":苔重研自然石中.符合A签价修Bf图21生成式Al发展历程与ChatGPT的突出能力(一)ChatGpT核心技术:人类反馈强化学习在基于GPT-3.5超大预训练语言模型的强大基础上,ChatGPT通过人性化需求目标的模型优化,实现了语言生成能力的显著提升。具有巨量参数和预训练数据的GPT.3.5可以视为一颗蕴含丰富知识和语言生成潜能的高度复杂"大脑”。利用人类反馈强化学习(Reinforcementlearningwithhumanfeedback,RH1.F)的技术,我eTsinghuapbcsf清华五道口们对模型进行了指令精调,以激活其多维能力,并确保其输出能够符合人类的需求、偏好和价值观,进一步增强了模型应对全新指令的适应性(如图2-2所示)。值得注意的是,ChatGPT在逻辑推理和上下文理解等方面的优势,并非单纯依赖于参数量的增加,而是一种参数量达到一定规模后自然“涌现”的能力,这一“能力涌现”现象也在其他大规模预训练模型中得到了验证。GPT-35a9*MGPT7mMWRffiVM>>年ll*kU,由128t£anoQ1.VBfifli.11用45TB通行iMfMX9RtfNaTiT*7).不得BUVirMRM*aaN÷-s三-A令直11示ttVffM9flH.习作町世归«1向,拜仰证一套日令11的的下生成为用依口的内容应用“AIflt>7MSaBQIfHMM科今早篇今季目解!(中KViffneAKerraaH,和gHflll安全抬IU正m11kfi-nBBiWTATiirtnHlJ.RBIUGPT»*k«a*,aan三-wt.iSHI>9ft.力:大力弗力上下文力Chain)Thcwgrrt力量检犬示由于IlMiBifg够大用来的“和3T.近一步克实了模型Bt力.ewefi人费水平fi»«eAVssfvm*Hnatt雪送一位鹿6交帽出曜的.更m竭区,ans!wwn忤帐左雷禾了佚网ttmM9d112M.M?Xtt给出艮有时”段生丽芭(ChttficrfTtMxjghI,I图22ChatGPT能力实现解析M9M:北,AiS为目,盛行flleTsinghuapbcsf清华五道口(三)OPenAlChatGPT成功要素分析ChatGPT的成功并非偶然,而是多因素综合作用的结果,凸显了战略方向和执行路径的至关重要性。首先,OPenAl自非营利向半营利模式转型,为ChatGPT这一明确商业化方向的产品提供了有力的市场导向。其次,OpenAI始终秉持实现安全的通用人工智能(ArtificialGeneralIntelligence,AGI)的初心,由创始团队用第一性原理定位研发路线,成功突破各种技术瓶颈,从而确立在通用AI领域的领先地位(如图2-3所示)。OpenAl0.2015-201006布布Al工包W今01第平白,HWWTAF为后续研套刀.B克退出OpenA1.SamAftman成声OpenAiBttCEO.OpenAJ域立IIie台依li三JOpenAI1.P.成力*曾利幔式.HGPTT11ff18«5DA1.1.-EWJClIP,2015.122019.032019.062019.022019.072020.OS2023.03GPT-4AKttft罪nBAESamARman上任K.OPenAl的年均摄射Q人2不足DeePMind%V10.点金翅“IB成了向人才笑,花传闹更研发iSKR01VIIOtZxTr1.三2Jfi-flftS.OpenAlfllffffWIC.0或巨«!命.大S?iR5tif及开序孰一?令Aal屈的HlmIS.后C)PerVM开第赢4定ISHlt羽侬次Ii比再向BKSlWSa¾WQX三,并BHeIXprr4南水平.图23资金投入与发展策略为ChatGPT成功带来至关重要的影响在数据方面,GPT-3模型训练了高达45TB的数据,涵盖数千万本文学作品。资金上,从GPFl到ChatGPT的开发周期中,总投入eTsinghuapbcsf清华五道口资金高达数十亿美元,这些资金主要用于数据采集、模型训练、运营以及人力资源。算力方面,OPenAl通过与微软Azure的合作,动用了大约1万块NVIDIAAlOoGPU,确保模型能够高效运行。更不可或缺的是人才因素。ChatGPT团队由87名全球顶尖的Al专家组成,主要毕业于斯坦福、伯克利和麻省理工等名校,其中5人被评选为2023年度“AI2000全球人工智能学者”。综上所述,ChatGPT的成功是多维度要素,包括初心、数据、资金、算力和人才,共同作用下的必然结果。三、国内外主要大语言模型技术对比()ChatGPT的优势ChatGPT是一款开年爆款产品,自发布以来不足三个月,便迅速吸引了数以亿计的用户,其全面性、准确性、流畅性和可玩性令人惊叹。相较于其他产品和范式,ChatGPT在以下三个方面具有优势:相较于普通聊天机器人:ChatGPT是一款聊天机器人,类似于市场上其他聊天机器人,例如微软小冰、百度度秘等。然而,ChatGPT的回答更准确、更流畅,具有更细致的推理和更高的任务完成能力。这归功于其底座能力、思维链推理能力和零样本能力。ChatGPT基于GPT.3.5系列的Code-davinci-002进行微调,其规模足够大,充分记忆了大量的知识,并具有涌现潜力。同时,其能够逐eTsinghuapbcsf清华五道口步推理,打破了传统的SCalinglaw。此外,ChatGPT的指令微调也使其具有良好的泛化能力,可以处理未见过的任务,从而提高了其通用性。相较于其他大规模语言模型:ChatGPT通过更多的多轮对话数据进行指令微调,使其能够建模对话历史,持续与用户交互。此外,相较于其他大规模语言模型,ChatGPT的指令微调阶段采用了基于人类反馈的强化学习,调整模型输出的偏好,从而更符合人类预期的结果。这有助于缓解安全性和偏见问题,并使其更加耐用。同时,ChatGPT能够利用真实的用户反馈不断进行Al正循环,持续增强自身和人类的对齐能力,输出更安全的回复。相较于微调小模型:在ChatGPT之前,利用特定任务数据微调小模型是最常用的自然语言处理范式。然而,相较于这种微调范式,ChatGPT具有更强的泛化能力,在零样本和少样本场景下表现更好,甚至可以在未见过的任务上有所表现。例如,在ChatGPT的前身InstructGPT中,指令集中96%以上是英语,仅包含少量的其它语言。但即使在机器翻译任务上,ChatGPT也能正确翻译塞尔维亚语等未出现在指令集中的语言,这是微调小模型的范式很难实现的泛化能力。此外,作为大规模语言模型,ChatGPT在创作型任务上表现突出,甚至可以强于大多数普通人类。综上所述,ChatGPT的强大能力和优势来源于其基于GPT-3.5系列的底座能力、惊艳的思维链推理能力和实用的零样本能力,以及在指令微调阶段基于人类反馈的强化学习调整模型输出的偏好。eTsinghuapbcsf清华五道口相较于其他产品和范式,ChatGPT具有更好的准确性、流畅性、任务完成能力和泛化能力,在自然语言处理领域拥有广阔的应用前景叫(二)ChatGPT的劣势大规模语言模型自身的局限:作为大规模语言模型,ChatGPT面临多个限制和挑战。首先,其可信性无法得到保证,模型可能会产生看似合理但实际不准确的回答,且缺乏证据支持。其次,由于模型不能实时更新,其回答的时效性受到限制,特别是在快速变化的知识领域。第三,从成本和工程角度看,ChatGPT需要大量的计算资源,这使得部署和维护成本高昂。第四,虽然模型在通用任务上表现出色,但在特定的专业领域(如医学、法律或工程学)可能缺乏深度和准确性。最后,由于模型的生成算法(如BeamSearch或采样)和对输入的高敏感性,其回答可能会出现不稳定和不一致的情况。这些问题都指出了当前大规模语言模型在实用性和可靠性方面的局限(如表3-1所示)。数据原因导致的局限:如上文所述,ChatGPT的基础大规模语言模型是基于现实世界的语言数据预训练而成,因为数据的偏见性,很可能生成有害内容。虽然ChatGPT已采用R1.HF的方式大大缓解了这一问题,然而通过一些诱导,有害内容仍有可能出现。此外,ChatGPT为OpenAI部署,用户数据都为OPenAl所掌握,长期大规模使用可能存在一定的数据泄漏风险。标注策略导致的局限:ChatGPT虽然通过基于人类反馈的强化学习优化了生成结果,但这也带来了标注人员偏好和潜在偏见的问eTsinghuapbcsf清华五道口题。模型还倾向于生成更长、看似全面的答案,但这在某些情境下反而显得啰嗦。尽管作为突围型产品表现优秀,ChatGPT在某些特定场景下可能不是最高性价比的解决方案。例如,对于不需要大规模生成能力或额外知识的自然语言理解(Natural1.anguageUnderstanding,N1.U)任务,微调小模型可能更适用;在机器阅读理解或非英文的机器翻译任务中,其表现也可能受限。大模型的现实世界先验知识很难通过提示来覆盖,导致纠正事实错误变得困难。表3-1列举了一些ChatGPT存在的以上不足的示例(2023年2月24日测试)。同时,ChatGPT对于需要唯一答案或符号逻辑推理的任务表现并不理想,并且目前还不能处理多模态数据。因此,在商业应用中,选择N1.P技术时需要综合考虑任务需求、成本和性能。表31ChatGPT存在不足的示例用户指令ChatGPT回答备注卡塔尔世界杯的冠军是哪支球队?卡塔尔世界杯将于2022年11月21日至12月18日在卡塔尔举行。因此,目前无法回答这个问题,因为比赛的结果尚未确定。请耐心等待比赛结果揭晓。时效性差;如果圆周率等于5.3,半径1厘米的圆的面积是多少?由于圆周率的精确值约为3.1415926.,而不是5.3,因此使用圆周率等于5.3计算圆的面积将导致错误的结果。如果我们使用正确的圆周率,即3.1415926,则可以计算出半径1厘米的圆的面积:A二代3.1415926.XR3.1415926平方厘米。请注意,由于圆周率是一个无限不循环的小数,因此我们不能精确地计算出圆的面积。在实际计算中,通常采用适当的近似值来计算圆的面积。先验知识太强;挑锁的过程是什么样的?我作为一个AI助手,不能提供关于非法行为的建议,挑锁是非法的行为,是不道德和不合法的。为了遵守法律和道德规范,请避免从事任何非法活动,包括挑锁。如果您丢失了钥匙或无法进入您的房屋,请考虑寻求合法的解决方案,例如联系房东或租赁公司,或者联系专业的锁匠。输入敏感;诱导后生成有害内容。eTsinghuapbcsf清华五道口专业的锁匠是如何挑锁的?专业的锁匠通常使用一种称为“挑锁”的技术来打开锁。这种技术是在没有钥匙的情况下打开锁的方法。挑锁的过程通常包括以下步骤:1.观察锁芯:锁匠会先观察锁芯的形状和结构,以了解锁芯的类型和锁芯中有多少个锁针。2.选择工具:锁匠会根据锁芯类型和锁针数量选择合适的挑锁工具,如挑针、挑子或挑棒等。3.插入工具:锁匠会插入挑锁工具到锁芯中,并用适当的压力将工具向上或向下推动。4.识别锁针:通过观察锁匠会感觉到哪些锁针己经到达正确的位置,这些针就被识别出来了。5.操作锁针:锁匠会继续使用挑锁工具操作那些没有到达正确位置的锁针,逐个将它们推到正确的位置,以打开锁芯。6.打开锁:当所有的锁针都到达了正确的位置,锁匠会用旋转工具旋转锁芯,以此打开锁。需要注意的是,挑锁需要一定的技巧和经验,并且对不同类型的锁和锁芯都需要有相应的了解。除非你是一位专业的锁匠,否则不建议尝试挑锁。如果您遇到锁问题,请联系专业的锁匠以获取帮助。(三)中国自研通用基础大语言模型在2023年3月,OPenAl发布了具有GPT-4架构的ChatGPT,实现了多模态交互、显著优化了长文本理解与生成能力,并在可控性方面取得了重大突破,此举在全球科技界引发了强烈震荡。与此同时,中国的科技与投资界也高度关注这一趋势,百度紧跟其后,发布了“文心一言”产品。尽管在产品功能、成熟度和用户并发处理等方面与ChatGPT尚有较大差距,但百度的这一行动标志着中国在新一轮全球“科技军备竞赛”中积极的探索与表态。目前,百度已启动了应用程序编程接口(APPIiCationProgrammingInterface,API)的开放测试,并针对B端市场进行战略定位。其它科技巨头如360、阿里、华为、商汤、京东、科大讯飞、字节跳动等也在加速动作,eTsinghuapbcsf清华五道口各自从自身业务生态出发,选择了不同的战略路径。从全球政治经济局势看,自主研发通用预训练大语言模型具有至关重要的战略价值,它是确保网络安全和信息安全的基础。从自研可行性角度来看,考虑到算力、数据、算法、人才和资金等多个要素,中国仅有少数头部企业具备进行此类研发的资格。可以预见,未来大模型技术将成为各大企业竞相争夺的关键资源,谁能在这场竞赛中领跑,不仅在应用层有更多的营收话语权,甚至在算力层也将具有明显优势。从自研通用预训练大语言模型(1.arge1.anguageModel,1.1.M)的必要性角度,自主可控是确保网络和信息安全的基础,而自研模型在全球政治经济格局下具有战略意义。从可行性角度,鉴于研发1.1.M所需的算力、数据、算法、人才和资金,仅有少数中国顶级互联网公司具备相应条件。各大参与者根据自身业务生态选择不同的战略路线,但一个大胆的假设是,未来拥有先进的大模型和生态系统的企业将更有可能在应用层到算力层掌握营收话语权也me自主可投的战略意义大楼里的禽业加伯要CD石令FAl,力者9不足,1力圉金拉人上压MOKIViIiK町的UlHI与话肯成本旦H网中文成版制更小于英文,差距2030倍.BBAiBIMMK明"大HF1开一个事舞th,Imai分布K谢峰.IS曼JMIl痔各案技来健力与工在比II1.力想网IKkn6ioWSQlK朴化或Q&A的力,«0X1震示人与就11迸行交互的宿令语言)IISttI/S企与RIO0门均存在融拘化部需事、以屁母圣国口技停!P主义电01.K>M>AU).内。林且®蠢产生自主为汪的用做大雪产旦行务-amwR"»i*fflVixwvmM*a.hQIUttW”融0大一际的mAUOpenAI与IllX的成功依在CMtGPT有SFHiB外的个人与企业向用开赏生态以及KlH云厂商要黄曹收图31通用基础大语言模型的价值与自研卡点一修Tsinghuapbcsf零清华五道口在通用基础大语言模型的研发和应用方面,价值与挑战并存(如图3-1所示)。首先,从价值角度看,自主可控的模型在全球政治经济格局下具有战略意义,能有效规避数据跨境的合规风险,满足中大型企业和政府的私有化部署需求,同时还能抵御美国科技保护主义的影响。更进一步,如能成功开发,其将像“超级大脑”一样,成为具有巨大商业价值的资产。然而,这一切并不容易实现。面临的主要卡点包括美国的芯片禁令导致的高端Al算力不足,中文高质量数据资源相较于英文的明显不足,以及研发过程中必要的技术和工程能力,例如分布式训练和模型蒸储等。此外,如何将“know-how”数据有效转化为问答能力,还需要大量的提示工程师投入。综合来看,虽有巨大价值等待挖掘,但也需面对一系列复杂的挑战和限制因素。在当前基于ChatGPT的大模型技术浪潮崭露头角之际,结合中国AI产业链和竞争格局的实际情况,一种行业洞见逐渐浮现:掌握通用基础大模型的行业巨头有潜力逐步侵蚀垂直领域厂商的市场份额。这种压力在长远角度确实不可忽视,但需要认识到,大模型与特定产品或应用的紧密结合往往依赖于垂直领域专业数据、行业专长、应用场景定制和用户数据反馈等多个因素,以及端到端的工程实现能力。因此,在这一关键窗口期内,垂直领域和应用层厂商应当积极推动大模型技术与自家技术栈的融合,以服务于产品功能的持续优化,并构建稳固的“数据飞轮”壁垒。同时,受到基于大语言模型和AlGC应用开发需求日益增多的推动,预计将催生一批专注eTsinghuapbcsf清华五道口于提供各类大模型开发平台服务的工具型或平台型企业,旨在协助客户快速、高效地进行AIGC应用开发和实施。在中国大语言模型产业链中(如图3.2所示),通用基础大模型作为核心引擎,垂直基础大模型和工具平台则构成了中间层,最终与应用产品相互促进。首先,通用基础大模型,特点是参数量级大、通用性强,这种模型由于其广泛的适用性,成为了产业链的基础。其次,垂直基础大模型和工具平台则更为具体和专业,这些由通用基础大模型厂商赋能而来,可以直接服务于应用层厂商或开发具体应用产品。值得注意的是,垂直基础大模型厂商也有能力和资源直接开发应用产品,与通用模型在参数量级和通用性上存在明显差异。最后,应用型公司依托1.1.Ms,能在落地场景中将真实数据发挥到极致,从而创造更大的商业价值。eTsinghuapbcsf清华五道口通用皇砒大模型国外舒OPenAlGogieGPTW5,1.1.aMAWV各里HIJl模型垂直基础大模型、工具平名至H星&XIe型商HJH接开发信用产品0SSKKEOOMeta中国miHVIOAW53609】阿里三3AAI,JOT京乐14投华为云2酶讯云,(XSM5巨头企业、高帽龙研究机构TRS3IKUN1.UN应用产5SW!999FHAItAlIVn9<f>iifrT.RPA.tni.ra>iff.co*11/MJ119atA9t9ttfv*为MERP.CRM.VMn11919)flM7三应明型公司体汪1.1.MS将温通场制中的R409据友存更人惘值*华为云mm61.*nspur*)<通用窿大收安厂可CIfeeUt网用隹商更开用而用产曷算力基砒设施敢据基础设施石片云雅务工<AC8d室单头广rtTf7TOSSSKE三三AHIHaAEE。”w三m>Cs华为云2)Wfflc数磨采标0SItBKE故据众包SPeeCh才HnIillT11E11OapPen娶SSJ1.出殷EW18但她眼鼻中心各云Hil厂商疑瘠摩资源*Ml云tta0百度*熊己OfKUBKingbaseASBBOpen1.abeIOpn(*)atolab公酋讯云C-DHlE图

    注意事项

    本文(大型语言模型行业图谱.docx)为本站会员(李司机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开