服务器日志分析-大模型混战,阿里百度华为谁将成就AI时代的“新地基”?

自2022年stable diffusion模型的行进推进AIGC的快速展开后,年末,ChatGPT以“破圈者”的姿态,快速“吸粉”亿万,在全球范围内掀起了一股AI浪潮,也促进了许多海外巨子竞相发布归于自己的大模型。

而在国内,实际上很久之前,阿里、华为、腾讯等公司便早已有所布局:2019年,阿里初步布局大模型研发,上一年9月发布“通义”大模型系列的许多大模型;华为在2021年依据昇腾AI与鹏城实验室联合发布了鹏程盘古大模型;而腾讯的思路也与阿里类似,发布了混元AI大模型;第二梯队的京东、网易、360、字节跳动等企业,也纷繁官宣了自己在AI大模型方面的布局。

而进入2023年以来,跟着文心一言的发布,成为了我国榜首个类ChatGPT产品后,各家的大模型也纷繁露脸,一时间,国内仿佛陷入了“大模型之战”中。

服务器日志分析,到现在,百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已露脸,然后还有许多大模型正在预备粉墨登场。

那么,在这匆促发布的反面,是真的技术老练,仍是鱼龙混杂?各个大模型的实力又是怎样?

本文将从言语大模型、算力与技术底座与详细运用层面状况三大角度,来分析和研究现在现已发布的大模型的技术基础、运用场景和用户生态,看看哪些大模型更有可能在这混战中成功包围。

1

ChatGPT不该止于C端

ChatGPT,作为最早出圈的大模型产品运用,其问答的流通程度与精确程度,可以很好地表现NLP模型的水平。

而现在,国内厂商百度、阿里也都发布了类似模型,那么,比较之下,文心一言与通义千问的表现怎样?

首要是最近对话式AI们经常出现的一个典型问题,面对自己常识库中没有,或自身便是过错的提问时,仍能对着过错描述侃侃而谈,简称不苟言笑的胡说八道。

所以,我先问了通义千问这样一个问题:你知道唐僧为什么要上梁山吗?

通义千问在考虑后,给出了这样的答复:它首要简略对唐僧进行了介绍,然后将其带入了《水浒传》中宋江的人物,但毕竟却又回到了《西游记》中,还讲“这一情节表现了唐僧的坚决和决计,也反映了他作为一个有崇奉的人物的形象。”

图片

而相同的问题给了文心一言,却得到了一个更加简略但相同荒谬的答案:唐僧上梁山的原因是因为他被逼出走,被唐朝通缉,无路可走,只能上梁山。

图片

本次检验中,通义千问与文心一言都犯了相同的过错,不过,在我纠正之后,通义千问也进行了活泼地认错,展示出了杰出的接连问答才干,而文心一言则并没有“听懂”我的纠正。

接下来,我又问了它们一个经典的数学问题——鸡兔同笼,“鸡兔同笼,头共10,足共28,鸡兔各几只?”

通义千问在得到提问后,快速做出了答复,为我列出了核算该问题所需求的方程式,还贴心肠在后面补白上了方程式的由来。

图片

而文心一言就显得更加直接,答复了我的问题。

图片

而在这两个问题之外,我还让它们两个一同编写了代码、赏析了诗词、编撰了文章。

总的来说,在面对用户提出的问题时,通义千问与文心一言在绝大多数状况都可以给出较为正确的答复,在面对C端用户的提问时,两个产品显示出了平起平坐的实力。

而在C端的势均力敌之下,阿里却祭出了同类竞品难以比较的B端服务才干。

通义千问在C端用户之外,专门针对企业用户发出了约请共测,企业可依据通义千问打造专属大模型,在企业专属的大模型空间中,既可以调集通义千问的悉数才干,也可以结合企业自己的工作常识和运用场景,操练自己的企业大模型。

详细而言,除了通用场景之外,企业因为业务特性的不同,关于大模型服务有特别需求和要求,期望让通用的大模型变成企业专属的大模型,支撑企业各式各样的运用与服务。

阿里云期望通过产品化的方式,满意企业专属大模型从生成到布置全生命周期的需求。

在发布会当天,阿里云就宣告将与OPPO安第斯智能云联合打造OPPO大模型基础设施,依据通义千问结束大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。

一同,中兴通讯、吉利轿车、智己轿车、奇瑞新动力、毫末智行、邃古可口可乐、波司登、掌阅科技等多家企业也标明,将与阿里云在大模型相关场景展开技术协作的探究和共创。

或许,在比赛剧烈的C端之外,面向企业端的大模型构建才干,才是通义千问实在的优势所在。

而相关专家也在交流中标明,通义千问将会在企业各自深耕的领域中为他们供应构建大模型方面的帮忙,带来更好的生态系统与商业模式。

2

大模型反面的算力之争,谁占先机?

纵观国内发布的大模型,可以发现,相关于国外顶级的AI企业来说,国内还像是踉跄学步的孩提,在这条道路上刚刚起步。

而在大模型展开的道路上,最重要的实际上仍是最基础的算力资源的多少与怎样利用算力的才干,那么国内顶尖大模型企业在算力上的贮藏几许?

首要是近来相同发布了大模型的商汤科技,在前段时间的交流中,商汤科技内部的相关专家对公司的算力状况进行了交流。

国内能拿到最顶级的显卡是来自英伟达的A100GPU,商汤科技在美国对华禁售之前,便提早囤积了上万张A100芯片,是国内算力资源比较足够的厂商。

除了来自英伟达的显卡之外,商汤还在收购国内的GPU,并且专家标明,早在上一年曾经,就现已在大设备中适配了许多寒武纪与海光信息的GPU卡,但在当下商汤依旧面对着怎样将国产GPU卡进行大模型操练适配的问题。

在商汤之外,华为的盘古大模型也引起了世人注目,但在算力资源方面,华为却略显窘迫。

因为受到美国的长时间制裁,华为只得运用悉数国产的加速芯片,而现在昇腾系列最早进大幅运用的类型昇腾910,也只需A10070%的功用,从长时间来看,将会限制大模型的展开。

而算力的缺少也直接影响了华为的展开策略,挑选性地抛弃了C端的展开,主攻B端工业大模型运用。

而说起算力资源贮藏最多的企业,莫过于云时代中名列前茅的阿里。

但从阿里云上的角度来看,当时云上至少具有上万片的A100GPU,从整体来说,阿里云的算力资源至少可以到达10万片以上。假如持续抬眼,从整个集团的算力资源来说,将会是阿里云5倍的这样的一个量级。

而在英伟达的芯片之外,阿里云也具有许多国产化的GPU芯片,而最近的项目中,便挑选了寒武纪MLU370,其功用底子过关(A100的60-70%),检测合格,厂商情绪活泼,愿意与阿里对接,并且现已用在了CV等小模型的操练和推理上。

在2023年,阿里云算力资源的增速也将到达30%-50%。

得益于云时代的绝对领先,让阿里具有了远超其他企业的算力资源,也让其在AI时代里天生就占得了优势。

但是,动辄超千亿参数的大模型研发,并不能靠简略堆积GPU就能结束,这是包括了底层算力、网络、存储、大数据、AI结构、AI模型等复杂技术的系统性工程,需求AI-云核算的全栈技术才干。

而阿里是全球少数在这几个领域都有深度布局、持久堆集的科技公司之一,也是为数不多具有超万亿参数大模型研发经历的组织。

AI算法方面,阿里达摩院是国内最早发动大模型研究的组织之一,2019年便初步投入大模型研发,在中文大模型领域一向处于引领方位,2021年阿里先后发布国内首个超百亿参数的多模态大模型及言语大模型,此后还操练结束了全球首个10万亿参数AI模型。

智能算力方面,阿里建成了国内最大规划的智算中心“飞天智算途径”,千卡并行功率达90%,自研网络架构可对万卡规划的AI集群供应无拥塞、高功用的集群通讯才干。依据飞天智算的阿里云深度学习途径PAI,可将核算资源利用率进步3倍以上,AI操练功率进步11倍,推理功率进步6倍,掩盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。

阿里云全栈AI技术系统,更是从机器学习途径、大模型即服务、工业智能三个层面,不断丰富AI服务,并通过全栈技术驱动千行百业的AI展开与运用。

图片

可以说,阿里在云时代的成功,在必定程度上接连到了AI时代,与那些算力资源相对缺乏的比赛者来说,阿里在算力与技术底座方面,有着无可比较的巨大优势。

3

大模型带来业务集合式腾跃

在具有了算力资源与技术底座后,大模型才干若想要普惠群众,触到达每一个人,就需求运用层面的生态建设,而这,也正是许多厂商“刺刀见红”的战场,许多厂商也依据企业展开的不同,做出了不同的挑选。

比如,华为盘古大模型,受算力资源缺乏与公司业务导向的影响,挑选了指向B端的打法。

在盘古大模型发布会上,华为没有着墨于NLP模型,而是着重强调了CV大模型与科学核算大模型的运用典范。

盘古CV大模型首要运用于智能巡检、才智物流等场景。

例如,在与动力公司协作的盘古矿山大模型中案例中,矿井现场是一个40米长的采掘机,宽度仅2米左右,传统相机很难一会儿捕捉到悉数画面,只能用图中的九宫格视频画面。而通过5G+AI全景视频拼接综采画面卷,传输到地上,地上工作人员将来可以结束地上控制机器进行采矿,结束矿下无人少人安全作业。

而盘古气候大模型,也在气候猜想方向上超越了传统数值的核算方法。

盘古气候大模型在气候预告的要害要素和常用时间范围上精度均超越当时最早进的预告方法,一同速度比较传统方法进步1000倍以上。如在飓风途径猜想任务上,比较传统数值气候预告方法,盘古气候大模型可以降低20%以上的方位误差。

而对阿里而言,其在国内领先的大模型才干与许多的业务板块,让阿里大模型在各个领域都能一展拳脚。

阿里云智能集团CEO张勇在峰会上标明,阿里巴巴一切产品未来都将接入“通义千问”大模型,进行全面改造,包含天猫、钉钉、高德地图、淘宝、优酷、盒马等。

图片

以阿里发家的电商赛道来说,大模型就有许多运用场景。

对商家而言,大模型最切合实际的运用场景莫过于智能客服。跟着电商工作逐步老练,顾客对服务质量的要求日益进步,客服这个岗位有着极为巨大的降本增效需求。

而通过通义千问的改造后,能听懂顾客的话、明白顾客诉求的聪明客服机器人也将上线,将依据机器学习、大数据、天然言语处理、语义分析和了解等多项人工智能技术,为顾客供应最优质的服务。

关于途径而言,大模型可以有用进步用户的购物体会。比如,用户可能有时不清楚自己的明确需求,但通过与AI导购员交流,可以得到相当多的指引信息以及购物清单,比如开一个生日party需求哪些方面的预备,扮装需求购买哪些工具等。

在电商场景之外,接入通义千问后的办公场景,也将结束多项全新功用。

例如在钉钉文档中,可凭仗通义千问自动配图、创造文章、编撰邮件、生成方案;在会议中,可以结束记载、总结、出产待办事项;乃至还能帮忙总结未读群聊信息中的要点……

图片

可以说,无论是对B端的企业仍是C端的用户,只需有阿里系产品存在的当地,在接入通义千问后,其智能水平与易用水平,都将快速进步一个档次。

而对阿里来说,作为国内最大的商业集团之一,有了通义千问的加持,得到的进步将不会仅仅局限于某个业务线或是某个方向,而将是整体实力的腾跃。

4

写在毕竟

AI大模型的浪潮,敞开了一个新的时代,将一切的互联网厂商都从头拉到了同一同跑线上。

在2023阿里云峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇也说出,“面对AI时代,一切产品都值得用大模型重做一次。”

而在一切运用重建后的AI时代里,中心比赛力毕竟是什么?也成为了厂商们需求考虑的首要问题。

在我看来,坚实的算力基础与杰出的用户生态,将成为AI时代里成功的两个必要条件。

而国内,谁具有最多高端算力资源与强壮的算法进化才干,在这场大模型之战中,就有着其他企业无法比较、得天独厚的优势。

揭发