西部数据空间-大模型中场战事,讯飞星火找到领先时刻

落地为王阶段,在算力、渠道、模型、运用、生态等方面,都有继续深化的企业,对工业来说有更强的吸引力。
作者|刘珊珊
修改|杨 铭
轰轰烈烈大模型,走到商场化大规划落地前夜。
8月15日,《生成式人工智能服务办理暂行办法》实施。这是我国榜首部AIGC办理办法,清晰职业健康、安全、规范同时,进一步促进生成式人工智能运用的加速落地。
这被解读为,在国内现已打响半年,热度空前的“千模大战”迎来要害战场节点,正式进入运用PK、“落地为王”阶段。
硝烟背面,业界与群众普遍关心论题是:当大模型逐步变成一种根底才能,怎么进行技能上的迭代晋级?又怎么与更多职业结合,提速规划化、商业化进程,在竞赛长距离跑中占据抢先地位?
这检测着入局者的才智,亦决议入局者未来命运走势。
“通用人工智能绝不只仅是单个企业、单个科研院所的任务,而是整个社会的机会,大模型赋能个别和职业的大未来正在到来。”8月15日,长达140多分钟的讯飞星火认知大模型V2.0晋级发布会上,身着传统黑西裤、白衬衫的科大讯飞董事长刘庆峰说。
这是科大讯飞大模型又一次重要亮相——自5月6日对外正式展现至今,讯飞星火认知大模型刚好100天,期间经历了V1.5的迭代。
当时V2.0 晋级,是在进步通用才能根底上,重点突破代码才能和多模态才能。依据刘庆峰的说法,代码才能是支撑认知大模型才智的要害维度,多模态才能则是完结通用人工智能的必经之路。
这些才能,已同步在iFlyCode1.0(编程帮手)、讯飞智作2.0(视频发明渠道)、星火语伴2.0(操练白话)等运用和产品上,成为科大讯飞大模型落地运用和商业化上的重要一步。
从技能才能来看,讯飞星火V1.5Python言语作用只需41分,V2.0已有61分,挨近ChatGPT。依据方案,到本年10月24日,讯飞星火各个代码纬度才能将比ChatGPT,完结中文逾越、英文相当的水平,到下一年上半年对标GPT-4。
这意味着,伴随大模型进入“落地为王”的中场战事阶段,中国大模型也将迎来自己的抢先时刻。
01大模型落地,从工业开始
命运齿轮,转动于5月6日。彼时科大讯飞躬身入局,发布星火认知大模型1.0版本。
短短几个月,大模型已在国内掀起一场场“肉搏战”。通用、职业、笔直、开源和闭源等不同类型大模型,依据GPT,就像树干上的枝丫相同,疯狂开枝散叶。互联网、人工智能巨子、创业公司、各类型中小企业、研究机构入局者数不胜数,简直每天都有不同类型大模型推出。
西部数据空间比方,10亿级参数规划大模型——参数量被默以为通用大模型、笔直和职业模型区别重要因素。规划参数越高,对算力、数据、资源、技能要求就更高,但在国内,10亿级参数以上多模态大模型却超80个。
这并不意味着赛道的实在兴起。在国内,投资者逐步趋冷,部分入局者黯然离场;在国外,ChatGPT诞生9个月花费近2亿美元,高昂本钱让OpenAI有“破产风险”。
盲目烧钱不可继续,大模型本钱、商业化落地两大难题,让群众开始重新审视,大模型的经济和社会价值。
各界“究竟需要什么大模型”探讨中,深耕职业,与生态结合,让大模型在不同职业、不同类型企业发挥生产力作用,成为解决大模型难题,实在发生价值职业共识。
“谁能在具有社会刚需的运用场景落地,谁就能最先构成自我造血的良性循环。”刘庆峰清晰断言。在他看来,对科大讯飞这样体量的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,连上桌机会都没有。
通用还是笔直挑选题上,每家企业都有自己理由和选择。多模态通用大模型,被业界视为“归纳大学学生”,可能在某些垂类范畴沉积数据有所缺乏,却是各个职业通向智能化、通用化必经之路,也是业界公认现实。
现实上,运用落地才是衡量一切大模型价值最高规范。最大难题是,怎么搞懂职业、每个客户需求,以及运用安全、易用,具有工业价值。
职业场景分为政府及大型企业(ToB、ToG)、个人(ToC)、中小企业(ToSME)等不同类型。不同职业与大模型结合本质逻辑不同,如ToB、ToG,往往要求逻辑杂乱定制化场景中,有必要做到可控、可追溯、可批改。ToSME相同有定制化需求,但降本增效,给企业带来添加价值,却是衡量要害。
多位调查人士以为,深化职业Know-how根底上,和大模型才能交融,是大模型工业化最有用途径。
刘庆峰以为,其前提是,要在国产算力安全和数据安全下,回归场景驱动。“场景给客户带来的价值是什么,新增效益,还是节省本钱、进步质量,同时可以让用户快速地、低技能门槛练习,才可以使它赋能千行百业。”
这是科大讯飞在8月15日推出星火一体机重要原因——其与华为昇腾AI联合研制,意在为每一家企业供给专属的大模型,适合有数据安全需求的大型客户。
“开箱即运用,供给从底层算力、AI 框架、练习算法、推理才能、运用成效等全栈 AI 才能。”刘庆峰称。
对科大讯飞来说,TOB端探究出的大模型赋能途径是,在研、产、供、销、服、管等各维度赋能。例如,大模型把握职业基本才能、通用常识后,结合企业专属常识库,让新员工也能敏捷把握经历和常识,大幅进步工作功率。
不止科大讯飞,百度、腾讯、阿里、360都试图经过为企业供给专属大模型,加速工业交融、落地速度。“落地为王阶段后,淘汰赛就会一触即发。”多位调查人士判别。
有必要意识到,受制于数据、算力、场景等约束,实在能跑通大模型商业化的入局者,数量将不会太多。其一,大模型仍会像互联网、人工智能、云核算相同,以互联网、科技大厂为主导;其二,大厂不会局限于泛通用职业,而是“大模型+事务”深化垂类,走通用+垂类“并行”途径。
比方科大讯飞,星火是多模态通用大模型,却早已开枝散叶,运用在教育、医疗、工作、数字员工、轿车、金融、工业等多垂类场景。
02千模大战,讯飞星火凭啥榜首?
当时,赛道各大玩家纷繁结合本身已有事务场景,试图在大模型开释更大价值前,抢占战场制高点。
但客观来看,科大讯飞目前是脱颖而出,走得最快的那个。

这从科大讯飞最新财报,大模型加持后的商业化添加,得到印证。本年上半年,教育、敞开渠道及顾客、才智轿车、才智医疗、才智金融等事务收入别离为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元,别离同比添加3.63%、21.6%、26.14%、37.13%和22.19%。
“可以看到,大模型正实实在在推动工业行进。” 刘庆峰称。
这也让外界颇为疑惑:ChatGPT都遭受变现难题时,科大讯飞为何抢先业界,先一步尝到大模型的商业化甜头?
有人工智能从业人士对“极点商业”称,大模型运用落地,其实是一条技能—产品—场景—规划化的演变途径。“就像一个木桶,不能存在短板,才有成功接受商场检测可能。”
大模型并非短期内一蹴即至,而是长时刻技能沉积下所推动。1999年成立的科大讯飞,24年来在刘庆峰博士带领下,一直是人工智能领头羊形象存在,在深度学习算法、职业大数据、常识图谱、多模态感知、系统工程等技能方面有着深厚堆集。
外界未曾关注到的是,其在认知大模型上也有近十年沉积。2014年,科大讯飞启动“讯飞超脑”方案,完结机器从“能听会提到能了解会考虑”。到2022年,累计摘取16项国际人工智能大赛的冠军,其间认知智能范畴有13项冠军。
这离不开研制的继续投入。2022年,科大讯飞总研制投入33.6亿元,研制人员数量占公司总人数的份额为约60%。而依据最新财报,科大讯飞上半年研制支出16.6亿元,同比去年同期16亿元添加大约3.8%。这是星火认知大模型短时刻内多次重要晋级要害。
研制投入、技能抢先带来的,是在G/B/C端运用场景不断拓宽,占据更多用户心智。依据IDC《中国人工智能软件2022年商场份额》,在语音语义AI商场,科大讯飞坐落榜首,继续抢先百度智能云、阿里云。
长达20年多年的技能沉积,让科大讯飞在大模型的打造上,有了“一切技能渠道彻底自主研制,每一阶段技能都可控”的底气。
比方,在大模型多个要害技能,多家威望评测就将讯飞火星排在了榜首位。
依据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,逾越商汤商议、通义千问等大模型,在四大评测维度中的智商指数、工具提效指数两个维度取得榜首。

IT之家评测中,在完善度、功用性、易用性等维度,讯飞星火相同逾越文心一言、通义千问、360智脑,排在榜首。
《麻省理工科技谈论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道标题的测试和盲评中,讯飞星火认知大模型V2.0在编程才能、理科归纳、逻辑思维、数学专项、言语专项和归纳常识6个大类中得分率排名榜首,逾越文心一言、商汤商议、通义千问,取得“最聪明”的国产大模型称谓。

商业化探究上,有别大多数大模型,科大讯飞采纳的是“技能才能+落地运用”并行策略。
一个细节是,科大讯飞在5月6日推出讯飞星火时,尽管发布时刻并不抢先,却在现场清晰了教育、医疗、金融、工作、轿车、工业六个职业的运用场景。
尔后两次晋级,也有清晰加速上述职业探究鸿沟,推动其规划化运用落地和工业生态的构建——值得一提的是,科大讯飞是榜首个在发布时,即清晰阶段性晋级时刻,并同步生态运用规划的企业。
别的,LUMIE 10系列、智能工作本X3等与讯飞星火结合的硬件产品,在展现技能才能时,也同步落地上市。
“不只需做根底通用大模型,还要同步做落地教育、医疗、工作场景的产品运用。”本年4月,科大讯飞副总裁、研究院执行院长刘聪曾泄漏,为进一步进步大模型细分职业的实用性,科大讯飞实行了“1+N”攻关系统。其间,“1”是通用认知智能大模型算法研制及高效练习底座渠道,“N”则是运用于教育、医疗、人机交互、工作等多个职业范畴的专用大模型版本。
“‘1’ 的才能融入到 ‘N’ 的产品运用中,‘N’ 的数据和场景更新到 ‘1’ 里迭代才能,构建一个循环的系统性工程。”刘聪说,讯飞大模型的技能、产品与服务,一直是环绕工业运用场景来打开。
因而,外界也得以在短短三个月内,就明晰看到了科大讯飞大模型,在C端和B/G端的齐头并进。
C端,科大讯飞顾客产品覆盖AI工作、AI学习、AI健康三大赛道,是国内AI运用产品最丰富的企业。
其间在AI学习赛道,仅仅是5-6月,科大讯飞AI学习机GMV就别离同比添加136%和217%;讯飞AI硬件在本年6.18取得京东和天猫双渠道7类出售冠军。
当时AI学习机为代表的智能学习硬件商场强敌林立、同质化严重,是各路巨子都看上的商场,包含小度、步步高、猿辅导、作业帮、读书郎等新老玩家齐聚。科大讯飞运用AI大模型才能,是其差异化突围要害。
B/G端,作为AI“国家队”,科大讯飞已在政务、电力、医疗、工业、司法、金融等职业深耕多年。
金融范畴,讯飞和人保科技等达到协作,推动大模型技能在金融笔直范畴的运用;工业范畴,星火大模型搭载在羚羊工业互联网渠道,智能匹配方案、服务商、专家等资源,完结供需匹配;医疗范畴,讯飞诊后恢复办理渠道依据大模型技能进行了晋级,与北京协和医院、四川华西医院等多所医院进行协作,覆盖20多个科室的首要病种。
在8月15日的发布会上,刘庆峰强调说,讯飞星火已完结金融、政务、轿车等范畴9个专属大模型数据显示,在场景任务优化、私域常识增强等方面增效20%。
03竞赛马拉松,科大讯飞怎么走更远
大模型竞赛是一场马拉松,当下大模型依然处于一个技能不断迭代、培育商场、抢占用户心智阶段。
这意味着,眼前领跑之外,更重要的是未来怎么走得更远。
对于未来,科大讯飞从未掩饰它的“野心”,在5月推出讯飞星火时,就成为国内首家清晰公布时刻表的企业:本年10月24日,讯飞星火代码各维度才能将逾越ChatGPT,下一年上半年对标GPT-4。

此前,由于种种原因,简直一切国内大模型都被外界以为,在技能、算法、可运用性上和ChatGPT存在距离。显着,在算力、算法等底层才能上坚持迭代优化,并和工业运用紧密结合,是科大讯飞能否完结上述方针的保证。
“对代码才能的逻辑、算法、方法、系统、数据预备现已全部安排妥当,所需要的便是时刻和算力。”刘庆峰称。
技能永无止境。多次迭代后,讯飞星火大模型核心才能、运用和产品正不断扩容。比方此次讯飞星火2.0,科大讯飞就对代码才能进行5个维度的晋级,包含:代码生成、代码补齐、代码纠错、代码解说、单元测试生成。
图画描绘、图画问答、识图发明、文图生成、虚拟人组成等多模态才能方面,讯飞星火大模型也全面晋级。在代码才能和多模态才能迭代根底上,科大讯飞推出了可以进行视频发明的讯飞智作2.0、“智能编程帮手iFlyCode2.0”、一键生成课件星火教师帮手等,作为AIGC内容的生产工具。
代码才能和多模态才能晋级,意味着帮助专业程序员进步功率,发明更大价值。
从演示来看,借助iFlyCode1.0工具,简略几步Prompt完iFlyCode界面后,一行代码都不必写,就可以马上完结“凌空手写”功用。曾经,经历丰富的工程师要半天到1天才能完结,现在只需要几分钟。
曩昔一个月,iFlyCode在讯飞内部有2000多名员工完结试点运用,代码采样率逾越30%,编码功率进步30%以上,归纳工作功率进步15%,能显着感受到大模型带来的功率进步。
此外,哪怕不是编程高手的普通人,只需发挥想象力、依据对运用场景的认知,也可以“零门槛”进入代码国际。
例如,运用Python画红色的心形线、用代码生成“贪吃蛇”等小游戏、运用小视频做表情包等需求,讯飞星火都能敏捷完结。
此前,科大讯飞已将星火大模型的才能,包装为中英文类人批改、英语类人白话对话等诸多运用场景,置入进T20、LUMIE 10、T10等AI学习机产品。有经销商表示,用户对搭载星火大模型的旗舰产品,热情度十分高。
晋级后的星火大模型,环绕教育落地多款产品和功用。星火教师帮手运用在讯飞教育数字基座上,零编程根底的教师也能运用,并满足校园办理数字化转型中的个性需求和定制开发。AI 智能编程帮手和 AI 构思绘画伙伴的推出,标志着大模型对AI学习机赋能,更全面靠近新课标的要求。
代码和多模态才能的晋级,也是大模型降低门槛,解放生产力,开释想象力的要害。目前,结合原有运用数据和场景描绘,集成讯飞星火的代码才能和言语了解才能,大大进步校园开发功率:原有开发运用周期从17天缩短至1天,投资本钱由15万降低至1.5万元。依据科大讯飞泄漏,该教育数字基座现已在上海、湖北、安徽的一些校园试点落地。
工业生态上,为职业、政务供给业界抢先、自主可控的私有化代码才能渠道——比方星火一体机。别的,开发者生态也是大模型工业良性循环要害。
5月6日星火大模型发布后两个月内,讯飞人工智能敞开渠道开发者数量添加了85万家。6月9日以来,已有4000余个帮手开发者团队加入进来,开发出了7800多个帮手。
跟着生态会集,大模型不只与工业运用更紧密,加速赋能千行百业进程,也能经过正向反馈,促进根底研究和要害技能的自主迭代,更大程度解放生产力,开释想象力。
科大讯飞就表示,当时多模态才能已广泛运用在教育、医疗、工业、轿车、机器人等范畴。实在国际取得的数据,将进步产品终端的学习、练习,从而推出更自主的工业机器人、更好的自动驾驶、走入家庭的陪同机器人等等。
“这会是一个长时刻进程。在算力、渠道、模型、运用、生态等方面,都有继续深化的企业,对工业来说有更强的吸引力。”一位人工智能分析人士说。
写在最终:
大模型落地道阻且长。总体而言,当时大模型尚未彻底离开“喧嚣”,各行各业大多处于赋能阶段,想收成大规划工业价值,还有很长的路要探究。
好像比尔·盖茨在《人工智能时代现已开启》中所描绘,自1980年图形用户界面呈现以来,大模型是所见过最具革命性的技能进步。一场事关一切工业的商业变革,现已拉开了大幕。