- 阶跃星辰的100天加速度:从走路入场到跑步前进,迈向AGI的征程
- 2024年07月06日来源:太原新闻网
提要:在生态合作方面,阶跃星辰已经在金融、网络文学、知识服务、游戏、数字人、影视等领域与合作伙伴达成了深度合作,共同探索面向C端用户的创新应用。例如,他们在WAIC大会上展示的“大闹天宫”AI互动体验就是与上影合作的结果。
在2024年3月,阶跃星辰成功吸引了大众的目光。他们发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版,这标志着他们正式进入大模型领域,并跻身国内六大大模型独角兽行列。
然而,阶跃星辰的低调和神秘感却让人对其团队核心成员、技术进展和产品研发等信息知之甚少。直到他们临近一周年之际,正式提交第一份成绩单时,外界才逐渐了解到这家公司的实力。
进入2024年以来,大模型行业的发展愈发多样化,大模型落地应用的主旋律下,行业模型和端侧模型逐渐升温。然而,阶跃星辰的声音似乎并不多见。因此,当得知阶跃星辰也将出席世界人工智能大会(WAIC)时,人们充满了期待和好奇,希望能够一探这家公司对当前关于AGI的各种共识与非共识问题的看法。
然而,阶跃星辰在WAIC上交出的却是第二份答卷——发布了Step-2万亿MoE语言大模型正式版、Step-1.5V多模态大模型和Step-1X图像生成大模型。这次的产品升级距离上次发布仅过去了100天。
将国内大模型升级到“万亿参数时代”的Step-2
在WAIC大会上,阶跃星辰的Step-2万亿参数MoE语言大模型正式版亮相了。它采用当前热门的MoE(Mixture of Experts)架构,这种架构可以实现在增大参数规模的同时,计算成本远低于相同参数规模下的稠密模型,从而实现高效训练。
在通往AGI的道路上,业界大多数人坚信Scaling Law定律——模型越大,性能越强。然而,现实问题是模型的升级迭代离不开算力的支撑,而算力的不足和匮乏是当前业界面临的共识之一。因此,在意识到MoE可以解决这一难题时,一些大模型从业者相继推出了基于MoE架构的大模型,阶跃星辰就是其中之一。
阶跃星辰的CEO姜大昕表示,在完成Step系列千亿模型的训练后,他们就开始训练万亿模型。而要将模型参数扩大到万亿级别,MoE几乎是一个必选项。在设计Step-2 MoE架构的过程中,阶跃星辰还进行了创新,通过部分专家共享参数、异构化专家设计等方式,让Step-2中的每个“专家模型”都得到了充分训练。
据阶跃星辰透露,目前Step-2万亿参数MoE语言大模型在数理逻辑、编程、中文知识、英文知识和指令跟随等方面已经全面逼近GPT-4。
阶跃星辰攀顶AGI的决心
阶跃星辰在3月份推出的Step系列模型是他们将近一年的成果结晶。而现在,仅仅过去了100天,他们就实现了对Step系列模型矩阵的全新升级。这表明阶跃星辰在通往AGI的征程中已经从“走路入场”转变为“跑步前进”。
尽管业界对AGI的定义和路径尚未形成明确共识,但阶跃星辰已经明确了自身的路线图:单模态—多模态—多模态理解和生成的统一—世界模型—AGI。他们以实现AGI为目标,专注于研发多模态基础大模型,并基于自研基础大模型打造新一代“AI +”应用。
姜大昕认为,攀登AGI巅峰需要“万亿参数”和“多模融合”两个关键要素。多模态理解和生成的统一是通向AGI的必经之路,而模型参数量决定了模型能力上限,因此全面进入万亿参数级别是通向AGI的核心之一。
此次阶跃星辰的Step系列通用大模型获得了WAIC 2024 SAIL之星称号,这是对他们在人工智能领域中具有高度认可和美誉的项目的表彰。
除了在模型上的努力,阶跃星辰在应用上也没有松懈。他们通过自研产品和生态合作产品逐渐形成了丰富的产业应用生态圈,并在重点行业领先落地。例如,他们自研的产品跃问和冒泡鸭已经全面开放使用。
在生态合作方面,阶跃星辰已经在金融、网络文学、知识服务、游戏、数字人、影视等领域与合作伙伴达成了深度合作,共同探索面向C端用户的创新应用。例如,他们在WAIC大会上展示的“大闹天宫”AI互动体验就是与上影合作的结果。
接下来,阶跃星辰将继续积极探索,并持续扩大生态圈,结交更多的生态伙伴。他们的目标是通过技术和产品的双重驱动,推动人工智能技术的发展和应用,为实现AGI的目标而努力。