埋头钻研一年后,阶跃星辰交出了第一份答卷
2025-07-12 13:54:15 - 风汇深
历经去年持续一年之久的钻研百模大战后,今年伊始,年后落地应用开始成为大模型的阶跃交出主流叙事方式。本以为,星辰在月之暗面、第份答卷智谱、钻研抖音带货博主塌房合集MiniMax、年后百川、阶跃交出零一万物等一众明星企业之后,星辰关于通用大模型的第份答卷格局既定,没想到,钻研平静水面下泛起涟漪,年后新玩家浮现……
其实,阶跃交出“新玩家”一词用来形容阶跃星辰并不恰当,星辰去年年末,第份答卷阶跃星辰以一家通用大模型初创公司的身份开始出现在公众视野,AI科技评论当时也就此做过报道。
但彼时网上关于这家公司的公开信息并不多,公司属于微软系创业,由前微软 NLP 大牛姜大昕创立,成立于2023年4月,发力自研大模型+AI原生应用,仅此而已,寥寥数笔就可以勾勒出大致轮廓。
神秘、低调,大概是阶跃星辰留给大家的第一印象。
而如今,在距离公司成立近一周年的朱某艳照流出热搜截图时间点,阶跃星辰交出了第一份答卷。
坚持一条自研大模型+AI原生应用的路线
今年3月底,阶跃星辰正式对外发布自研大模型——Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型,以及 Step-2 万亿参数 MoE 语言大模型预览版。
同时,阶跃星辰还发布了两款 ToC 产物——跃问与冒泡鸭。
跃问是一款 AI 聊天类应用,定位个人效率助手;冒泡鸭则是一款由剧情和角色构成的 AI 开放世界,可以为客户提供娱乐和社交。
整体来看,跃问作为一款 AI 聊天类应用,定位是个人效率助手,页面简洁明了,目前可支持上传图片、文档和网址,以及具有联网搜索功能。据了解,当前跃问的知识库信息储备截止到2023年,后面的信息可基于联网搜索提供。
从很多客户的使用反馈来看,跃问的效果得到了一众好评,“对于上传的文档,跃问可以快速输出总结结果,而且总结的能力还不错。”“计算会调用Python,保证了信息的准确性。”“能够识别图片。”
而说到图像识别能力,这也是跃问的显著优势之一,基于背后的多模态内容理解能力,它能够帮助客户识别真实世界的万事万物,像是理解和分析复杂的金融领域的信息图表、理解解读热门图片中的深意等。
比如,在输入框输入一份某公司的营业信息,要求将其转换为表格形式,并计算出每年的净利润增长率。根据输出内容可以看出,跃问明确诉求后,快速对信息进行分析、处理,给出结果。
另外,针对当前的热门电影《你想活出怎样的人生》,雷峰网(公众号:雷峰网)也输入了一张剧照,让跃问帮忙解读其中的意义,后者给出了以下的解读内容:
可以看出,对于图像中的内容,跃问可以给出具体的描述,而对于其中的内涵和情感,剖析得也不错。
效率工具跃问体验网址:https://stepchat.cn/chats/new
而另一款产物冒泡鸭则呈现了一个全新 AI 开放世界。
在这里,客户可以探索故事、创作角色,沉浸属于自己的开放世界。不仅如此,客户还可以选择自己上手去创造属于自身的独特角色。
据雷峰网体验,目前冒泡鸭上面客户玩的比较多的故事剧情是《逃离精神病院》,在对话过程中,不仅可以自定义回复内容,上面还提供选项,从而让客户以一种更便捷、快速的方式进入沉浸式剧情体验。
AI开放世界平台冒泡鸭体验网址:https://maopaoya.com
不管是跃问还是冒泡鸭,一款好的、能够满足客户需求的产物背后都离不开大模型的支撑。
正如阶跃星辰创始人、CEO 姜大昕所坚信的,模型和产物的关系就像是灵魂与皮囊,灵魂更加有趣一点,才能显示出产物的不同。
而跃问和冒泡鸭产物的灵魂就是此次发布的两款自研千亿级参数大模型——Step-1 千亿参数语言大模型和Step-1V 千亿参数多模态大模型。
据了解, Step-1 千亿参数语言大模型在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5。
Step-1V 千亿参数多模态大模型拥有出色的图像理解、多轮指令跟随、数学、逻辑推理、文本创作等能力。
国内的大型模型评估平台“司南”(OpenCompass)多模态模型评测结果显示,Step-1V 位列第一,性能比肩 GPT-4V。同时,Step-1V 的多模理解能力突出,可以精准描述和理解图像中的文字、信息、图表等信息,并根据图像信息实现内容创作、逻辑推理、信息分析等多项任务。
跃问和冒泡鸭可以对电影海报、网络热门表情包等图像进行多方位解读,依托的就是该能力。
即便阶跃星辰此次发布的两款千亿参数模型已经带给大家足够的惊喜,但这只是第一步,他们脚踏实地的同时还在仰望星空,向着通用机器智能(AGI)的方向奔去。比如,阶跃星辰这次还发布了 Step-2 万亿参数语言大模型预览版,直接将大模型的战场升级到“万亿参数时代”。
其实,阶跃星辰从成立起,设定的航向就是AGI,并基于此目标,总结出了一条独特的前进路线。
一方面坚信 Scaling Law 方向,模型参数量决定模型智能水平的上限,完成 Step-1 千亿参数语言大模型的训练后,马不停蹄地投入 Step-2 万亿参数大模型的训练工作。另一方面是认识到多模理解和生成的统一是通往AGI的必经之路。
这也是为什么在大模型战场“打得”如火如荼的时候,阶跃星辰还能耐得住寂寞,埋头磕工艺难点,钻研打磨产物,直到现在才正式发布。
抵达AGI的决心与底气
尽管探路者曾经一次次想象、描摹抵达AGI后的景象会是如何,但不可否认,大模型是一门流动的、仍在成长的工艺,OpenAI 也还只是路上走得比较快的探索者,每一个高举旗帜的探路者都有可能通往终点。
而那些在理念、工艺、人才、资本的累积上更丰富的玩家,更有可能接近正确答案。
在理念与工艺上,阶跃星辰交出的答卷已经言明了,而人才上,阶跃星辰拥有一支强大的队伍。
早在今年年初,一位接近阶跃星辰的投资者就告诉雷峰网,阶跃星辰在运算规则、信息、系统方面都有足够的人才。
只是那时出现在公众视野的只有微软出身的 CEO 姜大昕,大家对其他核心团队成员信息知之甚少,直到这次阶跃星辰正式对外公布。
据了解,目前阶跃星辰的团队规模在 150 人左右,核心创始团队成员包括创始人、CEO 姜大昕、系统负责人朱亦博、信息负责人焦斌星。
姜大昕大家都很熟悉,早年从纽约州立大学布法罗分校取得计算机科学博士学位后,赴新加坡南洋理工大学计算机科学与工程学院任助理教授,2007 年加入微软亚洲研究院任首席研究员。
在决定离职创业前,姜大昕任微软全球副总裁,负责的团队规模一度达到 400 多人,包括研究搜索和 AI 运算规则、应用程序和平台的应用科学家、工程师等。
而在微软长达16年的职业生涯,让姜大昕在机器学习、信息挖掘、自然语言处理和生物信息学等方面累积了丰富的研究和工程经验。
系统负责人朱亦博也是微软出身,曾在字节跳动、Google等公司任职,拥有多次单集群万卡以上的系统建设与运营实践经验。
信息负责人焦斌星曾担任微软必应引擎核心搜索团队负责人,负责利用信息挖掘和NLP运算规则优化索引和搜索质量。
而基于强大的人才储备,阶跃星辰自成立起,便以Scaling Law为准则,在算力、信息、运算规则和系统这四大要素上进行综合布局,铸就自身高高的护城墙。
算力上,阶跃星辰采取的是“自建机房+租用算力”的做法;系统方面,有经验丰富的朱亦博坐镇;信息方面,由焦斌星负责;而运算规则方面,由创始人姜大昕负责。
对于大模型的研发来说,参数量从千亿增长到万亿,是一个数量级的变化,对算力、系统、信息、运算规则都有着极高的要求,而目前阶跃星辰作为国内第一家迈入万亿参数阶段的初创公司,这方面的积累在业界来说也是极为罕见。
资本方面,目前阶跃星辰在融资方面并未有消息透露。但是,单凭他们在完成 Step-1 千亿参数语言大模型的训练后,又火速开启 Step-2 万亿参数大模型的训练,就可以看出来,阶跃星辰“不差钱儿”。
另外,一位投资人还向雷峰网表示,除了上述的诸多硬性优势外,阶跃星辰还有一个长板,那就是团队成员大多历经过上一代 AI 的浪潮,该踩的坑也踩了很多,试错经验更丰富,在这一波浪潮中会避免踩一些不必要的坑。
阶跃星辰会是最后一家通用大模型公司吗?
这是在此次阶跃星辰正式公开亮相时,大家的疑惑与好奇。
毕竟当大模型故事线延伸至今,落地、商业化已然成为主旋律,还会有谁会选择,甚至成功切进通用大模型赛道?似乎很难,看似刚刚入场的阶跃星辰,其实也是早早入局,潜心钻研,等待一个厚积薄发的时机。
不过,可以肯定的是,随着万亿参数大模型浮出水面,通往AGI的战场已经升级,进入新阶段。接下来,水面下是否还有像阶跃星辰这样的公司在暗地涌动、等待,都是一个未知数,唯一确定的是,在这场竞赛中,故事变得越来越精彩了。
本文作者(vx:youlinancy)长期关注月之暗面、阶跃星辰等 AI 初创公司的大模型叙事,不止于工艺增长、人物故事、行业动态,欢迎交流!
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
- END -
别再声讨零一万物了

最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A
AI Infra 往事之异构计算篇:吴韧与他的学生们

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕

6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量,
对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

当科学家把一些菟丝子移植到几株营养状态不同的山楂树上时,那些营养状况更好的山楂树会更容易获得菟丝子的「青睐」。这在以往被看作是植物内「被动」存在的东西,但据研究人员发现,植物也具备从过去的经验中学习区
以技术为引 以创意为核 上影节用新拥抱电影

来源标题:以技术为引 以创意为核 上影节用新拥抱电影“AIGC单元”入围作品《风吹过那拉提》电影百年,创制焕新。近些年,技术的快速发展、全面迭代,不仅提高了电影的制作质量,创新
GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至

8月14日,新加坡,大厦起伏如丘,树木葱茏,云卷云舒,风也是清新的。建立在大模型技术爆炸时代语境下的第七届GAIR全球人工智能与机器人大会,正式在新加坡乌节大酒店举办。大会共开设10个主题论坛,聚焦大
星尘数据MorningStar正式发布!狙击“数据债”成最大看点

3月11日,AI数据技术公司星尘数据Stardust AI)正式发布MorningStar——一款面向AI的数据闭环产品。MorningStar是目前首个专注数据价值发现的AI数据平台,基于DataO
大模型助力企业数据驱动,火山引擎数智平台发布 AI 助手

9月19日,火山引擎在其举办的“V-Tech数据驱动科技峰会”上宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能大模型,帮助企业提升数据处理和查询分析的效率。即使是不会写代码的运营人员
"寻数计划"已发布,面向全社会征集高质量大模型语料数据

一、“寻数计划”简介如果您有大模型所需的丰富语料数据资源,如果您有标准化的高质量精标语料数据产品,如果您愿意以多元化方式参与大模型高水平语料数据要素建设,诚邀您加入“寻数计划”。“寻数计划”是大模型语
埋头钻研一年后,阶跃星辰交出了第一份答卷

历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面
SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展

12月13日,以“新算力 新赋能 新未来”为主题的2022 CCF全国高性能计算学术年会CCF HPC China 2022)在线上正式召开。作为高性能计算领域全球最具影响力的三大超算盛会之一,大会邀
大模型时代的三道鸿沟:数据、成本与想象力

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融