【返回首页】
为数不多的仍在坚持基座模型研发的创业公司。今年1月,其发布并开源的新一代01全新系列模型,突破Transformer大模型架构的记忆瓶颈,首次大规模实现线性注意力机制。此前,“线性注意力”机制已多次出现于理论和学术研究中,但未被广泛应用于大模型中。
几乎同一时间,上海人工智能实验室发布升级后的书生大模型。它仅使用4T token(词元)的预训练数据,就实现主流开源模型18T token数据的训练效果,节约训练成本75%以上,为突破“尺度定律”带来新的研究范式。5月,由上海人工智能实验室青年科学家领衔的团队打破围棋思维“黑盒”,让大模型从不会下棋到具备专业围棋水平,为大模型处理复杂推理任务进而解决科学发现等难题奠定基础。
如果说这一轮人工智能热潮的起点,是算力提升带来的“以力破巧”,那么,随着摩尔定律逼近极限,人们便开始期待AI的下一个“核爆点”。本次世界人工智能大会特别设立“AI三问”,直达人工智能最基础的前沿核心问题,叩问智能时代的终极锚点。世界气象组织、联合国教科文组织、菲尔茨数学科学研究所、斯梅尔数学与计算研究院等的加入,更让议题含金量十足。
不久前,上海人形机器人独角兽公司智元机器人自研的A2-W机器人,开启全球首个“工厂作业直播”。3小时内,一个智元机器人搬运了800余只物料箱,全程零失误,充分展现其在长时间、高强度、动态干扰环境下的稳定作业能力。这不是智元机器人唯一的工作场地,车展、营业厅,甚至万众瞩目的红毯上,都留下它灵动的身影。