最准内部资料网站板块,人工智能实验室发布升级后的书生大模型

【返回首页】

为数不多的仍在坚持基座模型研发的创业公司。今年1月，其发布并开源的新一代01全新系列模型，突破Transformer大模型架构的记忆瓶颈，首次大规模实现线性注意力机制。此前，“线性注意力”机制已多次出现于理论和学术研究中，但未被广泛应用于大模型中。

几乎同一时间，上海人工智能实验室发布升级后的书生大模型。它仅使用4T token（词元）的预训练数据，就实现主流开源模型18T token数据的训练效果，节约训练成本75%以上，为突破“尺度定律”带来新的研究范式。5月，由上海人工智能实验室青年科学家领衔的团队打破围棋思维“黑盒”，让大模型从不会下棋到具备专业围棋水平，为大模型处理复杂推理任务进而解决科学发现等难题奠定基础。

如果说这一轮人工智能热潮的起点，是算力提升带来的“以力破巧”，那么，随着摩尔定律逼近极限，人们便开始期待AI的下一个“核爆点”。本次世界人工智能大会特别设立“AI三问”，直达人工智能最基础的前沿核心问题，叩问智能时代的终极锚点。世界气象组织、联合国教科文组织、菲尔茨数学科学研究所、斯梅尔数学与计算研究院等的加入，更让议题含金量十足。

不久前，上海人形机器人独角兽公司智元机器人自研的A2-W机器人，开启全球首个“工厂作业直播”。3小时内，一个智元机器人搬运了800余只物料箱，全程零失误，充分展现其在长时间、高强度、动态干扰环境下的稳定作业能力。这不是智元机器人唯一的工作场地，车展、营业厅，甚至万众瞩目的红毯上，都留下它灵动的身影。

首页：四九网址,49网址_玄机跑狗图 <<上一篇下一篇>>