5月28日举行的2023中关村论坛·人工智能大模型发展论坛上,科技部新一代人工智能发展研究中心发布了《中国人工智能大模型地图研究报告》,显示 中国研发的大模型数量排名全球第二,仅次于美国;从国内大模型区域分布来看,北京、广东、浙江、上海处于第一梯队。 目前中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。
(资料图)
中国与美国保持同步增长态势
2017年谷歌发布的Transformer网络结构是大模型发展的源头技术,自此以后大模型技术在自然语言理解、计算机视觉、智能语音等方面都取得了标志性的技术突破,在模型精度、通用性和泛化能力等方面都实现了跨越式发展。
ChatGPT又进一步激发了语言大模型爆发式涌现,也吸引了大量研发团队投入到通用视觉、多模态等更多大模型研发方向。赵志耘表示,仅用5年多时间,大模型技术已形成庞大技术群,衍生出涵盖各种参数规模、各种技术架构、各种模态、各种场景的大模型家族。
从全球大模型发展态势来看,美国谷歌、OpenAI等机构不断引领大模型技术前沿,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入到大模型的研发中。从全球已发布的大模型分布来看, 中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高,中国从2020年进入大模型快速发展期,目前与美国保持同步增长态势。
中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘带领团队编写的《中国人工智能大模型地图研究报告》显示,到目前为止 中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。
在模型领域分布上 ,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。从研发主体发布来看,高校、科研机构、企业等创新主体都在积极研发大模型,但学术界与产业界的联合研发案例较少。
算力-模型匹配度高,公共算力发展迅速。 北京、广东、浙江、上海等地的大模型数量最多,这四个地方也是近三年人工智能服务器采购数量最高的地区。 各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支持。
这份报告的人才地图显示, 北京、江苏、广东、上海是大模型研发人才较多的省市。 人工智能和大模型论文作者统计表明,大模型学者指数排名国内前四的是:北京、江苏、广东、上海;人工智能学者指数的排名中,上海位列第三,高于广东。“我国的大模型人才总量是稀缺的。”赵志耘指出,“这个领域的门槛比较高,需要高素质AI人才,目前国内各地的人才数量都不充足。”
报告的开源影响力地图显示,国内已有超过半数的大模型实现开源, 北京、广东、上海在开源数量和影响力上均排名前三。 高校和科研机构是开源主力,清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大模型在开源影响力上位居三甲。
具身智能将是未来AI形态
“ChatGPT表现出很强的人机对话能力和逻辑推理能力,拉开了迈向通用人工智能的序幕。”吴朝晖说。所谓通用人工智能,就是人工智能像人一样可以做很多事,不再局限于某些特定任务。回答各种问题、撰写各类文案、编写计算机程序……ChatGPT能够完成很多任务;GPT-4在迈向通用人工智能的道路上再进一步,具备了读图能力。
吴朝晖也指出,自然语言大模型并不是大模型的最终形态,比它更高级的是多模态的具身智能。这个观点与英伟达首席执行官黄仁勋相仿,后者近日在一次演讲中预测:人工智能的下一个浪潮是具身智能。所谓具身智能,是将智能算法与机器人的感知、行动和环境交互能力相结合,使机器能够以更自然、更智能的方式与环境进行交互并完成各种任务。
这意味着,除了“大脑”,“身体”对机器智能也很重要。包括ChatGPT等语言大模型在内的人工智能系统,执行的任务大多是数据处理和符号推理,类似人的大脑。而在具身智能系统中,机器人通过感知和行动与外部世界直接交互,再通过与“大脑”联合运行,就能从外部世界中获取知识和经验,并在实践中逐步改进自身能力。
具身智能系统感知到的信息,包括视觉、听觉、触觉、嗅觉等信息,用人工智能术语说,这些是多模态信息。多模态的具身智能,可以让机器人像人类那样感知丰富多彩的外部世界,为大模型“大脑”配备智能化“身体”。
基于大模型的发展趋势预测,吴朝晖表示,我们将进入智能增强时代,这是一个由人、物理世界、机器人、虚拟世界组成的“四元世界”;机器人将拥有自主学习、情感理解等类人智慧特征,与其他“三元”交互后,有望产生超级智能、融合智能等新形态。
中国大模型的产业化应用沿着两条路径发展 ,第一种是通用类大模型持续拓展应用领域,文心一言、通义千问、紫东太初、星火认知等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。第二种是垂直领域专业类大模型不断深化落地,一批针对生物医药、遥感气象等垂直领域的专业大模型发挥其领域纵深优势,提供针对特定业务场景的高质量专业化解决方案。
面向智能增强的未来, 吴朝晖 发出四点倡议 :一是坚持开源协作,通过技术创新协同解决透明性、稳定性等大模型共性问题,推动算力资源和数据资源开放共享,加快形成大模型的产业生态;二是坚持场景驱动,加快大模型在制造、医疗、电力等重点领域的落地应用,以应用推动技术迭代升级;三是坚持技术向善,深化人工智能伦理风险和治理体系研究,同时加强大模型安全可信、隐私保护等技术研发;四是坚持开放理念,聚焦大模型助力科学发现、工程研发以及环境治理、能源管理等可持续发展问题,不断深化国际交流合作、开拓国际合作空间。
这份《中国人工智能大模型地图研究报告》,园区荟(ID:biaozhunpark)小编暂时并未找到全文,但小编找到了同类型的相关研究报告,供参考。 以下报告来源:中国移动,内容节选如下——
Copyright © 2015-2022 热讯频道网版权所有 备案号:豫ICP备20005723号-6 联系邮箱:29 59 11 57 8@qq.com