2024年人工智能发展总体态势
来源:[freemarker标签异常,请联系网站管理员]
发布时间:2025-02-12 13:45:22

人工智能浪潮席卷全球,正以前所未有的速度、广度和深度改变生产生活方式,对全球经济社会发展和人类文明进步产生深远影响。近年来,语言大模型、多模态模型、智能体和具身智能等领域不断出现突破性创新,推动人工智能迈向通用智能初始阶段。与此同时,人工智能的工程化持续加速推进,新产品新模式层出不穷行业应用走深向实。

特别是过去一年,全球大模型井喷式发展。技术层面,缩放定律(Scaling Law)依然有效,语言大模型技术多维度能力持续进化,视觉大模型和多模态模型加速迭代,探索交叉模态融合处理。计算平台与模型创新紧密耦合,大规模分布式训练成为框架的新发力点,分布式训练支持、混合精度计算支持、高速互联通信等新要求驱动计算底座迭代升级。软件工具链全面优化升级,加速模型生产质效变革、提升模型部署推理效能、助力智能应用快速部署。高质量多模态数据集成为推动模型能力提升的关键,高水平数据标注和合成数据等新技术取得快速发展和突破。应用层面,专用智能应用逐步成熟,通用智能落地前景广阔。重点行业人工智能应用走深向实,贯穿产品研发设计、生产制造、营销服务、运营管理全流程,在提质增效的同时,逐步渗透并引导产业变革。从产业链各环节应用来看,大模型落地呈现“两端快、中间慢”的阶段特征。“选、建、用、管”体系化推动落地应用成为加速人工智能走向实用化、普惠化的行业共识。安全方面,人工智能技术应用带来自身安全、衍生安全两大类风险挑战,各国治理进程不断提速,全球人工智能治理正处于“从原则走向实践”的关键阶段。

人工智能技术演进走向新范式

Transformer架构为基础的大模型不断取得新突破,在大数据大算力加持下,逐渐实现从单任务智能到可扩展、多任务智能的跨越。这一关键突破,标志着人工智能技术发展走向新范式。以大模型为代表的人工智能技术展现出了类人智能的“涌现”能力,呈现规模可扩展、多任务适应及能力可塑三大特征。一是规模可扩展。模型的规模可扩展性不仅体现在参数的扩大,更依赖高质量数据集的供给以及大规模算力集群能力的增强。当前在模型参数保持不变的情况下,提高数据质量、扩大数据集规模或提升算力规模水平,都能够显著增强模型的复杂性和处理能力。二是多任务适应。大模型支持多任务多模态能力持续增强,可执行任务已经从文本对话拓展到多模态理解、多模态生成等场景。三是能力可塑。通用大模型在训练阶段通过结合增量预训练、有监督微调、知识图谱等方法,实现将专业数据和知识注入模型中,提升大模型在专业领域的应用能力;在推理阶段,通过引入检索增强生成、提示词工程和智能体等技术,将更丰富的上下文信息和专业知识引入模型推理过程,解决更复杂的推理任务,优化模型表现。

具体从大模型算法演进态势看,深挖现有体系架构潜力,以实现理解推理能力和训练效率倍增仍是当前发展主线。模型研发主体纷纷围绕算法理论融合(如Transformer 架构与其他路线结合)和型改造(如扩大上下文窗口、思维链复杂推理、优化注意力模块、网络架构稀疏化、多模态特征对齐与统一理解等)展开创新升级,从而提高模型性能表现。近期OpenAIo1模型通过模仿人脑思考的思维过程,显著提升数学、物理、编程等复杂任务的性能水平。与此同时,非 Transformer模型的底层算法也在不断创新。例如,基于图神经网络的 GraphCast、GNoME 在气象和材料领域已取得重大突破,基于物理约束的 PINN 网络、基于算子学习的 DeepONet 和基于傅里叶变换的 FNO 网络已成为求解偏微分方程(PDEs)的重要手段

二、人工智能工程化迈向新阶段

工程化技术是推动人工智能从实验室走向生产环境的关键桥梁,也是人工智能在垂直行业应用落地的必经之路。在此过程中,人工智能工具链发挥着核心作用,其覆盖数据处理、模型训练微调、部署推理、应用开发、监控运维和安全可信全流程,是实现智能化转型的基础设施和加速器。当前,人工智能工程化的重点逐渐从大模型的训练微调向应用开发和落地转变,构建起围绕大模型及其应用的工具链,标志着人工智能工程化进入了新的产业化阶段

开发工具链加速大模型技术迭代速度。开发工具链作为连接算法、数据与应用场景的关键纽带,对大模型的训练和推理至关重要在训练方面,开发工具围绕分布式训练持续优化,显著提升了大模型的训练效率,如DeepSpeed、Megatron-LM等分布式训练框架通过支持更丰富的并行策略,以及更丰富的计算加速策略,有效支持产业界超大规模模型的预训练。同时,训练框架围绕参数高效微调等方面的技术创新,可以有效降低计算和存储成本。在推理方面,开发工具链聚焦优化量化、剪枝等压缩技术持续突破,加速推理过程并降低部署成本。同时,开发工具通过完善并行推理、混合精度推理、推理缓存等技术,可以有效降低计算资源消耗,提升推理服务速度。

应用工具链拓展大模型应用广度。大模型应用工具主要围绕Agent(智能体)、多模型编排、大小模型协同、知识库集成、检索增强生成(RAG)及多组件融合等核心要素持续创新。Agent的引入,实现了复杂任务的自动化执行与智能决策;多模型编排则有效解决了单一模型局限性问题,通过灵活组合大小模型提升系统性能;大小模型协同机制,在确保精度的同时优化了计算资源利用;知识库与RAG 技术的结合,极大增强了模型的知识推理与生成能力,确保结果的精确性;多组件的融合应用,则进一步丰富应用场景,提升了系统的灵活性与可扩展性。应用工具链不仅极大降低了大模型应用的开发门槛,还显著提升了智能应用的性能与用户体验

人工智能安全治理工作紧密推进

在人工智能飞速发展的浪潮下,全球人工智能治理合作持续升温,各国政府、国际组织、私营部门及社会各界携手并进,各主要经济体治理体系日渐明晰,产研合作愈发紧密。各类安全治理框架、安全治理工具日新月异,标志着全球人工智能治理跨入更加成熟的新阶段,以应对人工智能技术快速发展带来的机遇与挑战。

全球人工智能安全治理合作愈发紧密,各主要经济体治理体系渐趋明晰国际合作方面,交流合作更加频繁,强调“负责任”普惠发展理念。联合国在全球人工智能治理中发挥主渠道作用,十国集团、七国集团等密集推出人工智能治理举措,人工智能安全峰会聚焦安全议题提供全球对话平台。与此同时,全球积极推动人工智能普惠发展。联合国大会通过了关于人工智能的里程碑式决议加快实现可持续发展目标,我国发起“一带一路”倡议、搭建“数据丝路”、成立中国-金砖国家人工智能发展与合作中心,并在“人工智能能力建设国际合作”高级别会议上提出《人工智能能力建设普惠计划》,都致力于让人工智能为全人类带来“惠益”。治理体系方面,各主要经济体治理体系渐趋明晰,旨在维护本土产业发展需要。我国兼顾人工智能发展与安全,提出建立人工智能安全监管制度,发布《全球人工智能治理倡议》《人工智能安全治理框架(1.0版)》。欧盟出台《人工智能法案》构建统一治理格局,美国发布拜登行政令推行行业自律的治理架构,英国、新加坡、日本等国加速构建立足本土产业发展需求的安全治理方案。

人工智能安全前瞻研究和产业实践深度结合,安全技术应用能力明显提升前瞻研究方面,麻省理工学院、伯克利大学和南洋理工大学等研究机构提出模型间对抗新范式,深入探索人工智能模型自身安全边界。清华大学、北京大学和腾讯等机构积极开发新型模型水印算法,增强人工智能应用的安全可追溯性。产业实践方面,各国推动安全治理走深向实。美国打造 Dioptra 测试平台评估人工智能安全可靠,英国人工智能安全研究所推出Inspect 工具集评估模型能力和整体模型安全,新加坡送代AI Verify 工具箱以期提升人工智能可信度,中国推出大模型公共服务平台,集成数字内容水印、生成内容检测、不良信息识别等技术工具,提升大模型的安全合规能力。

人工智能产业稳中有进迎来新动能

全球人工智能产业保持高速增长。据IDC预测,2024年全球人工智能产业规模将达到6233亿美元,同比增长21.5%。具体来看有两个方面的重要原因。一是大模型涌现式发展,为人工智能产业高速增长提供了核心动力。自2023年起,全球基础模型数量快速增加,相较于2022年增长数量翻倍;2024年以来全球基础模型新增或迭代近百个,保持了较强的创新态势。二是生成式人工智能技术加速产业化进程,促进全球人工智能规模化发展。据Gartner预测,到2026年,超过80%的企业将使用生成式人工智能API,或部署生成式人工智能的应用程序

大模型领域拉动全球人工智能投融资金额上扬2024年上半年,全球人工智能投融资金额达316亿美元,同比上升84%。在全球融资紧缩的背景下,受益于大模型发展和企业融资带动,人工智能领域融资占全行业融资比例持续上升,从2022年的4.5%上升至2024年上半年的 12.1%。2023年,生成式人工智能投融资规模达252亿美元,约为2022年的9倍,占2023年所有人工智能相关投资的约四分之一。2024年上半年,全球金额最大的10笔融资事件中有6笔为大模型企业融资,金额总计达135 亿美元

人工智能创业企业发展持续创新高。人工智能创业企业是智能化时代影响技术产业格局的生力军,也是推动全球人工智能产业生态繁荣的重要力量。截至2024年第二季度末,全球共有人工智能独角兽企业 242家,其中2024年上半年新增15家,占所有新增独角兽企业的 40%。独角兽企业业务分布广泛,2024年新增独角兽企业业务领域涵盖生物制药(如Xaira Therapeutics)、软件开发(如Cognition AI)、数据平台(如Weka)、搜索问答(如 Perplexity)科研写作(如SakanaAI)等。部分独角兽企业商业模式逐渐清晰,技术实力和发展前景已获得市场认可,其中AsteraLabs、出门问等已于2024年上半年成功上市。随着大模型应用落地门的持续降低,各行业也将涌现出更多人工智能创业企业,垂直行业赛道成为未来创新涌现的重要场景。

展望未来,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破,具身智能成为迈向通用人工智能的重要一步。面向中远期,类脑智能等颠覆性技术的成熟,有可能为人工智能发展带来更广阔的想象空间。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

(摘自中国信通院《人工智能发展报告(2024)》)