文章转载来源:AI之势
来源:财联社
原标题:《北京:系统构建大模型等通用人工智能技术体系》
图片来源:由无界 AI工具生成
财联社5月30日讯,北京市政府办公厅正式发布《北京市促进通用人工智能创新发展的若干措施》。其中提出,提升算力资源统筹供给能力。实施算力伙伴计划,与云厂商加强合作,提供多元化优质普惠算力。加快北京人工智能公共算力中心、北京数字经济算力中心等项目建设,形成规模化先进算力供给能力。实现异构算力环境统一管理、统一运营,提高环京地区算力一体化调度能力。
为贯彻落实《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,充分发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动本市通用人工智能实现创新引领和理性健康发展,特制定以下措施。
一、提升算力资源统筹供给能力
(一)组织商业算力满足紧迫需求
着力发挥本市算力资源优势,实施算力伙伴计划,通过与云厂商加强合作,加快归集现有算力,明确供给技术标准、软硬件服务要求、算力供给规模和支持措施,为创新主体提供多元化优质普惠算力,保障人工智能技术创新和产品研发算力需求。
(二)高效推动新增算力基础设施建设
将新增算力建设项目纳入算力伙伴计划,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。
(三)建设统一的多云算力调度平台
针对弹性算力需求,通过建设多云算力调度平台,实现异构算力环境统一管理、统一运营,便利创新主体在不同云环境上无缝、经济、高效地运行各类人工智能计算任务。进一步优化本市与天津市、河北省、山西省、内蒙古自治区等区域算力集群的直连基础光传输网络,提高环京地区算力一体化调度能力。
二、提升高质量数据要素供给能力
(四)归集高质量基础训练数据集
组织有关机构整合、清洗中文预训练数据,形成安全合规的开放基础训练数据集;持续扩展多模态数据来源,建设高质量的文字、图片、音频、视频等大模型预训练语料库,支持在依法设立的数据交易机构开展数据流通、交易。
(五)谋划建设数据训练基地
加快建设数据基础制度先行先试示范区,探索打造数据训练基地,推动数据要素高水平开放,提升本市人工智能数据标注库规模和质量。鼓励开展内容信息服务的互联网平台提供高质量语料数据,供创新主体申请使用。探索基于数据贡献、模型应用的商业化场景合作。
(六)搭建数据集精细化标注众包服务平台
以众包服务方式,建设数据集精细化标注平台,开发智能云服务系统,集成相关工具应用。鼓励并组织来自不同学科的专业人员参与标注多模态训练数据及指令数据,提高数据集质量。研究平台激励机制,推动平台持续良性发展。
三、系统构建大模型等通用人工智能技术体系
(七)开展大模型创新算法及关键技术研究
围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。
(八)加强大模型训练数据采集及治理工具研发
围绕训练数据“采、存、管、研、用”等环节,研究互联网数据全量实时更新技术、多源异构数据整合与分类方法,构建数据管理平台相关系统,研发数据清洗、标注、分类、注释及内容审查等算法及工具。
(九)建设大模型评测开放服务平台
鼓励第三方非盈利机构构建多模态多维度的基础模型评测基准及评测方法;研究人工智能辅助的模型评测算法,开发包括通用性、高效性、智能性、鲁棒性在内的多维度基础模型评测工具集;建设大模型评测开放服务平台,建立公平高效的自适应评测体系,根据不同目标和任务,实现大模型自动适配评测。
(十)构建大模型基础软硬件体系
支持研发大模型分布式训练系统,实现训练任务高效自动并行。研发适用于模型训练场景的新一代人工智能编译器,实现算子自动生成和自动优化。推动人工智能训练推理芯片与框架模型的广泛适配,研发人工智能芯片评测系统,实现基础软硬件自动化评测。
(十一)探索通用人工智能新路径
发展面向通用人工智能的基础理论体系,加强人工智能数学机理、自主协同与决策等基础理论研究,探索通用智能体、具身智能和类脑智能等通用人工智能新路径。支持价值与因果驱动的通用智能体研究,打造统一理论框架体系、评级标准及测试平台,研发操作系统和编程语言,推动通用智能体底层技术架构应用。推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。支持探索类脑智能,研究大脑神经元的连接模式、编码机制、信息处理等核心技术,启发新型人工神经网络模型建模和训练方法。
四、推动通用人工智能技术创新场景应用
(十二)推动在政务服务领域示范应用
围绕政务咨询、政策服务、接诉即办、政务办事等工作,利用人工智能在语义理解、自主学习和智能推理等方面的能力优势,提高政务咨询系统智能问答水平,增强“京策”平台规范管理和精准服务能力,辅助市民服务热线高效回应市民诉求,推进政务办事精准指引和高效审批。
(十三)探索在医疗领域示范应用
支持有条件的研究型医疗机构提炼智能导诊、辅助诊断、智能治疗等场景需求,充分挖掘医学文献、医学知识图谱、医学影像、生物学指标等多模态医疗数据,会同人工智能创新主体开发智能应用,实现对症状、体征和专病的精准识别与预测,提升疾病诊断、治疗、预防及全病程管理的智能化水平。
(十四)探索在科学研究领域示范应用
发展科学智能,加速人工智能技术赋能新材料和创新药物领域科学研究。支持能源、材料、生物领域相关实验室设立科研合作专项,与人工智能创新主体开展联合研发,充分挖掘材料、蛋白质和分子药物领域实验数据,研发科学计算模型,开展新型合金材料、蛋白质序列和创新药物化学结构序列预测,缩短科研实验周期。
(十五)推动在金融领域示范应用
系统布局“揭榜挂帅”项目,推动金融机构进一步开放行业应用场景;支持金融科技创新主体聚焦智能风控、智能投顾、智能客服等环节,研发金融专业长文本精准解析建模技术、复杂决策逻辑与模型信息处理融合技术,支撑金融领域投资辅助决策。
(十六)探索在自动驾驶领域示范应用
支持自动驾驶创新主体研发多模态融合感知技术,基于车路协同数据和车辆行驶多传感器融合数据,提高自动驾驶模型多维感知预测性能,有效解决复杂场景长尾问题,辅助提高车载自动驾驶模型泛化能力。支持在北京市高级别自动驾驶示范区3.0项目建设中,开放车路协同自动驾驶数据集。开展基于低时延通讯的云控自动驾驶模型测试,探索自动驾驶新技术路径。
(十七)推动在城市治理领域示范应用
支持人工智能创新主体结合智慧城市建设场景需求,率先在城市大脑建设中应用大模型技术,加快多维感知系统融合处理技术研发,实现智慧城市底层业务的统一感知、关联分析和态势预测,为城市治理决策提供更加综合全面的支撑。
五、探索营造包容审慎的监管环境
(十八)持续推动监管政策和监管流程创新
探索营造稳定包容的监管环境,鼓励创新主体采用安全可信的软件、工具、计算和数据资源,开展人工智能算法、框架等基础技术的自主创新、推广应用、国际合作。争取在中关村国家自主创新示范区核心区先行先试,推动实行包容审慎监管试点。
(十九)建立常态化服务和指导机制
对具有舆论属性或社会动员能力的人工智能相关互联网信息服务,开展常态化联系服务,指导创新主体引入技术工具进行安全检测、按规定申报安全评估、履行算法备案等程序。
(二十)加强网络服务安全防护和个人数据保护
指导创新主体加强网络和数据安全管理,落实网络安全、数据安全和个人信息保护主体责任,强化安全管理制度建设和工作落实。鼓励创新主体开展数据安全管理认证及个人信息保护认证,落实数据跨境传输安全管理制度,全面提升网络安全和数据安全防护能力。
(二十一)持续加强科技伦理治理
加强人工智能伦理安全规范及社会治理实践研究。建设通用人工智能领域科技伦理治理公共服务平台,服务政府监管,促进行业自律。开展科技伦理审查及相关业务培训,强化各责任主体科技伦理规范意识。深入开展科技伦理教育和宣传,构建良好人工智能科技伦理氛围。
2023年5月30日,北京市政府办公厅正式发布《北京市促进通用人工智能创新发展的若干措施》(以下简称《若干措施》)。现就《若干措施》解读如下:
一、出台背景
党的二十大提出,要建设现代化产业体系,推动战略性新兴产业融合集群发展,构建人工智能等一批新的增长引擎。2023年4月28日,中共中央政治局召开会议,指出要重视通用人工智能发展,营造创新生态,重视防范风险。
北京高度关注通用人工智能技术发展,持续支持本市新型研发机构,聚焦大模型、类脑智能、具身智能、价值与因果驱动的通用智能体等方向开展研究,产出悟道大模型、通用智能体平台等多项重大原创成果,具有先发优势。同时,本市集聚了一批人工智能优势创新企业和科研机构,推出紫东太初、文心一言、ChatGLM、CPM、孟子等大模型产品,并具备商业化落地能力。
近期,以ChatGPT、GPT-4为代表的Transformer架构大模型技术,因其强大的内容生成及多轮对话能力,展现出通往通用人工智能的可行路径,引发新一轮的人工智能创新浪潮。为系统推动全市人工智能技术及产业发展,市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》(以下简称《实施方案》),为进一步贯彻落实《实施方案》,聚焦通用人工智能发展,市政府办公厅同步印发《若干措施》。
二、工作思路
充分发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动本市通用人工智能领域实现创新引领和理性健康发展。围绕创新主体共性需求,推动数据、算力等关键创新要素汇聚与开放;引导创新主体加强大模型等通用人工智能技术体系研究,持续探索通用智能体、类脑智能、具身智能等通用人工智能新路径;加大创新应用场景供给,推动通用人工智能在政务、医疗、科学智能、金融、自动驾驶、城市治理等方面示范应用;不断探索监管工具及监管流程的创新,建立常态化服务和指导机制,推动相关评估及备案流程,为通用人工智能的技术发展营造包容审慎监管环境。
三、主要内容
《若干措施》针对提升算力资源统筹供给能力、提升高质量数据要素供给能力、系统构建大模型等通用人工智能技术体系、推动通用人工智能技术创新场景应用、探索营造包容审慎的监管环境五大方向,提出21项具体措施。
一是提升算力资源统筹供给能力。实施算力伙伴计划,与云厂商加强合作,提供多元化优质普惠算力。加快北京人工智能公共算力中心、北京数字经济算力中心等项目建设,形成规模化先进算力供给能力。实现异构算力环境统一管理、统一运营,提高环京地区算力一体化调度能力。
二是提升高质量数据要素供给能力。构建安全合规的开放基础训练数据集,建设高质量的预训练中文语料库。谋划建设数据训练基地,提升数据标注库规模和质量,探索基于数据贡献、模型应用的商业化场景合作。建设数据集精细化标注众包服务平台,鼓励专业人员参与标注,研究平台激励机制。
三是系统构建大模型等通用人工智能技术体系。开展大模型创新算法及关键技术研究,鼓励开源技术生态建设。构建数据管理平台相关系统,研发数据清洗、标注、分类、注释及内容审查等算法及工具。构建多模态多维度的基础模型评测基准及评测方法,建设自动评测开放服务平台。支持研发分布式训练系统、编译器及人工智能芯片自动化评测系统,推动基础软硬件广泛适配。持续探索通用智能体、具身智能和类脑智能等通用人工智能新路径。
四是推动通用人工智能技术创新场景应用。围绕政务咨询、政策服务、接诉即办、政务办事等工作,提升精准服务能力和系统智能化水平。面向智能导诊、辅助诊断、智能治疗等场景需求,开发智能应用,提升诊断、治疗、预防及全病程管理的智能水平。支持科研实验室与人工智能创新主体开展联合研发,加速人工智能技术赋能新材料和创新药物领域科学研究。聚焦智能风控、智能投顾、智能客服等环节,系统布局“揭榜挂帅”项目,推动金融机构开放应用场景。支持研发多模态融合感知技术,开放车路协同自动驾驶数据集,探索自动驾驶新技术路径。支持在城市大脑建设中应用大模型技术,为城市治理决策提供更加综合全面的支撑。
五是探索营造包容审慎的监管环境。鼓励创新主体采用安全可信的工具及资源开展技术创新,推动在中关村国家自主创新示范区核心区实行包容审慎监管试点。建立常态化联系服务指导机制,指导创新主体加强安全检测,履行安全评估及算法备案流程。加强网络和数据安全管理,落实主体责任,强化安全管理制度建设,全面提升网络安全和数据安全防护能力。建设科技伦理治理公共服务平台,开展科技伦理审查及相关业务培训,构建良好人工智能科技伦理氛围。
四、政策亮点
一是直击发展褃节。发展人工智能是我国实现中国式现代化的重大战略。《若干措施》坚决落实国家有关战略部署和《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》重点任务,针对算力、数据、算法、应用、监管等产业发展核心要素及关键环节的难点、堵点,提出具体举措,五个维度协同发力,突破发展瓶颈,推动本市人工智能创新发展。
二是直通未来布局。通用人工智能是目前和未来国际人工智能研究的焦点。《若干措施》体系化布局大模型关键共性技术创新,同时前瞻布局通用智能体、类脑智能、具身智能等其他新路径,通过支持创新主体突破关键“点”、支持领军企业带动产业“链”、建设公共服务平台拓宽服务“面”,三位一体协同布局,推动本市全力构建面向未来的人工智能全栈自主技术体系及产业生态。
三是直面产业关切。市场是推动人工智能产业发展的关键力量。《若干措施》坚持发挥市场机制作用,牢牢把握大模型赋能千行百业的战略机遇,充分结合本市经济社会发展优势特点,引导创新主体在智慧城市、科学研究、智慧医疗等一批重点场景实现人工智能创新应用,加强监管技术和政策创新,为北京人工智能健康发展构建完善的创新生态和发展环境。
来源:AI之势
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com