T_ZSA 164-2023 人工智能应用创新智能云基础设施技术规范.docx
《T_ZSA 164-2023 人工智能应用创新智能云基础设施技术规范.docx》由会员分享,可在线阅读,更多相关《T_ZSA 164-2023 人工智能应用创新智能云基础设施技术规范.docx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学兔兔标准下载ICS35.240CCSL77团体标准T/ZSA1642023人工智能应用创新智能云基础设施技术规范ArtificialintelligenceapplicationinnovationTechnicalspecificationofintelligentcloudcomputinginfrastructure2023-10-20发布2023-10-21实施中关村标准化协会发布学兔兔标准下载T/ZSA1642023目次前言.II1范围.32规范性引用文件.33术语和定义.34缩略语.55总体技术架构.56技术要求.66.1智能云资源层.76.1.1基础资源整合.76.1.2基础资
2、源服务.86.2智能云中台层.106.2.1部署管理.106.2.2训练管理.106.2.3推理管理.116.2.4数据管理.126.2.5算法管理.136.2.6模型管理.146.2.7开发管理.156.3运营运维管理.166.3.1监控管理.166.3.2告警管理.166.3.3租户管理.176.3.4服务目录管理.176.3.5计量计费管理.176.3.6配额管理.176.4安全能力.176.4.1智能云资源层安全能力.176.4.2智能云中台层安全能力.17I学兔兔标准下载T/ZSA1642023前言本文件按照GB/T1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规
3、定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中关村数智人工智能产业联盟提出并归口。本文件起草单位:赛迪检测认证中心有限公司、中关村数智人工智能产业联盟、中国软件评测中心(工业和信息化部软件与集成电路促进中心)、上海东部科技成果转化有限公司、数动达观(北京)科技有限公司、北京九章云极科技有限公司、济南浪潮数据技术有限公司、优刻得科技股份有限公司、中科软科技股份有限公司、瑞莱信创技术(北京)有限公司、曙光云计算集团有限公司、腾讯云计算(北京)有限责任公司、统信软件技术有限公司、麒麟软件有限公司、北京宝兰德软件股份有限公司、上海泛微网络科技股份有限公司、
4、上海亘岩网络科技有限公司、浪潮电子信息产业股份有限公司。本文件主要起草人:刘云龙、贾昊、邹叔君、李安伦、翟艳芬、蒋宁、方磊、吕广杰、张百林、文天乐、谢宇杰、王洋、袁鹏、于水、么雨田、代威、刘海涛、孟杰、王磊、战茅、李志伟、詹年科、王伟东、刘超、杨国生、张建、谢传宇、李宝然、韩君辉、都静妍、谢姣。II学兔兔标准下载T/ZSA1642023人工智能应用创新智能云基础设施技术规范1范围本文件规定了应用于人工智能领域(以下简称AI)的云基础设施的系统架构及技术要求,包括智能云资源、智能云中台、运营运维管理及安全能力四部分。本文件适用于AI云服务提供商及第三方机构开展业务活动时,为产品及服务的设计、开发
5、、测试、评估、维护及运营等提供参考依据。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB18030信息技术中文编码字符集GB/T202722019信息安全技术操作系统安全技术要求JR/T01662020云计算技术金融应用规范技术架构3术语和定义GB/T352952017界定的以及下列术语和定义适用于本文件。3.1智能云中台artificialintelligencemiddleendbasedcloudcomputing将人工智能领域的技术
6、组件、框架、工具、平台、环境等的公共能力抽取出来,构建成基于云计算技术的可复用的服务,支撑数据服务或者业务逻辑服务的软件系统。3.2推理inference推断从已知前提导出结论的推理方法。注1:在人工智能领域中,前提是事实或规则。注2:术语“推理”既指过程也指结果。来源:GB/T5271.282001,28.03.013.3数据管理datamanagement在数据处理系统中,提供对数据的访问,执行或监视数据的存储,以及控制输入输出操作等功能。来源:GB/T5271.12000,01.08.023.4框架(用于人工智能)frame(inartificialintelligence)一种面向数据
7、的知识表示,与具有一系列特征的某一对象相关联,其中每一个特征都存储在称为“槽”的专用区域内。来源:GB/T5271.282001,28.02.133.53学兔兔标准下载T/ZSA1642023数据集dataset数据记录汇聚的数据形式。注:它可以具有大数据的体量、速度、多样性和易变性特征。数据集的特征表征的是数据本身或静态数据,而数据的特征,当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时,表征的是动态数据。来源:GB/T352952017,2.1.463.6可用区availabilityzone在智能云基础设施中,基于空调、电力设施、主机、网络、存储等物理资源的容灾因素划分出来的
8、物理区域。3.7虚拟机virtualmachine通过各种虚拟化技术,为用户提供的与原有物理服务器相同的操作系统和应用程序运行环境的统称。注:虚拟机通常使用物理服务器的资源,在用户看来它与物理服务器的使用方式完全相同。来源:JR/T01662020,3.223.8容器组pod一个或多个共享存储、网络、命名空间及运行规范的容器组合。3.9访问服务service一组容器及其外部访问入口。3.10机器学习machinelearning从数据中自动分析获得规律,并利用规律对未知数据进行预测的方法。通过获取、重组新知识或技能提升功能单元效能的过程。来源:ISO/IEC2382:2015(en),2123
9、789,有修改3.11深度学习deeplearning通过训练具有许多隐层的神经网络创建丰富层次表示的方法。训练神经网络构建含多个(1)隐藏层的层次化表达的方法。来源:ISO/IEC23053:2020CD,3.13,有修改3.12云原生cloudnative基于分布部署和统一运管的,以容器、微服务等技术为基础建立的一套云技术产品体系。注:云原生具有容器化、模块化、持续交付、弹性分布式等特点。3.13网页集成开发环境WebIDE针对编程开发人员的在线集成开发环境,编程人员无需本地安装开发环境,通过打开浏览器就可以进行开发,并支持断点调试、版本管理、团队开发等能力。4学兔兔标准下载T/ZSA16
10、420233.14隐私保护计算privacy-preservingcomputation隐私计算一类技术方案,在处理和分析计算数据的过程中能保持数据不透明、不泄露、无法被计算方以及其他非授权方获取。来源:联合国隐私保护计算技术手册.大数据联合国全球工作组,2019注:隐私计算是一个技术范畴和集合。可信执行环境、多方安全计算、联邦学习等都属于隐私计算技术。4缩略语下列缩略语适用于本文件。AI:人工智能(ArtificialIntelligence)API:应用程序编程接口(ApplicationProgrammingInterface)ARM:微处理器(AdvancedRISCMachine)A
11、SIC:专用集成电路(ApplicationSpecificIntegratedCircuit)CPU:中央处理器(CentralProcessingUnit)CV:计算机视觉(ComputerVision)DHCP:动态主机配置协议(DynamicHostConfigurationProtocol)DNS:域名系统(DomainNameSystem)GPU:图形处理器(GraphicsProcessingUnit)HBA:主机总线适配器(HostBusAdapter)HCA:主机通道适配器(HostChannelAdapter)HDFS:Hadoop分布式文件系统(HadoopDistrib
12、utedFileSystem)H5:分层数据格式的第5代版本(TheHierarchicalDataFormatVersion5)IaaS:基础设施即服务(InfrastructureasaService)I/O:输入/输出(Input/Output)IP:网际协议(InternetProtocol)JDBC:Java语言连接数据库(JavaDatabaseConnectivity)JSON:JS对象简谱(JavaScriptObjectNotation)MIG:多实例GPU(Multi-InstanceGPU)MIPS:无内部互锁流水级的微处理器(MicroprocessorwithoutI
13、nterlockedPipelineStages)NFS:网络文件系统(NetworkFileSystem)NLP:自然语言处理(NaturalLanguageProcessing)ONNX:开放神经网络交换(OpenNeuralNetworkExchange)PKL:一种由Python的Pickle模块创建的文件格式(Pickle)PMML:预测模型标记语言(PredictiveModelMarkupLanguage)SDK:软件开发工具包(SoftwareDevelopmentKit)SDN:软件定义网络(SoftwareDefinedNetwork)USB:通用串行总线(Universa
14、lSerialBus)VPC:虚拟私有云(VirtualPrivateCloud)VPN:虚拟专用网络(VirtualPrivateNetwork)XML:可扩展标记语言(ExtensibleMarkupLanguage)5总体技术架构5.1如图1所示,“人工智能应用创新智能云基础设施”(以下简称“智能云基础设施”)总体技术架构包括智能云资源和智能云中台两个层次。同时以运营运维管理和安全能力贯穿各个层次。5学兔兔标准下载T/ZSA1642023图1智能云基础设施总体技术架构图5.2智能云资源层由基础资源整合模块、基础资源服务模块组成。该层利用云计算技术,将底层服务器、存储设备、网络设备等基础资
15、源通过调度、抽象、编排、池化等方法进行统一整合管理,生成基础资源服务,支撑上层智能云中台服务。具体如下:a)基础资源整合模块应包括计算资源池、存储资源池、网络资源池。该模块是实现基础硬件设施与设备池化能力的基础,为云服务提供支撑;b)基础资源服务模块应包括云主机服务、备份服务、镜像服务、弹性伸缩服务、裸金属服务、容器服务、存储资源服务、VPC服务、负载均衡服务。该模块将基础资源整合模块的资源池进行服务化抽象,为租户提供以IaaS为核心的云服务。5.3智能云中台层由部署管理模块、训练管理模块、推理管理模块、数据管理模块、算法管理模块、模型管理模块、开发管理模块组成。该层继承智能云资源层云化能力,
16、向上提供AI数据服务和技术服务。具体如下:a)部署管理,应包括算力部署管理、AI运行环境部署管理、云边端统一调度、监控审计;b)训练管理,应包括分布式训练、可视化建模、自动学习;c)推理管理,应包括推理框架、推理部署、任务管理;d)数据管理,应包括数据采集、数据探索、数据预处理、数据标注、数据集管理、特征工程;e)算法管理;f)模型管理,应包括模型定义管理、模型可回溯管理、模型配置项管理、模型分类进退管理、模型校准管理、模型可解释性管理、模型运行条件管理、模型偏差管理、模型全生命周期管理;g)开发管理,应包括集成式开发环境管理、开发环境资源调度、开发方式管理、开发环境管理、开发配置管理、开发任
17、务管理。5.4运营运维管理包括监控管理、告警管理、租户管理、服务目录管理、计量计费管理、配额管理。运营运维管理面向智能云基础设施各层的服务运营及技术运维的需求,提供技术、管理等方面的支撑。5.5安全能力提供智能云基础设施各层的安全防护与安全加固的技术能力,保障智能云基础设施的安全性。6技术要求6学兔兔标准下载T/ZSA16420236.1智能云资源层6.1.1基础资源整合6.1.1.1计算资源池计算资源池主要包括物理资源、虚拟化资源及容器化资源,应统一管理计算资源并提供服务,具体要求如下:a)应至少支持两种国产处理器架构;b)应支持GPU芯片及其虚拟化或容器化;c)应支持不同国产处理器架构的服
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- T_ZSA 164-2023 人工智能应用创新智能云基础设施技术规范 164 2023 人工智能 应用 创新 智能 基础设施 技术规范
限制150内