人工智能的迅速发展正在深刻改变人类社会生活、改变世界,其技术和应用正经历快速发展的阶段。机器学习是人工智能的核心技术之一,是使计算机具有智能的重要途径,其应用遍及人工智能的各个领域。深度学习是机器学习的一个子集,发源于人工神经网络的研究,通常也称为深度神经网络,是一种基于数据进行表征学习的方法。

近几年来,深度学习作为一种实现人工智能的技术,正经历快速发展的过程。与此同时,国内国际上深度学习算法评估的标准仍属空白,行业发展碎片化,制约着技术的应用,不利于深度学习的应用落地和技术发展。深度学习算法评估的标准化有助于统一对深度学习算法的认识,对于深度学习产业生态发展意义重大。

2018年7月1日,中国首个人工智能深度学习算法标准《人工智能 深度学习算法评估规范》在“中国人工智能开源软件发展联盟”成立大会上正式发布,想了解这个标准的背景及其内涵吗?让我们来一起看一看。

 

【标准由谁编】


《人工智能 深度学习算法评估规范》是联盟理事长单位中国电子技术标准化研究院联合中国科学院软件研究所、上海计算机软件技术开发中心、北京航空航天大学、华东师范大学、中国科学院计算技术研究所、军事科学院国防科技创新研究院、国防科技大学、卡索(北京)科技有限公司、北京百度网讯科技有限公司、浙江蚂蚁小微金融服务集团有限公司、深圳前海微众银行股份有限公司、顺丰科技有限公司、深圳市优必选科技有限公司、北京京东尚科信息技术有限公司、深圳赛西信息技术有限公司、数据地平线(广州)科技有限公司等产学研单位共同编制而成,聚集了产学研各方的需求及智慧。   

 

 

 

 【标准讲什么】


《人工智能 深度学习算法评估规范》标准内容分为八个部分,包括范围、术语和定义、评估指标体系、评估流程、需求阶段的评估、设计阶段的评估、实现阶段的评估、运行阶段的评估、规范性附录A深度学习算法可靠性评估指标选取规则和资料性附录B深度学习算法可靠性评估实施案例。

基于深度学习算法可靠性的内外部影响考虑,结合用户实际的应用场景,标准给出了一套深度学习算法的可靠性评估指标体系,包含7个一级指标和20个二级指标。其中1级指标包括:算法功能实现的正确性、代码实现的正确性、目标函数的影响、训练数据的影响、对抗性样本的影响、软件平台依赖的影响和环境数据的影响。

标准中确定的深度学习算法可靠性评估流程包括确定可靠性目标、选择评估指标、需求阶段的评估、设计阶段的评估、实现阶段的评估、运行阶段的评估及得出评估结论7个活动。

在资料性附录中,分别给出人脸识别算法可靠性评估实施案例和行为检测算法可靠性评估实施案例,为标准的实施提供了参考。

 

【标准解决什么问题】


《人工智能 深度学习算法评估规范》是人工智能领域关于深度学习算法可靠性领域的基础性标准,对推进国内深度学习应用具有重要意义。其目标是发现深度学习算法中影响算法可靠性的因素并给出提高算法可靠性的活动建议,从而缩短深度学习算法的研发周期和提高深度学习算法的可靠性,最终目的是提高基于深度学习算法开发的软件系统的质量。

 

【标准谁来用】


标准适用于面向深度学习算法的开发者和使用深度学习算法实现特定需求的用户方,也适用于对深度学习算法进行可靠性评估的第三方机构。

  

中国科学院软件研究所薛云志研究员标准解读

          人工智能 深度学习算法评估规范