欢迎访问ic37.com |
会员登录 免费注册
发布采购

算法框架是AI芯片与商业应用之间的重要桥梁

日期:2022-6-20 (来源:互联网)

后来有了PyTorch和TensorFlow,开发基于深度学习的算法更方便。然后得到一个高质量的Spec优化列表,从算法模型优先级评估模型卷积输入配置频率,获得模型重要性和卷积输入配置频率加权分数,然后获得高质量的Spec优化列表,芯片制造商可以参考优化列表进行有针对性的优化。

近年来,包括自动驾驶、智慧城市、教育、医疗、金融等在内的AI模型应用场景迅速扩展,行业多样性和应用场景分散,使得AI模型爆炸式增长。

前几天在一个论坛上,商汤科技联合创始人兼大型设备首席科学家林大华表示,商汤科技每年要生产上万个AI模型,但模型丰富,算子的长尾效应也很明显。虽然10%的经典算子占据了90%的AI芯片算力,但90%的长尾算子占据了大量的计算时间。

多样化的应用催生了支持应用的各种算法框架,而算法框架是利用算法解决实际问题,帮助人工智能芯片体现计算能力价值,作为人工智能芯片与应用之间的桥梁。

例如,算法是实际解决数学问题的公式实现,如LR、GBDT、DNN、DeepFM。算法框架可以使算法执行更有效率。例如,第一个玩深度学习的人使用Theano,基于Theano去开发算法很困难,后来有了PyTorch和TensorFlow,开发基于深度学习的算法更方便。

目前,算法框架已经非常丰富,包括PyTorch、TensorFlow,还有商汤科技开源的Sense Parrots,华为开源的昇思MindSpore,百度飞桨PaddlePaddle等。

事实上,算法工程师基于算法框架开发人工智能算法,即深度学习框架连接硬件芯片计算能力和上述人工智能算法应用。然而,人工智能培训框架逐渐丰富,但没有形成统一的AD7224KN芯片接口,这使得人工智能培训芯片逐个适应框架的成本很高,这也阻碍了人工智能芯片在市场应用中的快速迭代。

因此,商汤科技希望在开源开放的算法体系的基础上,构建一个统一的接口,让大家一起工作。在软件层面,一些标准算法被分解在算法的结构中,表明哪些算法在哪些应用场景中最重要,这样每个人都可以将有限的自适应资源放在更有用的地方。

商汤给出的软件解决方案包括算法分级系统和标准算子接口系统。据林大华介绍,算法分级系统首先从影响力、性能、部署特征三个维度进行分级,即算法模型在学术界和工业界的影响,算法模型的准确性和速度,以及算法模型的部署友好性,从而对AI算法进行分级,从而提供方向性的应用参考。

然后是卷积输入分配频率统计。在实际训练中,每个算法模型都有不同的卷积输入参数分配,不同参数分配的卷积算子的使用频率也有很大的差异。

然后得到一个高质量的Spec优化列表,从算法模型优先级评估+模型卷积输入配置频率,获得模型重要性和卷积输入配置频率加权分数,然后获得高质量的Spec优化列表,芯片制造商可以参考优化列表进行有针对性的优化。

简而言之,基于算法分级系统的算子优化方法可以帮助挖掘高优化的Spec,确认常用的卷积输入配置优化优先级,提高芯片厂商的适效。

长尾算子在实际应用中所占比例很高,但不在标准算法库中,因此需要建立标准算子接口,以提高芯片和框架的适配度。

标准算子接口系统,包括统一的算子接口、函数签名和一致性测试套件。其主要特点是不依赖于特定的框架和芯片,逻辑简单,易于阅读。易于扩展,与标准接口定义一致,可移植性强,适用性强,错误处理机制一致,支持主流开发框架和应用模型。

传统的芯片和框架适应过程存在这样的问题:1、厂家合作前沟通成本高;2、适应工作量困难,风险难以控制;3、适应案例和经验很难在其他芯片和框架适应场景中重复使用。芯片和框架适应过程接入标准算子接口系统有几个优点:1、制造商在合作前没有额外的通信成本;2、工作量小,难度低,风险可控;3、主流芯片一次接入即可完成支持、框架适应场景。

总的来说,近年来,人工智能行业在芯片计算能力、算法、框架和应用方面取得了很大进展。然而,如果人工智能行业想要长期健康发展,它仍然需要上下游的机构。制造商共同努力建立一个繁荣的生态系统。中间算法框架对连接底层芯片和上层业务负有重要责任。