11月29日亚马逊集团旗下亚马逊云服务(AWS)在拉斯维加斯召开的 re:Invent 大会上发布了一款代号为:Inferentia的机器学习专用AI推理芯片,这款芯片预计将于明年上市。
发布会现场
亚马逊云服务的CEO Andy Jassy在发布会表示Inferentia将是一种高吞吐量、低延迟、持续性能极具成本效益的处理器。Inferentia支持流行的框架,如INT8、FP16和混合精度。更重要的是,它支持多种机器学习框架,包括TensorFlow、Caffe2和ONNX。
在本周一,亚马逊云服务就突然发布了首款自研基于Arm架构的云服务器CPU—Graviton,这款云服务器CPU明显直指两家CPU巨头—英特尔和AMD。这款支持AWS的A1EC2实例的多核Arm处理器,性能几乎与AMD的基于Arm的芯片水平并肩。亚马逊AWS自研发Graviton也表示了其并不想在服务器处理上受制于英特尔,英特尔服务器处理器高成本且供应有短缺风险。
亚马逊
可以说Graviton针对的是芯片厂商,而具有学习功能的AI芯片Inferentia针对的就是整个云计算市场的同行,国外的微软、谷歌等,也包括国内的阿里云(阿里今年收购中天微系统有限公司和旗下达摩院自研芯片业务一起合并成芯片公司——平头哥半导体有限公司就能说明阿里也不想受芯片商的制约。)、华为云等。
云计算
估值5000亿美元的智能云计算市场,亚马逊,甲骨文,微软,阿里云,华为云各方云计算巨头都纷纷备战,而AI智能加CPU似乎是前景不错的方向。并且随着巨头自主研发服务器芯片,传统芯片厂商如英特尔,AMD要如何面对,一切值得期待。