百万个冷知识百万个冷知识

百万个冷知识
一起学习百万个冷知识

定制芯片行列“新人”:Facebook 自研机器学习芯片,用于内容推荐及视频转码(芯片设计定制保证金需要多少)

近几年,不少科技子公司已经开始独立自主研制计算机晶片,意在节约伺服器成本,并提升机器学习数学模型的处理和体能训练工作效率。据介绍,Facebook 也加入了这一战团,并已经已经开始为其网络系统独立自主合作开发两套订制晶片。

其中, 两个晶片CPU用作强化音频音频文件,或进一步提升其使用者观赏音频的新体验;而另两个晶片CPU将用作文本所推荐等机器学习任务。

如此一来,Facebook 将逐渐增加奥波切茨晶片生产商的倚赖,比如说AMD、英特尔和N43EI241SN等;另一方面,由于Facebook 网络系统的碳足迹处于不断增长的趋势,转为订制晶片可以有效帮助其增加碳足迹。

此外,Facebook 并不急于让暗鞘晶片完全替代原先的晶片CPU ,新晶片将与现阶段已经已经开始采用的服务器端CPU一起运行。

订制晶片并并非两个新公理,比如说,自 2016 年年来,Google始终拥有用作机器学习的 TPU (Tensor Processing Unit)订制晶片。该晶片已经已经开始为 Google 的许多应用流程提供更多全力支持,包括用作提升搜寻结果和全景关联性的人工智慧系统 RankBrain ,进一步提升了Google世界地图导航系统的准确度和质量。

值得一提,在与中国围棋全国冠军柯洁的对局中,由 TPU 提供更多全力支持的Google DeepMind AI 流程以 4-1 的大比分获得胜利。

(来源:YouTube 音频截屏)

2020 年 12 月,据彭博社报道,Google也在为其 Surface 电子设备和云基础建设合作开发内部的 ARM 晶片CPU,并已经开始暗鞘用作网络系统的晶片。

始终年来,Google的 Azure 云服务都是采用AMD的CPU来驱动力。虽然 Surface 电子设备在 PC 市场上所占的交易额相对较细,但Google已经开始暗鞘晶片的这一行径仍对AMD造成一定压制,以致其股价在该日收盘前下跌约 6.3%。

Facebook 表示,他们始终在与晶片合作方共同积极探索提升计算操控性和节能水平的方法。关于未来的计划,现阶段尚未有更多可公布的新接收者。

实际上,对 Facebook 来说,跨足订制晶片并并非一件容易的事,不过此前该子公司已经进入半订制晶片领域。

(来源:Pixabay)

2019 年, Facebook 宣布已经已经开始合作开发一种用作音频音频文件和推理工作的专用集成电路(ASIC)。

据了解,Facebook 每月需为超过 27 亿使用者提供更多应用和服务。为全力支持如此庞大的使用者量,该子公司设计并构建了先进且高效的系统来扩展其基础建设。

然而,随着工作负载的增长,仅由传统的通用处理器为使用者提供更多服务已远远不够。在 Facebook 看来,或许只有合作开发新的专用加速器和整体系统级解决方案,才能进一步提升系统的操控性、功率和工作效率。

因此,Facebook 与他子公司合作合作开发了分别面向 AI 推理强化、AI 数学模型培训和音频音频文件的解决方案。

2019 年 3 月 14 日,Facebook 宣布推出用作AI 数学模型培训的 “Zion” 平台、用作 AI 推理强化的专用集成电路 “Kings Canyon” 以及用作音频音频文件的 “Mount Shasta”。

其中,作为 Facebook 的下一代体能训练硬件平台,“Zion” 平台具有强大的计算能力。在进行 AI 数学模型培训的过程中,不仅能够有效处理 CNN、LSTM 和 SparseNN 等一系列神经网络,而且可提供更多高内存容量、高带宽以及灵活的高速互连,以全力支持 Facebook 的关键工作负载。

需要注意的是,在 Facebook 体能训练工作负载增加的同时,其推理工作负载也在不断增加。而 Facebook 当前采用的标准 CPU 伺服器由于很难继续扩展,因此并不能跟上AI 推理强化的进程。基于此,Facebook 与多个合作方合作合作开发了可在其基础建设中部署和扩展的推理 ASIC。

据了解,该推理 ASIC 拥有四个主要组成部分,分别为国王峡谷推理 M.2 模块、双湖单路伺服器、Glacier Point v2 载卡、优胜美地 v2 机箱。这些组成部分利用已经发布到 OCP(Open Compute Project,开放计算项目) 的现有构建块,加快了合作开发时间且依靠其通用性降低了风险。

图 | Facebook 用作AI 推理解决方案的构建块(来源:Facebook)

据统计,Facebook 的平均直播数量每年都在翻倍增长。尤其自 2018 年 8 月在全球推出年来,Facebook Watch 服务的月观众人数已超过 4 亿,每天约有 7500 万人采用。

针对观众不同的可用互联网连接,Facebook 生成了多种输出质量和分辨率(或比特率)来强化音频观赏,这一过程称为音频文件。要完成此音频文件过程需要大量密集型的计算,而通用 CPU 的工作效率远远不及 Facebook 音频扩展基础建设的增长速率。

因此,Facebook 与晶片供应商 Broadcom 和 Verisilicon 合作设计了针对音频文件工作负载进行强化的订制 ASIC。这其中包含用作音频文件工作流程每个阶段的专用晶片,能够全力支持分布在不同网络系统位置的异构硬件电子设备,平衡音频音频文件的工作负载。

暗鞘晶片的势头正逐渐扩大,整个科技行业的晶片布局是否会因此发生变化?现阶段仍需继续观望。

未经允许不得转载:百万个冷知识 » 定制芯片行列“新人”:Facebook 自研机器学习芯片,用于内容推荐及视频转码(芯片设计定制保证金需要多少)
分享到: 更多 (0)

百万个冷知识 带给你想要内容

联系我们