线程计数

在我们到达死亡场景之前,让我们及时退回......

历史倾向于关注添加新的力量,例如水轮和蒸汽发动机,作为工业革命的变革方面。可以说,将货物的生产分成不同的任务,然后在规模中具有专业系统,是实际革命。在纺织工业中,作为山寨行业的早期通道 - 那些可以旋转,编织和缝制的技术人员 - 当任务分开并被新工厂的专家的集合进行了舒适地表现出来。

一般主义者将任务作为一系列,一个接一个:梳理羊毛或棉花,然后将其旋转成一个螺纹,然后编织布管然后制作衣服。工厂有许多工人并行地执行任务,纺纱机的楼层和织机分别在许多螺纹上工作。

这可能并不令人惊讶的是,通过计算开拓者采用这种类比 - 从“60年代”向后,可以调度由计算机执行的谨慎指令的集合开始被称为“线程”。一组可以在一次通过一组任务工作的计算机是“单螺纹”,并且可以处理多个并行处理的任务是“多线程”。

家用电脑 - 新的山寨行业

70年代后期的家庭电脑的出现是依赖于将有用的计算设备的成本降低到它可以适应的点,以便在足够大的社会部分的自由支出范围内。Starting with 8-bit computers like the Apple II or Commodore PET, and progressing through the 16-bit era and into the age of IBM PC compatible dominance in the ‘90s and early 2000s (286, 386, 486 and Pentium processors), personal computing hardware was almost universally single-threaded. Clever programming meant that multi-tasking – or the ability for two or more applications to appear to be running at the same time – existed at the operating system layer. Amiga OS was a particularly early example, and the feature came to the PC with much fanfare in Windows 95. Even when OS-level multi-tasking was in use, under the hood the CPUs were dutifully executing instructions in series on a single thread at any one time. Serial, not parallel.

虽然有一些罕见的个人电脑以前可用的两个或更多CPU,但2002年Pentium IV处理器的出现是广泛的。在带有多个核心的长期CPU之前,虽然可以处理最多两个线程,是常见的。如今,有4,8或16个线程的4-6或8核心CPU是商品产品,“工作站”级CPU可能拥有28个或更多核心。早期电脑年龄的单线式小屋业正在促进CPU内的多线程工厂。

进入第三维度

90年代早期的单线CPU仍然足够强大,以点燃3D革命。敞口技术,伪3D发动机完全在CPU上运行,允许玩家从纳粹射击所有人到侵入火星的恶魔......我确实承诺有死亡。

真正的3D发动机,具有纹理映射,照明效果,透明度,更大的颜色深度和更高的分辨率所需的时间更加同时计算,即当天的CPU可以支持。一种新的专用协同处理器出生 - 3D显卡。

Instead of a second general-purpose CPU that could carry out a range of different types of calculations with high-levels of precision, these new processors were turned to perform the specific types of linear algebra and matrix manipulations for 3D gaming to a ‘good enough’ level of precision. Importantly, these Graphics Processing Units, or GPUs, were made up of multiple individually simple computing cores on a single chip, allowing many lower-precision calculations to be performed in parallel.

不仅仅是一张漂亮的照片

在几年内,GPU彻底改变了PC游戏。1996年,用GPU出售的PC很少见。到1999年,专门的游戏玩家不会考虑没有人的PC。今天,即使是最具业务专注的PC也将运行一个带内置的3D图形加速的CPU,并且游戏玩家将在AMD上的最新图形卡上花费数千张。即使它们经常嵌入CPU内,GPU也是普遍存在的。

即使在今天的多核多线程CPU,GPU可以运行的同时线程的数量也将使CPU可以处理的线程。使用标准PC设置的GPU硬件部分,存在不可避免的项目来解锁该目的的并行计算能力。根据“通用计算单元上的图形处理单元”(GPGPU)的横幅收集,OpenCL等项目允许程序员访问当今GPU的大规模并行架构。

一个特定用例,创造了大量需求并导致GPU短缺是区块链技术 - 特别是工作验证加密挖掘。由于许多加密货币中使用的加密散列函数依赖于线性代数(椭圆曲线)计算,这些计算与基础3D图形,挖掘软件将大多数工作卸载到GPU的基础上。

人工智能 - 超大平行

基于神经网络的任何机器学习系统都需要进行重要的计算资源来运行,仍然更大的资源训练。即使是一个相对简单的神经网络,每个层可能有数百或数千个神经元,以及几层。如果层中的每个神经元必须连接到前一层中的每个神经元,并且对于所有这些连接都具有权重和偏差,则计算的数量需要迅速飙升到荒谬大的数量,并且可以保持该信息所需的存储器。试图运行训练有素的AI可以将一个强大的机器带到其膝盖 - 以及GPU可以同时浅地落入微不足道的线程。如果我们在培训AI所需的附加计算中,则使用诸如BackProjagation的技术优化那些权重和偏置的额外计算,计算任务通常是幅度或更大的阶数。

这一现实是为什么专家AI硬件越来越重要。新的AI聚焦处理器的阶级提供了这种超大的平行化,内置了处理器内置的内存,允许使用较大的数据集更有效地培训模型和运行。在我们的最后一篇文章中,我们提请注意包括GraphCore'智能处理单位'(IPU)的示例。Taking that example again (although other specialist AI hardware is available), when compared to the few tens of threads that a workstation CPU might run, GraphCore’s latest-generation Colossus MK2 IPU can process nine thousand threads in parallel – and with multiple IPUs in each machine, there is simply no comparison to what can be achieved with general purpose hardware.

虽然高端GPU可能有很多核心,但专家AI硬件再次获胜 - 这次是因为内存带宽。图形卡可能为GPU提供单独的存储器,但架构对通过逻辑板连接到GPU的标准内存模块。这限制了信息可以从GPU上的大量计算核心馈入和接收信息的速度。对于3D图形或加密挖掘,这往往不是一个重要的约束,而是用于运行或培训它通常是模型。作为处理器架构的一部分,在每个核心链接到每个核心的硅内存存储避免了这种瓶颈,提高性能,并且如果在单个机器中链接多个专业处理器,则允许更有效的缩放。

即使在专业AI硬件中的所有这些优点,通过稀疏技术减少负载,避免了浪费的计算循环(即,摆脱值为零的冗余计算)产生巨大的差异。如此经常这种情况,具有良好调整软件的高能力硬件的组合是最好的方法。

整合完整性

在技​​术炒作曲线的峰值上,在高度的情况下,跑步和训练最佳机器学习模型的积极部署是许多企业的重要差异。拥有最佳和“最聪明”的机器的竞争压力只会增加。

这些技术平台的巨大潜力可以完全受到差的部署,差的整合和劣质数据的古老挑战(垃圾进入,垃​​圾仍然适用的挑战......)。正如新的企业资源规划(ERP)部署都是2000年代初的所有愤怒,系统集成商都有很大的机会,AI与AI相同。大多数组织在设计,部署和整合这些新的AI平台方面不太可能具有重要内部专业知识 - 在专业知识中购买是前往的方式。

许多与系统集成交易的合同挑战将是熟悉的 - 要求设计,项目时间表和延迟后果,支付触发的里程碑,验收测试和被视为接受。成功的关键将是要交付的目标和结果的清晰度,以及提供给予他们的计划。复杂的事项是AI系统在能够产生结果的范围内,如果没有适当的结构,可以在精度或性能方面是次优的,但是在训练,并调整以避免冗余工作,以避免冗余努力,以避免冗余的努力,以便在准确度或性能方面是“工作”的程度。这些事项对第三方的硬件和相关软件的背景资本支出进行了新的意义,并加强了作为监管要求增加的AI系统运营商的法律责任。我们已经看到了欧盟的拟议AI规则,并且知道合规性负担将是物质,罚款甚至比GDPR细阈值更大。

下一步

我们将讨论这个激动人心的时期在硬件中的含义欧洲技术峰会在我们的“硬件文艺复兴”小组中。要了解更多并注册参加峰会,请访问活动网站。

您可以从DLA Piper团队找到更多关于AI,硬件和博客技术的法金博宝188转账律边缘的相关法律问题的更多信息。

如果您想讨论本文中讨论的任何问题,请与之联系加雷斯斯斯托克斯或者您通常的DLA Pipe金博宝188转账r联系。

作者的观点不一定代表DLA Piper或其客户的视图。金博宝188转账