新闻稿

4 分钟阅读

在人工智能更新的白皮书中 Tachyum AI (速生人工智能)人工智能掌握 FP8以达到 FP32精度

拉斯维加斯2023 年 5月 17 日——Tachyum™ (速生)今天宣布正式发布了第二版“处于人工智能行业趋势前沿的 Tachyum Prodigy(速生神童)”白皮书,重点介绍了改进的 8 位浮点 (FP8) 量化感知技术的实施以及实现 32 位浮点的自适应和可学习缩放等更新( FP32) 准确度。

在白皮书中,Tachyum(速生)展示了 FP8 格式在量化深度神经网络(包括权重、激活和梯度)方面的最优性,利用了浮点数提供比 8 位整数数据类型更好的覆盖这一事实。结果表明,FP8 量化网络可以保持与基线 FP32 模型相当的准确度,甚至超过基线 FP32 模型的准确度。

FP8 对于事半功倍至关重要。与 BFLOAT16 等传统技术相比,它以更低的功耗和芯片面积实现了更高的性能。 FP8 不仅降低了计算成本,还降低了大型且快速增长的 AI (人工智能)模型的内存需求。该白皮书重点介绍了不同模型和数据集的分析和量化误差,以及 Tachyum(速生)如何在两倍的性能、能效和带宽减少方面扩大 FP8 的优势。

AI(人工智能)推理和生成 AI(人工智能)越来越多地包含在许多软件应用程序中,使 AI (人工智能)成为数据处理的重要组成部分,并且需要更紧密和更低延迟地集成到软件中。凭借能够执行主流人工智能功能的 FP8,像 Tachyum 这样的领导者有望帮助加速​​人工智能硬件技术的快速发展。这将导致 CPU(中央处理器)、HPC(高性能计算)和 AI(人工智能)统一到一个单一的处理引擎中,而不是将不同的芯片集成到一个封装中,这是一种成本更高且不太令人满意的解决方案。

Tachyum 创始人兼首席执行官 Radoslav Danilak 博士说: “我们的实验结果表明,FP8 可以加快训练速度并降低功耗,而不会降低一系列深度学习模型的准确性。” “这是 Tachyum 想要在流片前实现的最重要的 AI (人工智能)里程碑之一,以确保我们拥有使用稀疏性和超稀疏性主流 AI(人工智能)技术制作 FP8 所需的一切。”

在实现围绕 FP8 完成基础设施以实现与 FP32 几乎相同的训练和推理精度这一里程碑之后,Tachyum 正在将其工程重点转移到尚未公布的 Tachyum AI (TAI) 基础设施,该基础设施提供了更高水平的超越 FP8 的人工智能。 TAI 是 Tachyum 当前硬件的一部分,并将在今年晚些时候推出,并结合当今主流 AI (人工智能)应用程序的结果。

Prodigy(神童)提供了一种革命性的新架构,将 CPU、GPGPU 和 TPU 的功能统一到一个芯片中。作为通用处理器,Prodigy(神童)在单一架构中提供云和 HPC/AI(高性能计算和人工智能)工作负载所需的高性能。由于适用于所有工作负载,Prodigy(神童)支持的数据中心服务器可以在计算域之间无缝动态切换。

通过消除对昂贵的专用 AI (人工智能)硬件的需求并显着提高服务器利用率,Prodigy(神童)显着降低了 CAPEX 和 OPEX,同时提供了前所未有的数据中心性能、功率和经济性。 Prodigy (神童)集成了 128 个高性能定制设计的 64 位计算内核,为云工作负载提供最高性能 x86 处理器的 4 倍性能,为 HPC(高性能计算)提供最高性能 GPU(图形处理器)的 3 倍,为 AI(人工智能)应用提供 6 倍的性能.

要了解更多关于 Prodigy(神童)在 AI(人工智能)方面的能力,包括其实施 FP8 的结果,有兴趣的人士可以在 https://www.tachyum.com/resources/whitepapers/2023/05/17/tachyum-prodigy-artificial-intelligence-second-edition/ 下载 Tachyum(速生) 的最新白皮书

关注 Tachyum

https://twitter.com/tachyum

https://www.linkedin.com/company/tachyum

https://www.facebook.com/Tachyum/

关于 Tachyum

Tachyum(速生)正在通过其最近推出的旗舰产品改变人工智能、高性能计算、公共和私有云数据中心市场。 Prodigy(神童)是世界上第一款通用处理器,将 CPU、GPU 和 TPU 的功能统一到单个处理器中,为专业和通用计算提供行业领先的性能、成本和能效。当在超大规模数据中心配置 Prodigy(神童)处理器时,它们使所有人工智能、高性能计算和通用应用程序能够在一个硬件基础设施上运行,每年为公司节省数十亿美元。数据中心目前消耗了全球 4% 以上的电力,预计到 2030 年将达到 10%,超低功耗 Prodigy(神童)通用处理器对于每四年将全球数据中心容量继续翻一番至关重要。由 Radoslav Danilak 拉多斯拉夫·达尼拉克博士共同创立的 Tachyum(速生)在欧盟基于 Prodigy(神童)处理器构建世界上最快的人工智能超级计算机(128 AI exaflops)。 Tachyum 在美国和斯洛伐克设有办事处。如需了解更多信息,请访问https://www.tachyum.com/。