新聞稿

4 分鐘閱讀

在人工智能更新的白皮書中 Tachyum AI (速生人工智能)掌握 FP8以達到 FP32精度

拉斯維加斯2023 年 5月 17 日——Tachyum™ (速生)今天宣布正式 發布了第二版“處於人工智能行業趨勢前沿的 Tachyum Prodigy(速生神童)”白皮書,重點介紹了改進的 8 位浮點 (FP8) 量化感知技術的實施以及實現 32 位浮點的自適應和可學習縮放等更新( FP32) 準確度。

在白皮書中,Tachyum(速生)展示了 FP8 格式在量化深度神經網絡(包括權重、激活和梯度)方面的最優性,利用了浮點數提供比 8 位整數數據類型更好的覆蓋這一事實。結果表明,FP8 量化網絡可以保持與基線 FP32 模型相當的準確度,甚至超過基線 FP32 模型的準確度。

FP8 對於事半功倍至關重要。與 BFLOAT16 等傳統技術相比,它以更低的功耗和芯片面積實現了更高的性能。 FP8 不僅降低了計算成本,還降低了大型且快速增長的 AI (人工智能)模型的內存需求。該白皮書重點介紹了不同模型和數據集的分析和量化誤差,以及 Tachyum(速生)如何在兩倍的性能、能效和帶寬減少方面擴大 FP8 的優勢。

AI(人工智能)推理和生成 AI(人工智能)越來越多地包含在許多軟件應用程序中,使 AI (人工智能)成為數據處理的重要組成部分,並且需要更緊密和更低延遲地集成到軟件中。憑藉能夠執行主流人工智能功能的 FP8,像 Tachyum 這樣的領導者有望幫助加速人工智能硬件技術的快速發展。這將導致 CPU(中央處理器)、HPC(高性能計算)和 AI(人工智能)統一到一個單一的處理引擎中,而不是將不同的芯片集成到一個封裝中,這是一種成本更高且不太令人滿意的解決方案。

Tachyum 創始人兼首席執行官 Radoslav Danilak 博士說:“我們的實驗結果表明,FP8 可以加快訓練速度並降低功耗,而不會降低一系列深度學習模型的準確性。” “這是 Tachyum 想要在流片前實現的最重要的 AI (人工智能)里程碑之一,以確保我們擁有使用稀疏性和超稀疏性主流 AI(人工智能)技術製作 FP8 所需的一切。”

在實現圍繞 FP8 完成基礎設施以實現與 FP32 幾乎相同的訓練和推理精度這一里程碑之後,Tachyum 正在將其工程重點轉移到尚未公佈的 Tachyum AI (TAI) 基礎設施,該基礎設施提供了更高水平的超越 FP8 的人工智能。 TAI 是 Tachyum 當前硬件的一部分,並將在今年晚些時候推出,並結合當今主流 AI (人工智能)應用程序的結果。

Prodigy(神童)提供了一種革命性的新架構,將 CPU、GPGPU 和 TPU 的功能統一到一個芯片中。作為通用處理器,Prodigy(神童)在單一架構中提供雲和 HPC/AI (高性能計算和人工智能)工作負載所需的高性能。由於適用於所有工作負載,Prodigy(神童)支持的數據中心服務器可以在計算域之間無縫動態切換。

通過消除對昂貴的專用 AI (人工智能)硬件的需求並顯著提高服務器利用率,Prodigy(神童)顯著降低了 CAPEX 和 OPEX,同時提供了前所未有的數據中心性能、功率和經濟性。 Prodigy (神童)集成了 128 個高性能定制設計的 64 位計算內核,為雲工作負載提供最高性能 x86 處理器的 4 倍性能,為 HPC(高性能計算)提供最高性能 GPU(圖形處理器)的 3 倍,為 AI(人工智能)應用提供 6 倍的性能.

要了解更多關於 Prodigy(神童)在 AI(人工智能)方面的能力,包括其實施 FP8 的結果,有興趣的人士可以在 https://www.tachyum.com/resources/whitepapers/2023/05/17/tachyum-prodigy-artificial-intelligence-second-edition/ 下載 Tachyum(速生) 的最新白皮書

關注 Tachyum

https://twitter.com/tachyum

https://www.linkedin.com/company/tachyum

https://www.facebook.com/Tachyum/

關于 Tachyum

Tachyum(速生)正在通過其最近推出的旗艦產品改變人工智能、高性能計算、公共和私有云數據中心市場。 Prodigy(神童)是世界上第一款通用處理器,將 CPU、GPU 和 TPU 的功能統一到單個處理器中,為專業和通用計算提供行業領先的性能、成本和能效。當在超大規模數據中心配置 Prodigy(神童)處理器時,它們使所有人工智能、高性能計算和通用應用程序能夠在一個硬件基礎設施上運行,每年為公司節省數十億美元。數據中心目前消耗了全球 4% 以上的電力,預計到 2030 年將達到 10%,超低功耗 Prodigy(神童)通用處理器對於每四年將全球數據中心容量繼續翻一番至關重要。由 Radoslav Danilak 拉多斯拉夫·達尼拉克博士共同創立的 Tachyum(速生)在歐盟基於 Prodigy(神童)處理器構建世界上最快的人工智能超級計算機(128 AI exaflops)。 Tachyum 在美國和斯洛伐克設有辦事處。如需了解更多信息,請訪問 https://www.tachyum.com/