在記憶體上運算,以達到最高的輸送量和最低的能耗 (而且不需要晶片外的 DRAM)
純資料流架構,以最佳化資料移動 - 以低延遲 (Batch=1) 和無晶片上網路 (NoC) 的方式進行串流處理,以最大化資料移動的效率並降低 SW 的複雜性
高準確性 - 啟動全部使用 B-float(16 位元); (可選擇 4/8/16 位元權值)
可擴充性 - 多個小型 AI 網路可在單一晶片上執行,大型模型則可在多個晶片上執行,全部使用完全相同的 SW
決定性 - 一致/精確的執行時間;SW 模擬精確匹配 HW 測量 (畫面速率、延遲等) )