总运算量= 2.8*10^9(参数)* 2 (操作/参数) = 5.6* 10^9 (操作) |
总计算量 = 5.6* 10^9 (操作)* 250 (tokens) = 1.4* 10^{12) (操作) |
每秒计算能力= 60K* 10^6 (FLOPS) = 60* 10^9 (FLOPS) |
计算时间 =总计算量/每秒计算能力= (1.4* 10^12) / (60* 10^9) = 23.33 (秒) |
总数据传输量 = 1.4 GB(模型存储需求) + 8 KB(输入数据存储需求) ≈ 1.4 (GB) |
数据传输时间 = 1.4 (GB)/51.2 (GB/s) ≈ 0.027 (秒) |
总推理时间 ≈ 23.33 (秒) + 0.027 (秒) ≈ 23.357 (秒) |
计算时间 = 总计算量/每秒计算能力= 1.4* 10^12/16* 10^12(秒) = 0.0875 (秒) |
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |