スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

无聊地八卦一下

最近被喷到飞起的那个天河一号,这里有这玩艺的具体资料:

http://server.ccw.com.cn/yjzx/htm2009/20091029_829469.shtml

"天河一号的硬件系统包含:计算阵列、加速阵列、服务阵列,以及互连通信子系统、I/O存储子系统和监控诊断子系统等。其计算阵列共有2560个计算结点 ;每个计算结点集成2个Intel CPU,配32GB内存。加速阵列共有2560个结点;每个加速结点含2个AMD GPU、 2GB显存。"

这机器号称的能力是1206TFlops。是怎么来的呢?首先看CPU的部分,它有2560个双路CPU节点。我们拿中科院的深腾7000来比较一下,后者有1140个双路CPU刀片节点。这两者的节点配置应该很相似。深腾的理论能力是100TFlops出头,里面还加上了38个16路CPU的厚节点(大约刀片节点的1/4运算能力)和一组Itanium2胖节点的能力(5T Flops,可以忽略)。所以如果把深腾的集群规模扩大一倍,大约就等于天河的集群部分,运算能力撑死了200TFlops。

那剩下的一千Flops怎么来的呢?这当然就是那5000个AMD(不是ATI,记者同学,ATI已经不存在了)GPU的功劳了。一颗RV770理论上就有1T的FLOPs(单精度),所以5000个的话是5000T Flops(单精度),对RV770,双精度浮点能力大约是单精度的1/4还是1/5,于是正好1000TFlops,完全没作假。

现在的问题是,在GPGPU计算领域,AMD的Brook+远没有NV的CUDA来得普及,而且就算是后者,应用都还是相当有限。所以几乎可以认为,这5000个GPU在很长时间内都会是光耗电不办事的摆设。至于为什么不用NV而用AMD,这里不比较brook+和CUDA的优劣;但请注意一点,NV的半速双精度的GT300还没量产,现有的GPU的双精度能力只有单精度的1/17,而且NV的1T Flops(单精度)的成本和AMD比起来高了一个档次。所以如果用NV的芯片,这机器在纸面上都没办法挤进Top10。这已经是一个足够强的理由了吧。

当然你可以说,也许这机器能促进国内GPGPU计算研究的发展,在Brook+体系上产生一些好的应用出来。问题是……先买硬件然后再研究配套的软件……这种事例……真的有过么?

最后稍微比较一下Roadrunner和这玩艺。Roadrunner的运算能力主要来自于IBM的Cell处理器,就算架构上你可以对power 有这样那样的抱怨,人家至少是个CPU,不是GPU。所以只是因为FLOPs就拿来比较的话,就和把手砍了顶在头顶上然后说“看,我和你一样高”类似的可笑。
スポンサーサイト

主题 : 最新パソコン
分类 : コンピュータ

发表评论(*请使用半角标点符号)

不公开的评论

个人情报

とある姉コン

Author:とある姉コン
轻小说,ACG,IT相关。

本人则是姐控的死宅(啥),专业是物理化学和高性能计算,有悠久历史(从2000年开始算的话)的代码民工,没了。

ココロ
RSS
最新日志
最新评论
分类
検索フォーム
Tag

虚假的完美世界 EP 姐控 网络 真实的悲惨世界 破鞋党 后宫 絶望した! 文学少女 化物語 HTTP代理 MPC-HC Little_Busters! Fate 文学批评的性别观 戦場ヶ原さま大好き 无限循环 学生会 游戏 K-ON 笨蛋测验召唤兽 DNS服务 Galgame创作 RivaTuner 人渣 自爆 Room.No.1301 GPU-Z 4850HD IE8 WPF Rita UAC windows_live CLANNAD Windows_Gadgets 空境 

友情连接
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。