
5月の発表を前に性能・スペック予想をまとめ&考察してみた。
スポンサードリンク
5月7日のイベントでGTX1080のほぼ全ての仕様・スペックが公開されました。
・GTX1080(5月27日発売)&GTX1070(6月10日発売) 情報まとめ
――――――――――――――――――
5月5日追記
GTX1080と思われるグラボのベンチスコアがリークしました。
・NVIDIA 次世代GPU Pascal GTX1080のベンチマークがリーク!!

NVIDIAの次世代GPU Pascalの第一弾となるGP104について、5月6日に一部企業やレビュアー向けに開催される「NVIDIA Editors’ Day 2016」というイベントでアナウンスがあるのではないかとの噂が上がっています。2014年にはGTX980、GTX970が発表される1週間前に「NVIDIA Editors’ Day」が開催されており、似た流れになるのではないかと期待されているようです。
ソース:http://videocardz.com/59459/nvidia-pascal-editors-day-next-week
また本日(30日)掲載された記事によると来週、NVIDIAはGP104についてアナウンスビデオを公開するとの噂もあり、加えて発売は6月になると報じられています。
ソース:http://www.tweaktown.com/news/51921/nvidias-next-gen-video-cards-available-retail-june/index.html
5月4日追記―――――
ティザーサイトっぽいところで発表までのカウントダウン中。
http://orderof10.com/humanityshallbeenlightened

―――――――――――――――
4月も最終日ですし、5月のGP104発表を目前に管理人の独断と偏見込みでGP104(GTX1080)について、まとめ&考察をしてみました。
最初にGP104には3種類のバリエーションがあり、フルスペックの「GP104-400-A1」(GTX1080tiとの見方もあるが当ブログでは以下GTX1080と呼ぶ)とカット版の「GP104-200-A1」と「GP104-150-A1」となっています。(後者2つについてはGTX1070、GTX1070Eと呼ぶことにします)


ソース:https://wccftech.com/nvidia-pascal-gp104-gpu-gddr5x-leak
GP104のうちGTX1070とGTX1070Eの2種はGTX1080を最大性能としてカットする割合次第、つまりNVIDIAの匙加減によるので、考えてもあんまり意味はないと思います。ということでフルスペックのGTX1080がどの程度の性能になるのかに焦点を絞ってここからは予想していきます。
以下、リーク情報主体ですが、比較的信用できそうな情報を順に列挙していこうと思います。
列挙していく内容についてはGPU性能に直結するであろう「GPUコア(CUDAコア数)」「コアクロック」「アーキ・製造プロセス変更」「VRAM」の4項目となります。
・GPUコア(CUDAコア数)について
まず上のGTX1080のダイ画像と同ソースから、GTX1080のダイサイズは320mm^2であるらしいということがわかっています。またGTX980などのGM204が398mm^2(CUDAコア数2000)、GTX980tiなどのGM200が600mm^2(CUDAコア数3000)となっています。

では肝心のGTX1080のCUDAコア数がどの程度か。すでに詳細がある程度公開されているGP100の企業向けモデルTESRA P100はダイサイズ600mm^2程度でCUDAコア数は3584となっています。(コンシューマー向けフルスペックは3840になる見込みです)

転載元:http://www.4gamer.net/games/251/G025177/20160407104/
NVIDIAが「Pascalは前世代の2倍!」と押していたので去年の夏ごろにはGP100のCUDAコア数6000程度になるのでは?との予測がありましたが、TESRA P100のスペックを確認する限りプロセス改良による集積性の改善はさほど大きくないようです。(倍精度の組込みの影響もあると思いますが)
GP100はダイサイズ600mm^2、CUDAコア数3840であることは確定と見て間違いなさそうなので、ダイサイズ比からGTX1080のCUDAコア数を単純換算すると、GTX1080は2048コアになる見込みになります。
海外情報サイトの予想スペックでは2560CUDAコアとの見方が強いですが、すでに詳細のわかっているTESRA P100の仕様から想像するにGTX980tiのCUDAコア数2800はもとより、予想スペックの2560CUDAコアという数字にも疑問符がつきます。倍精度に関わる部分をカットしていたとしても、GTX1080のCUDAコア数は2000~2500程度になるのではないかと予測できます。
加えて言うならGTX780のコア数は2300コア程度となっており、次の世代であるGTX980の2000コアよりも多かったです。プロセスの変更、次世代GPUとはいえ単純にコア数が増えると考えるのは安直過ぎるかなという気もします。
過去の海外情報を洗ってみたらGP104のフルスペックが2560コアであると予想した理由を見つけました。
ソース:http://videocardz.com/58865/nvidia-1st-generation-pascal-speculation
そもそもパスカルのアーキテクチャありきでGP100をフルスペックとしてどうカットするかでコア数を割り出していた模様。要するにPascalは下の画像みたいなアーキだから、GP100から1/3を削ったものがGP104になるんじゃね?→じゃあダイサイズは350~400くらいだろという考え方みたいです。

しかしながら、Kepler(GK110とGK104)、Maxwell(GM200とGM204)の過去2例を見る限り、コア数とダイサイズは綺麗に比の関係になっており、この点は倍精度を備えたKeplerと倍精度をオミットしたMaxwellでも変わらないという結果になっています。

以上を鑑みるにリークしたGP104のダイサイズが正しいと考えれば、GP104のコア数は2500ではなく2000程度である可能性が濃厚だと思います。
・コアクロックについて
CUDAコア数2800の780tiに対して、CUDAコア数2000のGTX980が肉薄するどころか780tiを超える性能を発揮した理由はコアクロックの差でした。GTX780tiのコアクロックは950MHz程度(OCしても1000程度が上限)でしたが、GTX980はOCすれば1400MHz程度とMaxwell世代は当時のGPUとしては破格のコアクロックを誇っていました。CUDAコア数×コアクロックを計算すると、GTX780tiは2660000、GTX980では2800000となり、これがGTX980がCUDAコア数に劣るGTX780tiを打倒した理由になっていました。

転載元:http://www.4gamer.net/games/274/G027467/20140918001/
ではPascal世代とMaxwell世代ではどうなるのかというと、TESRA P100のコアクロックはベースクロック1328MHz、ブーストクロック1480MHzとなっています。この数字をPascal世代GPUのコアクロックの指標とするなら、OCが可能だったとしてもGTX1080のコアクロックはせいぜい1600MHz程度になるのではないかと思います。16nmプロセスへの変更となりますしKeplerからMaxwellのような大幅な動作クロック上昇は難しいと思いますし、むしろP100企業向け宣伝のため性能を上げる必要に迫られて高クロックのチューニングをかなりしている気がしてなりません。
・アーキテクチャ・製造プロセスの変更について
また単精度演算性能を見ても、TESRA M40(1200MHz程度)が7.0 TFROPS、TESRA P100(1480MHz程度)が10.6 TFROPSとなっており、コア数×コアクロックと単精度演算性能の比はほぼほぼ一致しています。


これを見る限りアーキテクチャの変更由来のパフォーマンス向上というのは正直見込めないのではないかなという気がしています。製造プロセス、アーキテクチャの変更によるパフォーマンスの向上が見込めないとなると、この部分についてはあくまでワットパフォーマンスの向上にのみ寄与しているのではないかなと予想します。GTX1080のリファレンス基盤は補助電源8PIN*1で動作するとの噂もあり、消費電力性能については非常に高いと予想されますし。
以上のCUDAコア数とコアクロックの比較から考えると、予想最大値の2500コア、1600MHzとしても、1400MHzの980tiをギリギリ超えるかどうかという計算になります。
・VRAMについて
GTX1080に搭載されるVRAMについては従来同様のGDDR5と改良型のGDDR5X、どちらが採用されるのか憶測が飛び交っている現状です。なおメモリ容量についてはGTX1080は8GBでほぼ確定っぽい。GTX1070も8GB、GTX1070Eについては6GBになるようです。

GM200のTitanXの場合、1500MHzでFireStrikeを回すとグラフィックスコアは21000程度になりますが、さらに定格のメモリクロック7GHz(帯域幅336GB/s)を8GHz(帯域幅380GB/s)にOCすると22200程度までスコアが伸びます。フルHDのFireStrikeですらメモリ帯域がある程度のボトルネックになっていることが確認できます。

またGTX1080に搭載される見込みのGDDR5Xについては次の記事で詳細にまとめられています。
ソース:次世代GPU向けの新メモリ「GDDR5X」は,今までと何が違うのか? 改良点を仕様書から読み解いてみた - 4Gamer.net
GDDR5Xのバンド幅は最大でGDDR5の2倍となる673GB/sになると報じられており、上のメモリクロックOCによる比較から考えると、GDDR5Xを採用することによるパフォーマンスの向上は少なくありません。
とりわけ、すでに第一世代HBMを採用しているFuryXとTitanXのパフォーマンスについてフルHDでの差に比べ、UWQHDや4K解像度などでは(4GBのVRAMで収まるならば)差がかなり小さくなることも確認されており、VRAMの帯域が増すことの高解像度におけるパフォーマンスへの寄与は無視できません。
だだし実際の性能向上についてはコアクロックやCUDAコア数の増加に比べてメモリバス幅の増加はボトルネックの緩和の意味合いが強く、解像度やテクスチャ容量の大きさに依存するので線形的な性能向上が見込めないというのも予測が難しいところです。
しかし一方で、GDDR5Xの量産は7月以降であるとの情報や、GDDR5Xの消費電力はGDDR5の2倍であることを考えると、Paccalアーキテクチャのワッパの向上を相殺する可能性もあります。また冒頭のGTX1080コアのリーク画像がベンダーオリジナル基盤のものらしいという検証もあり、リファレンス基盤でもGTX1080にGDDR5Xを採用してくるのかは未知数です。
あくまで管理人の予想ですが、GTX1080に搭載されるVRAMについては(CUDAコア数とセットで)シナリオは次の2つになると管理人は予想します。
①最大性能を重視してGDDR5XをGTX1080のリファレンス基盤にも採用し、ワッパの向上についてはGTX1070やGTX1070Eとしてコア毎に役割分担をさせる。
→この場合は、2500コア程度になると予想。
②GDDR5XについてはNVIDIAはあくまでGTX1080が対応するという形に留めて、前世代に対するワッパの向上を重視し、GDDR5X採用はベンダーオリジナル基盤のみとなる。
→TESRA P100のダイサイズ、コア数からの単純換算で2000コア程度になると予想。
まとめ
上の内容についてパフォーマンスに最も影響するであろう4項目についてまとめると次のようになります。
CUDAコア数:2000~2500コア程度になる。P100のスペックから考えると2000コア程度が濃厚
コアクロック:せいぜい1400~1600MHzが上限。
製造プロセス・アーキテクチャの変更:性能向上には直接的にあまり寄与せず、ワッパの向上のみ
VRAM:性能向上については未知数。GTX1080がGTX980tiを大きく越えるとしたらこの部分の寄与が最も大きいのではないかと予想。
「2500コアで1500MHz程度、GDDR5Xを搭載する」ならばワッパの向上は微妙になりますが、980tiやTitanXを若干超える性能を発揮するでしょうし、P100スペックからの換算を信用してCUDAコア数が2000コアであると考えると事実上、980ti越えは難しくあえてワッパの向上を妨げるGDDR5Xを採用せずGDDR5を採用して高ワッパモデルとしてリリースし、GDDR5Xはベンダーオリジナルモデルのみとなる。
管理人の勘では、3:7くらいで後者のほうが見込みが強いのではないかなあと思っています。
しかし後者である場合GM200の生産が終了する意味は?という疑問も残ります。P100スペックからの換算も信憑性が少なくないとも思うので非常に悩ましいです。
ただ後者の場合、GDDR5Xをベンダーオリジナルで採用する意味とは……、と残念なことになる可能性も。
ワッパには期待してもいいと思いますが、絶対性能で期待できるかと言うと非常に微妙です。
(GTX1070が980tiを超えることは100%ないと思う。)
あと完全に管理人の妄想ですが、GTX1080は600ドル以下、GTX1070は450ドル以下、GTX1070Eは350ドル以下で販売されるんじゃないかなーと思います。流石にGTX1080がが980tinの649ドルを超えることはないはず。
最後に、みんなの声―――――――――――――――
(転載元:http://anago.2ch.sc/test/read.cgi/jisaku/1460537482/0-)
131 :Socket774:2016/04/22(金) 19:51:28.45 ID:ma2Ra42p.net[1/2]
http://videocardz.com/59238/nvidia-releases-pascal-architecture-whitepaper
http://images.nvidia.com/content/pdf/tesla/whitepaper/pascal-architecture-whitepaper.pdf
NVIDIA Pascal GPU release date: could come on GeForce Graphics Cards in May
発売は5月な
新メモリ搭載のti付は来年な
133 :Socket774:2016/04/22(金) 20:20:31.98 ID:8BswFyc7.net
NVIDIA Pascal GP104 GPU pictured up close
http://videocardz.com/59266/nvidia-pascal-gp104-gpu-pictured-up-close
134 :Socket774:2016/04/22(金) 21:51:55.12 ID:4uT7oD4Z.net
今回のTITANが一枚で4k60fps出るんだろうか
980SLIでウィッチャー3では4K20FPS前後しかでない
135 :Socket774:2016/04/22(金) 22:09:00.44 ID:1ijsfYGk.net
一枚で4K60fpsなんて時代すぐ来るわけないでしょ
136 :Socket774:2016/04/22(金) 22:20:37.12 ID:r1ZoLH66.net[2/2]
>>133
330mm2か
大きくなったね
有り難い事だ
139 :Socket774:2016/04/22(金) 23:44:34.86 ID:KPs4PTez.net
330mm2くらいってことは2560SPはほぼ確定だな
WQHDまでならリファ980Tiをクロックでなんとか上回るってくらいか
4kになったらひっくり返されるって感じで微妙論が巻き起こるかもね
でも最初だからイールドわるくて2048SPでGDDR5つかって1080としておいて
GDDR5Xがある程度供給できるようになって1080Tiとして256SPGDDR5Xってやってくるかも
145 :Socket774:2016/04/23(土) 01:03:16.97 ID:08sMJkvI.net[1/2]
>>139
kepler以降ボトルネックが顕著なのはMEM周りだしなぁ
GK104→GM204では同じ256bitバスでもL2は512kBから2048kBの4倍増がGP100見るに今回は256bitならL2も据え置きっぽいからね
レジスタファイルサイズは増えるけどそれで過去のL2増量分を賄えるかどうか非常に疑問
あ、ちなみにGM200搭載のリッチなカードなんて恐れ多くて持ってないよw
168 :Socket774:2016/04/23(土) 13:23:56.38 ID:AeTtyBBI.net[2/2]
1080は、MicronのGDDR5Xか
https://wccftech.com/nvidia-pascal-gp104-gpu-gddr5x-leak/
182 :Socket774:2016/04/23(土) 16:21:59.33 ID:7B9jN+Hb.net
GDDR5Xは高速化の代償としてTDP食うから良し悪しだぞ
言ってみればバス幅が倍になるのとおなじでhawaiiがとった爆熱手法をまねるに等しい
倍速とまでいかなかったとしても5割増しでもせっかくの省電力バス幅が384bitの電気喰いと化す
それを解決するのが低電圧低クロックでの駆動を実現したHBM
183 :Socket774:2016/04/23(土) 16:22:31.35 ID:g5bG76tk.net
HBMでそんなに差が出るのかね?
FuryX見た感じでは4kにでもしないかぎり大差あるようには見えなかった
202 :Socket774:2016/04/24(日) 08:14:23.45 ID:s0qwW/vv.net[1/2]
最速でベンチ自慢したいやつ以外は輸入でまったり待ったほうが
精神的にいいよね
286 :Socket774:2016/04/29(金) 21:39:18.58 ID:5nBIFjId.net
価格の安さ ポラリス>>>パスカル
性能の高さ パスカル>>>ポラリス
発熱の多さ ポラリス>>>パスカル
こんな感じになるんだろうなぁ
パスカルが高くて買えない層が先行するポラリスのミドルに流れると予想
288 :Socket774:2016/04/29(金) 21:44:44.75 ID:5M41VFmH.net
ポラリスの方は性能上げるよりは価格下げる方に重点置いてる感じだから
当面は綺麗にすみ分けちゃいそうで怖い
290 :Socket774:2016/04/29(金) 22:28:07.55 ID:tpldeXFI.net
新しい製造プロセスはGPUメーカー各社の設計次第でパフォーマンスとコストが大きく変わってくるね
http://pc.watch.impress.co.jp/docs/column/kaigai/20160315_748146.html
ピッチを狭めた配線層を増やせば高いパフォーマンス・電力効率を得られるが、代わりに露光コスト増で歩留まりも低下する
コストを抑えつつ、高い電力
295 :Socket774:2016/04/29(金) 23:37:05.59 ID:Lngj79k4.net[1/2]
330mm2くらいといわれてるGP104と232mm2って言われてるpolarisじゃ性能帯が違うんで直接の比較はむりがあるだろ
性能はGP104が上回ってないとおかしいしな
GP104のあとにかなり遅れてでてくるだろうGP106の競合にさせるはずのコアであってGP104の競合ではない
おそらくはpolaris10の倍の価格になるだろうし
303 :Socket774:2016/04/30(土) 01:37:25.15 ID:4ll8QSuW.net[1/3]
980Tiにちかいってのはかなり誇張したリークだろう
ダイサイズからみて性能としてはtongaを超えるがhawaiiには足りないってくらい
改良いれてクロックが回るようになればhawaiiをこえるか?って感じで980リファは超えても
980Tiどころか980ocにもとどかないって程度だろう
最初のGDDR5版といわれてる1070で980リファをこえて980Tiにはとどかないってくらいにして
1080で980Tiを超えてくるって性能にするだろうから値段としてもpolarisとはランクがちがう
305 :Socket774:2016/04/30(土) 02:04:20.94 ID:LKQGPpF9.net[1/2]
>>303
GTX1070は980TIは超える。
308 :Socket774:2016/04/30(土) 02:27:35.55 ID:4ll8QSuW.net[2/3]
>>305
リファ1070では980Tiは超えないがサードパーティーのocタイプであれば980Tiリファを超えるってくらいと予想してる
309 :Socket774:2016/04/30(土) 04:27:57.57 ID:LKQGPpF9.net[2/2]
>>308
GTX1070は980TIを超える。16nmだろ。
310 :Socket774:2016/04/30(土) 05:39:33.91 ID:bVHB9QVI.net
全然NVの戦略が見えてないな
980Tiは超えない、ちょい手前の性能
1080は980Tiをもちろん超えてくる
両方超えてくるとインパクトが薄れる
311 :Socket774:2016/04/30(土) 06:08:40.58 ID:ZRrWGwAZ.net
970と980では性能差が大してなかったようにx70とx80では性能差はそれほどない
1070が980tiのちょい手前程度だと1080が980tiを超えたとしてもほんの少しで、
それだとインパクトが薄れる以前にインパクト自体ないよ
Pascalは既にMaxwellの時より開発期間が大分長くなってるから、
売れそうにない性能で出してくるとは思えない
今970持ってるユーザーが1070買いたくなるくらいの性能になると思うよ
313 :Socket774:2016/04/30(土) 07:30:00.06 ID:fw4ZQe+G.net
>>311
970のコスパは特例だと思うな。パスカルからは80との差をつけてくると思う。
ポラリスがのコスパが良ければ無理して対抗するだろうから全てはATIの頑張りしだい
314 :Socket774:2016/04/30(土) 08:19:14.11 ID:4ll8QSuW.net[3/3]
多分1080はgddr5x待ちで当分でないよ
メモリ回りの強化で1070とは高負荷での差をつけるってことで差別化を図るつもりじゃないかと思う
ライバルが232mm2しか用意してないなら焦って出す必要もないし
(注:記事内で参考のため記載された商品価格は記事執筆当時のものとなり変動している場合があります)
スポンサードリンク
非対称になるので考えづらいですが、もしGPCが3基になった場合は1920コアになります。2基の場合は1280コアとなり、これがGP106のフルスペック版になるとされています。