* z" U* z9 I D5 b5.39.217.77因此,綜合來看,Krait系列核心的能耗,恐怕是比較悲觀的, . u/ ^7 u7 e) s公仔箱論壇即APQ8064的執行效率並不如Cortex A9,Krait 400核心雖然經過了兩次升級,公仔箱論壇$ ^$ x& u) i A; e, F6 t |# g 但是考慮到Krait 300的實際表現,我們認為其執行效率至多只能達到略高於A9的水平。0 J4 i. `+ y( y) ?3 T6 j- w 也就是說,Krait 400架構效率上並沒有大幅超越Cortex A9。" E" J/ ^6 | [& |4 u; ]7 t
1 @8 S7 i* E* ^6 u1 m* C: u4 m2 N# t7 R9 P0 J
tvb now,tvbnow,bttvb) K/ F2 Q8 ^+ H) x. o8 @ b
- D1 X. t5 E) U, n3 M
那麼產品效率呢?在這之前筆者需要稍微岔開一些話題。不知道你是否發現, W# g% r4 j* ^6 z' m, W% W5.39.217.77我們在對比效率的時候往往都會和Cortex A9相比,準確來說是和SAMSUNG Exynos 4412相比。 & I0 F1 y0 B% k7 |tvb now,tvbnow,bttvb為何要用它作為基準?這並不是因為偏心或是對於三星有著額外的好感,原因很簡單,4 o! y, y- S: b2 A+ n
那就是根據之前我們對手機極限功耗的定義,在那樣的功耗限制之下, " a, I$ a9 p; s$ C) xExynos 4412是體效值與絕對性能之間最接近的產品:Exynos 4412的核心,公仔箱論壇0 L% f: h2 g% g5 g- h5 l# I: C, X
工作在1.4GHz時單顆功耗約為440mW,1.6GHz約為600mW,總功耗即為1.8W與2.4W。% S% R* ~3 K8 l& R/ n3 v0 Z
因此Exynos 4412是一個極好的標準——如果有產品的效率比4412高, 5 L8 H1 O) B) g. O7 A' o它就可以發揮出比4412更加優越的實際性能,否則就只能在降頻中工作。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。" M( R) c0 J% N$ X6 }
tvb now,tvbnow,bttvb" C1 ]; Z; H5 S/ ]1 W1 k
! q5 {5 d" G; }( }4 G( I& G9 Y
5 e' W! v3 k5 p2 x$ j1 |公仔箱論壇 4 q+ {: b' q/ z8 p, F在驍龍800以外的產品中,高通採用的是28LP SiON/Poly工藝,這會導致漏電增加, # @. b9 X' V4 M6 [) y: u5 v5.39.217.77繼而降低能耗比。在上篇中我們引用外媒Anandtech的結論,( X8 i f3 G1 I* ^2 g7 p4 r 得知28LP工藝的驍龍APQ8064,運行在1.5GHz的頻率下,單個核心的功耗大約是700mW。 0 i0 p) }9 s& k9 K& A公仔箱論壇 : A7 ?* _8 R9 h' T3 y# q- @ % J' g5 _; H$ ]8 R2 F公仔箱論壇& b6 x0 `, m: U5 U3 _/ p3 F
/ G* m0 [. z4 H3 F. A9 v5 g
而到了驍龍800,高通終於引入了先進的HKMG技術,將工藝更換為了28HPM。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。1 o* `% d+ `9 |& Z A9 V
那麼,這個工藝是否能提升驍龍800的能耗比?根據TSMC對於28HPM的工藝描述,5.39.217.773 V: U& l' c, }: ?0 y& D8 d# P9 b) y4 Y: F
我們認為這個答案同樣也許是比較悲觀的,因為28HPM本質上是用來提升性能的工藝,+ c" ?4 w+ a' u2 ~$ d
它的主要目的是讓驍龍800得以運行在使用28LP的驍龍600所無法達到的高頻下,tvb now,tvbnow,bttvb6 \; ?2 K' i. o2 j% s
但是處理器本身的漏電並不會因此而減小。 J$ ]3 m3 [! t: @TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 . ]; X7 F8 e( F* ^5.39.217.77台積電四種28納米工藝的區別 & B1 q! ]% Z2 E8 c; P4 k3 i& ]5.39.217.77 % x6 u7 H+ ]3 l8 v; L公仔箱論壇 " A4 \2 T" S7 `/ X; |2 g8 j0 NTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 7 W2 O# h o7 R, K% ` Ytvb now,tvbnow,bttvb % k3 k# |! S# Y! S2 XTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。我們粗略估計,運行在2.3GHz下的Krait 400核心,即便只考慮頻率的提升,單個核心滿載的功率也將超過1W, 5 n2 l/ o$ h3 Y& g: p四核心的總功耗則會遠超2.5W的散熱功耗上限。至於能耗比,在低頻段,驍龍800的能耗比也許可以略超龍600, 3 }* P* ]6 N: d" M5 t但是總體來說我們並不認為驍龍800在CPU部分的能耗比會大幅領先於Cortex A9, $ @( g |$ f6 ~3 x5 ]也就是說驍龍800的體效值將明顯小於極限性能。5.39.217.77: l# K. z! {" ]% m
公仔箱論壇* c9 P! x% j. w' G
2 K: A$ C8 {% X
公仔箱論壇; J5 O6 c! R! Z ?
5 x$ a9 n5 M" m' Otvb now,tvbnow,bttvb按照我們之前的分析,驍龍800在手機上的長期性能表現就將不會比Cortex A9提升太多 3 U! T* ?6 ?6 `7 N' P' ]tvb now,tvbnow,bttvb(短期性能表現,例如基準測試,會因為設備的熱容以及溫度滯後效應而大幅提升,- O6 A! b" i0 N5 W; Z
但是只要工作足夠長——不超過三分鐘——的時間後,性能將會降低到Cortex A9水平)。tvb now,tvbnow,bttvb) p6 N2 B' h1 b) v. T , l' V2 Z$ E3 }/ K0 h5.39.217.77使用工具監控驍龍APQ8064的CPU頻率變化,運行2分鐘以後,CPU頻率降低到了1GHz以下公仔箱論壇" V/ g* t3 G7 d X4 S; `& x
y! N' k" G. x, i. f蘋果的方案則很難找到對比的標準,但是至少這兩家的行動方向是正確的。 , `) G8 v4 d+ K4 D2 PTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。, n$ x' ~. @. q2 E2 M; j, N
2 j' m+ A2 |" [1 Z
- W; Z$ v0 v6 J* J# M9 l' S! o" `5.39.217.775.39.217.77- k+ M4 d" ]% m, y3 q
, S0 r! ^$ J6 D# o% g公仔箱論壇因此在Cortex A15架構推出3年後的2013年,ARM痛定思痛,給出了自己針對這個問題的答案,那就是Cortex A12。 / @2 V. x3 ~* a; V2 I C! }4 {TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。公仔箱論壇2 X# C2 E% N/ ?7 ^0 c5 x
$ j3 H) X* [4 T Y% o% i5.39.217.77 . Q! S O0 `& d5 c- cTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 $ O4 G7 R' g6 D. `在設計規格上,ARM終於放棄了宏偉龐大的「200%性能提升」, , A+ c8 m" m6 L+ D& \5 w H5 D& `9 Y3 n , o2 S. A0 y [# m7 G. o公仔箱論壇轉而只給Cortex A12定下了比Cortex A9快40%這樣一個目標。這是一個相當現實的目標,TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。' L. N' A/ Y: n. Y9 _" C
9 |* G. b' A- n+ l公仔箱論壇尤其是考慮到Cortex A9的體系架構上的確存在一些過時的限制,讓我們來看Cortex A12是怎麼改的。tvb now,tvbnow,bttvb" S! U" l F" ^
6 {/ C7 K& }- L0 }0 e; J G 4 ~) e- z2 t: i! jtvb now,tvbnow,bttvb 7 Q* c9 f% \4 `2 J- Y公仔箱論壇首先,如同其他的ARMv7架構處理器一樣,Cortex A12提升了二級緩存的性能, 2 m9 Y. j, M* P# @* }TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 5 X$ q8 v; f) ?0 C. F, |" O學習前輩Cortex A15和A7的先進經驗,4 O2 P$ k0 b0 D b& [" q. P. x2 M' C
0 j/ \3 ?5 ~2 I. K6 a
把二級緩存整合進多核心控制器,所有核心終於可以不用再通過一條可憐的64bit總線訪問自己的緩存,TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。' V0 A V0 ` R: d, {+ |
9 u) b) E- E& d" ], B1 ]
這將大大緩解擁堵現象。其次,Cortex A12把NEON和vFP提升到了第四版,tvb now,tvbnow,bttvb( O8 e2 |% L6 T5 _5 K( b
+ W$ b, p: s E9 @/ S
並且和Cortex A15一樣引入了內部OoO(亂序執行)設計,指令執行時效率要比A9高很多。 ; `; u& u) h& U. [TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。# L# N& ], f& T2 C
最後,A12的外部接口也從64bitAMBA 3升級到了128bitAMBA 4,帶寬提升一倍有餘。 # a3 T' h! `0 i- yTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。- O4 E+ G& b8 G, {, w M
- v, y+ b6 F3 n: g2 u , ^3 g( ]% L* \6 |TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。Cortex A12憑什麼降低了功耗?主要是三方面, 4 o# B4 k$ ~ r- etvb now,tvbnow,bttvb. D8 v5 d2 k6 W: z
一方面是最大並發取指數從3降低到2, 0 J$ m- C* ]9 x1 T- j . v& t i9 o0 b" ^ o/ q另一方面是大幅度縮減了指令派發隊列, ( H; G0 W2 V" P) i# i5 {" L ( g& ~9 M5 w( R公仔箱論壇最後一方面是大幅度縮減了運算單元的數量。 ' Z8 F9 R" |' c* i$ Otvb now,tvbnow,bttvb & [' [- c0 l: ~9 Q& Ftvb now,tvbnow,bttvb公仔箱論壇' o" ~, `+ S1 [: n
" C2 d5 U. E6 D
由於指令派發隊列的意義在於可以支撐亂序執行,它所對應的寄存器資源和硬連接資源是非常龐大的, 2 d+ E3 c b# C, ?5 o- a4 ztvb now,tvbnow,bttvb 4 i# ]* i5 @7 f公仔箱論壇Cortex A15為所有8組8個運算單元設計了完整的8個獨立指令隊列,這無疑消耗了巨大的電力,tvb now,tvbnow,bttvb: E, T! J9 i6 {7 ~5 q6 D
公仔箱論壇# Q; u$ F! k( [2 a2 ?
而Cortex A12把這個數字縮減到了3。與此同時,Cortex A12的運算單元也減少到3組6個,TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。6 w$ J# U6 m, d) O
公仔箱論壇2 X% `, Y" E: n; y$ F, U
即整數、存取和FP/NEON,每一組內包含兩個運算單元,共享一個指令隊列。 C0 D. t( w& e( W6 ctvb now,tvbnow,bttvb . p9 c) K& J* z' y* I3 @& Q1 q% L |" m J: g, H8 E: C2 M. ]8 h3 E% W 5.39.217.770 k1 o! H5 y- v6 ^7 n; O
4 y4 j* T B* Z3 M) P7 ~5.39.217.77而Cortex A9就相當寒酸了,只有一個指令隊列,支撐著2個整數ALU、一個存取單元和FP與NEON。 ; A1 B$ r" c2 d$ {* _TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。5.39.217.77- d: E* D* Y5 F1 s" J: s5 l
僅僅依靠這樣的改進,Cortex A12就幾乎可以實現40%的性能提升, ) f: E7 H2 b3 {公仔箱論壇& m7 o4 f3 V# h6 m. h. R
更不要說算上二級緩存、外部總線、以及更為前端的取指與解碼部分——tvb now,tvbnow,bttvb" G& A4 \. B5 C! M
例如數據與指令部分重命名與分派彼此獨立的改進了。 / ?) u3 w" d3 y0 P p- I3 D4 H5.39.217.774 Y& X. |! u2 G+ V* e% o; _
; T6 G( \; S4 @1 p) p/ MTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。: F8 u, [3 C3 p# O& S' z& |
總體來說,Cortex A12是一個與Cortex A9相比性能提升40%、功耗維持不變的架構, 2 t; v7 F$ L4 Q! btvb now,tvbnow,bttvb 4 H5 [) D4 p T3 {7 s; I它單憑一己之力拯救了ARM處理器搖搖欲墜的每瓦特性能,可以說是ARM的救星。 5 l& A' O5 A2 e8 P. e& X$ T; e7 _2 m5.39.217.77 l# t7 G0 g' z) ]* `% ^& z: ~
A12唯一的問題只有一個 ——它最早也要等到2014年中才可能有產品,那時ARM很可能已經被英特爾大卸八塊了。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。5 f8 f8 d2 O" A' W3 F
) S4 V, \' V0 a6 Y( Z6 u6 |; Ztvb now,tvbnow,bttvb9 b Q4 \- q' Z# F5 s, V
5.39.217.77/ R$ e7 c- X' c/ |3 Q( H
如果我們把Cortex A12與高通Krait、蘋果Swift放在一起看,可以發現一些比較有趣的地方。7 P! Z h; P2 I* d4 _
u5 g% _& e5 ^# l4 Z* S# M. q9 c
與ARM不同,高通Krait幾乎保持了Cortex A9的前端設計,唯一的增強是取指部分的並發能力提升到3, . w W* y6 V0 f7 T% v ' [- B b' l6 G9 X0 C+ GTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。後端則和Cortex A15一樣堆積了數量巨大的執行器,具體來說是7個。 2 {& K7 h+ `5 r, K! q8 ^# zTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。% S+ _0 }3 |. x
這樣的架構瓶頸來自於連接前端與後端的中間部分, & o1 |9 I5 {! h& T4 F$ W& E2 t公仔箱論壇 1 a- x5 c* Y, T' v, T" Y$ A公仔箱論壇導致Krait在實際應用中根本無法發揮其 3300DMIPS——只比Cortex A15低5.7%——的理論最高性能。tvb now,tvbnow,bttvb$ J& p2 F0 i7 x
5.39.217.77; ]! n# c6 R/ b( A. y: s
tvb now,tvbnow,bttvb4 n2 ]% m/ e1 X* b
公仔箱論壇& V8 u$ ~5 u9 y" A4 G
至於蘋果Swift,由於缺乏資料與有效的對比方式,在這裡並不能給出太多的分析, 9 h0 ]* B, J% p5.39.217.77 6 O5 e1 x" b8 q, {- x! U5 j- f' N, I$ `TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。但是蘋果的優勢在於硬件與軟件之間可以做到完全的匹配,因此即便蘋果對Cortex A9進行如高通一般的單方面增強, + d: c+ P& d4 H* ]- m( U7 dtvb now,tvbnow,bttvb - ?; _) {4 S4 u, rtvb now,tvbnow,bttvb也可以依靠自身的操作系統進行針對性的優化並將其發揮出來。 $ D9 K/ Y2 a1 T! N- _8 i6 B( ?公仔箱論壇5.39.217.77$ z5 m6 p; {5 F# ~. n! K( c% U
) }* K U0 u: U U3 DTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。如果你希望獲得更強的CPU體驗,那麼你的升級日程完全可以推到2015年。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。0 H- H7 m) p( b/ n4 G: i