Features/ArchitectureSupport - changing what we build for
drago01
drago01 at gmail.com
Thu Feb 5 21:30:51 UTC 2009
Here are some numbers(attached) using nbench (run on a core 2 duo
T7400 with 4MB L2 Cache).
To summarize the results:
i686 vs i586 does add +2% performance
going to x86_64 you gain +10 % (or 9.1% from i686)
from -O2 to -O3 there is a 4.9% performance win on x86_64 and 3.7%*
(more than i686 vs i586) on x86.
So instead of changing arch and breaking compatibility we should
switch from -O2 to -O3
* tested with -march=i686 can rerun with -march=i586 if needed.
-Os is also included.
-------------- next part --------------
-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 989.16 : 25.37 : 8.33
STRING SORT : 207.92 : 92.90 : 14.38
BITFIELD : 4.0679e+08 : 69.78 : 14.58
FP EMULATION : 139.88 : 67.12 : 15.49
FOURIER : 21850 : 24.85 : 13.96
ASSIGNMENT : 30.548 : 116.24 : 30.15
IDEA : 6097.6 : 93.26 : 27.69
HUFFMAN : 2000 : 55.46 : 17.71
NEURAL NET : 43.433 : 69.77 : 29.35
LU DECOMPOSITION : 1421.8 : 73.65 : 53.19
MEMORY INDEX : 18.488
INTEGER INDEX : 15.860
FLOATING-POINT INDEX: 27.929
===================================================================
-O3 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 1018.8 : 26.13 : 8.58
STRING SORT : 225.12 : 100.59 : 15.57
BITFIELD : 4.0499e+08 : 69.47 : 14.51
FP EMULATION : 222.44 : 106.74 : 24.63
FOURIER : 21595 : 24.56 : 13.79
ASSIGNMENT : 30.579 : 116.36 : 30.18
IDEA : 6193.5 : 94.73 : 28.13
HUFFMAN : 2147.1 : 59.54 : 19.01
NEURAL NET : 44.529 : 71.53 : 30.09
LU DECOMPOSITION : 1442.2 : 74.71 : 53.95
MEMORY INDEX : 18.963
INTEGER INDEX : 18.335
FLOATING-POINT INDEX: 28.186
===================================================================
-Os -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 1491.1 : 38.24 : 12.56
STRING SORT : 200.4 : 89.54 : 13.86
BITFIELD : 3.4651e+08 : 59.44 : 12.42
FP EMULATION : 107.8 : 51.73 : 11.94
FOURIER : 21731 : 24.71 : 13.88
ASSIGNMENT : 30.247 : 115.10 : 29.85
IDEA : 6184.6 : 94.59 : 28.08
HUFFMAN : 1452.4 : 40.28 : 12.86
NEURAL NET : 42.2 : 67.79 : 28.52
LU DECOMPOSITION : 1439.5 : 74.57 : 53.85
MEMORY INDEX : 17.254
INTEGER INDEX : 15.254
FLOATING-POINT INDEX: 27.727
===================================================================
-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i586 -mtune=generic -fasynchronous-unwind-tables
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 861.96 : 22.11 : 7.26
STRING SORT : 92.362 : 41.27 : 6.39
BITFIELD : 3.9745e+08 : 68.18 : 14.24
FP EMULATION : 98.2 : 47.12 : 10.87
FOURIER : 24238 : 27.57 : 15.48
ASSIGNMENT : 33.719 : 128.31 : 33.28
IDEA : 5912.9 : 90.44 : 26.85
HUFFMAN : 1748.8 : 48.49 : 15.49
NEURAL NET : 36.941 : 59.34 : 24.96
LU DECOMPOSITION : 1438.9 : 74.54 : 53.83
MEMORY INDEX : 14.466
INTEGER INDEX : 13.460
FLOATING-POINT INDEX: 27.502
===================================================================
-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 841.32 : 21.58 : 7.09
STRING SORT : 92.203 : 41.20 : 6.38
BITFIELD : 3.9814e+08 : 68.29 : 14.27
FP EMULATION : 132.28 : 63.47 : 14.65
FOURIER : 24176 : 27.49 : 15.44
ASSIGNMENT : 32.974 : 125.47 : 32.54
IDEA : 5888.2 : 90.06 : 26.74
HUFFMAN : 1822.9 : 50.55 : 16.14
NEURAL NET : 36.991 : 59.42 : 25.00
LU DECOMPOSITION : 1467.8 : 76.04 : 54.91
MEMORY INDEX : 14.359
INTEGER INDEX : 14.548
FLOATING-POINT INDEX: 27.675
===================================================================
-O3 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 903.72 : 23.18 : 7.61
STRING SORT : 93.523 : 41.79 : 6.47
BITFIELD : 3.943e+08 : 67.64 : 14.13
FP EMULATION : 207.8 : 99.71 : 23.01
FOURIER : 24740 : 28.14 : 15.80
ASSIGNMENT : 32.401 : 123.29 : 31.98
IDEA : 5845 : 89.40 : 26.54
HUFFMAN : 1812 : 50.25 : 16.05
NEURAL NET : 37.814 : 60.75 : 25.55
LU DECOMPOSITION : 1447.2 : 74.97 : 54.14
MEMORY INDEX : 14.297
INTEGER INDEX : 16.526
FLOATING-POINT INDEX: 27.961
===================================================================
-Os -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 981 : 25.16 : 8.26
STRING SORT : 91.403 : 40.84 : 6.32
BITFIELD : 3.0512e+08 : 52.34 : 10.93
FP EMULATION : 107.12 : 51.40 : 11.86
FOURIER : 24063 : 27.37 : 15.37
ASSIGNMENT : 32.27 : 122.79 : 31.85
IDEA : 4772.4 : 72.99 : 21.67
HUFFMAN : 1909.3 : 52.95 : 16.91
NEURAL NET : 36.204 : 58.16 : 24.46
LU DECOMPOSITION : 1440.2 : 74.61 : 53.88
MEMORY INDEX : 13.008
INTEGER INDEX : 13.766
FLOATING-POINT INDEX: 27.261
More information about the fedora-devel-list
mailing list