Features/ArchitectureSupport - changing what we build for

drago01 drago01 at gmail.com
Thu Feb 5 21:30:51 UTC 2009


Here are some numbers(attached) using nbench (run on a core 2 duo
T7400 with 4MB L2 Cache).

To summarize the results:

i686 vs i586 does add +2% performance
going to x86_64 you gain +10 % (or 9.1% from i686)

from -O2 to -O3 there is a 4.9% performance win on x86_64 and 3.7%*
(more than i686 vs i586) on x86.

So instead of changing arch and breaking compatibility we should
switch from -O2 to -O3

* tested with -march=i686 can rerun with -march=i586 if needed.

-Os is also included.
-------------- next part --------------
-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          989.16  :      25.37  :       8.33
STRING SORT         :          207.92  :      92.90  :      14.38
BITFIELD            :      4.0679e+08  :      69.78  :      14.58
FP EMULATION        :          139.88  :      67.12  :      15.49
FOURIER             :           21850  :      24.85  :      13.96
ASSIGNMENT          :          30.548  :     116.24  :      30.15
IDEA                :          6097.6  :      93.26  :      27.69
HUFFMAN             :            2000  :      55.46  :      17.71
NEURAL NET          :          43.433  :      69.77  :      29.35
LU DECOMPOSITION    :          1421.8  :      73.65  :      53.19


MEMORY INDEX        : 18.488
INTEGER INDEX       : 15.860
FLOATING-POINT INDEX: 27.929

===================================================================

-O3 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1018.8  :      26.13  :       8.58
STRING SORT         :          225.12  :     100.59  :      15.57
BITFIELD            :      4.0499e+08  :      69.47  :      14.51
FP EMULATION        :          222.44  :     106.74  :      24.63
FOURIER             :           21595  :      24.56  :      13.79
ASSIGNMENT          :          30.579  :     116.36  :      30.18
IDEA                :          6193.5  :      94.73  :      28.13
HUFFMAN             :          2147.1  :      59.54  :      19.01
NEURAL NET          :          44.529  :      71.53  :      30.09
LU DECOMPOSITION    :          1442.2  :      74.71  :      53.95

MEMORY INDEX        : 18.963
INTEGER INDEX       : 18.335
FLOATING-POINT INDEX: 28.186

===================================================================

-Os -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1491.1  :      38.24  :      12.56
STRING SORT         :           200.4  :      89.54  :      13.86
BITFIELD            :      3.4651e+08  :      59.44  :      12.42
FP EMULATION        :           107.8  :      51.73  :      11.94
FOURIER             :           21731  :      24.71  :      13.88
ASSIGNMENT          :          30.247  :     115.10  :      29.85
IDEA                :          6184.6  :      94.59  :      28.08
HUFFMAN             :          1452.4  :      40.28  :      12.86
NEURAL NET          :            42.2  :      67.79  :      28.52
LU DECOMPOSITION    :          1439.5  :      74.57  :      53.85

MEMORY INDEX        : 17.254
INTEGER INDEX       : 15.254
FLOATING-POINT INDEX: 27.727

===================================================================

-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i586 -mtune=generic -fasynchronous-unwind-tables

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          861.96  :      22.11  :       7.26
STRING SORT         :          92.362  :      41.27  :       6.39
BITFIELD            :      3.9745e+08  :      68.18  :      14.24
FP EMULATION        :            98.2  :      47.12  :      10.87
FOURIER             :           24238  :      27.57  :      15.48
ASSIGNMENT          :          33.719  :     128.31  :      33.28
IDEA                :          5912.9  :      90.44  :      26.85
HUFFMAN             :          1748.8  :      48.49  :      15.49
NEURAL NET          :          36.941  :      59.34  :      24.96
LU DECOMPOSITION    :          1438.9  :      74.54  :      53.83

MEMORY INDEX        : 14.466
INTEGER INDEX       : 13.460
FLOATING-POINT INDEX: 27.502

===================================================================

-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          841.32  :      21.58  :       7.09
STRING SORT         :          92.203  :      41.20  :       6.38
BITFIELD            :      3.9814e+08  :      68.29  :      14.27
FP EMULATION        :          132.28  :      63.47  :      14.65
FOURIER             :           24176  :      27.49  :      15.44
ASSIGNMENT          :          32.974  :     125.47  :      32.54
IDEA                :          5888.2  :      90.06  :      26.74
HUFFMAN             :          1822.9  :      50.55  :      16.14
NEURAL NET          :          36.991  :      59.42  :      25.00
LU DECOMPOSITION    :          1467.8  :      76.04  :      54.91

MEMORY INDEX        : 14.359
INTEGER INDEX       : 14.548
FLOATING-POINT INDEX: 27.675

===================================================================

-O3 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          903.72  :      23.18  :       7.61
STRING SORT         :          93.523  :      41.79  :       6.47
BITFIELD            :       3.943e+08  :      67.64  :      14.13
FP EMULATION        :           207.8  :      99.71  :      23.01
FOURIER             :           24740  :      28.14  :      15.80
ASSIGNMENT          :          32.401  :     123.29  :      31.98
IDEA                :            5845  :      89.40  :      26.54
HUFFMAN             :            1812  :      50.25  :      16.05
NEURAL NET          :          37.814  :      60.75  :      25.55
LU DECOMPOSITION    :          1447.2  :      74.97  :      54.14

MEMORY INDEX        : 14.297
INTEGER INDEX       : 16.526
FLOATING-POINT INDEX: 27.961

===================================================================

-Os -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m32 -march=i686 -mtune=generic -fasynchronous-unwind-tables

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :             981  :      25.16  :       8.26
STRING SORT         :          91.403  :      40.84  :       6.32
BITFIELD            :      3.0512e+08  :      52.34  :      10.93
FP EMULATION        :          107.12  :      51.40  :      11.86
FOURIER             :           24063  :      27.37  :      15.37
ASSIGNMENT          :           32.27  :     122.79  :      31.85
IDEA                :          4772.4  :      72.99  :      21.67
HUFFMAN             :          1909.3  :      52.95  :      16.91
NEURAL NET          :          36.204  :      58.16  :      24.46
LU DECOMPOSITION    :          1440.2  :      74.61  :      53.88

MEMORY INDEX        : 13.008
INTEGER INDEX       : 13.766
FLOATING-POINT INDEX: 27.261



More information about the fedora-devel-list mailing list