Performance Information for the MASS Libraries for Linux

Product documentation


Abstract

This document provides performance data for the MASS scalar, SIMD, and vector libraries for Linux, in comparison with the standard system math library.

Content

Performance information for the MASS libraries for Linux


The following tables provide approximate performance data for the MASS scalar, vector, and SIMD libraries running under Linux on various IBM System p® and Power Architecture® machines.

The columns labelled libm and mass list the results obtained with the libm.a system library and the libmass.a MASS scalar library, respectively. This data was obtained by timing many repetitions of a loop over 1000 random arguments and includes all overheads.

The columns labelled massv, vp4, vp5, vp6, or vp7 list the results obtained with the libmassv.a, libmassvp4.a, libmassvp5.a, libmassvp6.a, or libmassvp7.a MASS vector libraries, respectively (or the libraries with _64.a suffix for the 64-bit tables). They give estimates of the number of cycles per evaluation of a vector element. The estimates used vectors of length 1000 so that the caches contain all the vectors.

The columns labelled massS list the results obtained with the libmass_simdp7.a MASS SIMD library. They give estimates of the number of cycles per evaluation of a SIMD vector element.

Although the vector names (e.g. vacos) are used in the Function column, the libm and mass columns refer to the corresponding scalar function (e.g. acos), and the simdp7 columns refer to the corresponding SIMD function (e.g. acosd2).

The timing method used brings the input and output vectors into the on-chip cache (because the loop is short enough for the vectors to fit in the cache). Performance may deteriorate significantly when the input and output vectors are not in the cache. Performance may also deteriorate for arguments at or near the end-points of the valid argument ranges. The libmassvp7.a timings were done with input and output vectors aligned on 16-byte boundaries. Reduced performance may occur for other alignments.

The system library measurements were made with the versions of the library available on the test systems. They may vary from the versions timed for previous versions of MASS. Users may experience performance that differs from that found in these tables.

Results will vary with vector length. Entries in the table where the library function does not exist, or the measurement was not done, are left blank.

The following range keys give the argument ranges over which the performance was measured. The range 0,1, for example, indicates that arguments in the range 0 <= x <= 1 were used. (Note that these are only the ranges over which performance was measured, and not the maximal valid ranges for the functions.)

Range Key for POWER7 tables

A    -100,100
B      -1,1
C       0,100
D       1,100
E     -20,20

Range Key for all but POWER7 tables

 A      0,1
 B     -1,1
 C      0,100
 D   -100,100
 E    -10,10
 F    -20,20
 G      1,100
 H     -1,100
 I      0,10

POWER7 Performance

POWER7 double precision 32-bit functions
Cycles per element (vector length 1000)
                                                libm/   libm/   libm/
Function Range   libm    mass   simdp7   vp7    mass    simdp7   vp7
=====================================================================
   
vacos      B    229.70  107.90  84.31   26.89   2.13    2.72    8.54
vacosh     D    497.33  169.31  90.39   18.07   2.94    5.50    27.52
vasin      B    232.05  111.30  141.46  26.85   2.08    1.64    8.64
vasinh     A    465.39  154.53  121.20  19.96   3.01    3.84    23.32
vatan      A    249.84  95.72           27.53   2.61            9.08
vatan2     A    385.66  116.64  116.46  51.31   3.31    3.31    7.52
vatanh     B    511.57  163.39  103.30  18.11   3.13    4.95    28.25
vcbrt      A    546.11  147.96  82.42   21.47   3.69    6.63    25.44
vcopysign  A    103.74                  62.72                   1.65
vcos       A    303.52  97.18   100.59  16.56   3.12    3.02    18.33
vcosh      A    388.32  97.16   119.15  18.08   4.00    3.26    21.48
vcosisin   A    344.77  79.51           29.07   4.34            11.86
vdint      A                            5.51
vdiv       A                    38.83   7.76
vdnint     A            84.06           5.50
verf       C    96.17   56.47   61.19   17.59   1.70    1.57    5.47
verfc      C    222.81  103.34  115.97  177.97  2.16    1.92    1.25
vexp       A    281.40  75.95   79.69   14.13   3.71    3.53    19.92
vexp2      A    435.14          60.39   10.19           7.21    42.70
vexp2m1    A                    123.98  145.62
vexpm1     A    305.44  79.39   80.86   22.67   3.85    3.78    13.47
vhypot     A    479.10  73.26   51.03   11.51   6.54    9.39    41.62
vlgamma    C    499.85  241.08  172.60  42.54   2.07    2.90    11.75
vlog       C    352.58  133.04  80.38   24.14   2.65    4.39    14.61
vlog10     C    430.19  117.63  80.37   20.99   3.66    5.35    20.49
vlog1p     D    349.82  110.00  144.29  13.90   3.18    2.42    25.17
vlog2      C    262.76          167.80  34.41           1.57    7.64
vlog21p    D                    159.72  13.54
vpow       C    360.11  211.50  240.14  44.31   1.70    1.50    8.13
rint       A            33.40
vqdrt      C                    44.06   29.76
vrcbrt     A                    82.19   19.71
vrec       C                    21.12   5.88
vrqdrt     C                    30.32   8.33
vrsqrt     C            128.43  23.52   6.27
vsin       A    306.79  99.40   106.55  16.25   3.09    2.88    18.88
vsincos    A    612.19  56.88   111.05  25.52   10.76   5.51    23.99
vsinh      A    428.80  88.80   90.57   20.51   4.83    4.73    20.91
vsqrt      C    122.02  36.21   25.29   6.89    3.37    4.82    17.71
vtan       A    433.72  88.56   93.35   33.45   4.90    4.65    12.97
vtanh      E    505.95  101.82  107.61  15.49   4.97    4.70    32.66

POWER7 single precision 32-bit functions
Cycles per element (vector length 1000)
                                                libm/   libm/   libm/
Function Range   libm    mass   simdp7   vp7    mass    simdp7   vp7
=====================================================================
vsacos     B    219.74  75.83   36.10   9.05    2.90    6.09    24.28
vsacosh    D    288.66  123.48  79.53   9.14    2.34    3.63    31.58
anint      A            48.06
vsasin     B    236.47  74.26   36.09   7.79    3.18    6.55    30.36
vsasinh    A    331.80  132.61  55.07   11.10   2.50    6.03    29.89
vsatan     A    185.24  103.16          5.35    1.80            34.62
vsatan2    A    392.28  174.05  58.25   8.57    2.25    6.73    45.77
vsatanh    B    475.76  137.56  46.84   12.37   3.46    10.16   38.46
vscbrt     A    384.89  96.59   40.90   7.15    3.98    9.41    53.83
vscopysign A    109.65                  64.98                   1.69
vscos      A    417.71  93.24   46.70   6.31    4.48    8.94    66.20
vscosh     A    505.05  89.10   37.16   8.87    5.67    13.59   56.94
vscosisin  A                            8.97
vsdiv      A                    37.02   3.76
vserf      C    104.54  49.18   34.02   9.98    2.13    3.07    10.47
vserfc     C    261.04  80.69   69.78   22.03   3.24    3.74    11.85
vsexp      A    438.13  94.64   47.21   7.23    4.63    9.28    60.60
vsexp2     A    432.62          45.29   6.81            9.55    63.53
vsexp2m1   A                    43.27   6.11
vsexpm1    A    254.61  88.75   45.46   6.90    2.87    5.60    36.90
vshypot    A    351.69  61.40   71.45   5.68    5.73    4.92    61.92
vslgamma   C    375.47  239.25  47.39   19.61   1.57    7.92    19.15
vslog      C    223.83  80.71   72.47   7.86    2.77    3.09    28.48
vslog10    C    303.78  80.85   71.36   7.99    3.76    4.26    38.02
vslog1p    D    284.19  102.95  66.61   6.63    2.76    4.27    42.86
vslog2     C    240.40          47.25   7.83            5.09    30.70
vslog21p   D                    43.69   6.30
vspow      C    265.19  173.76  59.46   31.86   1.53    4.46    8.32
rintf      A            52.13
vsqdrt     C                    61.90   4.11
vsrcbrt    A                    36.41   8.00
vsrec      C                    27.74   2.34
vsrqdrt    C                    61.83   3.70
vsrsqrt    C                    30.52   3.21
vssin      A    420.18  98.41   44.31   5.88    4.27    9.48    71.46
vssincos   A    817.84          41.82   26.89           19.56   30.41
vssinh     A    529.18  86.50   74.56   13.49   6.12    7.10    39.23
vssqrt     C    59.23           28.82   3.61            2.06    16.41
vstan      A    537.93  91.66   46.63   14.90   5.87    11.54   36.10
vstanh     E    491.10  84.88   54.36   8.80    5.79    9.03    55.81

POWER7 double precision 64-bit functions
Cycles per element (vector length 1000)
                                                libm/   libm/   libm/
Function Range   libm    mass   simdp7   vp7    mass    simdp7   vp7
=====================================================================
vacos      B    243.03  120.23  88.85   97.09   2.02    2.74    2.50
vacosh     D    544.46  171.58  103.66  41.27   3.17    5.25    13.19
vasin      B    325.23  124.55  145.45  97.34   2.61    2.24    3.34
vasinh     A    529.19  167.69  124.72  61.11   3.16    4.24    8.66
vatan      A    321.67  98.24           99.32   3.27            3.24
vatan2     A    382.80  122.12  118.66  52.35   3.13    3.23    7.31
vatanh     B    523.25  164.21  103.77  49.93   3.19    5.04    10.48
vcbrt      A    458.33  147.00  85.00   21.07   3.12    5.39    21.75
vcopysign  A     73.88                  56.36                   1.31
vcos       A    313.66  101.26  103.53  23.45   3.10    3.03    13.38
vcosh      A    378.23  91.00   98.87   55.33   4.16    3.83    6.84
vcosisin   A    314.22  59.91           69.99   5.24            4.49
vdint      A                            6.19
vdiv       A                    38.12   7.03
vdnint     A            83.39           5.63
verf       C    126.37  59.84   62.50   71.81   2.11    2.02    1.76
verfc      C    267.69  111.88  115.14  171.23  2.39    2.32    1.56
vexp       A    287.21  78.74   86.53   14.14   3.65    3.32    20.31
vexp2      A    418.03          70.39   10.10           5.94    41.39
vexp2m1    A                    157.52  80.63
vexpm1     A    357.45  81.59   86.43   24.12   4.38    4.14    14.82
vhypot     A    469.99  96.15   52.43   21.93   4.89    8.96    21.43
vlgamma    C    521.20  248.43  210.43  186.28  2.10    2.48    2.80
vlog       C    347.40  133.75  90.44   21.00   2.60    3.84    16.54
vlog10     C    480.31  121.78  90.47   20.06   3.94    5.31    23.94
vlog1p     D    270.32  110.25  146.50  50.25   2.45    1.85    5.38
vlog2      C    261.88          149.97  44.66           1.75    5.86
vlog21p    D                    118.51  13.13
vpow       C    678.83  199.11  229.98  83.54   3.41    2.95    8.13
rint       A            46.33
vqdrt      C                    48.16   23.31
vrcbrt     A                    85.37   19.40
vrec       C                    22.45   5.55
vrqdrt     C                    34.55   8.24
vrsqrt     C            127.99  24.49   5.72
vsin       A    313.21  100.44  109.40  23.48   3.12    2.86    13.34
vsincos    A    607.70  58.42   111.43  24.72   10.40   5.45    24.58
vsinh      A    454.94  88.36   96.96   21.17   5.15    4.69    21.49
vsqrt      C    126.34  56.74   27.23   7.43    2.23    4.64    17.00
vtan       A    479.78  93.23   93.74   36.33   5.15    5.12    13.21
vtanh      E    581.17  107.54  122.96  53.87   5.40    4.73    10.79

POWER7 single precision 64-bit functions
Cycles per element (vector length 1000)
                                                libm/   libm/   libm/
Function Range   libm    mass   simdp7   vp7    mass    simdp7   vp7
=====================================================================
vsacos     B    278.53  79.99   36.89   11.72   3.48    7.55    23.77
vsacosh    D    359.95  149.09  83.57   13.24   2.41    4.31    27.19
anint      A            51.12
vsasin     B    300.58  83.91   36.95   12.24   3.58    8.14    24.56
vsasinh    A    384.59  153.72  61.17   17.97   2.50    6.29    21.40
vsatan     A    203.23  107.26          8.49    1.89            23.94
vsatan2    A    398.69  172.17  57.56   10.93   2.32    6.93    36.48
vsatanh    B    533.02  139.04  49.59   16.21   3.83    10.75   32.88
vscbrt     A    449.74  102.27  42.94   8.72    4.40    10.47   51.58
vscopysign A     72.12                  67.50                   1.07
vscos      A    533.45  104.74  45.25   10.01   5.09    11.79   53.29
vscosh     A    529.11  98.22   38.69   12.90   5.39    13.68   41.02
vscosisin  A                            8.73
vsdiv      A                    36.70   3.61
vserf      C    173.48  54.06   32.30   11.31   3.21    5.37    15.34
vserfc     C    321.53  81.59   69.62   44.14   3.94    4.62    7.28
vsexp      A    413.59  96.92   46.64   9.62    4.27    8.87    42.99
vsexp2     A    359.74          46.50   6.73            7.74    53.45
vsexp2m1   A                    42.59   6.18
vsexpm1    A    307.20  95.46   46.19   9.62    3.22    6.65    31.93
vshypot    A    332.26  85.93   68.77   9.59    3.87    4.83    34.65
vslgamma   C    396.64  256.83  49.01   20.07   1.54    8.09    19.76
vslog      C    258.03  83.14   74.93   10.45   3.10    3.44    24.69
vslog10    C    373.18  84.54   75.00   10.45   4.41    4.98    35.71
vslog1p    D    290.77  103.27  72.59   10.40   2.82    4.01    27.96
vslog2     C    280.27          47.81   7.83            5.86    35.79
vslog21p   D                    44.45   6.16
vspow      C    911.91  177.40  58.38   26.09   5.14    15.62   34.95
rintf      A            53.77
vsqdrt     C                    64.70   3.96
vsrcbrt    A                    56.52   8.21
vsrec      C                    33.98   2.30
vsrqdrt    C                    61.14   3.65
vsrsqrt    C                    30.85   3.28
vssin      A    466.62  96.34   43.76   9.34    4.84    10.66   49.96
vssincos   A    971.98          25.80   24.20           37.67   40.16
vssinh     A    572.38  94.55   78.98   16.69   6.05    7.25    34.29
vssqrt     C    64.05           32.55   3.51            1.97    18.25
vstan      A    586.43  105.46  49.01   24.35   5.56    11.97   24.08
vstanh     E    578.99  89.32   54.20   8.62    6.48    10.68   67.17

POWER6 Performance

POWER6 double precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp6    mass   vp6
==================================================
vacos        B  373.18 207.53  71.97   1.80   5.19
vacosh       G  704.63 267.30  63.15   2.64  11.16
vasin        B  378.96 200.73  71.87   1.89   5.27
vasinh       D  616.87 248.12  57.04   2.49  10.81
vatan        B  402.50 131.05          3.07      
vatan        D  414.13 196.26          2.11      
vatan2       D  735.77 188.98  56.98   3.89  12.91
vatanh       B  652.57 259.19  43.99   2.52  14.83
vcbrt        D  574.50 192.25  17.77   2.99  32.33
vcopysign    D   89.31 100.97          0.88      
vcos         B  260.49  87.92  16.64   2.96  15.65
vcos         D  425.32 158.48  16.59   2.68  25.64
vcosh        D  546.12 171.28  21.25   3.19  25.70
vcosisin     B  536.55 204.53  42.47   2.62  12.63
vcosisin     D  868.34 238.54  47.20   3.64  18.40
vdint        D                 27.28              
vdiv         D                  7.53              
vdnint       D   51.28 136.58  19.37   0.38   2.65
verf         C  148.00 102.26          1.45      
verfc        C  323.36 180.58          1.79      
vexp         D  403.54 175.82  16.56   2.30  24.37
vexpm1       D  333.15 158.67  18.50   2.10  18.01
vhypot       D  492.15 152.80          3.22      
vlgamma      H  748.20 397.05          1.88      
vlog         C  553.71 181.63  18.65   3.05  29.69
vlog10       C  728.00 183.88  18.34   3.96  39.69
vlog1p       H  364.31 184.01  29.58   1.98  12.32
vpow         C 1074.27 279.46  53.00   3.84  20.27
vqdrt        C                 16.07              
vrcbrt       D                 24.05              
vrec         D                  7.72              
vrqdrt       C                 14.92              
vrsqrt       C  224.30 172.27  18.00   1.30  12.46
vsin         B  259.42  83.62  16.59   3.10  15.64
vsin         D  420.25 176.84  16.63   2.38  25.27
vsincos      B  493.15 116.62  31.41   4.23  15.70
vsincos      D  819.98 171.72  31.88   4.78  25.72
vsinh        D  518.85 180.29  18.61   2.88  27.88
vsqrt*       C  199.56 167.58  16.89   1.19  11.82
vtan         D  553.85 158.57  35.34   3.49  15.67
vtanh        F  666.80 166.01  33.20   4.02  20.08


*libm routine uses hardware instruction

POWER6 single precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp6    mass   vp6
==================================================
vsacos       B  347.28 158.58  24.68   2.19  14.07
vsacosh      G  506.80 245.61  51.29   2.06   9.88
vsasin       B  343.40 167.63  24.81   2.05  13.84
vsasinh      D  386.83 234.15  44.07   1.65   8.78
vsatan       B  216.83 128.24          1.69      
vsatan       D  220.75 199.39          1.11      
vsatan2      D  537.31 224.04  43.99   2.40  12.21
vsatanh      B  616.98 226.72  38.44   2.72  16.05
vscbrt       D  536.09 184.03  17.10   2.91  31.35
vscopysign   D   89.37  95.51          0.94      
vscos        B  249.83 107.68  16.56   2.32  15.09
vscos        D  469.08 186.15  16.57   2.52  28.31
vscosh       D  639.92 184.06  34.18   3.48  18.72
vscosisin    B                 28.60              
vscosisin    D                 28.98              
vsdiv        D                  6.94              
vserf        C  160.42 113.15          1.42      
vserfc       C  340.02 137.12          2.48      
vsexp        D  515.54 162.62  18.96   3.17  27.19
vsexpm1      D  398.90 165.99  16.50   2.40  24.18
vshypot      D  391.69 136.42          2.87      
vslgamma     H  542.73 372.79          1.46      
vslog        C  349.44 158.39  16.56   2.21  21.10
vslog10      C  480.21 158.39  18.30   3.03  26.24
vslog1p      H  364.55 175.80  22.21   2.07  16.41
vspow        C 1380.10 234.38  28.45   5.89  48.51
vsqdrt       C                 18.66              
vsrcbrt      D                 14.38              
vsrec        D                 12.52              
vsrint       D  115.01  95.59          1.20      
vsrqdrt      C                 18.34              
vsrsqrt      C                 15.69              
vssin        B  214.32 109.47  16.57   1.96  12.93
vssin        D  478.55 177.97  16.58   2.69  28.86
vssincos     B                 30.88              
vssincos     D                 30.02              
vssinh       D  619.45 175.45  21.13   3.53  29.32
vssqrt       C                 18.92              
vstan        D  542.98 204.96  31.98   2.65  16.98
vstanh       F  660.75 158.10  38.12   4.18  17.33

POWER5 Performance

POWER5 double precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp5    mass   vp5
==================================================
vacos        B  234.12 119.10  25.29   1.97   9.26
vacosh       G  466.23 161.11  67.24   2.89   6.93
vasin        B  233.52 116.54  25.33   2.00   9.22
vasinh       D  439.70 154.60  65.05   2.84   6.76
vatan        B  246.21  64.74          3.80      
vatan        D  277.07  98.25          2.82      
vatan2       D  398.95 117.62  34.60   3.39  11.53
vatanh       B  406.95 149.99  59.67   2.71   6.82
vcbrt        D  359.60 120.40  14.03   2.99  25.63
vcopysign    D   68.20  39.69          1.72      
vcos         B  170.87  44.58  13.35   3.83  12.80
vcos         D  279.15  89.49  16.38   3.12  17.04
vcosh        D  328.44  77.03  16.32   4.26  20.12
vcosisin     B  355.20  96.12  34.90   3.70  10.18
vcosisin     D  577.78 139.93  39.32   4.13  14.69
vdint        D                  7.31              
vdiv         D                  6.67              
vdnint       D   66.83  49.87   7.25   1.34   9.22
verf         C   87.06  46.95          1.85      
verfc        C  222.08 101.80          2.18      
vexp         D  249.05  65.34  13.45   3.81  18.52
vexpm1       D  229.27  67.27  16.78   3.41  13.66
vhypot       D  329.97  66.34          4.97      
vlgamma      H  566.02 229.76          2.46      
vlog         C  375.97  99.54  13.29   3.78  28.29
vlog10       C  477.69  94.09  11.70   5.08  40.83
vlog1p       H  249.85  85.60  18.08   2.92  13.82
vpow         C  709.23 172.60  40.64   4.11  17.45
vqdrt        C                 27.17              
vrcbrt       D                 11.47              
vrec         D                  5.97              
vrqdrt       C                 28.38              
vrsqrt       C  105.13  86.80   9.26   1.21  11.35
vsin         B  171.77  40.59  13.28   4.23  12.93
vsin         D  279.96  87.49  16.28   3.20  17.20
vsincos      B  334.37  56.07  22.75   5.96  14.70
vsincos      D  549.12  93.09  24.83   5.90  22.12
vsinh        D  320.72  70.41  16.59   4.56  19.33
vsqrt*       C  103.25  88.33  25.28   1.17   4.08
vtan         D  319.09  87.98  28.12   3.63  11.35
vtanh        F  423.85  89.15  24.31   4.75  17.44


*libm routine uses hardware instruction

POWER5 single precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp5    mass   vp5
==================================================
vsacos       B  216.19  73.93  35.80   2.92   6.04
vsacosh      G  315.31 125.40  49.30   2.51   6.40
vsasin       B  190.54  70.13  35.73   2.72   5.33
vsasinh      D  268.10 140.77  55.59   1.90   4.82
vsatan       B  132.81  56.12          2.37      
vsatan       D  140.50 105.83          1.33      
vsatan2      D  359.30 150.73  31.35   2.38  11.46
vsatanh      B  358.90 146.73  28.07   2.45  12.79
vscbrt       D  294.13  98.42   8.62   2.99  34.12
vscopysign   D   68.99  38.17          1.81      
vscos        B  117.70  39.14  10.63   3.01  11.07
vscos        D  259.93  80.79  13.43   3.22  19.35
vscosh       D  367.50  80.83  37.64   4.55   9.76
vscosisin    B                 29.81              
vscosisin    D                 33.93              
vsdiv        D                  5.51              
vserf        C   87.73  50.35          1.74      
vserfc       C  200.36  71.21          2.81      
vsexp        D  289.32  60.30  12.27   4.80  23.58
vsexpm1      D  241.40  66.31  12.22   3.64  19.75
vshypot      D  201.69  61.59          3.27      
vslgamma     H  353.99 221.93          1.60      
vslog        C  214.34  67.80  11.02   3.16  19.45
vslog10      C  269.85  67.84   8.59   3.98  31.41
vslog1p      H  234.74  73.03  13.87   3.21  16.92
vspow        C  877.95 133.85  26.74   6.56  32.83
vsqdrt       C                  9.04              
vsrcbrt      D                  8.94              
vsrec        D                  3.86              
vsrint       D   58.46  43.27          1.35      
vsrqdrt      C                  9.00              
vsrsqrt      C                  9.23              
vssin        B  104.56  41.15  10.69   2.54   9.78
vssin        D  259.36  79.98  13.45   3.24  19.28
vssincos     B                 25.42              
vssincos     D                 27.88              
vssinh       D  366.04  71.88  20.90   5.09  17.51
vssqrt       C                  6.76              
vstan        D  318.88  88.11  25.64   3.62  12.44
vstanh       F  425.69  70.61  21.13   6.03  20.15


POWER4+ Performance

POWER4+ double precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp4    mass   vp4
==================================================
vacos        B  228.02  96.85  26.35   2.35   8.65
vacosh       G  433.43 124.63  65.39   3.48   6.63
vasin        B  224.88  96.64  26.34   2.33   8.54
vasinh       D  388.37 136.11  63.57   2.85   6.11
vatan        B  214.03  56.92          3.76      
vatan        D  229.16  96.44          2.38      
vatan2       D  344.97 116.71  34.90   2.96   9.88
vatanh       B  399.87 149.94  57.93   2.67   6.90
vcbrt        D  336.59 108.43  12.94   3.10  26.01
vcopysign    D   54.25  35.57          1.53      
vcos         B  137.38  41.13  14.36   3.34   9.57
vcos         D  246.26  75.73  17.28   3.25  14.25
vcosh        D  301.39  61.98  17.08   4.86  17.65
vcosisin     B  282.63  88.87  34.78   3.18   8.13
vcosisin     D  504.25 121.17  38.18   4.16  13.21
vdint        D                  8.18              
vdiv         D                  6.20              
vdnint       D   63.64  38.23   8.21   1.66   7.75
verf         C   84.17  39.07          2.15      
verfc        C  210.38  88.72          2.37      
vexp         D  214.98  61.13  13.12   3.52  16.39
vexpm1       D  207.22  58.09  17.26   3.57  12.01
vhypot       D  306.55  57.37          5.34      
vlgamma      H  487.67 193.46          2.52      
vlog         C  349.99  95.91  13.96   3.65  25.07
vlog10       C  447.80  88.64  11.09   5.05  40.38
vlog1p       H  217.48  83.13  17.93   2.62  12.13
vpow         C  643.13 162.31  39.05   3.96  16.47
vqdrt        C                 25.07              
vrcbrt       D                 10.99              
vrec         D                  5.16              
vrqdrt       C                 27.25              
vrsqrt       C  113.04  88.85   8.22   1.27  13.75
vsin         B  143.06  39.09  14.43   3.66   9.91
vsin         D  244.38  75.01  17.35   3.26  14.09
vsincos      B  265.74  46.80  23.24   5.68  11.43
vsincos      D  488.61  83.97  24.65   5.82  19.82
vsinh        D  297.39  67.58  17.92   4.40  16.60
vsqrt*       C   81.12  86.67   8.58   0.94   9.45
vtan         D  301.51  79.79  24.54   3.78  12.29
vtanh        F  412.54  80.02  24.57   5.16  16.79


*libm routine uses hardware instruction

POWER4+ single precision functions
Cycles per element (vector length 1000)
                                       libm/ libm/
Function  Range  libm   mass    vp4    mass   vp4
==================================================
vsacos       B  221.99  64.15  33.77   3.46   6.57
vsacosh      G  335.14 103.45  47.16   3.24   7.11
vsasin       B  198.60  64.89  33.71   3.06   5.89
vsasinh      D  281.29 122.27  53.13   2.30   5.29
vsatan       B  119.74  50.40          2.38      
vsatan       D  116.04  88.24          1.32      
vsatan2      D  343.67 128.90  30.00   2.67  11.46
vsatanh      B  366.21 125.94  27.02   2.91  13.55
vscbrt       D  308.69  75.99   7.67   4.06  40.25
vscopysign   D   55.76  29.94          1.86      
vscos        B  122.00  36.79  10.81   3.32  11.29
vscos        D  246.06  71.88  13.83   3.42  17.79
vscosh       D  344.81  68.75  33.78   5.02  10.21
vscosisin    B                 28.82              
vscosisin    D                 32.91              
vsdiv        D                 15.01              
vserf        C   83.23  42.18          1.97      
vserfc       C  193.43  59.56          3.25      
vsexp        D  277.96  53.35  13.29   5.21  20.91
vsexpm1      D  229.11  61.52  12.14   3.72  18.87
vshypot      D  216.43  45.68          4.74      
vslgamma     H  330.27 184.29          1.79      
vslog        C  216.90  58.76   7.99   3.69  27.15
vslog10      C  276.23  58.75   7.87   4.70  35.10
vslog1p      H  189.73  71.19  13.24   2.67  14.33
vspow        C  844.60 125.96  24.38   6.71  34.64
vsqdrt       C                  8.02              
vsrcbrt      D                  7.75              
vsrec        D                 13.76              
vsrint       D   54.41  40.00          1.36      
vsrqdrt      C                  7.94              
vsrsqrt      C                  5.58              
vssin        B  109.69  37.72  10.79   2.91  10.17
vssin        D  245.64  71.46  13.82   3.44  17.77
vssincos     B                 21.89              
vssincos     D                 24.69              
vssinh       D  355.71  63.08  19.90   5.64  17.87
vssqrt       C                  5.39              
vstan        D  301.53  79.06  27.05   3.81  11.15
vstanh       F  413.42  62.44  21.64   6.62  19.10


Original publication date

2007/7/20

Rate this page:

(0 users)Average rating

Document information


More support for:

Mathematical Acceleration Subsystem
Libraries

Software version:

6.0

Operating system(s):

Linux

Reference #:

7007063

Modified date:

2010-12-23

Translate my page

Machine Translation

Content navigation