C，Java和Python之間的性能比較

作者：聞數(shù)起舞 2020-07-27 08:24:42

在過(guò)去的兩年中，我為C語(yǔ)言做了大量的實(shí)現(xiàn)工作。我之所以選擇C語(yǔ)言而不是其他語(yǔ)言，是因?yàn)槿藗兤毡檎J(rèn)為C代碼比其他流行的編程語(yǔ)言(例如Java和Python)運(yùn)行得更快。

這是我用所有三種語(yǔ)言運(yùn)行矩陣乘法時(shí)發(fā)生的情況

在過(guò)去的兩年中，我為C語(yǔ)言做了大量的實(shí)現(xiàn)工作。我之所以選擇C語(yǔ)言而不是其他語(yǔ)言，是因?yàn)槿藗兤毡檎J(rèn)為C代碼比其他流行的編程語(yǔ)言(例如Java和Python)運(yùn)行得更快。但是，即使我一直對(duì)C的速度(或C實(shí)際上最快)感到好奇，我自己也沒(méi)有做任何實(shí)驗(yàn)來(lái)證實(shí)這一說(shuō)法。最后，我決定進(jìn)行一些實(shí)驗(yàn)，以比較C，Java和Python的性能。本文是關(guān)于我進(jìn)行的實(shí)驗(yàn)和獲得的結(jié)果的文章。

本實(shí)驗(yàn)

我決定使用所有三種語(yǔ)言進(jìn)行矩陣乘法。矩陣的大小為2048 x 2048(即每個(gè)矩陣的乘法和加法運(yùn)算為8,589,934,592)，我為它們填充了0.0到1.0之間的隨機(jī)值(使用隨機(jī)值而不是對(duì)所有三種語(yǔ)言使用完全相同的矩陣的影響可以忽略不計(jì))。我將每個(gè)實(shí)驗(yàn)運(yùn)行了五次，并計(jì)算了平均運(yùn)行時(shí)間。

C代碼

#include <stdlib.h> 
#include <stdio.h> 
#include <time.h> 
 
#define n 2048 
 
double A[n][n]; 
double B[n][n]; 
double C[n][n]; 
 
int main() { 
 
    //populate the matrices with random values between 0.0 and 1.0 
    for (int i = 0; i < n; i++) { 
        for (int j = 0; j < n; j++) { 
 
            A[i][j] = (double) rand() / (double) RAND_MAX; 
            B[i][j] = (double) rand() / (double) RAND_MAX; 
            C[i][j] = 0; 
        } 
    } 
 
    struct timespec start, end; 
    double time_spent; 
 
    //matrix multiplication 
    clock_gettime(CLOCK_REALTIME, &start); 
    for (int i = 0; i < n; i++) { 
        for (int j = 0; j < n; j++) { 
            for (int k = 0; k < n; k++) { 
                C[i][j] += A[i][k] * B[k][j]; 
            } 
        } 
    } 
    clock_gettime(CLOCK_REALTIME, &end); 
    time_spent = (end.tv_sec - start.tv_sec) + (end.tv_nsec - start.tv_nsec) / 1000000000.0; 
    printf("Elapsed time in seconds: %f \n", time_spent); 
    return 0; 
}

Java代碼

import java.util.Random; 
 
public class MatrixMultiplication { 
    static int n = 2048; 
    static double[][] A = new double[n][n]; 
    static double[][] B = new double[n][n]; 
    static double[][] C = new double[n][n]; 
 
    public static void main(String[] args) { 
        //populate the matrices with random values between 0.0 and 1.0 
        Random r = new Random(); 
        for (int i = 0; i < n; i++) { 
            for (int j = 0; j < n; j++) { 
                A[i][j] = r.nextDouble(); 
                B[i][j] = r.nextDouble(); 
                C[i][j] = 0; 
            } 
        } 
 
        long start = System.nanoTime(); 
        //matrix multiplication 
        for (int i = 0; i < n; i++) { 
            for (int j = 0; j < n; j++) { 
                for (int k = 0; k < n; k++) { 
                    C[i][j] += A[i][k] * B[k][j]; 
                } 
            } 
        } 
 
        long stop = System.nanoTime(); 
        double timeDiff = (stop - start) * 1e-9; 
        System.out.println("Elapsed time in seconds: " + timeDiff); 
    } 
}

Python代碼

import random 
import time 
 
n = 2048 
 
#populate the matrices with random values between 0.0 and 1.0 
A = [[random.random() for row in range(n)] for col in range(n)] 
B = [[random.random() for row in range(n)] for col in range(n)] 
C = [[0 for row in range(n)] for col in range(n)] 
 
start = time.time() 
#matrix multiplication 
for i in range(n): 
    for j in range(n): 
        for k in range(n): 
            C[i][j] += A[i][k] * B[k][j] 
 
end = time.time() 
print("Elapsed time in seconds %0.6f" % (end-start)) 
如何編譯和運(yùn)行 
#C 
gcc MatrixMultiplication.c -o matrix 
./matrix 
 
#Java 
javac MatrixMultiplication.java 
java MatrixMultiplication 
 
#Python 
python MatrixMultiplication.py

如何編譯和運(yùn)行

#C 
gcc MatrixMultiplication.c -o matrix 
./matrix 
 
#Java 
javac MatrixMultiplication.java 
java MatrixMultiplication 
 
#Python 
python MatrixMultiplication.py

運(yùn)行時(shí)間

根據(jù)這些結(jié)果，C比Java慢2.34倍，Python比Java慢33.34倍。

等待!!! C應(yīng)該不是最快的嗎???

實(shí)際上，這是不公平的比較。當(dāng)我們編譯Java程序時(shí)，即使沒(méi)有任何優(yōu)化標(biāo)志，Java JIT(即時(shí))編譯器也會(huì)自動(dòng)執(zhí)行優(yōu)化。但是，對(duì)于GCC(編譯C程序)，情況并非如此，我們必須顯式設(shè)置優(yōu)化標(biāo)志。

因此，我在編譯C程序時(shí)使用了-O2和-O3優(yōu)化標(biāo)志，并再次進(jìn)行了實(shí)驗(yàn)。

gcc -O2 MatrixMultiplication.c -o matrix./matrixgcc -O3 MatrixMultiplication.c -o matrix./matrix

新的經(jīng)過(guò)時(shí)間

現(xiàn)在，Java代碼比C [-O3]慢1.69倍，而Python代碼慢56倍。我做出了正確的決定(或者很幸運(yùn)：-))，選擇了C而不是其他編程語(yǔ)言。

總結(jié)結(jié)果

討論結(jié)果

Python相對(duì)非常慢，因?yàn)镃是經(jīng)過(guò)編譯的，而Python是被解釋的。編譯器一次將C代碼轉(zhuǎn)換為機(jī)器代碼。另一方面，解釋器必須讀取，解釋和執(zhí)行每一行代碼，并更新機(jī)器狀態(tài)(這會(huì)增加很多開(kāi)銷(xiāo))。將程序編譯為機(jī)器代碼時(shí)，CPU可以直接執(zhí)行它。但是，當(dāng)涉及到解釋器時(shí)，CPU將運(yùn)行解釋器，并且解釋器本身將執(zhí)行程序。 (如果您對(duì)編譯器和解釋器感興趣，請(qǐng)閱讀Vaidehi Joshi撰寫(xiě)的精彩文章)
這就是使Python非常靈活的原因。 Python犧牲了一點(diǎn)性能來(lái)提供更多的靈活性/高級(jí)編程功能(如果不使用C語(yǔ)言指定數(shù)據(jù)類(lèi)型，則不能將變量初始化為n = 100，但是可以在Python中進(jìn)行初始化)。
JIT(Java編譯器)位于C和Python之間。首次執(zhí)行代碼時(shí)，將對(duì)其進(jìn)行解釋。但是，當(dāng)一段代碼頻繁執(zhí)行時(shí)，它會(huì)實(shí)時(shí)編譯為機(jī)器代碼，并且進(jìn)一步的執(zhí)行將使用編譯后的版本。

本文的靈感來(lái)自Charles E. Leiserson教授關(guān)于性能工程的演講，我修改了他使用的源代碼以滿足我的要求。

責(zé)任編輯：華軒來(lái)源：今日頭條

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

C，Java和Python之間的性能比較