Selesai: kod untuk statistik inferensi dalam python

Kemaskini terakhir: 09/11/2023

Masalah utama yang berkaitan dengan kod untuk statistik inferensi dalam Python ialah sukar untuk memahami dan mentafsir keputusan. Python ialah bahasa yang berkuasa, tetapi mungkin sukar untuk membaca dan memahami kod yang digunakan untuk statistik inferens. Selain itu, terdapat banyak pakej berbeza yang tersedia untuk statistik inferensi dalam Python, yang boleh menyukarkan untuk memilih yang betul untuk analisis tertentu. Akhir sekali, sesetengah pakej ini mungkin tidak terkini atau tidak boleh dipercayai seperti yang lain, jadi penting untuk membuat penyelidikan sebelum menggunakannya.

1. Chi-Square Test of Independence: 
from scipy.stats import chi2_contingency
chi2, p, dof, expected = chi2_contingency(observed)

2. One-Way ANOVA: 
from scipy import stats 
F, p = stats.f_oneway(sample1, sample2, sample3) 
  
3. Pearson’s Correlation Coefficient: 
from scipy.stats import pearsonr 
corr, _ = pearsonr(x, y)

Baris 1: Baris ini mengimport fungsi chi2_contingency daripada pustaka scipy.stats, dan kemudian menggunakannya untuk mengira ujian khi kuasa dua kebebasan pada data yang diperhatikan. Keputusan ujian ini disimpan dalam pembolehubah chi2, p, dof, dan dijangka.

Baris 2: Baris ini mengimport fungsi f_oneway daripada perpustakaan scipy, dan kemudian menggunakannya untuk mengira ANOVA sehala pada tiga sampel (sample1, sample2, sample3). Keputusan ujian ini disimpan dalam pembolehubah F dan p.

Baris 3: Baris ini mengimport fungsi pearsonr daripada pustaka scipy.stats, dan kemudian menggunakannya untuk mengira pekali korelasi Pearson antara dua pembolehubah (x dan y). Keputusan ujian ini disimpan dalam pembolehubah corr dan _.

Apakah statistik inferens

Statistik inferensi ialah satu cabang statistik yang menggunakan data daripada sampel untuk membuat inferens atau generalisasi tentang populasi. Ia melibatkan membuat kesimpulan tentang populasi berdasarkan data yang dikumpul daripada sampel. Dalam Python, statistik inferensi boleh digunakan untuk membuat kesimpulan dan membuat ramalan dengan menggunakan pelbagai teknik seperti ujian hipotesis, analisis korelasi, analisis regresi dan banyak lagi. Teknik ini membolehkan kami mendapatkan cerapan yang bermakna daripada data kami dan membantu kami membuat keputusan yang lebih baik.

Jenis statistik inferens

Dalam Python, terdapat beberapa jenis statistik inferensi yang boleh digunakan untuk menganalisis data. Ini termasuk ujian-t, ANOVA, ujian khi kuasa dua, ujian korelasi dan analisis regresi. Ujian-t digunakan untuk membandingkan min dua atau lebih kumpulan data. ANOVA digunakan untuk membandingkan cara berbilang kumpulan data. Ujian khi kuasa dua digunakan untuk menguji hubungan antara pembolehubah kategori. Ujian korelasi mengukur kekuatan dan arah hubungan linear antara dua pembolehubah. Akhir sekali, analisis regresi digunakan untuk meramal pembolehubah bersandar daripada satu atau lebih pembolehubah tidak bersandar.

Bagaimana anda menulis statistik inferens

Statistik inferensi ialah satu cabang statistik yang menggunakan data daripada sampel untuk membuat inferens tentang populasi dari mana sampel itu diambil. Dalam Python, statistik inferensi boleh dilakukan menggunakan pelbagai perpustakaan seperti SciPy, StatsModels dan NumPy.

Untuk melaksanakan statistik inferensi dalam Python, anda perlu terlebih dahulu mengimport perpustakaan yang diperlukan dan kemudian menggunakan fungsi seperti min(), median(), mod(), varians(), sisihan piawai(), t-test(), chi -square test() dsb. Contohnya, jika anda ingin mengira min set data yang diberikan, anda boleh menggunakan fungsi min() daripada NumPy:

import numpy sebagai np
data = [1,2,3,4]
nilai_min = np.min(data)
print(min_value) # Output: 2.5

Related posts: