-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmedia.py
33 lines (22 loc) · 1.1 KB
/
media.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
# legge il csv e lo trasforma in dataframe ma non prende la prima colonna come intestazione
dataset = pd.read_csv('dataset.csv', header=None) # legge il csv e lo salva come dataframe
#print(dataset) # printa il dataframe
print(dataset)
mean1 = dataset.iloc[:,0].mean() # calcola la media dei valori della colonna 1
mean2 = dataset.iloc[:,1].mean() # calcola la media dei valori della colonna 2
std1 = dataset.iloc[:,0].std() # calcola la deviazione standard dei valori della colonna 1
std2 = dataset.iloc[:,1].std() # calcola la deviazione standard dei valori della colonna 2
# crea un istogramma con le due distribuzioni
plt.hist(dataset.iloc[:,0], bins=20, color='red', alpha=0.5, label='colonna 1')
plt.hist(dataset.iloc[:,1], bins=20, color='blue', alpha=0.5, label='colonna 2')
plt.legend()
t_stat, p_value = stats.ttest_ind(dataset.iloc[:,0], dataset.iloc[:,1]) # calcola il t-statistico e il p-value
#printa i risultati a terminale
print(std1, std2)
print(mean1, mean2)
print(t_stat, p_value)
#print(t_stat, p_value)
plt.show()