Finish first TP R

This commit is contained in:
flyingscorpio@clevo 2022-03-08 09:18:41 +01:00
parent 567ee81053
commit c47a9b49ba

View file

@ -1,5 +1,4 @@
#cats <- read.csv("cats.csv", sep="", stringsAsFactors=TRUE)
cats <- read.csv("cats.csv", sep="", stringsAsFactors=TRUE)
# Exercice 1
# 1. Quels sont les noms de variables ?
@ -56,4 +55,41 @@ histo$counts
class(Sex)
levels(Sex)
table(Sex)
barplot(table(Sex))
# Exercice 5 et 6
# donne la répartition des variables, leur somme étant égale au total
barplot(table(Sex))
# affiche un boxplot en fonction d'une classe
boxplot(Bwt ~ Sex)
pie(table(Sex))
# On remarque que le poids du coeur et le poids du corps sont globalement
# plus élevés pour les mâles que pour les femelles. Avant de conclure il
# faudrait établir le lien entre le poids du coeur et le poids du corps.
# S'il y a une correlation, on pourra peut-être établir une relation entre
# le sexe et le poids.
# Cette analyse est importante pour toute étape d'inférence.
# Exercice 7
# Nous allons tracer un nuage de points pour établir la relation entre les
# poids
plot(Bwt, Hwt)
# Malgré la forte dispersion des variables, on peut tout de suite dire que
# la relation est linéaire. Si le poids du corps augmente, le poids du coeur
# augmente.
# cor(x, y) = cov(x, y) / sigma_x * sigma_y
# avec sigma_x = sqrt(var_x) et sigma_y = sqrt(var_y)
# le coef est compris entre [-1, 1]
# - si coef proche de -1 ou 1 : forte correlation
# - si coef proche de 0 : x et y sont "indépendants"
# - si coef > 0 : x et y augmentent dans le même sens
# - si coef < 0 : x et y augmentent en sens inverse
cov(Bwt, Hwt)
cor(Bwt, Hwt) # la correlation est forte, de 80%
# Afficher le nuage des points avec des couleurs différentes en fonction du
# sexe, pour visualiser son impact.
#help(plot)
plot(Bwt[Sex=='F'], Hwt[Sex=='F'], col="red", xlim=c(1.9,4), ylim=c(6.2,21), xlab="Bwt", ylab="Hwt")
points(Bwt[Sex=='M'], Hwt[Sex=='M'], col="blue")
cor(Hwt[Sex=='F'], Bwt[Sex=='F'])
cor(Hwt[Sex=='M'], Bwt[Sex=='M'])