Finish first TP R
This commit is contained in:
parent
567ee81053
commit
c47a9b49ba
1 changed files with 39 additions and 3 deletions
|
@ -1,5 +1,4 @@
|
|||
#cats <- read.csv("cats.csv", sep="", stringsAsFactors=TRUE)
|
||||
|
||||
cats <- read.csv("cats.csv", sep="", stringsAsFactors=TRUE)
|
||||
|
||||
# Exercice 1
|
||||
# 1. Quels sont les noms de variables ?
|
||||
|
@ -56,4 +55,41 @@ histo$counts
|
|||
class(Sex)
|
||||
levels(Sex)
|
||||
table(Sex)
|
||||
barplot(table(Sex))
|
||||
|
||||
# Exercice 5 et 6
|
||||
# donne la répartition des variables, leur somme étant égale au total
|
||||
barplot(table(Sex))
|
||||
# affiche un boxplot en fonction d'une classe
|
||||
boxplot(Bwt ~ Sex)
|
||||
pie(table(Sex))
|
||||
# On remarque que le poids du coeur et le poids du corps sont globalement
|
||||
# plus élevés pour les mâles que pour les femelles. Avant de conclure il
|
||||
# faudrait établir le lien entre le poids du coeur et le poids du corps.
|
||||
# S'il y a une correlation, on pourra peut-être établir une relation entre
|
||||
# le sexe et le poids.
|
||||
# Cette analyse est importante pour toute étape d'inférence.
|
||||
|
||||
# Exercice 7
|
||||
# Nous allons tracer un nuage de points pour établir la relation entre les
|
||||
# poids
|
||||
plot(Bwt, Hwt)
|
||||
# Malgré la forte dispersion des variables, on peut tout de suite dire que
|
||||
# la relation est linéaire. Si le poids du corps augmente, le poids du coeur
|
||||
# augmente.
|
||||
# cor(x, y) = cov(x, y) / sigma_x * sigma_y
|
||||
# avec sigma_x = sqrt(var_x) et sigma_y = sqrt(var_y)
|
||||
# le coef est compris entre [-1, 1]
|
||||
# - si coef proche de -1 ou 1 : forte correlation
|
||||
# - si coef proche de 0 : x et y sont "indépendants"
|
||||
# - si coef > 0 : x et y augmentent dans le même sens
|
||||
# - si coef < 0 : x et y augmentent en sens inverse
|
||||
cov(Bwt, Hwt)
|
||||
cor(Bwt, Hwt) # la correlation est forte, de 80%
|
||||
# Afficher le nuage des points avec des couleurs différentes en fonction du
|
||||
# sexe, pour visualiser son impact.
|
||||
#help(plot)
|
||||
plot(Bwt[Sex=='F'], Hwt[Sex=='F'], col="red", xlim=c(1.9,4), ylim=c(6.2,21), xlab="Bwt", ylab="Hwt")
|
||||
points(Bwt[Sex=='M'], Hwt[Sex=='M'], col="blue")
|
||||
|
||||
cor(Hwt[Sex=='F'], Bwt[Sex=='F'])
|
||||
cor(Hwt[Sex=='M'], Bwt[Sex=='M'])
|
||||
|
|
Loading…
Reference in a new issue