r CodeRdéveloppépourle DU Analyste Big Data

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了r CodeRdéveloppépourle DU Analyste Big Data相关的知识,希望对你有一定的参考价值。

a = c(1, 2, 5)
class(a)
print(a)
is.vector(a)
b = c("bon", "jour")
class(b)
as.factor(b)
abis = as.factor(a)
class(abis)
mean(a)
mean(abis)

# Données déjà présentes :  iris
iris
class(iris)
iris[1,2] # 1ère ligne, 2ème colonne
iris[1,] # 1ère ligne, toutes les colonnes
iris[,2] # 2ème colonne, toutes les lignes
names(iris)
iris$Sepal.Length # variable Sepal.Length
class(iris$Sepal.Length)
class(iris$Species)
summary(iris)
head(iris) # premières lignes
head(iris, n = 10) # 10 premières lignes
tail(iris) # dernières lignes
tail(iris, n = 10) # 10 dernières lignes

# Redirection de la sortie vers un fichier texte
getwd() # connaître le répertoire de travail
setwd("z:/DU ABD/") # change le répertoire de travail
getwd()
sink("test-sortie.txt")
iris
sink()
file.show("test-sortie.txt")

# exportation des données iris
write.table(iris, "iris-01.data") # export par défaut
file.show("iris-01.data")
iris01 = read.table("iris-01.data")
head(iris01)

write.table(iris, "iris-02.data", row.names = F) 
file.show("iris-02.data")
iris02 = read.table("iris-02.data", header = T)
head(iris02)

write.table(iris, "iris-03.data", row.names = F, sep = ";") 
file.show("iris-03.data")
iris03 = read.table("iris-03.data", header = T, sep = ";")
head(iris03)

write.table(iris, "iris-04.data", 
            row.names = F, sep = ";",
            col.names = F) 
file.show("iris-04.data")
iris04 = read.table("iris-04.data", sep = ";")
names(iris04)
names(iris04) = c("SepLen", "SepWid", "PetLen", "PetWid", "Spe")
iris04$iris04 = 1:150
head(iris04)

write.table(iris, "iris-05.data", 
            row.names = F, sep = ";",
            col.names = F, quote = F) 
file.show("iris-05.data")
iris05 = read.table("iris-05.data", sep = ";")
head(iris05)
class(iris05$V5)

iris_sansFactor = read.table("iris-01.data", 
                             stringsAsFactors = F)
head(iris_sansFactor)
summary(iris_sansFactor)
class(iris_sansFactor$Species)

names(iris) = c(names(iris), "test")
iris$test = 0
names(iris)
head(iris)
iris$test[1] = "bonjour"
head(iris)
summary(iris)


save.image("workspace.Rdata")
rm(list=ls())
load("workspace.Rdata")

save(iris_sansFactor, a, b, 
     file = "workspace-partiel.Rdata")
load("workspace-partiel.Rdata")

# pour créer une matrice
matrix(0, 2, 2)
matrix(1:4, 2, 2)
m = matrix(1:4, 4, 2)
class(m)

runif(10) # 10 nombre aléatoire entre 0 et 1 (loi uniforme)
rnorm(10) # 10 nombre aléatoire entre 0 et 1 (loi normal (0,1))
rnorm(10, mean = 5, sd = 10) # normal(5, 10)

sink("test1.txt")
print(a)
sink("test2.txt")
print(b)
sink()
print(b)
sink()

# quelques statistiques
summary(iris) # sur chaque colonne
summary(iris$Sepal.Length)
mean(iris$Sepal.Length, na.rm = T)
sd(iris$Sepal.Length)
min(iris$Sepal.Length)
max(iris$Sepal.Length)
median(iris$Sepal.Length)
var(iris$Sepal.Length)
quantile(iris$Sepal.Length)
quantile(iris$Sepal.Length, p = c(0, 0.4, 0.99))
quantile(iris$Sepal.Length, p = seq(0, 1, by = 0.1))
# graphique
hist(iris$Sepal.Length)
hist(iris$Sepal.Length, col = "gray50")
hist(iris$Sepal.Length, col = "gray50",
     main = "Longueur du sépale",
     xlab = "en centimètres",
     ylab = "Occurences")
hist(iris$Sepal.Length, 
     col = "gray50",
     main = "Longueur du sépale",
     xlab = "en centimètres",
     ylab = "Densité",
     breaks = c(4, 5, 5.5, 6, 6.5, 8))

boxplot(iris$Sepal.Length,
        col = "gray50",
        main = "Longueur du sépale",
        ylab = "en centimètres")

qqnorm(iris$Sepal.Length)
qqline(iris$Sepal.Length)


# sur la même page
graphQuanti <- function(x, nom = "var x") {
  opar = par(no.readonly = T) # sauvegarde des paramètres graphiques
  layout(matrix(c(1, 2, 1, 3), 2, 2))
  par(mar = c(2.5, 2.5, 2, 0) + 0.1)
  hist(x, col = "gray50", 
       main = nom,
       ylab = "Occurences")
  par(mar = c(0, 2.5, 0, 0) + 0.1)
  boxplot(x,
          col = "gray50")
  par(mar = c(2.5, 2.5, 0, 0) + 0.1)
  qqnorm(x, main = "")
  qqline(x)
  par(opar)
}
graphQuanti(iris$Sepal.Length, "Longueur Sépale")
graphQuanti(iris$Sepal.Width)

pdf("graphQuanti.pdf")
sapply(iris,
       function(x) { 
         if (is.numeric(x))
           graphQuanti(x)
         return (NULL)
         })
dev.off()


pdf("graphQuanti.pdf")
for (i in 1:ncol(iris)) {
  if (is.numeric(iris[,i]))
      graphQuanti(iris[,i], nom = names(iris)[i])
}
dev.off()

table(iris$Species)
prop.table(table(iris$Species))
barplot(table(iris$Species),
        main = "Espèce",
        sub = "150 iris, 3 espèces")
plot(iris$Species) # idem
plot(iris$Species,
     main = "Espèce",
     sub = "150 iris, 3 espèces",
     col = rainbow(3))
plot(iris$Species,
     main = "Espèce",
     sub = "150 iris, 3 espèces",
     col = c("#abcdef", "#fedcba", "#aaaaaa"))
pie(table(iris$Species),
    main = "Espèce",
    radius = 1.5,
    col = c("#abcdef", "#fedcba", "#aaaaaa"))




# régression simple
?LifeCycleSavings # 5 variables quantitatives
round(cor(LifeCycleSavings), 2)
pairs(LifeCycleSavings)

m = lm(sr ~ pop15, data = LifeCycleSavings) 
print(m)
print(summary(m))
m = lm(sr ~ pop15 - 1, data = LifeCycleSavings) 
print(m)
print(summary(m))
m = lm(sr ~ pop15 + pop75, data = LifeCycleSavings) 
print(m)
print(summary(m))
m = lm(sr ~ ., data = LifeCycleSavings) 
print(m)
print(summary(m))
mstep = step(m, dir = "both")
summary(mstep)


# connexion à un BD SQLite
library(RSQLite)
db = dbConnect(RSQLite::SQLite(), "world.sqlite")
dbGetQuery(db, "select count(*) from country;")




以上是关于r CodeRdéveloppépourle DU Analyste Big Data的主要内容,如果未能解决你的问题,请参考以下文章

text 02 - Récupérerdesinformations avec SELECT

sql 02 - Récupérerdesinformations avec SELECT

java Récupérerdesvaleurs saisies par l'utilisateur

html 有效的点菜谷歌地图和récupérer高度sur clique

php RésolutionquêteArrayBoucle PHP

r 用于绘制曲线的Wahrol方式(ché背景)