• ENTRAR
  • Nenhum produto no carrinho.

R em 1 dia

Ao término deste tutorial você:

✔ Saberá o porquê usar R
✔ Preparará o ambiente de desenvolvimento em R
✔ Aprenderá a programar em R
✔ Aprenderá a realizar aquisição de dados
✔ Acessará Datasets do R base
✔ Conhecerá o pacote ggplot2 e dataviz em R

 

Por Quê R?

R é um software estatístico/linguagem de programação muito utilizado no campo acadêmico. Domina-lo é requisito essencial para Cientistas de Dados e carreiras adjuntas a esta.

🔴 Open-Source: gratuito e com comunidade cada vez maior e mais ativa;
🔴 Com uma grande comunidade por conta do fenômeno Open Source, surgem milhares de bibliotecas gratuitas para uso;
🔴 Multi-plataforma: Windows, Mac, Linux…
🔴 Já falamos que é requisito para a “profissão mais sexy do século” ?

Ambiente de Desenvolvimento

R em https://cloud.r-project.org/

✔ RStudio em https://www.rstudio.com/products/rstudio/download/

ou ainda

✔ Pacote Anaconda(possibilitando a instalação também de python e suas libs)

Fundamentos

Declarando variáveis, comentando código e printando na tela:

⚫ Declare variáveis com “=” ou “<-“;
⚫ Utilize “#” para comentar linhas;
⚫ Utilize print() para executar na tela;



r-em-1-dia








Ao término deste tutorial você:

✔ Saberá o porquê usar R
✔ Preparará o ambiente de desenvolvimento em R
✔ Aprenderá a programar em R
✔ Aprenderá a realizar aquisição de dados
✔ Acessará Datasets do R base
✔ Conhecerá o pacote ggplot2 e dataviz em R

Por Quê R?

R é um software estatístico/linguagem de programação muito utilizado no campo acadêmico. Domina-lo é requisito essencial para Cientistas de Dados e carreiras adjuntas a esta.

🔴 Open-Source: gratuito e com comunidade cada vez maior e mais ativa;
🔴 Com uma grande comunidade por conta do fenômeno Open Source, surgem milhares de bibliotecas gratuitas para uso;
🔴 Multi-plataforma: Windows, Mac, Linux…
🔴 Já falamos que é requisito para a “profissão mais sexy do século” ?

Ambiente de Desenvolvimento

✔ R em https://cloud.r-project.org/
✔ RStudio em https://www.rstudio.com/products/rstudio/download/

ou ainda

✔ Pacote Anaconda(possibilitando a instalação também de python e suas libs)

Fundamentos

Declarando variáveis, comentando código e printando na tela:

⚫ Declare variáveis com = ou <-
⚫ Utilize # para comentar linhas
⚫ Utilize print() para executar na tela

In [2]:
# Você pode declarar variáveis utilizando "=" ou "<-"
x = "Hello Qoda!"
y <- "Hello Qoda!"
In [3]:
# Print na tela seu primeiro programa em R!
print(x)
print(y)
[1] "Hello Qoda!"
[1] "Hello Qoda!"

Dados e Operadores

Tipos de Dados(básicos)


⚫ Character(“Texto”)
⚫ Integer (1L)
⚫ Numeric (7.25)
⚫ Logical (T/F ou TRUE/FALSE)

In [29]:
inteiro = 15L
class(inteiro)
‘integer’
In [30]:
num = 15
class(num)
‘numeric’
In [31]:
caract = "Texto caractere"
class(caract)
‘character’
In [34]:
logic = TRUE
class(logic)
‘logical’

Operadores Aritméticos

Operação Operador
Adição +
Subtração
Multiplicação *
Divisão /
Exponenciação ^
Módulo %%
Divisão Inteiros %/%

Operadores Lógicos

Operação Operador
< Menor
> Maior
<= Menor ou igual
>= Maior ou igual
== Igual
!= Diferente
! Not

Estruturas de Dados

VETOR (todos elementos serão do mesmo tipo)

In [5]:
vec = 3
is.vector(vec) #Retorna TRUE
TRUE
In [6]:
# Para adicionar diversos elementos em 1 vetor, use c()
vec = c(1,2,3,"texto")
class(vec) #retorna character pois todos elementos serão do mesmo tipo
‘character’

LISTA (elementos de tipos diferentes)

In [35]:
x = c("texto1","texto2")
y =  c(1,2,3)
z = c(T,F,T)
lista = c(x,y,z)
lista
  1. ‘texto1’
  2. ‘texto2’
  3. ‘1’
  4. ‘2’
  5. ‘3’
  6. ‘TRUE’
  7. ‘FALSE’
  8. ‘TRUE’

MATRIZ (todos elementos serão do mesmo tipo)

In [36]:
mat = matrix(c(1,2),nrow=1,ncol=2,byrow = TRUE) 
#nrow se refere ao número de colunas e ncol se refere ao número de linhas
#byrow insere os elementos dentro de linhas quando TRUE ou em colunas, quando FALSE
mat
1 2

DataFrame (estrutura para armazenar em forma de tabela)

In [18]:
x = data.frame(c("altura","largura","comprimento"),c("1.8","80","35"))
nrow(x) #retorna número de linhas do dataframe
ncol(x) #retorna número de colunas do dataframe
dim(x) #retorna número de linhas e colunas
3
2
  1. 3
  2. 2

Condicionais

if/else

In [37]:
a = 1
b = 2

ifelse(a>0,"A maior que 0","A menor que 0")
‘A maior que 0’
In [24]:
# FUNÇÕES R BASE
x = c(1,2,3,4,5,6,7,8,9,10)
sd(x) #desvio padrão
mean(x) #média
head(iris) #primeiras linhas dataframe
tail(iris) #ultimas linhas dataframe
file.choose() #abre pasta para caminho de arquivos

# CRIAÇÃO DE FUNÇÕES
raizquadrada = function(x) {
  return(x*x)
}

raizquadrada(4)
3.02765035409749
5.5
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
Error in file.choose(): escolha de arquivo cancelada
Traceback:

1. file.choose()
In [ ]:
# CRAN
install.packages("ggplot2") #instala pacote
library("ggplot2") #carrega pacote para seu código

# GITHUB
devtools::install_github("nome-do-repo/nome-do-pacote")

# .ZIP, .TAR.GZ
install.packages(file.choose()) #abre pasta para escolha do arquivo a ser instalado
In [ ]:
# arquivos .csv
dados = read.csv(file.choose(), sep=";")

# arquivos .xlsx
install.packages("xlsx")
library(xlsx)
planilha = read.xlsx(file.choose())
In [26]:
df = VADeaths
df
Rural Male Rural Female Urban Male Urban Female
50-54 11.7 8.7 15.4 8.4
55-59 18.1 11.7 24.3 13.6
60-64 26.9 20.3 37.0 19.3
65-69 41.0 30.9 54.6 35.1
70-74 66.0 54.3 71.1 50.0
In [27]:
x = df([0,1])
y = df([1:])
plot(x,y)
Error in parse(text = x, srcfile = src): <text>:1:8: '[' inesperado
1: x = df([
           ^
Traceback:

27 de novembro de 2019

0 respostas em "R em 1 dia"

Deixe sua mensagem

Feito com AMOR por ©Qoda. Todos Direitos Reservados.

Menus de configuração no Painel de Administração