1 + 1[1] 2
# Se você usar uma "#", o código fica comentado. Ou seja, é só um texto!
# 1 + 1 R!
R2 de fevereiro de 2026
O código é uma linguagem, então podemos documentar os passos da nossa análise. Isso é, escrever, linha à linha, os passos do processo de análise.
O código é texto, então podemos copiar e colar, facilitando enormemente a transposição do código para novos casos.
As linguagens de programação para ciência de dados mais utilizadas são de código aberto, em especial R, com dominância em certos nichos acadêmicos, e Pyhton, com popularidade ascentende e mais utilizado no universo corporativo.
R ao invés de Python.Alternativas proprietárias (fechadas, controladas por empresas que cobram por licenças ou assinatura) incluem softwares como Stata, SAS, SPSS, entre outras. Ou seja, mais custo para o negócio.
Free Software como em “liberdade” não como em “grátis”. Na prática temos acesso gratuito (na maioria dos casos). Os usuários podem modificar e aperfeiçoar o código-fonte.
As pessoas podem acessar as ferramentas, tendo as condições mínimas em termos de hardware e conhecimento, independente de poderem pagar uma licensa de uso.
Estudantes podem usar software semelhante ao de profissionais.
Você pode corrigir problemas e aprimorar a linguagem e eventualmente contribuir e modificar o projeto principal.
Você pode desenvolver suas próprias ferramentas.
Possibilita a existência de uma comunidade ativa.


É uma linguagem de programação que possui muitas ferramentas para análise de dados
É código aberto (open source)
Possui uma comunidade ativa de pessoas desenvolvedoras
É flexível, permite desenvolver funções e pacotes para facilitar o trabalho
Está disponível, gratuitamente, em diferentes plataformas: Windows, Linux e Mac
Mantido pela R Development Core Team
Vocês já tentaram repetir uma análise feita meses atrás e não lembraram como chegaram no resultado?
Já recebeu uma planilha e não entendeu como a pessoa chegou naqueles resultados, já que faltam passos claros de como executar a análise?
Você já ficou “irritado” de ter que fazer toda uma análise, que parece MUITO com alguma outra que você já fez mas que só mudou a variável de interesse?
Isso conecta com a experiência comum de quem lida com dados;
Reprodutibilidade é como pensar no seu eu do futuro e na sua equipe: todo mundo deve ser capaz de apertar Run e obter exatamente o mesmo resultado.
R?R não é só “programar”, mas se alinhar com boas práticas;R significa estar preparado para dialogar com transparência em todos os ambientes;A reprodutibilidade é um pilar ético e epistemológico da ciência, pois assegura que o conhecimento seja verificável e coletivo, não apenas dependente da autoridade de um pesquisador.
{ggplot2}
Quarto
R!objetos criados na sessão;O RStudio é um pai coruja 🦉. Isso significa que ele vai querer te lembrar de TODOS os comandos que você executou anteriormente. Isso é salvo em dois arquivos ocultos: .RData (guarda os objetos de uma sessão) e .Rhistory (abriga todos os comandos executados).
Qual o problema disso, então?
.RData pode fazer com que seu ambiente de trabalho fique muito pesado!RStudio, dependendo das configurações de seu computador.
:
Vá em Tools -> Global options... -> General
Pronto! Agora você vai garantir um ambiente de trabalho eficiente e reprodutível.
Se acostumar com sessões efêmeras não é uma tarefa fácil e um desconforto inicial é esperado. Pode ser que você ache entediante executar o mesmo código toda vez que abrir seu RStudio, mas é importante ter em mente que esse programa só está lá e pode ser executado inúmeras vezes porque o R não estará mais fazendo o seu trabalho. Zen do R, capítulo 2
1 Atenção: se você nunca usar, nem vai sentir falta!
R!RVamos para o quadrante do Editor/Script no RStudio. Se somarmos, por exemplo, 1 + 1, veremos que o R nos retorna [1] 2.
# antes do código, nós estamos comentando ele.
R como calculadoraTodas as operações possíveis!
[1] 2
[1] 2
[1] 6
[1] 1.666667
[1] 16
[1] 1
[1] 3
Assim como na matemática, a divisão e a multiplicação são calculadas antes da adição e da subtração! De qualquer forma, usar os parênteses nunca é demais.
É o mesmo que:
E diferente de :
No Script, ao final da linha de código, você pode executar CTRL + ENTER. Este é o atalho para rodar, avaliar ou executar o seu código! Você vera a resposta diretamente no Console.
Grosso modo, objetos são nomes que guardam informações. Tabelas, números, funções etc. Para criar um objeto, basta usar os operadores <- ou =.
Na comunidade R, a convenção é usarmos o sinal <- ao invés do sinal de =. Na maioria dos casos, se você usar <- ou =, vai obter o mesmo resultado. Entretanto, o sinal de igualdade é reservado para funções dentro do R. O atalho para o sinal de atribuição <- é ALT -.
R é sensível 😭😱O R diferencia letras maiúsculas e minúsculas. Tecnicamente, dizemos que o R é case sensitive.
mean(), sum(), sd()R irá sobrescreveri. Ou seja, substituimos os ` ` por `_`
Os objetos no R podem comportar muitas informações de uma só vez. A mais frequente que nós utilizamos são os vetores. Eles são um conjunto de informações atribuídas em uma única linha. Os vetores podem ser:
character):É possível verificar a classe dos vetores:
RNo slide anterior, vimos uma coisa estranha que ainda não apresentamos. O que é o c()?
Para pedir ajuda ao R, basta ir no Console e digitar:
[1] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
[26] 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
[51] 50 60 70 80 90
[1] 0
[1] 90
[1] 99
[1] 810
[1] -9
[1] 81
[1] 28.63636
[1] 90
[1] 0
[1] 28.63636 90.00000 0.00000
| Operador | Operação |
|---|---|
! |
Negação (não) |
& |
E (avalia elemento a elemento) |
| |
Ou (avalia elemento a elemento) |
< |
Menor |
<= |
Menor ou igual |
> |
Maior |
>= |
Maior ou igual |
!= |
Diferente |
&& |
E (avalia apenas o 1º elemento) |
|| |
Ou (avalia apenas o 1º elemento) |
Alguns conceitos são importantes para se trabalhar no R. Um deles é a ideia de diretórios de trabalhos (working directory) e projetos.
Para isso, usamos o conceito de caminhos.
Caminhos podem ser:
Ou seja, o caminho completo desde a raiz do seu computador até o arquivo desejado.
Ou um caminho relativo à uma pasta de referência.
Usar caminhos relativos, ao invés de caminhos absolutos, garante que o código funcione em qualquer computador!
Um diretório de trabalho no R é o diretório (ou pasta) para onde o R se baseia quando precisamos interagir com os nossos arquivos.
getwd().RProjA melhor forma de organizar os seus arquivos dentro do R é usando Projetos.
projeto no RStudio, ele cria uma pasta para nós e define essa pasta como diretório de trabalho (lembra do caminho relativo?).
.RProj dentro da pasta.projetos facilita a organização de arquivos e a reprodução do código.File > New Project...