2 Instalação dos softwares
Os softwares R e RStudio devem ser instalados antes do início do curso. É possível utilizar na versão em nuvem também.
2.1 Instalação dos softwares
2.1.1 R
O R é um ambiente de software livre para computação estatística e gráficos. (https://www.r-project.org/). Primeiros, é necessário fazer a instalação do R. Basta acessar este link e selecionar a opção “Download R for Windows”, caso você use Windows. Caso você utilize outro sistema operacional (Linux, macOS etc.), basta acessar a página principal de download e selecionar a opção que te atenda.
Mesmo que você já tenha o R e o RStudio baixados no seu computador/notebook, recomendo que baixe-os novamente. Isso pois os programas estão em constante aperfeiçamento. A última versão do R é a 4.5.2, e a do RStudio foi lançada em 06 de janeiro de 2026 (algumas semanas atrás!!).
2.1.2 RStudio
O RStudio é uma IDE (integrated development environment) baseado em Linguagem R, ou seja, um ambiente de desenvolvimento que utilizamos para editar e executar os códigos em R. É mantida pelo time da Posit.
Outras interfaces são possíveis, como:
Neste curso, utilizaremos apenas o RStudio.
2.1.3 RStudio Cloud
É a IDE RStudio que podemos utilizar via navegador (sem que seja necessário instalar nada). É recomendado caso você não consiga instalar no seu computador. Basta criar uma conta:
O RStudio Cloud é uma boa opção para quem tem limitações de hardware no computador. Infelizmente, a versão cloud tem algumas limitações, como o limite de 25h de utilização por mês.
2.2 As vantagens de analisar dados usando linguagens de programação
O código é uma linguagem, então podemos documentar os passos da nossa análise. Isso é, escrever, linha à linha, os passos do processo de análise.
O código é texto, então podemos copiar e colar, facilitando enormemente a transposição do código para novos casos.
As linguagens de programação para ciência de dados mais utilizadas são de código aberto, em especial R, com dominância em certos nichos acadêmicos, e Pyhton, com popularidade ascentende e mais utilizado no universo corporativo.
- Fora do Brasil, é mais comum empresas de ponta utilizarem o
Rao invés de Python.
- Fora do Brasil, é mais comum empresas de ponta utilizarem o
Alternativas proprietárias (fechadas, controladas por empresas que cobram por licenças ou assinatura) incluem softwares como Stata, SAS, SPSS, entre outras. Ou seja, mais custo para o usuário.
2.3 O que significa ser código aberto e software livre?
Free Software como em “liberdade” não como em “grátis”. Na prática temos acesso gratuito (na maioria dos casos). Os usuários podem modificar e aperfeiçoar o código-fonte.
As pessoas podem acessar as ferramentas, tendo as condições mínimas em termos de hardware e conhecimento, independente de poderem pagar uma licensa de uso.
Você pode corrigir problemas e aprimorar a linguagem e eventualmente contribuir e modificar o projeto principal.
Você pode desenvolver suas próprias ferramentas.
Possibilita a existência de uma comunidade ativa.