|
| 1 | +--- |
| 2 | +title: "Aula 1 - Uma Overview de R" |
| 3 | +output: html_document |
| 4 | +--- |
| 5 | + |
| 6 | +```{r setup, include=FALSE} |
| 7 | +knitr::opts_chunk$set(echo = TRUE) |
| 8 | +library(knitr) |
| 9 | +
|
| 10 | +``` |
| 11 | + |
| 12 | + |
| 13 | + |
| 14 | +## O R como calculadora |
| 15 | + |
| 16 | +### Você pode executar somas |
| 17 | +```{r} |
| 18 | +25+11 |
| 19 | +``` |
| 20 | + |
| 21 | +### Assim como subtrações. |
| 22 | +```{r} |
| 23 | +385-298 |
| 24 | +``` |
| 25 | +### Multiplicações. |
| 26 | +```{r} |
| 27 | +223*9384 |
| 28 | +``` |
| 29 | +### Divisões. |
| 30 | +```{r} |
| 31 | +389/11 |
| 32 | +``` |
| 33 | + |
| 34 | +### Exponenciações. |
| 35 | +```{r} |
| 36 | +2^10 |
| 37 | +``` |
| 38 | + |
| 39 | +### Ou operações matemáticas mais complexas como expressões númericas. |
| 40 | + |
| 41 | +Todavia dentro do ambiente do R não usamos {} ou [], já que eles tem funções específicas, mas usamos os (). |
| 42 | + |
| 43 | +```{r} |
| 44 | +2+(1+(4/2)-(2*1)+10) |
| 45 | +``` |
| 46 | +## Apresentando os operadores lógicos do R. |
| 47 | +```{r, echo = FALSE, results ='asis'} |
| 48 | +operadores<-data.frame('Tipo de Teste'=c("igual", |
| 49 | + "diferente", |
| 50 | + "maior que", |
| 51 | + "menor que", |
| 52 | + "maior ou igual que", |
| 53 | + "menor ou igual que", |
| 54 | + "e", |
| 55 | + "ou", |
| 56 | + "não", |
| 57 | + "de n até m", |
| 58 | + "valor correspondente"), |
| 59 | +'Operador Lógico'= c("==", "!=", |
| 60 | + ">", |
| 61 | + "<", |
| 62 | + ">=", |
| 63 | + "<=", |
| 64 | + "&", |
| 65 | + "|", |
| 66 | + "!", |
| 67 | + ":", |
| 68 | + "%in%"), |
| 69 | + ex=c("2==2", |
| 70 | + "2!=3", |
| 71 | + "3>2", |
| 72 | + "3<2", |
| 73 | + "", |
| 74 | + "", |
| 75 | + "A&B", |
| 76 | + "A|B", |
| 77 | + "A!B", |
| 78 | + "1:60", |
| 79 | + 'vogais %in% c("a","b","c","d","e")')) |
| 80 | +names(operadores)<-c("Tipo de Teste", "Operador Lógico", "Exemplo") |
| 81 | +
|
| 82 | +kable(operadores) |
| 83 | +``` |
| 84 | +## Apresentando os Tipos de Objetos |
| 85 | + |
| 86 | +### Objetos númericos (numeric). |
| 87 | +```{r} |
| 88 | +a<- c(9, 4,4,1) |
| 89 | +a;class(a) |
| 90 | +``` |
| 91 | + |
| 92 | +### Objetos de sequência de caracteres (character). |
| 93 | +```{r} |
| 94 | +b<- c("flamengo", "vasco", "fluminese", "botafogo") |
| 95 | +b;class(b) |
| 96 | +``` |
| 97 | + |
| 98 | +### Objetos do tipo factor (factor). |
| 99 | +```{r} |
| 100 | +c<- factor(c("atual campeão", "em disputa série", "fora da competição", "fora da competição")) |
| 101 | +c;class(c) |
| 102 | +``` |
| 103 | + |
| 104 | +### Objetos do Tipo Dataframe. |
| 105 | +```{r} |
| 106 | +df<-data.frame(b,a,c) |
| 107 | +df |
| 108 | +``` |
| 109 | + |
| 110 | +### Alterando o nome das colunas de um dataframe. |
| 111 | +```{r} |
| 112 | +names(df)<-c("time", "número de brasileiros", "status no brasileirão") |
| 113 | +df |
| 114 | +``` |
| 115 | + |
| 116 | +## Acessando elementos dentro de um objeto. |
| 117 | +```{r} |
| 118 | +head(iris) |
| 119 | +``` |
| 120 | + |
| 121 | +### Selecionando os itens da primeira coluna. |
| 122 | +```{r} |
| 123 | +iris[1] |
| 124 | +``` |
| 125 | + |
| 126 | +### Selecionando Elementos na primeira linha. |
| 127 | +```{r} |
| 128 | +iris[1,] |
| 129 | +``` |
| 130 | + |
| 131 | +### Selecionando elementos da 5° a 10° linha e das colunas 2 a 5. |
| 132 | +```{r} |
| 133 | +iris[5:10,2:5] |
| 134 | +``` |
| 135 | + |
| 136 | +### Selecionando elementos das linhas 3, 5 e 6 e das colunas 1, 3 e 5. |
| 137 | +```{r} |
| 138 | +iris[c(3,5,6), c(1,3,5)] |
| 139 | +``` |
| 140 | + |
| 141 | +### Selecionando uma coluna em um objeto Tabular |
| 142 | +```{r} |
| 143 | +iris$Sepal.Length |
| 144 | +``` |
| 145 | + |
| 146 | +## Revisão |
| 147 | + |
| 148 | +### Dados Simulados |
| 149 | + |
| 150 | +```{r} |
| 151 | +t<-data.frame( |
| 152 | + stringsAsFactors = FALSE, |
| 153 | + estado = c("alagoas","pernambuco","sergipe", |
| 154 | + "bahia","rio grande do norte","piaui", |
| 155 | + "ceará","paraiba","maranhão"), |
| 156 | + matches = c(23320L,42392L,35292L,63850L, |
| 157 | + 42823L,33301L,16711L,59766L,69495L), |
| 158 | + matches.brasil = c(848298L,848298L,848298L,848298L, |
| 159 | + 848298L,848298L,848298L,848298L, |
| 160 | + 848298L), |
| 161 | + maioria_feminina = c("sim","não","sim","não","sim", |
| 162 | + "sim","sim","não","não"), |
| 163 | + classe_predominante = c("alta","alta","media","baixa", |
| 164 | + "baixa","alta","media","media","baixa"), |
| 165 | + idade_predominante = c("<20 e >30","<31 e > 35", |
| 166 | + "<18 e > 23","<18 e > 23","<18 e > 23", |
| 167 | + "<20 e >30","<31 e > 45","<31 e > 45","<45") |
| 168 | + ) |
| 169 | +``` |
| 170 | + |
| 171 | +### Observando os casos onde há maioria feminina. |
| 172 | +```{r} |
| 173 | +t[t$maioria_feminina=="sim",] |
| 174 | +``` |
| 175 | + |
| 176 | +### Observando Casos onde a classe predominante é alta. |
| 177 | +```{r} |
| 178 | +t[t$classe_predominante == "alta", ] |
| 179 | +``` |
| 180 | + |
| 181 | + |
| 182 | +### Observando Casos onde a classa predominante é alta e a maioria é feminina. |
| 183 | +```{r} |
| 184 | +t[t$classe_predominante == "alta" & t$maioria_feminina=="sim", ] |
| 185 | +``` |
| 186 | + |
| 187 | +### Observando Casos onde o número de matches é menor que 40 mil ou a classe predominante não é alta |
| 188 | +```{r} |
| 189 | +t[t$matches < 30000 | t$classe_predominante!="baixa", ] |
| 190 | +``` |
| 191 | + |
| 192 | +### Observando Casos onde a idade predominante é entre 18 e 30 anos |
| 193 | +```{r} |
| 194 | +t[t$idade_predominante %in% c("<18 e > 23", "<20 e >30"), ] |
| 195 | +``` |
| 196 | + |
| 197 | +### Calculando o percentual equivalente de matches no brasil do estado |
| 198 | +```{r} |
| 199 | +t$matches/t$matches.brasil*100 |
| 200 | +``` |
| 201 | + |
| 202 | +## Exercícios |
| 203 | + |
| 204 | +Acesse a página do "https://pt.wikipedia.org/wiki/Lista_de_unidades_federativas_do_Brasil_por_PIB" que contém uma tabela com os resultados do pib dos estados brasileiros. A partir dela responda os itens a seguir |
| 205 | + |
| 206 | +Crie um Vetor com o nome das UFs por ordem alfabética. |
| 207 | +```{r} |
| 208 | +
|
| 209 | +``` |
| 210 | + |
| 211 | +Qual a classe desse vetor? |
| 212 | +```{r} |
| 213 | +``` |
| 214 | +Crie um vetor com os valores do pib, por ordem alfabética. |
| 215 | +```{r} |
| 216 | +
|
| 217 | +``` |
| 218 | +Qual a classe desse vetor/variável? |
| 219 | +```{r} |
| 220 | +
|
| 221 | +``` |
| 222 | + |
| 223 | +Acesse o link a seguir "https://pt.wikipedia.org/wiki/Lista_de_unidades_federativas_do_Brasil_por_popula%C3%A7%C3%A3o", que contem os dados da tamanho da população dos estados e crie um vetor com a população dos estados por ordem alfabética. |
| 224 | +```{r} |
| 225 | +
|
| 226 | +``` |
| 227 | +Qual a classe desse vetor/variável? |
| 228 | +```{r} |
| 229 | +
|
| 230 | +``` |
| 231 | + |
| 232 | +Crie e armazene em um objeto um dataframe com as variáveis, UF, PIB e População. |
| 233 | +```{r} |
| 234 | +
|
| 235 | +``` |
| 236 | +Cheque se o objeto criado é um dataframe. |
| 237 | + |
| 238 | +```{r} |
| 239 | +
|
| 240 | +``` |
| 241 | + |
| 242 | +Crie uma variável que meça o PIB per capita dos estados. |
| 243 | +```{r} |
| 244 | +
|
| 245 | +``` |
| 246 | + |
| 247 | +Sabendo que a população brasileira é de 211 milhões, crie uma variável com a população brasileira |
| 248 | + |
| 249 | +```{r} |
| 250 | +
|
| 251 | +``` |
| 252 | + |
| 253 | +Crie uma variável que meça o percentual da população do estado representa a população brasileira. |
| 254 | +Por exemplo se o Amazonas tem 4.207.714 habitantes, ele representa 2% da população brasileira. |
| 255 | + |
| 256 | +```{r} |
| 257 | +
|
| 258 | +``` |
| 259 | + |
| 260 | +### Apêndice |
| 261 | + |
| 262 | +Existem uma série de materiais com guias úteis, e que podem ajudar você nesse exercício, e/ou atividades futuras que contenham inserção de dados no ambiente R, e/ou operações aritméticas com variáveis. Deixo aqui alguns itens que podem ajudá-lo. |
| 263 | + |
| 264 | +Um que pode auxiliar na inserção de dados é o datapasta "https://github.com/MilesMcBain/datapasta", ele é um addin que permite copiar informações de fora do r e colá-los no ambiente R em formatos tabulares, como tribble, tibble, dataframe. Segue vídeo exemplificando o uso do addin. "https://www.youtube.com/watch?v=Sz-tEVqZh5s" |
0 commit comments