Lectura de la base de datos

library(readxl)
icfes201502 <- read_excel("20152.xls", skip = 5)

Dimensión y registros inciales y registros finales

dim(icfes201502)
## [1] 12162    24
head(icfes201502)
## # A tibble: 6 x 24
##   CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##   <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
## 1 142133  I.E. INTERNADO … 91263           EL ENCANTO      AMAZONAS     A          OFICIAL    MAÑANA 
## 2 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
## 3 117127  I.E. INTERNADO … 91407           LA PEDRERA      AMAZONAS     A          OFICIAL    COMPLE…
## 4 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 5 038919  I.E. INEM JOSE … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 6 065482  I.E. INDIGENA S… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
## # … with 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>, PROMMATEMATICA <dbl>,
## #   PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>
tail(icfes201502)
## # A tibble: 6 x 24
##   CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##   <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
## 1 031039  I.E. NORMAL SUP… 99001           PUERTO CARREÑO  VICHADA      A          OFICIAL    MAÑANA 
## 2 087460  I.E. JOSE EUSTA… 99001           PUERTO CARREÑO  VICHADA      A          OFICIAL    MAÑANA 
## 3 099366  I.E. ANTONIA SA… 99001           PUERTO CARREÑO  VICHADA      A          OFICIAL    MAÑANA 
## 4 135020  JOSÉ CELESTINO … 99001           PUERTO CARREÑO  VICHADA      A          OFICIAL    MAÑANA 
## 5 167981  I.E. MARIA INMA… 99001           PUERTO CARREÑO  VICHADA      A          OFICIAL    MAÑANA 
## 6 037440  I.E. INTERNADO … 99624           SANTA ROSALIA   VICHADA      A          OFICIAL    MAÑANA 
## # … with 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>, PROMMATEMATICA <dbl>,
## #   PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>
library(tidyverse)
## ── Attaching packages ────────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.2.1 ──
## ✔ ggplot2 3.2.1     ✔ purrr   0.3.2
## ✔ tibble  2.1.3     ✔ dplyr   0.8.3
## ✔ tidyr   1.0.0     ✔ stringr 1.4.0
## ✔ readr   1.3.1     ✔ forcats 0.4.0
## ── Conflicts ───────────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()

Convertir un data.frame a formato dplyr.

icfes201502 <- tbl_df(icfes201502)
icfes201502
## # A tibble: 12,162 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 142133  I.E. INTERNADO … 91263           EL ENCANTO      AMAZONAS     A          OFICIAL    MAÑANA 
##  2 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
##  3 117127  I.E. INTERNADO … 91407           LA PEDRERA      AMAZONAS     A          OFICIAL    COMPLE…
##  4 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  5 038919  I.E. INEM JOSE … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  6 065482  I.E. INDIGENA S… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  7 065490  COL FEMENINO MA… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  8 087429  COL CRISTO REY   91001           LETICIA         AMAZONAS     A          NO OFICIAL MAÑANA 
##  9 093229  I.E. COLEGIO TE… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 10 117358  I.E. SAGRADO CO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>

Filtrado de una base de datos

filter(icfes201502, DEPARTAMENTO == "ANTIOQUIA", NOMBREMUNICIPIO == "MEDELLIN")
## # A tibble: 419 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 000018  COL ATENEO HORI… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
##  2 000059  INST EDUC CEFA   05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    MAÑANA 
##  3 000075  INST EDUC SANTO… 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    MAÑANA 
##  4 000083  COL BARBARA MIC… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
##  5 000091  COL BETHLEMITAS  05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
##  6 000125  COL CALASANZ FE… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
##  7 000141  COL CALASANZ     05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
##  8 000174  COL CORAZONISTA  05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL MAÑANA 
##  9 000190  COL DE LA COMPA… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
## 10 000208  COL DE LA PRESE… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL COMPLE…
## # … with 409 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>

Selección de posiciones específicas de una base de datos

slice(icfes201502, 1000:1050)
## # A tibble: 51 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 162834  I.E. CIUDADELA … 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    MAÑANA 
##  2 163253  ESC BARRIO SAN … 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL MAÑANA 
##  3 163782  INST EDUC PBRO … 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    MAÑANA 
##  4 164491  GIMN GUAYACANES  05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL SABATI…
##  5 164509  COL FUNDADORES … 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL SABATI…
##  6 168476  INST EDUC FEDER… 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    NOCHE  
##  7 168682  CENTRO DE ESTUD… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL MAÑANA 
##  8 168690  CENTRO DE ESTUD… 05001           MEDELLIN        ANTIOQUIA    A          NO OFICIAL SABATI…
##  9 169516  I.E. MANUEL URI… 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    MAÑANA 
## 10 171249  I.E. COLEGIO LO… 05001           MEDELLIN        ANTIOQUIA    A          OFICIAL    COMPLE…
## # … with 41 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>

Ordenación de la base de datos

arrange(icfes201502, DEPARTAMENTO)
## # A tibble: 12,162 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 142133  I.E. INTERNADO … 91263           EL ENCANTO      AMAZONAS     A          OFICIAL    MAÑANA 
##  2 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
##  3 117127  I.E. INTERNADO … 91407           LA PEDRERA      AMAZONAS     A          OFICIAL    COMPLE…
##  4 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  5 038919  I.E. INEM JOSE … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  6 065482  I.E. INDIGENA S… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  7 065490  COL FEMENINO MA… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  8 087429  COL CRISTO REY   91001           LETICIA         AMAZONAS     A          NO OFICIAL MAÑANA 
##  9 093229  I.E. COLEGIO TE… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 10 117358  I.E. SAGRADO CO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>
arrange(icfes201502, DEPARTAMENTO, NOMBREINSTITUCION)
## # A tibble: 12,162 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 153510  COL  NAVAL AF-4… 91001           LETICIA         AMAZONAS     A          NO OFICIAL COMPLE…
##  2 087429  COL CRISTO REY   91001           LETICIA         AMAZONAS     A          NO OFICIAL MAÑANA 
##  3 065490  COL FEMENINO MA… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  4 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
##  5 093229  I.E. COLEGIO TE… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  6 104281  I.E. COLEGIO VI… 91798           TARAPACA        AMAZONAS     A          OFICIAL    MAÑANA 
##  7 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  8 173260  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    TARDE  
##  9 135517  I.E. FRANCISCO … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 10 132506  I.E. FRANCISCO … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>
arrange(icfes201502, PROMLECTURACRITICA)
## # A tibble: 12,162 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 077834  CENT EDUC CAJAS… 68001           BUCARAMANGA     SANTANDER    A          NO OFICIAL NOCHE  
##  2 172783  C. E. R. CHAVER… 05756           SONSON          ANTIOQUIA    A          OFICIAL    COMPLE…
##  3 196188  ESC RUR MIX MAR… 27250           EL LITORAL DEL… CHOCO        A          OFICIAL    MAÑANA 
##  4 084368  INST SER INTERN… 76001           CALI            VALLE        B          NO OFICIAL MAÑANA 
##  5 196931  ESCOL RUR INDIG… 27150           CARMEN DEL DAR… CHOCO        A          OFICIAL    TARDE  
##  6 154450  COLEGIO DEPARTA… 25483           NARIÑO          CUNDINAMARCA A          OFICIAL    SABATI…
##  7 135947  INDIGENA MUREWO… 85125           HATO COROZAL    CASANARE     A          OFICIAL    TARDE  
##  8 193466  LICEO DE ALTAMI… 05093           BETULIA         ANTIOQUIA    A          OFICIAL    NOCHE  
##  9 196907  SEDE DE LETICIA  13001           CARTAGENA       BOLIVAR      A          OFICIAL    MAÑANA 
## 10 134494  LICEO JOAQUIN F… 13430           MAGANGUE        BOLIVAR      A          OFICIAL    SABATI…
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>
arrange(icfes201502, desc(PROMLECTURACRITICA))
## # A tibble: 12,162 x 24
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 180372  COL LEONARDO DA… 15690           SANTA MARIA     BOYACA       A          NO OFICIAL COMPLE…
##  2 066845  INST ALBERTO ME… 11001           BOGOTÁ D.C.     BOGOTA       A          NO OFICIAL COMPLE…
##  3 112078  COL BILINGÜE LA… 76001           CALI            VALLE        B          NO OFICIAL COMPLE…
##  4 099002  LIC CAMPO DAVID  11001           BOGOTÁ D.C.     BOGOTA       A          NO OFICIAL COMPLE…
##  5 017806  LICEO FRANCES P… 76001           CALI            VALLE        B          NO OFICIAL COMPLE…
##  6 048298  ASPAEN LICEO TA… 76001           CALI            VALLE        B          NO OFICIAL COMPLE…
##  7 075176  COL EL PINAR     76001           CALI            VALLE        B          NO OFICIAL COMPLE…
##  8 105742  COLEGIO FREINET  76001           CALI            VALLE        B          NO OFICIAL COMPLE…
##  9 125211  CAMBRIDGE SCHOO… 54518           PAMPLONA        NORTE SANTA… A          NO OFICIAL MAÑANA 
## 10 079806  COL NUEVO COLOM… 11001           BOGOTÁ D.C.     BOGOTA       A          NO OFICIAL COMPLE…
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>

Seleccion de columnas

select(icfes201502, NOMBREMUNICIPIO, DEPARTAMENTO, PROMLECTURACRITICA)
## # A tibble: 12,162 x 3
##    NOMBREMUNICIPIO DEPARTAMENTO PROMLECTURACRITICA
##    <chr>           <chr>                     <dbl>
##  1 EL ENCANTO      AMAZONAS                   42.5
##  2 LA CHORRERA     AMAZONAS                   40.1
##  3 LA PEDRERA      AMAZONAS                   39.9
##  4 LETICIA         AMAZONAS                   49.9
##  5 LETICIA         AMAZONAS                   45.8
##  6 LETICIA         AMAZONAS                   42.6
##  7 LETICIA         AMAZONAS                   39.9
##  8 LETICIA         AMAZONAS                   55.7
##  9 LETICIA         AMAZONAS                   41.1
## 10 LETICIA         AMAZONAS                   47.6
## # … with 12,152 more rows

Elementos o registros únicos

distinct(select(icfes201502, DEPARTAMENTO))
## # A tibble: 33 x 1
##    DEPARTAMENTO
##    <chr>       
##  1 AMAZONAS    
##  2 ANTIOQUIA   
##  3 ARAUCA      
##  4 ATLANTICO   
##  5 BOGOTA      
##  6 BOLIVAR     
##  7 BOYACA      
##  8 CALDAS      
##  9 CAQUETA     
## 10 CASANARE    
## # … with 23 more rows

Adicionar una nueva columna

mutate(icfes201502, promTotal = (PROMLECTURACRITICA + PROMMATEMATICA + PROMINGLES)/3)
## # A tibble: 12,162 x 25
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 142133  I.E. INTERNADO … 91263           EL ENCANTO      AMAZONAS     A          OFICIAL    MAÑANA 
##  2 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
##  3 117127  I.E. INTERNADO … 91407           LA PEDRERA      AMAZONAS     A          OFICIAL    COMPLE…
##  4 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  5 038919  I.E. INEM JOSE … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  6 065482  I.E. INDIGENA S… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  7 065490  COL FEMENINO MA… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  8 087429  COL CRISTO REY   91001           LETICIA         AMAZONAS     A          NO OFICIAL MAÑANA 
##  9 093229  I.E. COLEGIO TE… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 10 117358  I.E. SAGRADO CO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## # … with 12,152 more rows, and 17 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>, promTotal <dbl>
transmute(icfes201502, promTotal = (PROMLECTURACRITICA + PROMMATEMATICA + PROMINGLES)/3)
## # A tibble: 12,162 x 1
##    promTotal
##        <dbl>
##  1      43.5
##  2      41.3
##  3      41.0
##  4      48.4
##  5      45.5
##  6      42.1
##  7      41.8
##  8      57.5
##  9      40.6
## 10      45.7
## # … with 12,152 more rows

Resumir variables o consolidar valores

summarise(icfes201502, mean(PROMMATEMATICA))
## # A tibble: 1 x 1
##   `mean(PROMMATEMATICA)`
##                    <dbl>
## 1                   48.8

Agrupación

group_by(icfes201502, DEPARTAMENTO)
## # A tibble: 12,162 x 24
## # Groups:   DEPARTAMENTO [33]
##    CODINST NOMBREINSTITUCI… CODIGOMUNICIPIO NOMBREMUNICIPIO DEPARTAMENTO CALENDARIO NATURALEZA JORNADA
##    <chr>   <chr>            <chr>           <chr>           <chr>        <chr>      <chr>      <chr>  
##  1 142133  I.E. INTERNADO … 91263           EL ENCANTO      AMAZONAS     A          OFICIAL    MAÑANA 
##  2 087445  I.E. COLEGIO IN… 91405           LA CHORRERA     AMAZONAS     A          OFICIAL    MAÑANA 
##  3 117127  I.E. INTERNADO … 91407           LA PEDRERA      AMAZONAS     A          OFICIAL    COMPLE…
##  4 019109  I.E. ESCUELA NO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  5 038919  I.E. INEM JOSE … 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
##  6 065482  I.E. INDIGENA S… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  7 065490  COL FEMENINO MA… 91001           LETICIA         AMAZONAS     A          OFICIAL    COMPLE…
##  8 087429  COL CRISTO REY   91001           LETICIA         AMAZONAS     A          NO OFICIAL MAÑANA 
##  9 093229  I.E. COLEGIO TE… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## 10 117358  I.E. SAGRADO CO… 91001           LETICIA         AMAZONAS     A          OFICIAL    MAÑANA 
## # … with 12,152 more rows, and 16 more variables: EVALUADOS <dbl>, PROMLECTURACRITICA <dbl>,
## #   PROMMATEMATICA <dbl>, PROMSOCIALESYCIUDADANAS <dbl>, PROMCIENCIASNATURALES <dbl>, PROMINGLES <dbl>,
## #   PROMRAZONAMIENTOCUANTITA <dbl>, PROMCOMPETENCIASCIUDADAN <dbl>, DESVLECTURACRITICA <dbl>,
## #   DESVMATEMATICA <dbl>, DESVSOCIALESYCIUDADANAS <dbl>, DESVCIENCIASNATURALES <dbl>, DESVINGLES <dbl>,
## #   DESVRAZONAMIENTOCUANTITA <dbl>, DESVCOMPETENCIASCIUDADAN <dbl>, PERIODO <chr>

Combinación de “verbos” en base de datos

agrupados_deptos <- group_by(icfes201502, DEPARTAMENTO)
promedio_depto <- summarise(agrupados_deptos, mean(PROMMATEMATICA))
promedio_depto
## # A tibble: 33 x 2
##    DEPARTAMENTO `mean(PROMMATEMATICA)`
##    <chr>                         <dbl>
##  1 AMAZONAS                       42.1
##  2 ANTIOQUIA                      48.7
##  3 ARAUCA                         49.2
##  4 ATLANTICO                      47.7
##  5 BOGOTA                         53.9
##  6 BOLIVAR                        45.5
##  7 BOYACA                         51.5
##  8 CALDAS                         48.1
##  9 CAQUETA                        46.4
## 10 CASANARE                       48.2
## # … with 23 more rows

Mediante encadenamiento de verbos

icfes201502 %>% group_by(DEPARTAMENTO) %>% summarise(mean(PROMMATEMATICA))
## # A tibble: 33 x 2
##    DEPARTAMENTO `mean(PROMMATEMATICA)`
##    <chr>                         <dbl>
##  1 AMAZONAS                       42.1
##  2 ANTIOQUIA                      48.7
##  3 ARAUCA                         49.2
##  4 ATLANTICO                      47.7
##  5 BOGOTA                         53.9
##  6 BOLIVAR                        45.5
##  7 BOYACA                         51.5
##  8 CALDAS                         48.1
##  9 CAQUETA                        46.4
## 10 CASANARE                       48.2
## # … with 23 more rows

Combinación de manejo de datos

icfes201502 %>%
  mutate(promTotal = rowMeans(.[10:16])) %>%
  group_by(CODIGOMUNICIPIO) %>%
  arrange(desc(promTotal)) %>%
  select(NOMBREINSTITUCION, NOMBREMUNICIPIO, DEPARTAMENTO, promTotal) %>%
  slice(1:3)
## Adding missing grouping variables: `CODIGOMUNICIPIO`
## # A tibble: 2,914 x 5
## # Groups:   CODIGOMUNICIPIO [1,109]
##    CODIGOMUNICIPIO NOMBREINSTITUCION                    NOMBREMUNICIPIO DEPARTAMENTO promTotal
##    <chr>           <chr>                                <chr>           <chr>            <dbl>
##  1 05001           COL MONTESSORI                       MEDELLIN        ANTIOQUIA         76.1
##  2 05001           COL DE LA COMPANIA DE MARIA          MEDELLIN        ANTIOQUIA         75.8
##  3 05001           COL SAN IGNACIO DE LOYOLA            MEDELLIN        ANTIOQUIA         74.8
##  4 05002           I. E. FUNDACION CELIA DUQUE DE DUQUE ABEJORRAL       ANTIOQUIA         56.2
##  5 05002           I. E. ESCUELA NORMAL SUPERIOR        ABEJORRAL       ANTIOQUIA         51.9
##  6 05002           I. E. R.  DE PANTANILLO              ABEJORRAL       ANTIOQUIA         49.4
##  7 05004           I. E.  LA MILAGROSA                  ABRIAQUI        ANTIOQUIA         46.9
##  8 05004           COLEGIO IAUR                         ABRIAQUI        ANTIOQUIA         35.1
##  9 05021           LICEO DE ALEJANDRIA                  ALEJANDRIA      ANTIOQUIA         50.2
## 10 05021           INSTITUTO REGIONAL COREDI            ALEJANDRIA      ANTIOQUIA         44.9
## # … with 2,904 more rows

¿Cuántas Instituciones Educativas tiene cada municipio?

icfes201502 %>%
  group_by(CODIGOMUNICIPIO, NOMBREMUNICIPIO, DEPARTAMENTO) %>%
  summarise(n = n()) %>%
  select(DEPARTAMENTO, NOMBREMUNICIPIO, n) %>%
  group_by(DEPARTAMENTO) %>% 
  arrange(desc(n))
## Adding missing grouping variables: `CODIGOMUNICIPIO`
## # A tibble: 1,109 x 4
## # Groups:   DEPARTAMENTO [33]
##    CODIGOMUNICIPIO DEPARTAMENTO    NOMBREMUNICIPIO     n
##    <chr>           <chr>           <chr>           <int>
##  1 11001           BOGOTA          BOGOTÁ D.C.      1459
##  2 76001           VALLE           CALI              438
##  3 05001           ANTIOQUIA       MEDELLIN          419
##  4 08001           ATLANTICO       BARRANQUILLA      341
##  5 13001           BOLIVAR         CARTAGENA         237
##  6 54001           NORTE SANTANDER CUCUTA            167
##  7 73001           TOLIMA          IBAGUE            160
##  8 50001           META            VILLAVICENCIO     139
##  9 47001           MAGDALENA       SANTA MARTA       135
## 10 68001           SANTANDER       BUCARAMANGA       129
## # … with 1,099 more rows