Introdução ao
Monitoria I e II de Técnicas de Pesquisa em Economia
23 de maio de 2025
Visite CRAN - The Comprehensive R Archive Network e baixe a linguagem, através de um arquivo executável, para seu sistema operacional;
Visite RStudio Desktop e baixe o instalador para seu sistema operacional;
Siga as instruções fornecidas nos instaladores para completar o processo de instalação.

Visite a Posit Cloud para acessar e utilizar o RStudio sem a necessidade de instalação local;
Necessário realizar login (através de uma conta Google, Github, entre outros) para acessar o RStudio Cloud.

Os pacotes no R são coleções de funções e conjuntos de dados desenvolvidos pela comunidade.

Fonte: Smith (2019).
O tidyverse oferece uma alternativa aos métodos base do R para análise de dados em dados organizados de forma “arrumada” (tidy data).
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.5
✔ forcats 1.0.0 ✔ stringr 1.5.1
✔ ggplot2 3.5.1 ✔ tibble 3.2.1
✔ lubridate 1.9.3 ✔ tidyr 1.3.1
✔ purrr 1.0.2
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
O operador pipe no R é uma ferramenta poderosa para encadear operações e facilitar a leitura e escrita de código. Existem dois operadores de pipe comuns:
Operador %>% (pipe do pacote magrittr)
%>% é usado para encadear funções, passando o resultado de uma função como argumento para a próxima função.Operador |> (pipe do pacote base)
|> é uma alternativa ao operador do magrittr.A linguagem R nos permite realizar cálculos simples e complexos, fornecendo operações aritméticas como adição, subtração, multiplicação, divisão e outras operações matemáticas.
Na linguagem R, há várias estruturas de dados fundamentais que são usadas para armazenar e manipular informações de várias maneiras.

Fonte: Ceballos e Cardiel (2013).

Fonte: Stauffer et al. (2025).
Os data frames são estruturas de dados fundamentais no R, muito utilizadas para armazenar conjuntos de dados tabulares, onde as colunas podem conter diferentes tipos de classes (numéricos, caracteres, lógicos, etc.).

Fonte: GeeksforGeeks (2025).
Um vetor é uma estrutura de dados que contém elementos do mesmo tipo. Pode ser numérico, de caracteres, lógico, etc.
Podemos combinar os objetos ano, revistas e impacto em um data frame.
Tibbles são data frames modernizados, introduzidos pelo pacote tibble no tidyverse. Eles foram projetados para corrigir algumas das limitações dos data frames tradicionais e para melhorar a usabilidade.
Uma lista é uma coleção ordenada de elementos que podem ser de diferentes tipos. Diferente de vetores, que só podem conter elementos de um único tipo, listas podem armazenar números, caracteres, vetores, data frames e até mesmo outras listas.
Parte do tidyverse, o dplyr é um pacote do R que incorpora uma gramática para transformação de dados, ou seja, fornece funções (verbos) para fazer operações com tabelas (isto é, data frames ou tibbles);
Ele permite filtrar, selecionar, organizar, transformar e resumir dados de forma encadeada. E qual a finalidade disso? um código limpo.
Principais funções (verbos)
filter(): filtra linhas (condições)
select(): seleciona colunas
mutate(): cria/edita colunas
arrange(): ordena linhas
summarise() ou reframe(): resume dados
group_by(): agrupa dados para sumarização
==);!=);>);<);>=);<=);%in%).&, | e !, respectivamente.Com os nossos dados, podemos filtrar artigos a partir de 2023, calcular a média de impacto por revista e ordenar do maior para o menor.
Exportar dados é uma tarefa comum no R quando se deseja salvar resultados de análises ou compartilhar informações com outros usuários.
Neste caso, ao importar dados no R, estaremos carregando conjuntos de dados externos para manipulação e/ou visualização.
Hora de praticar!
Acesse o arquivo main.pdf, que está dentro da pasta atividade, localizada em “tecnicas-pesquisa-economia” no repositório monitorias-ufdpar, ou clique aqui para acessá-lo diretamente.
Bibliometria é um campo das áreas da biblioteconomia e da ciência da informação que emprega o estudo quantitativo da produção científica, através de métodos estatísticos e matemáticos para analisar publicações acadêmicas, como artigos, livros, teses e conferências.
Contagem de publicações: Quantos artigos sobre “sustentabilidade” foram publicados entre 2010 e 2020?Análise de citações: Qual é o artigo mais citado sobre Inteligência Artificial?Análise de palavras-chave: Quais são os termos mais recorrentes nas pesquisas sobre Mudanças Climáticas?| Aplicação | Descrição |
|---|---|
| Mapeamento de áreas de conhecimento | Identificar tendências, tópicos emergentes ou temas em declínio em uma disciplina. |
| Análise de tendências científicas | Ver como um tema ganha ou perde relevância ao longo do tempo. |
| Avaliação de desempenho acadêmico | Avaliar a produtividade de autores, universidades ou países (por número de publicações, citações etc.). |
| Identificação de redes de colaboração | Descobrir grupos de pesquisa que atuam juntos (análise de coautoria). |
| Tomada de decisão em políticas científicas | Ajudar agências de fomento e universidades a definir prioridades de investimento em ciência. |
Assim como o dplyr, mencionado anteriormente, o bibliometrix também é um pacote do R criado para realizar análises bibliométricas completas, desde a importação dos dados até a construção de gráficos e redes científicas.
Para realizar análises bibliométricas no R, primeiro é necessário baixar os dados de bases acadêmicas confiáveis.
No Brasil, temos acesso gratuito a bases internacionais de alta qualidade por meio da:
Estando dentro da universidade (rede da instituição) ou
Pelo sistema de CAFe (Comunidade Acadêmica Federada), usando login e senha institucionais.




Permite criar pesquisas mais específicas usando filtros como tema, autor, instituição, tipo de documento, ano de publicação etc.
A função convert2df() é usada para ler os dados exportados das bases e transformá-los em data frames organizados, prontos para análise.
Após importar os dados da Web of Science e Scopus separadamente, como demonstrado em 1. e 2., podemos combinar estes dados em um único data frame.
Quando importamos e transformamos os dados com convert2df(), o bibliometrix organiza as informações em uma tabela (data frame) com linhas e colunas.
Rows: 681
Columns: 8
$ PY <dbl> 2018, 2018, 2020, 2021, 2019, 2022, 2021, 2022, 2016, 2021, 2023…
$ AU <chr> "OISHI S;KUSHLEV K;SCHIMMACK U", "KIM H", "BARNES L", "NADIROV O…
$ TI <chr> "PROGRESSIVE TAXATION INCOME INEQUALITY AND HAPPINESS", "SOME MO…
$ SO <chr> "AMERICAN PSYCHOLOGIST", "COMMUNICATIONS OF THE KOREAN MATHEMATI…
$ DE <chr> "HAPPINESS; PROGRESSIVE TAXATION; INCOME INEQUALITY", "PROGRESSI…
$ TC <dbl> 71, 1, 4, 6, 2, 9, 0, 0, 2, 3, 1, 4, 4, 22, 2, 9, 23, 10, 26, 0,…
$ DT <chr> "ARTICLE", "ARTICLE", "ARTICLE", "ARTICLE", "ARTICLE", "ARTICLE"…
$ AU_UN <chr> "UNIVERSITY OF VIRGINIA;UNIVERSITY OF TORONTO;UNIVERSITY TORONTO…
A função biblioAnalysis() realiza uma análise exploratória automática dos dados bibliográficos importados.
summary() para resumir e visualizar as principais informações.Após realizar a análise bibliométrica básica, pode-se visualizar os principais resultados de forma gráfica usando a função plot().
Por que exportar a base?
O Biblioshiny (interface gráfica do bibliometrix) permite carregar dados manualmente a partir de um arquivo .xlsx.
Assim, se quisermos analisar uma base já tratada no R dentro do Biblioshiny, precisamos exportá-la para o formato Excel.
write.xlsx() do pacote openxlsx para salvar o data frame como um arquivo .xlsx.
Utilizando a palavra-chave “climate change” e “income inequality”, realize a atividade proposta a seguir.
Acesse uma das bases de dados disponíveis, Web of Science ou Scopus, por meio do Portal de Periódicos da CAPES. Após obter os resultados da pesquisa, exporte o conjunto de dados em formato Plaintext (.txt), caso utilize a Web of Science, ou em formato CSV (.csv), caso utilize a Scopus.
Após importar os dados para o R, utilize a função biblioAnalysis() para gerar uma análise bibliométrica exploratória básica. Em seguida, execute biblioshiny() para abrir a interface gráfica do bibliometrix.