sexta-feira, 3 de julho de 2015

[P13] Pesquisadores brasileiros (Dados de Julho de 2015)


     O Brasil investiu muito dinheiro em pesquisa nos últimos anos. Isso refletiu em citações nos artigos de outros pesquisadores do mundo inteiro, de forma positiva, colocando o país em uma posição de destaque na pesquisa internacional.

     O site Webometrics - Ranking Web of Universities disponibiliza um ranking de pesquisadores do mundo inteiro a partir do H-Index e do total de citações em artigos. O link Ranking of scientists in Brazilian Institutions according to their Google Scholar Citations public profiles mostra o ranking do Brasil.

     Mas o que significa o H-Index? Meu perfil no Google Scholar, datado de hoje, 3/Julho/2015 (vamos usar este método, neste post, existem outras maneiras, tais como usar o Scopus, etc), indica que o meu H-Index é 7. Isso significa que eu tenho pelo menos 7 artigos com 7 citações cada (obviamente, eu tenho mais do que 7 artigos, mas estes tem menos de 7 citações, então não entram no cômputo do índice). Este H-Index é considerado baixo, já que o primeiro pesquisador do ranking do Webometrics possui H-Index de 126 (ou seja, ele tem pelo menos 126 artigos com 126 citações cada).

     As dificuldades de se usar o H-Index como métrica para bons pesquisadores são muitas, por exemplo, eu poderia apenas citar meus próprios trabalhos, com o objetivo de aumentar o meu índice. Existem maneiras de coibir isso, retirando da contagem de citações as chamadas auto-citações, entre outras técnicas (avaliações de pares consistentes, que removam estes comportamentos, etc). Hoje em dia, observa-se que os pesquisadores lutam para serem citados, pois reflete diretamente no aumento do seu H-Index. Claro que bons pesquisadores desejam realizar apenas pesquisas relevantes, sendo citados de forma natural por outros pesquisadores, mas muitas vezes, não é isso que se observa.

Dados

     Baixe neste link os arquivos para este projeto - existe apenas um arquivo, ordenado por H-Index, com tamanho de 400Kb, com dados de Julho de 2015, contendo o seguinte cabeçalho:
#RANK;NAME;ORGANIZATION;H-INDEX;CITATIONS
  onde:
#RANK mostra o número do pesquisador no ranking (variando de 1 a 6000, com possibilidade de existir valores repetidos)
#NAME indica o nome do pesquisador
#ORGANIZATION mostra a afiliação do pesquisador (podendo ter mais de uma)
#H-INDEX mostra o índice H do pesquisador
#CITATIONS indica o total de citações (de todos os seus artigos científicos) feita por ele ou por outros pesquisadores
     Por exemplo, os primeiros 5 pesquisadores são:
RANK NOME ORGANIZATION H-INDEX CITATIONS
1Cesar VictoraUniversidade Federal de Pelotas10647202
2Maria Elena PolCentro Brasileiro de Pesquisas Físicas10553007
3S F NovaesUniversidade Estadual Paulista10047511
4Eduardo de Moraes GregoresUniversidade Federal do ABC10044555
5Luiz MundimUniversidade do Estado do Rio de Janeiro9844501

Questões interessantes deste projeto
  1. Aspectos gerais - estatísticas interessantes
    1. Quais instituições, sem repetição estão listadas no arquivo?
    2. Construa um ranking por instituição que mais possui pesquisadores na listagem
    3. Crie um arquivo novo chamado pesquisadores-citacoes.txt que organiza os pesquisadores pelo seu total de citações (e não pelo H-Index)
    4. Quantos pesquisadores empataram no ranking?
  2. Desafio
    1. Tente classificar os pesquisadores por região do Brasil, conforme a localização da Universidade (descubra onde fica cada universidade, esta informação não foi disponibilizada em nenhum arquivo)

Nenhum comentário:

Postar um comentário