sexta-feira, 10 de abril de 2015

[P7] Sobrenomes da língua portuguesa


     Indiscutivelmente, Portugal no Século XV foi uma potência naval. No mapa-múndi, Portugal é um país de proporções pequenas e encontra-se encravado em um pequeno estreito de terras no oeste da Europa. Os grandes (e corajosos) navegadores portugueses circularam o mundo levando a sua cultura por onde passavam, influenciando o globo terrestre. Hoje em dia, a língua portuguesa é falada em pelo menos 10 países, por aproximadamente 269 milhões de pessoas, muito mais que as 11 milhões de pessoas de Portugal de onde tudo se originou. As línguas românicas são hoje faladas em muitos locais (Itália, França, Espanha, Romênia, etc) sendo estas derivadas do latim (e latim vulgar), com influências de muitas línguas (no Brasil, inclusive, as línguas dos índios foram mescladas no português brasileiro).
     Os historiadores marcam que o Império Português durou de 1415 (Conquista de Ceuta, no norte da África) até 1999 (com a entrega de Macau), ou seja, 584 anos (o Brasil tem em 2015 apenas 515 anos).

Curiosidades

     O português é a língua oficial dos seguintes países (dados obtidos em Wikipedia em 15/03/2015, e ordenados por população):

País População(*) Percentual (%)
Brasil 202.656.788 75,3% 93,5%
Moçambique 24.692.144 9,2%
Angola 24.300.000 9,0%
Portugal 10.813.834 4,0% 6,5%
Guiné-Bissau 1.693.398 0,6%
Goa (Índia) 1.457.723 0,5%
Timor-Leste 1.201.542 0,4%
Guiné-Equatorial 722.254 0,3%
Macau 587.914 0,2%
Cabo Verde 538.535 0,2%
Índia Damão e Diu (Índia) 242.911 0,1%
São Tomé e Príncipe 190.428 0,1%
Total 269.097.471 100%
(*) baseando-se em estimativas populacionais.






     A imagem a seguir explica os dados acima, onde o Brasil detém 75,3% da população total de falantes da língua portuguesa. Angola e Moçambique vem logo a seguir, com 18,2% dos falantes e estes três países tem 93,5% do total.


     A figura a seguir mostra o mapa-múndi e os países que falam português, destacando-se Portugal.

     A próxima figura detalha a zona de influência do português ao redor do mundo. Tirando a área do mar da figura (33 milhões de km2, aproximadamente), a área possui 11 milhões de km2 (olhar próxima tabela), o que é bastante considerável em relação ao resto do mundo (estes números não são exatos, mas fornecem uma ideia da área aproximada de pessoas que estão falando português).

Dados

     Os dados a seguir listam os primeiros 200 sobrenomes dos países que falam português, obtidos no site http://forebears.io/. A tabela a seguir lista as siglas utilizadas no arquivo (estes dados também estão comentados no cabeçalho) relacionando-as com o país (no primeiro arquivo). O segundo arquivo contém 1951 sobrenomes gerais (sem origem definida).

     Faça o download dos seguintes arquivos:
  1. 200 sobrenomes mais comuns em países de língua portuguesa (arquivo sobrenomes-lingua-portuguesa.txt)
  2. Outros 1951 sobrenomes (arquivo sobrenomes-gerais.txt)
     Legenda dos sobrenomes do arquivo sobrenomes-lingua-portuguesa.txt:
Sigla País/RA* Área (km2)
BRA Brasil 8.515.767
ANG Angola 1.246.700
MOZ Moçambique 801.590
POR Portugal 92.090
GUI Guiné Bissau 36.544
MAU Macau 28.600
EQU Guiné Equatorial 28.051
TIM Timor Leste 15.007
CAB Cabo Verde 4.033
- Goa** 3.702
SAO São Tomé e Príncipe 1.001
Total 10.773.085
Área Mundial 149.000.000
(*) Região Administrativa
(**) Para Goa não existem dados relativos à sobrenomes

Questões interessantes deste projeto
  1. Qual é o sobrenome mais comum de cada país (a partir do arquivo dos 200 sobrenomes mais comuns)?
    1. Quais são os menores (em número de caracteres) e maiores (idem) sobrenomes de cada país?
  2. Por ordem alfabética, qual é o número total de sobrenomes existentes de cada letra? (por exemplo: sobrenomes com 'A': 3.444.200, ...)
  3. A listagem fornece um total de pessoas com um sobrenome específico. Qual é o sobrenome (entre todos os países) com o maior número de pessoas?
  4. Para a listagem fornecida, quantas pessoas no total estão contadas nas listagens de sobrenome?
  5. Qual é o percentual de pessoas listadas no arquivo em relação à população de cada país?
  6. Separe o arquivo original em um arquivo de sobrenome por país, colocando a sigla no cabeçalho e informando o nome do arquivo como sendo a sigla com terminação .txt
  7. Construa um arquivo novo ordenando pelo maior número de sobrenomes da listagem, preservando a sigla do país (também ordenada alfabeticamente)
  8. Crie um novo arquivo de dados (chamado sobrenomes-unicos.txt) contendo a listagem de sobrenomes únicos (retira os sobrenomes repetidos, e somam-se os totais dos sobrenomes de cada país), sem a sigla
  9. Qual é o sobrenome com o maior número de caracteres de cada país?
  10. Para cada sobrenome de cada país, mostre o percentual deste em relação à população total do país (use a tabela acima que mostra a população)
  11. Quais são os sobrenomes em comum entre todos os países? (se é que existe algum - se não existir, mostre o sobrenome em comum com o maior número de países)
  12. Quantos sobrenomes e quantas pessoas possuem hipocorismos (apenas com sufixos -inho e -inha) no nome? Liste-os.
  13. Quantos sobrenomes são patronínicos, ou seja, terminados em ES (significando 'filho de'), em IZ (idem)? Liste-os, bem como a população por país que os possui
  14. Análises sobre os dois arquivos de sobrenomes do problema
    1. Quais e quantos sobrenomes em comum existem nos dois arquivos?
    2. Qual país possui o maior número de sobrenomes nos dois arquivos?
    3. Quais sobrenomes do arquivo de nomes gerais (o segundo arquivo) não existem nos 200 sobrenomes (primeiro arquivo) de qualquer país?
    4. Quantos habitantes que falam português existem por metro quadrado em cada país? (ordene a lista do maior para o menor número)

Nenhum comentário:

Postar um comentário