9 de fevereiro de 2006

5.. factos sobre o Abrupto

1. O Abrupto é feito de aproximadamente 838.026 palavras, das quais 67.020 são vocábulos únicos (como referência, o Dicionário da Língua Portuguesa Contemporânea contém 270.000 vocábulos).

2. "De" é a palavra mais utilizada, 28.619 vezes para ser preciso. Portugal é o substantivo próprio mais frequente (647 ocorrências) e política é o mais comum substantivo abstracto (629).

3. Em quase três anos, o Abrupto publicou mais de 4400 entradas, o que dá uma média de 4.3 artigos por dia.

4. Por cada hiperligação que faz, o Abrupto recebe 1107 hiperligações de volta, de acordo com o cálculo do Blogshares.

5. Segundo a Bravenet, o Abrupto recebeu 2 milhões de visitas desde Junho de 2003, a maior parte das quais à segunda-feira.

A lista de cinco assuntos ou objectos desta semana merece uma explicação mais alongada. Encontrado através do Lifehacker, o TextStat é uma ferramenta de análise de documentos de texto (Word, ficheiros em HTML, etc) que produz uma lista de palavras ordenadas pela sua frequência e concordâncias, independentemente da língua em que o texto foi escrito. Para além do número de ocorrências de uma palavra em particular, também se pode ficar a saber do contexto em que ocorre e exportar essa informação para Excel, entre outras alternativas. Para o nosso primeiro teste, fizemos questão de utilizar um corpus de análise suficientemente vasto que permitisse extrair resultados minimamente representativos do seu contexto, autor e meio de comunicação. É aí que entra o blog de José Pacheco Pereira, e em particular as suas 36 páginas de texto, equivalentes a aproximadamente 1265 páginas A4.

O potencial desta pequena aplicação (o ficheiro de instalação tem menos de 3 MB) desenvolvida e distribuída gratuitamente pelo Departamento de Linguística da Universidade de Berlim é vasto, nem que seja para saciar alguma curiosidade frívola. De que outro modo poderíamos ficar a saber que certamente é o advérbio mais utilizado por JPP?

6. No último ano, o maior pico de visitas do Abrupto registou-se nas primeiras semanas de Fevereiro de 2005.

7. De manhã, às 10 horas, é a altura mais habitual para a publicação de um artigo no Abrupto.

8. O não ganha ao sim (9314 contra 307).

9. Blogue é referido mais vezes do que blog.

10. Soares é referido mais vezes do que Cavaco e PSD mais vezes do que PS.

11. Uma pesquisa no Google por blog Abrupto devolve 193 mil resultados.

12. 150 é o número de INTENDÊNCIAS feitas até hoje no Abrupto.

13. JPP já esteve 9 vezes de CORRIDA e 13 DE REGRESSO.

14. A duração das visitas ao Abrupto é maior ao fim-de-semana.

15. Os LEITORES já fizeram o Abrupto 343 vezes.

16. O Espírito prevalece sobre a Oportunidade.

17. JPP prefere a Montanha à Praia, mas por pouco (57 vs 40).

18. Certamente é o advérbio mais utilizado no Abrupto (100 vezes). Exactamente é o segundo mais utilizado (94).

19. O Abrupto é citado ou referido 177 vezes no Posto de Escuta (188 a contar com este artigo).

20. JPP conjugou duas vezes o verbo hesitar na primeira pessoa do singular. Hesito também é a última palavra da lista de 67 mil outras utilizadas.

Sem comentários: