Acesso a corpos de português: Projecto AC/DC: corpo Moçambula

Moçambula : AC/DC : Linguateca
O corpus Moçambula foi criado no âmbito da tese de mestrado de Torun Reite na Universidade de Oslo, Reite (2013), e contém cartas de leitores publicadas em 2012 em vários jornais moçambicanos.

Os jornais incluídos, e marcados no atributo posicional fonte são: Diário de Moçambique, Jornal A verdade, Notícias, O País e Savana.

Estrutura do corpo

Os textos foram transcritos manualmente ou obtidos através do sítio do jornal.

O corpo está dividido em mensagens/textos separados, marcadas pelo atributo texto, com informação do identificador do mesmo.

Os textos têm também os marcadores estruturais adicionais p [parágrafo] e s [frase].

Como atributos posicionais adicionais temos o fonte que indica em que jornal o texto foi publicado.

Versão do corpo

Corpo MOÇAMBULA, versão texto de novembro de 2012, anotado a 22 de junho de 2013 com moçambicanismos, revisto em 19 de outubro de 2013, v. 3.4

Excerto do corpo


<texto notcl1405>
<p> <s> <t>Não matem o xitique</t> </s>
<p> <a> Óscar Fumo </a>
<p> <s> Sr. Director! </s>
<p> <s>Antes de tudo devo confessar que me apraz ver este texto publicado neste «nosso» jornal e do qual V. Excia é digno dirigente.</s>
<p> <s>Quando aos sábados, previamente programados, a minha mãe se enrola em pompa de traje, prepara-se ao pormenor e diz, despedindo-se dos filhos, «vou ao xitique», ela não vai fazer negócio. </s>
<s> Quando, invariavelmente, uma ou duas vezes ao ano, as mamanas amigas da minha mãe se reúnem na nossa casa, não as vejo a fazer negócio ou a operar crédito. </s>
<s> Para elas o micro-crédito é um som bárbaro que os filhos levaram a casa transportado em compêndios de economia usados na faculdade que elas, as mamanas sustentam com o seu suor - padrão dos recalques de gente humilde. </s>
<p> (...)
</texto>

Dados quantitativos

Corpo MOCAMBULA Número de formasNúmero de tipos
Unidades 7139410701
Total de palavras 5826410650
Palavras em minúscula 474228393
Palavras com inicial maiúscula46281462
Palavras todas em maiúsculas 15185
Números 405110
Palavras com números1614
Palavras mistas7633
Pontuação292649

Número de unidades estruturais

Atributo Número
p 118
s 2223
texto 93
mwe 1224

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 1728 2892
Locuções 1224 2645
Palavras gráficas 58264 58264
Palavras simples 52727 52727
Palavras 55679 58264

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 12343 23,41%
Verbos V.* 8960 16,99%
Adjectivos ADJ.* 3359 6,37%
Pronomes pessoais .*PERS.* 1019 1,93%
Preposições PRP.* 9580 18,17%
Conjunções K.* 3154 5,98%
Advérbios ADV.* 3459 6,56%
Determinantes .*DET.* 10621 20,14%
Especificadores .*SPEC.* 1385 2,63%
Numerais NUM.* 766 1,45%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última actualização: 14 de Julho de 2014
Perguntas, comentários e sugestões