Acesso a corpos de português: Projecto AC/DC: corpo Museu da Pessoa

Museu da Pessoa : AC/DC : Linguateca
O corpus Museu da Pessoa é um corpus de cento e sete entrevistas transcritas pelo Núcleo Português do Museu da Pessoa no âmbito dos seus projectos, mais cento e seis entrevistas transcritas pelo Museu da Pessoa brasileiro. As entrevistas portuguesas sofreram um processo de revisão adicional.

Estrutura do corpo

Marcadores estruturais: entrevista [entrevista completa], p [parágrafo], s [frase], resposta, pergunta, legenda [legenda de uma fotografia], introd [texto de introdução antes da entrevista]

Para cada entrevista temos a indicação dos dados possíveis sobre cada entrevistado aqui.

Versão do corpo

Corpus Museu da Pessoa, versão do texto português de Abril de 2005, versão do texto brasileiro de Dezembro de 2008, anotado a 13 de Maio de 2014, v. 5.6

Excerto do corpo


<entrevista E001>
<pergunta>
<p par=1>
<s> Qual o seu nome? </s>
</p>
</pergunta>
<resposta>
<p par=2>
<s> Lúcio Craveiro da Silva . </s>
</p>
</resposta>
<pergunta>
<p par=3>
<s> Onde nasceu? </s>
</p>
</pergunta>
<resposta>
<p par=4>
<s> Tortosendo, Covilhã . </s>
</p>
</resposta>
...

Dados quantitativos

Corpo MUSEUDAPESSOA Número de formasNúmero de tipos
Unidades 183686642924
Total de palavras 142129142793
Palavras em minúscula 111502830394
Palavras com inicial maiúscula1444918380
Palavras todas em maiúsculas 4558348
Números 8822353
Palavras com números12473
Palavras mistas266145
Pontuação106370126

Número de unidades estruturais

Atributo Número
mwe 26002
p 11780
s 93500
entrevista 215
pergunta 11015
resposta 11351
legenda 45
introd 5
corr 625

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 35140 57797
Locuções 26002 55292
Palavras gráficas 1421291 1421291
Palavras simples 1308202 1308202
Palavras 1369344 1421291

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 237035 18,12%
Verbos V.* 263977 20,18%
Adjectivos ADJ.* 50798 3,88%
Pronomes pessoais .*PERS.* 75977 5,81%
Preposições PRP.* 166817 12,75%
Conjunções K.* 82437 6,30%
Advérbios ADV.* 135510 10,36%
Determinantes .*DET.* 224163 17,14%
Especificadores .*SPEC.* 37899 2,90%
Numerais NUM.* 18863 1,44%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última actualização: 14 de Julho de 2014
Perguntas, comentários e sugestões