Friday, 10 November 2017

Alterando O Tipo De Armazenamento No Stata Forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis ​​incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e configuramos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis ​​no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal dando um presente FAQ do Stata Como posso converter rapidamente muitas variáveis ​​de string em variáveis ​​numéricas Pode haver momentos em que você recebe um arquivo que possui muitas (ou todas) variáveis Definido como cordas. Isto é, variáveis ​​de caracteres. As variáveis ​​podem conter valores numéricos, mas se eles são definidos como string de tipo. Há muito poucas coisas que você pode fazer para analisar os dados. Você não pode obter meios, você não pode fazer uma regressão, você não pode fazer uma ANOVA, etc. Às vezes, o conjunto de dados contém valores numéricos que são armazenados como strings. Nós abordaremos esse cenário primeiro. Em seguida, abordaremos o caso em que as variáveis ​​de string realmente contêm cordas, e o objetivo é atribuir cada valor que a string assume em um valor numérico. Todos os exemplos desta página usam o mesmo conjunto de dados, então vamos começar examinando os dados. O conjunto de dados de exemplo, hsbs. É um subconjunto do arquivo de dados High School e Beyond, com todas as variáveis ​​como variáveis ​​de string. Como você vê a partir do comando de descrição abaixo, as variáveis ​​são todas definidas como variáveis ​​de string (por exemplo, ciência é str2. Uma seqüência de comprimento 2). Agora que sabemos que as variáveis ​​são variáveis ​​de string, podemos usar o comando list para ver como as strings armazenadas nessas variáveis ​​se parecem. Embora a ciência variável seja definida como str2, você pode ver da lista abaixo que contém apenas valores numéricos. Mesmo assim, porque a variável é definida como str2, a Stata não pode realizar qualquer tipo de análise numérica da ciência variável. O mesmo é verdadeiro para a leitura variável. Convertendo variáveis ​​de string com valores numéricos Um método para converter números armazenados como strings em variáveis ​​numéricas é usar uma função de string chamada real que traduz valores numéricos armazenados como seqüências de caracteres em valores numéricos. A Stata pode reconhecer como tal. A primeira linha de sintaxe lê no conjunto de dados mostrado acima. O segundo gera uma nova leitura variável que é igual ao valor do número armazenado na leitura da variável de string. O (s) real (es) é a função que traduz os valores mantidos como strings, onde s é a variável que contém strings. Um segundo método para alcançar o mesmo resultado é o comando destring. Vamos tentar usar o comando destring e ver como ele funciona. A primeira linha de sintaxe carrega o conjunto de dados novamente, de modo que estamos começando com um conjunto de dados contendo apenas variáveis ​​de string novamente. A segunda linha de sintaxe executa o comando destring. Como você pode ver no comando de descrição abaixo, o comando destring converteu todas as variáveis ​​em numérico, exceto para a raça. Gênero e schtyp. Como essas variáveis ​​tinham caracteres neles, o comando destring deixou essas variáveis ​​sozinhas. Se houvesse variáveis ​​numéricas no conjunto de dados, elas permaneceriam inalteradas. Ambas as técnicas descritas acima possuem atributos que em algumas situações são vantajosas e em outras situações podem ser desvantagens. O comando destring pode ser executado em um conjunto de dados inteiro em um passo, o método usando a função real exige emitir um comando para cada variável a ser convertida (embora isso possa ser feito com um loop em vez de digitar a sintaxe para cada variável). Uma vantagem potencial para usar a função real (o primeiro método) é que, se a função real encontrar um valor não-numérico, ele define a variável igual à ausente nesse caso e continua. Até certo ponto, podem ser feitos comportamentos para se comportar de forma semelhante, mas não de forma idêntica. Para converter uma variável de string contendo qualquer valor não numérico usando destring, é necessário listar os caracteres que devem ser ignorados (por exemplo, ou.). Além disso, ao invés de definir valores para os casos com valores não-numéricos em falta (o que a função real faz), destring remove os caracteres não-numéricos especificados. Destring irá extrair as cordas especificadas e, em seguida, converter, o que significa que a4 pode ser convertido em 4. o comportamento de destring é muito bom se um tiver valores numéricos armazenados como strings que ocasionalmente contêm coisas como vírgulas (por exemplo, 4,354), mas pode haver situações em que Esse comportamento não é desejável. Convertendo variáveis ​​de string com valores não numéricos em valores numéricos Como convertem gênero e schtyp em valores numéricos Podemos usar o comando codificar como mostrado abaixo. Esses comandos criam gender2 e schtyp2. Observe no comando de descrição abaixo que gender2 e schtyp2 são variáveis ​​numéricas e eles possuem rótulos associados a eles (chamado gender2 e schtyp2). Se listarmos os dados, parece que gender2 e schtyp2 são idênticos ao gênero e ao schtyp. No entanto, eles são realmente numéricos eo que você está vendo são os rótulos de valor associados às variáveis. Abaixo, usamos a opção nolabel e você vê que gender2 e schtyp2 são realmente numéricos. E quanto à raça variável. Ainda é uma variável de caracteres porque nosso comando de destruição anterior viu o X nos dados e não tentou convertê-lo porque tinha valores não-numéricos. Abaixo, podemos convertê-lo em numérico, incluindo a opção ignorar (X) que informa a destring para converter a variável em numérico e quando encontra X para converter isso em um valor ausente. Você pode ver os resultados no comando da lista abaixo. Como você viu, podemos usar destring para converter variáveis ​​de string que contêm números em variáveis ​​numéricas, e pode lidar com situações em que alguns valores são armazenados como um personagem (como o X que vimos com a raça). Se você tem uma variável de caracteres que está armazenada como todos os caracteres, você pode usar codificar para converter a variável de caracteres numérico e criará rótulos de valores que tenham os valores que foram armazenados com a variável de caracteres. Para mais informações, consulte o manual de ajuda ou referência sobre os comandos de destring e codificar. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment