Friday 22 December 2017

Criar nova variável dummy em stata forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas mais antigas serão removidas ou arquivadas de tal forma que não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa Digital e Educação Ajude o Stat Consulting Group dando um presente Stata FAQ Como posso criar variáveis ​​dummy em Stata Existem duas maneiras fáceis de criar variáveis ​​dummy no Stata. Vamos começar com um conjunto de dados simples que tem três níveis do grupo de variáveis. Podemos criar variáveis ​​dummy usando o comando tabulate ea opção generate (), como mostrado abaixo. O comando tabulate com a opção generate criou três variáveis ​​dummy denominadas dum1. Dum2 e dum3. Também podemos usar o comando xi para criar variáveis ​​dummy para nós. O comando xi criou duas variáveis ​​dummy, chamadas Igroup2 e Igroup3, e omitiu a variável dummy para o grupo 1. Um exemplo usando o conjunto de dados High School e Beyond Usando o conjunto de dados High School e Beyond, queremos explicar a variabilidade nos escores de escrita usando informações sobre leitura , A matemática e o tipo de programa em que o estudante está. A variável categórica prog tem três níveis: 1) programa geral, 2) programa acadêmico e 3) programa vocacional. Primeiro, vamos carregar o dataset da Internet, então vamos criar variáveis ​​dummy para prog usando o comando tabulate. O comando tabulate com a opção generate criou as seguintes variáveis: prog1. Prog2. E prog3. Em uma análise de regressão, podemos usar apenas duas das três variáveis ​​dummy. Desde que o prog tem três níveis usa dois graus de liberdade. Aqui está a análise de regressão. Na análise, todas as variáveis ​​foram estatisticamente significativas, exceto prog2 e prog3. No entanto, é necessário lembrar que é a combinação de prog2 e prog3 que compõe o tipo de programa variável. Vamos testar prog2 e prog3 juntos. Como se verifica, ao testar prog2 e prog3 juntos, descobrimos que o tipo de programa variável não é estatisticamente significativo. Nós também podemos fazer isso em uma etapa usando o prefixo xi, como mostrado abaixo. Observe como os resultados abaixo correspondem exatamente àqueles acima. Como fizemos no exemplo anterior, podemos testar o efeito global do tipo de programa com o comando de teste, conforme mostrado abaixo. Para obter mais informações Consulte o manual Stata ou Stata ajuda para tabulação e para xi. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia. Estatística: Análise de Dados e Software Estatístico William Gould, StataCorp Uma variável dummy é uma variável que assume Os valores 1 e 0 1 significam que algo é verdadeiro (como a idade lt 25, sexo é masculino, ou na categoria ldquovery muchrdquo). Variáveis ​​dummy também são chamadas de variáveis ​​de indicador. Como veremos em breve, na maioria dos casos, se você usar a notação de variável-fator, você não precisa criar variáveis ​​dummy. Nos casos em que as variáveis ​​fatoras não são a resposta, você pode usar gerar para criar uma variável dummy de cada vez e tabular para criar um conjunto de manequins de uma só vez. Usando variáveis ​​fatoras em vez de gerar variáveis ​​dummy, tenho uma variável discreta, tamanho. Que assume valores discretos de 0 a 4 Se eu quiser um manequim para todos os níveis de tamanho, exceto para um grupo de comparação ou nível de base, eu não preciso criar 4 dummies. Usando variáveis ​​de fator U. Eu posso digitar ou usar um estimador Se eu quiser usar um manequim que é 1 se tamanho é grande (size3) e 0 caso contrário, eu digito Se eu quiser fazer o grupo de comparação, ou nível de base, de tamanho seja size3 em vez do tamanho Tamanho padrão0. I type Você também pode usar a notação de variável-fator para referir-se a variáveis ​​categóricas, suas interações ou interações entre variáveis ​​categóricas e contínuas. Por exemplo, eu posso especificar a interação de cada nível de tamanho (exceto o nível base) ea variável contínua x, digitando O c. Instrui Stata que a variável x é contínua. Em todos os casos acima, não foi necessário criar uma variável. Além disso, muitas das instalações de postestimation da Statas, incluindo em particular o comando de margens, estão cientes de variáveis ​​de fator e as manipularão elegantemente ao fazer cálculos. Existem alguns casos em que a criação de manequins pode valer a pena. Nós ilustramos estes abaixo. Usando gerar para criar variáveis ​​dummy Esta declaração faz a mesma coisa que as duas primeiras declarações. Agelt25 é uma expressão, e Stata avalia-a retornando 1 se a instrução for verdadeira e 0 se for falsa. Se você tem valores em falta em seus dados, seria melhor se você digitar Stata trata um valor ausente como infinito positivo, então a expressão agelt25 avalia 0, não faltando, quando a idade está faltando. (Se a expressão for agegt25, a expressão será avaliada como 1 quando a idade estiver ausente.) Você não precisa digitar os parênteses em torno da expressão. É bom o suficiente. Aqui estão mais algumas ilustrações de gerar variáveis ​​dummy: Na linha acima, matriculado é em si uma variável dummy variablemdasha assumindo valores zero e um. Poderíamos ter digitado inscritos1. Mas digitar inscrito é bom o suficiente. Assim como Stata retorna 1 para true e 0 para false, Stata assume que 1 significa verdadeiro e que 0 significa falso. Usando tabulate para criar variáveis ​​dummy tabulate com a opção generate () irá gerar conjuntos inteiros de variáveis ​​dummy. Digamos que o grupo de variáveis ​​assume os valores 1, 2 e 3. Se você digitar, você verá uma tabela de freqüência de quantas vezes o grupo recebe cada um desses valores. Se digitar, você verá a tabela e tabulate criará nomes de variáveis ​​g1. G2. E g3 que assumem os valores 1 e 0, g1 sendo 1 quando grupo1. G2 sendo 1 quando grupo2. E g3 sendo 1 quando grupo3. Watch: O que você nomeia a variável é com você. Se tivéssemos digitado as novas variáveis ​​teria sido chamado res1. Res2. E res3. Também não é necessário que a variável que está sendo tabulada tome valores seqüenciais ou mesmo seja inteiros. Aqui está outro exemplo: Você pode descobrir o que os valores são de descrever. Finalmente, o tabulate pode ser usado com variáveis ​​de string:

No comments:

Post a Comment