adolescentes_regiaosul_brasil_regressao_rosangela

Published: 31 August 2021| Version 1 | DOI: 10.17632/kh9hdxt983.1
Contributor:
Rosangela Maria Pontili

Description

O banco de dados foi criado a partir dos microdados do Censo Demográfico 2010, do Brasil. Foram selecionados somente adolescentes com idade entre 14 e 17 anos, estudantes e não estudantes, da região Sul do Brasil. Para estes adolescentes identificou-se as características pessoais (idade, sexo, cor ou raça, se residentes em área urbana ou rural, se estudavam ou não, série que cursavam, identificação de atraso escolar, se trabalhavam ou não, se recebiam algum tipo de transferência governamental). Também foram identificadas várias características familiares (renda familiar per capita, escolaridade/cor ou raça/salário da mãe, do pai e do chefe de família). Por fim, as 191.588 observações dos adolescentes da região Sul do Brasil foram cruzadas com informações sociais e econômicas dos 1.188 municípios da mesma região (indicadores de mercado de trabalho, IDH-m, índice de Gini, indicadores de localização, taxa de desemprego, taxa de rotatividade da força de trabalho, PIB e PIB/per capita). Com isso, criou-se uma base de dados para análise multinível dos fatores capazes de influenciar o abandono escolar dos adolescentes em idade ideal para cursar o ensino médio.

Files

Steps to reproduce

A pesquisa utilizou o nível de educação formal como proxy do capital humano obtido por um indivíduo. Assim, foi estimada uma Função de Produção Educacional (FPE) em que a educação formal obtida por um adolescente z, residente no município j, é uma função de suas características individuais e familiares, sendo que as características individuais foram definidas como: a idade, o sexo deste adolescente, situação do domicílio (rural ou urbano), o estado de residência, o fato de estar trabalhando (ou não) e o fato de receber transferências de programas governamentais (ou não); as características familiares foram identificadas como: a cor ou a raça e a escolaridade da mãe, o sexo do chefe da família e a renda familiar per capita. Também se entendeu que a decisão de estudar era afetada por indicadores municipais, tais como: os indicadores de emprego formal, a taxa de rotatividade, a taxa de desemprego, o logaritmo do PIB per capita, o índice de Gini e o IDH-M. A forma funcional escolhida diz respeito a um modelo logit hierárquico em dois níveis por entender-se que a estrutura da base de dado possui natureza hierárquica. A variável dependente foi a binária identificada como 1 em caso de o adolescente com idade para cursar o ensino médio estar fora da escola (abandono escolar) e identificada como 0 quando o adolescente estava matriculado em qualquer série do ensino fundamental ou médio (não abandonou a escola). O software utilizado para rodar a regressão foi o HLM (Hierarchical Linear and Nonlinear Modeling). Para a extração dos microdados do censo demográfico e posterior cruzamento com as informações em nível municipal utilizou-se o Stata for Windows 12. Inclusive, o banco de dados disponível nesse repositório tem extensão dta e pode ser aberto somente com o uso do Stata.