Data for: "Like, share and react: Twitter capture for research and corporate decisions" published by RAC-Revista de Administração Contemporânea.
Description
Data for: "Like, share and react: Twitter capture for research and corporate decisions" published by RAC-Revista de Administração Contemporânea. Script (conjunto de comandos) para extração de dados do Twitter Na tarefa de extração de dados do Twitter, o caminho mais objetivo é utilizar as ferramentas fornecidas pela própria rede social. O Twitter oferece uma API de extração de dados (Meirelles, 2019), entretanto, esta API limita o usuário a extrair tweets recentes, publicados no máximo há sete dias da data de extração dos posts, inviabilizando, dessa forma, a extração de dados publicados anteriormente a esse período. Publicações históricas são relevantes a uma quantidade significativa de análises, inclusive a leitura informal da rede social pelos usuários, que tendem a procurar postagens antigas. Além disso o estabelecimento de uma estratégia de monitoramento histórico de redes sociais, pode trazer uma série de benefícios para a empresa como, por exemplo, a compreensão do comportamento do público através da observação do que lhe agrada ou não, além do entendimento da percepção da marca junto ao público que faz uso dessas mídias. A relevância dos dados históricos, além dos fornecidos pela API, é significativa, e o Twitter oferece, aos seus usuários, uma busca avançada, que lhes permite filtrar palavras-chave e intervalo de datas. O tema proposto para realização deste estudo faz parte de uma pesquisa acadêmica, em que se analisou os tweets das cem maiores Instituições de Ensino Superior (IESs) no Brasil em número de alunos. Para tanto, foi observado se as IESs utilizavam mídia social e, então, buscou-se avaliar as postagens dos seus usuários no Twitter no período de 2013 a 2019. Devido à limitação de acessos a dados históricos da plataforma, o que inviabilizaria a análise retroativa das postagens realizadas, optou-se por desenvolver um script (conjunto de comandos) capaz de gravar dados de páginas web ao se acessar o site. A ferramenta desenvolvida consiste em um script (conjunto de comandos) na linguagem de programação Python, o navegador Selenium e a bilblioteca BeautifulSoup, para implementar um robô que simula a utilização da rede social por um humano, realizando as pesquisas manualmente. Cabe destacar que a mídia social foco deste estudo, o Twitter, adotou uma política de privacidade (https://twitter.com/pt/privacy) que torna públicos todos os tweets registrados pelos seus usuários, ou seja, eles se tornam visíveis e pesquisáveis por qualquer pessoa. Conforme a política de privacidade do Twitter, ao compartilhar publicamente um conteúdo através de um tweet, o usuário concorda em divulgar essas informações da maneira mais ampla possível. Assim, o usuário é responsável por seus tweets e por outras informações fornecidas por meio dos serviços disponibilizados. A construção do script deste artigo seguiu as diretrizes do Twitter, conforme pode ser consultado pelo link <https://twitter.com/robots.txt>.