Investigating Sentences Features for Subjectivity and Polarity Classification in Brazilian Portuguese

Published: 19 August 2020| Version 1 | DOI: 10.17632/hsn6g3dbsk.1
Contributor:
Tiago de Melo

Description

O dataset consiste de uma coleta que nós fizemos de 350 comentários de usuários sobre restaurantes no Brasil no site TripAdvisor[1], no período de janeiro a março de 2020. Os comentários foram divididos em 1.049 sentenças e cada sentença foi manualmente anotada pelos autores. Inicialmente, nós classificamos as sentenças em objetivas e subjetivas. Nós pudemos observar que existe um equilíbrio no número de sentenças em cada uma dessas classes. Em seguida, nós classificamos manualmente as sentenças subjetivas em positivas e negativas. As sentenças que eram subjetivas, mas com polaridade neutra, foram desconsideradas. Na prática, nós observamos que existem poucas sentenças que são subjetivas e neutras. Também foi possível observar que há uma quantidade bastante superior de sentenças positivas do que sentenças negativas. [1] https://www.tripadvisor.com.br

Files

Institutions

Universidade do Estado do Amazonas

Categories

Portuguese Language, Sentiment Analysis

Licence