A corpus for mining drug-related knowledge from Twitter chatter: Language models and their utilities

Name: A corpus for mining drug-related knowledge from Twitter chatter: Language models and their utilities
Creator: Abeed Sarker
Published: 2017-07-17T18:30:14.417Z
Keywords: Social Media, Drug Adverse Reactions, Language Modeling, Pharmacovigilance

Sarker, Abeed; Gonzalez, Graciela

doi:10.17632/dwr4xn8kcv.3

A corpus for mining drug-related knowledge from Twitter chatter: Language models and their utilities

Published: 17 July 2017| Version 3 | DOI: 10.17632/dwr4xn8kcv.3

Contributors:

Abeed Sarker, Graciela Gonzalez

Description

Language models. As described in the publication titled above. DSM-langauge-models-3M-LARGE is generated from over 3M posts using window size 5 and dimension 400. **USE THIS**: DSM-language-model-1B-LARGE is generated from ~ 1B tweets from user timelines where at least 1 medication is mentioned. This model is an n-gram model.

A corpus for mining drug-related knowledge from Twitter chatter: Language models and their utilities

Description

Files

Categories

Licence