Publication:
Finding similar tweets within health related topics

Thumbnail Image
Authors
Villanueva Vega, Danny Gilberto
Embargoed Until
Advisor
Rodríguez-Martínez, Manuel
College
College of Engineering
Department
Department of Electrical and Computer Engineering
Degree Level
M.S.
Publisher
Date
2019-07-10
Abstract
Social networks have become a very important means to facilitate the creation and sharing of information, ideas, news, and opinions on many topics. They also provide real-time information on sales, marketing, politics, natural disasters, and crisis situations, among others. These networks include Facebook, Twitter, WhatsApp, and Instagram, to name a few. In this work, we shall focus our efforts on the Twitter social network. This network provides a mechanism for people to express their views using short messages (i.e., 280 characters) called tweets. In this project, we investigate and implement text similarity neural network models in such a way that we can: 1) know if they are related or not with a disease, 2) group similar tweets to those that we have already captured, analyzed or stored, and 3) find similarity index between tweets using different learning algorithms. We based our work on, semantic similarity approaches and text similarity measures using Deep Learning algorithms to deliver reliable information about health-related topics.

Las redes sociales se han convertido en un medio muy importante para crear y compartir información, ideas, noticias y opiniones sobre muchos temas. Estas también proporcionan información en tiempo real sobre ventas, mercadotecnia, política, desastres naturales y situaciones de crisis, entre otros. Estas redes incluyen Facebook, Twitter, WhatsApp e Instagram, por nombrar algunas. En este trabajo, centraremos nuestros esfuerzos en la red social Twitter. Esta red proporciona un mecanismo para que las personas expresen sus puntos de vista mediante mensajes cortos (no más de 280 caracteres) llamados tweets. En este proyecto, investigamos e implementamos modelos de redes neuronales de similitud de texto de manera que podamos: 1) saber si están relacionados o no con una enfermedad, 2) agrupar tweets similares a los que ya hemos capturado, analizado o almacenado y 3) encontrar el índice de similitud entre los tweets que utilizan diferentes algoritmos de aprendizaje. Basamos nuestro trabajo en los enfoques de similitud semántica y las medidas de similitud de texto utilizando algoritmos de “Deep Learning” para proporcionar información confiable sobre temas relacionados a la salud.
Keywords
Text similarity,
Deep learning algorithms,
Health related topics,
Semantic similarity,
Social networks
Usage Rights
All Rights Reserved / restricted to Campus
Cite
Villanueva Vega, D. G. (2019). Finding similar tweets within health related topics [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2536