Social data mining and analysis in the job market context

  1. Dai, Kais
Dirixida por:
  1. Rebeca Díaz Redondo Director
  2. Ana Fernández Vilas Director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 25 de outubro de 2016

Tribunal:
  1. Nashwa Elbendary Presidente/a
  2. Manuel Fernández Veiga Secretario
  3. Florina Almenares Mendoza Vogal
Departamento:
  1. Enxeñaría telemática

Tipo: Tese

Teseo: 428179 DIALNET

Resumo

La tesis que se explora en este trabajo es que la minería y el análisis del contenido generado por los usuarios en los medios sociales específicamente relacionados con el mercado laboral proporciona conocimiento sobre dicho mercado y constituye un elemento clave para el soporte a la toma de decisión (para individuos en búsqueda de empleo, empleadores, agentes políticos, etc.). Se hace, por tanto, referencia al mercado laboral en el contexto de los diferentes actores y sus interacciones en los medios sociales (contenido generado por el usuario). Para tal fin, los datos deben ser extraídos de diferentes medios sociales (respetando la privacidad del usuario y la integridad de los datos) y, posteriormente, explorados para proporcionar conocimiento relevante sobre los componentes del mercado laboral. Los hallazgos de los experimentos propuestos permitirán dar soporte al diseño e implementación de soluciones adaptativas y dependientes del contexto para la toma de decisiones. Más concretamente, la presente investigación se inicia mediante el establecimiento de un modelado de perfiles profesionales a partir de los datos formativos y profesionales de los individuos. Un paso más allá, se aporta una caracterización de los individuos en función de las similitudes de las descripciones en el perfil (mediante análisis de lenguaje natural) y de los parámetros temporales que las acompañan. En una segunda fase, la investigación se basa en marcadores sociales en línea (taxonomías o etiquetado colaborativo) con el fin de extraer nuevas bases de conocimiento que soporten la toma de decisión: clasificación de los anuncios de empleo en Twitter; detección de la orientación profesional a través de Workforce-Analyzer (analizador del mercado laboral); inferencia del nivel de especialización de un solicitante de empleo (Senior-meter); y recomendación de temáticas de cursos formativos tipo MOOC a profesionales y diseñadores de cursos (Topics_Rec y MOOCs_Rec). PREGUNTAS DE INVESTIGACIÓN Este trabajo de investigación busca dar respuesta a las siguientes, preguntas con las fuentes de datos y requisitos que se mencionan más abajo. 1. ¿Cómo descubrir y caracterizar grupos de perfiles profesionales en función de su información curricular?; 2. ¿Cómo detectar la orientación profesional del mercado laboral?; 3. ¿Cómo evaluar el nivel de especialización de un profesional?; 4. ¿Cómo capturar y clasificar las ofertas de trabajo en Twitter?; 5. ¿Cómo detectar los perfiles profesionales más demandados (por sector profesional, ubicación, etc.)?; 6. ¿Cómo recomendar MOOCs a estudiantes en base a las necesidades del mercado laboral, apoyando la formación continua durante toda la vida? FUENTES DE DATOS Se busca una aproximación generalista que pueda ser llevada a la práctica con un alto número de medios sociales. Para la validación específica de la propuesta se han utilizado, sin embargo, dos plataformas de uso extendido: una red social en línea orientada a los negocios - LinkedIn y una plataforma de microblogging general – Twitter (conocida por su amplio espectro de contenidos y temática: política, deportes, artes y entretenimiento, salud, tecnología, etc.). La elección de estas dos plataforma ha sido motivada por el alto número de usuarios activos en cada una de ellas, lo que se traduce en un alto grado de participación y un elevado número de contenidos dinámicos. REQUISITOS La configuración de la confidencialidad en las plataformas de medios sociales han transformado el aspecto de la privacidad de los usuarios en un matter of control: los usuarios son conscientes del coste y del beneficio relacionados con la auto-revelación de información (¿qué se ve, quién lo ve, y a qué coste?). Dada la falta de disponibilidad de conjuntos de datos para llevar a cabo nuestros experimentos, y dado que las interacciones del mercado de trabajo se han desplazado a sitios sociales, la exploración de perfiles profesionales y el análisis de las ofertas de trabajo en este tipo de medios se revela como un enfoque prometedor de cara a explorar tanto la mano de obra como las solicitudes disponibles. CONTRIBUCIONES La principal contribución de esta investigación consiste en la captura y la minería de marcadores sociales en línea en el contexto profesional con el objetivo de descubrir nuevo conocimiento acerca de los componentes del mercado laboral. En este contexto, los resultados de nuestro análisis exploratorio habilitan el diseño de soluciones adaptativas de toma de decisiones para los diferentes agentes involucrados (solicitantes, reclutadores, políticos, etc.). Más específicamente, este trabajo aporta al estado del arte las siguientes contribuciones: 1. La captura de datos de redes sociales relacionadas con el mercado laboral, obteniéndose conjuntos de datos de (i) perfiles públicos de LinkedIn (LPPD, incluyendo la formación académica y profesional), (ii) ofertas de empleo en LinkedIn (LJAD) y ofertas de empleo en Twitter (TJAD), y (iii) cursos masivos en linea (Massive Open Online Courses: MOOCs) en Coursera. 2. El descubrimiento de grupos de perfiles similares basados en la información curricular de los profesionales. En este contexto, el enfoque en esta tesis permite detectar la orientación profesional de la mano de obra. Sobre esta base, se implementa también una herramienta inteligente para la inferencia del nivel de especialización (senior o junior) que se apoya en datos de LinkedIn. 3. El diseño de un enfoque dependiente del contexto para el descubrimiento de tendencias en las ofertas de empleo (por dominio profesional, ubicación, etc.), habilitando aplicaciones como, por ejemplo, un agregador de anuncios de empleo que junto con un motor de búsqueda permita recuperar en tiempo real las ofertas de trabajo en distintos medios sociales. 4. Un marco de recomendación de MOOCs compuesto por dos sistemas diferentes: (i) Topics_Rec - una herramienta de visualización que tiene como objetivo poner de relieve los temas de interés para los proveedores de MOOCs teniendo en cuenta las necesidades del mercado de empleo, y (ii) MOOCs_Rec - un módulo que recomienda MOOCs a los profesionales en función de su información curricular (perfiles de LinkedIn). Como parte de las contribuciones realizadas, se identifican también retos futuros, principalmente (i) clasificador de ofertas de trabajo en tiempo real para la provisión de un agregador de ofertas, (ii) análisis basado en series temporales para el estudio de la evolución del mercado laboral en el tiempo con el objetivo de predecir necesidades futuras y (iii) la validación del marco de trabajo para recomendación de MOOCs basado en las necesidades del mercado laboral y el perfil de los profesionales.