Development and computational implementation of estimation and inference methods in flexible regression modelsapplications in Biology, Engineering and Environment.

  1. Sestelo, Marta
Dirixida por:
  1. Javier Roca Pardiñas Director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 17 de xuño de 2013

Tribunal:
  1. Stefan A. Sperlich Presidente/a
  2. Jacobo de Uña Álvarez Secretario
  3. María Luz Durbán Reguera Vogal
Departamento:
  1. Estatística e investigación operativa

Tipo: Tese

Resumo

En muchos estudios de investigación se obtienen colecciones de datos que necesitan ser tratados por algún tipo de procedimiento estadístico para la correcta interpretación y obtención de conclusiones. Dentro de estas técnicas estadísticas cabe destacar los modelos de regresión cuyo objetivo es encontrar un modelo matemático que permita una interpretación razonable de la relación entre una variable respuesta y un conjunto de variables independientes (o covariables). En este contexto, se centra la temática de esta tesis, que puede ser resumida en los siguientes puntos generales:   • Implementación del algoritmo de estimación local scoring basado en suavizadores locales polinómicos tipo núcleo para la estimación de los modelos aditivos generalizados. Aspectos computaciones: Desarrollo de técnicas tipo binning de aceleración computacional. Selección automática de las ventanas de suavización. Técnicas de remuestreo bootstrap: intervalos de confianza y contrastes de hipótesis. • Inclusión de interacciones en el efecto de las covariables: interacciones factor-por-curva e interacciones curva-por-curva. • Algoritmos de selección de variables para aquellas situaciones donde existe un número elevado de covariables. Se pretende obtener el subconjunto de variables que de lugar al modelo que presente una mayor capacidad predictiva. • La metodología desarrollada tendrá una aplicación directa a datos reales, como por ejemplo, la estimación de una talla de captura mínima en diversos recusos marinos estudiando para ello las relaciones alométricas frecuentemente utilizadas en la gestión y evaluación pesquera,  el análisis de la precisión de GPS (Global Positioning System) en ambientes forestales o la predicción de episodios de emisión de SO2. • Finalmente, creemos que todo desarrollo metodológico debe llevar asociado un desarrollo computacional (o software) del mismo, que permita y facilite su transferencia y uso, tanto por parte de la comunidad estadística como por los profesionales de otras disciplinas (informática, biomedicina, etc.). Por ello, los desarrollos metodológicos desarrollados en esta tesis irán acompañados de la elaboración de un software amigable y de libre distribución. En particular se desarrollará un paquete de R (R Development Core Team, 2010) que será finalmente subido al CRAN (Comprehensive R Archive Network, http://cran.r-project.org/).En moitos estudios de investigación son obtidas  coleccións de datos que necesitan ser tratados por algún tipo de procedemento estatístico para a correcta interpretación e obtención de conclusións. Dentro destas técnicas estatísticas é importante destacar os modelos de regresión destinados a encontrar un modelo matemático que permita unha interpretación razoable da relación entre unha variable resposta e un conxunto de variables independentes (ou covariables). Neste contexto, céntrase a temática desta tesis, que pode ser resumida nos seguintes  puntos xeráis:   • Implementación do algoritmo de estimación local scoring baseado en suavizadores locáis polinómicos tipo núcleo para a estimación dos modelos aditivos xeneralizados. Aspectos computacionáis: Desenvolvemento de técnicas tipo binning de aceleración computacional. Selección automática das ventanas de suavización. Técnicas de remuestreo bootstrap: intervalos de confianza e contrastes de hipótese. • Inclusión de interaccións no efecto das covariables: interaccións factor-por-curva e interaccións curva-por-curva. • Algoritmos de selección de variables para aquelas situacións donde existe un número elevado de covariables. Preténdese obter o subconxunto de variables que dean lugar ó modelo que presente una maior capacidad predictiva. • A metodoloxía desenvolvida terá unha aplicación directa a datos reáis, como por exemplo, a estimación dunha talla de captura mínima en diversos recusos mariños estudiando para iso as  relacións alométricas frecuentemente utilizadas na xestión e evaluación pesqueira,  o análise da precisión de GPS (Global Positioning System) en ambientes forestáis ou a predicción de episodios de emisión de SO2. • Finalmente, creemos que todo desenvolvemento metodolóxico  debe levar asociado un desenvolvemento computacional (o software) do mesmo, que permita e facilite a súa transferencia e uso, tanto por parte da comunidade estatística como por os profesionáis de outras disciplinas (informática, biomedicina, etc.). Así,  os desenvolvementos metodolóxicos obtidos nesta tesis irán acompañados da elaboración dun software amigable e de libre distribución. En particular desenvolverase un paquete de R (R Development Core Team, 2010) que será finalmente subido ó CRAN (Comprehensive R Archive Network, http://cran.r-project.org/).