Image steganalysis and steganography in the spatial domain

Lerch Hostalot, Daniel

Image steganalysis and steganography in the spatial domain

Lerch Hostalot, Daniel

Dirixida por:

David Megías Jiménez Director

Universidade de defensa: Universitat Oberta de Catalunya

Fecha de defensa: 23 de febreiro de 2017

Tribunal:

Jordi Herrera Joancomartí Presidente/a
Jordi Serra Ruiz Secretario/a
Pedro Comesaña Alfaro Vogal

Tipo: Tese

Teseo: 571939 DIALNET

Resumo

La esteganograf´ıa moderna surgi´o al mismo tiempo que los ordenadores personales y, lo que fue una ciencia de desarrollo muy lento a lo largo de la historia, empez´o a evolucionar r´apidamente. Hoy en d´ıa, las t´ecnicas esteganogr´aficas pueden encontrarse en aplicaciones tan diversas como la privacidad, el malware, el espionaje y las comunicaciones terroristas u otros tipos de comunicaci´on criminal, y existe un n´umero creciente de herramientas de esteganograf´ıa disponibles a trav´es de Internet. Sin embargo, la esteganograf´ıa no est´a tan desarrollada como otras ciencias relacionadas, como la criptograf´ıa. Por otra parte, en los ´ultimos a˜nos, ha habido un incremento considerable en el n´umero de publicaciones en esta ´area, la cual se ha convertido en un campo en activo desarrollo. Uno de los medios m´as usados para ocultar informaci´on son las im´agenes, dado su amplio uso en Internet y la dificultad de modelizaci´on estad´ıstica, que hace que la detecci´on de informaci´on oculta sea un desaf´ıo. El enfoque habitual en el estado del arte, para ocultar informaci´on, consiste en minimizar la distorsi´on introducida durante la inserci´on del mensaje, obteniendo una imagen (imagen estego) cuyas propiedades estad´ısticas son muy parecidas a las de la imagen original (imagen cubierta). Para detectar informaci´on oculta, el enfoque habitual en el estado del arte consiste en usar estegoan´alisis basado en aprendizaje autom´atico. Este tipo de estegoan´alisis consiste en preparar un conjunto de im´agenes y ocultar informaci´on en algunas de ellas, obteniendo un conjunto de datos de entrenamiento: im´agenes cubierta y im´agenes estego usadas para entrenar un clasificador. El estegoanalista usa estos datos de entrenamiento para extraer algunas caracter´ısticas y entrenar un clasificador capaz de detectar qu´e im´agenes son cubierta y qu´e im´agenes son estego, con alta precisi´on. El conjunto de im´agenes que queremos clasificar se conoce como datos de prueba. Este enfoque funciona muy bien en condiciones de laboratorio, pero todav´ıa es necesaria mucha investigaci´on para poder aplicarlo satisfactoriamente en entornos reales. En el estado del arte, habitualmente se usa el framework conocido como rich models para extraer las caracter´ısticas de la imagen y el clasificador ensemble classifiers para realizar el entrenamiento y la clasificaci´on. En esta tesis, proponemos diferentes t´ecnicas novedosas para detectar informaci´on oculta (estegoan´alisis) y para ocultar informaci´on (esteganograf´ıa). Estas t´ecnicas se presentan como una colecci´on de cinco contribuciones, que comparten un problema com´un. La primera contribuci´on presenta tres m´etodos diferentes para detectar informaci´on oculta usando t´ecnicas de desplazamiento de histograma, algunas de las cuales son ataques dirigidos a esquemas concretos, mientras que las otras son m´as gen´ericas. En la segunda contribuci´on, en el ´area del aprendizaje autom´atico aplicado al estegoan´alisis, presentamos un nuevo extractor de caracter´ısticas para detectar informaci´on oculta en el dominio espacial, que se puede usar como submodelo adicional en el framework rich models, y que supera la precisi´on obtenida por el m´etodo del estado del arte subtractive pixel adjacency matrix (SPAM) usando un n´umero inferior de caracter´ısticas. En el mismo contexto, la tercera contribuci´on es un algoritmo esteganogr´afico que explota la debilidad de algunos submodelos para tratar con datos de muchas dimensiones (los cuales suelen usar un umbral para superar el problema de la dimensionalidad). Como cuarta contribuci´on, presentamos un nuevo framework de estegoan´alisis dirigido no supervisado con una precisi´on superior a la de los m´etodos supervisados del estado del arte, y que permite eludir el problema del cover source mismatch (CSM). Finalmente, como quinta contribuci´on, presentamos un nuevo enfoque al problema del CSM basado en un conjunto de t´ecnicas de aprendizaje autom´atico conocidas como manifold alignment.