Verificación de autoría, modelos intrínsecos basados en semejanza

El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analiz...

Full description

Bibliographic Details
Main Author:	Castro, Daniel
Other Authors:	Muñoz, Rafael
Format:	Doctoral Thesis
Language:	Spanish
Published:	Universidad de Alicante 2019
Subjects:	Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos
Online Access:	http://hdl.handle.net/10045/91047

id	ndltd-ua.es-oai-rua.ua.es-10045-91047
record_format	oai_dc
spelling	ndltd-ua.es-oai-rua.ua.es-10045-910472021-06-04T05:14:24Z Verificación de autoría, modelos intrínsecos basados en semejanza Castro, Daniel Muñoz, Rafael Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analizados en la comunidad internacional se corresponde con determinar el autor de un documento anónimo o uno cuyo autor esté en duda. Para esto es necesario intentar inferir características del estilo de redacción del autor a través de los documentos escritos por él, estas características nos permitirán conformar un modelo del estilo de este autor y medir qué tan similar puede ser un documento cualquiera a los documentos escritos por dicho autor. Un caso de estudio práctico en las ciencias forenses se manifiesta cuando el perito debe evaluar la autoría de un documento desconocido y solo cuenta con muestras certificadas de un autor, para lo cual debe responder si fue redactado o no por el consiguiente autor, se puede abstener o en qué grado pudo ser redactado, entre otros elementos, atendiendo a la semejanza con las muestras conocidas. Este caso de estudio se corresponde con las investigaciones realizadas en la Verificación de Autoría (VA). Al proceso que trata de determinar la autoría de un documento digital a partir de las muestras digitales conocidas de uno o más autores se conoce como Verificación de Autoría Intrínseca (VAI). La propuesta se centra en el diseño y la implementación de métodos supervisados de VAI orientado a una sola clase, donde solo se empleen muestras conocidas de un autor y se analicen las características contenidas en la redacción de cada documento (enfoque basado en instancias) y otra variante donde a partir de las muestras conocidas de autor se crea un nuevo documento ficticio que contiene información de todos los documentos (enfoque basado en prototipo). Los resultados obtenidos son alentadores y permiten evaluar la utilidad y generalización de nuestra propuesta ante diferentes escenarios y dominios de aplicación. En lo fundamental se manifiesta la importancia de disponer de más de una muestra conocida para cada autor que se desee analizar. Los mejores resultados se obtienen para las colecciones con mayor promedio de palabras por documentos y número de muestras por autores. Se aprecia que la combinación de los resultados en las decisiones permite obtener una mayor efectividad que si solo se empleara una función de comparación y una representación de los documentos empleando un solo tipo de rasgo. 2019-04-10T09:31:24Z 2019-04-10T09:31:24Z 2019 2019 2019-01-28 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10045/91047 spa Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 info:eu-repo/semantics/openAccess Universidad de Alicante
collection	NDLTD
language	Spanish
format	Doctoral Thesis
sources	NDLTD
topic	Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos
spellingShingle	Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos Castro, Daniel Verificación de autoría, modelos intrínsecos basados en semejanza
description	El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analizados en la comunidad internacional se corresponde con determinar el autor de un documento anónimo o uno cuyo autor esté en duda. Para esto es necesario intentar inferir características del estilo de redacción del autor a través de los documentos escritos por él, estas características nos permitirán conformar un modelo del estilo de este autor y medir qué tan similar puede ser un documento cualquiera a los documentos escritos por dicho autor. Un caso de estudio práctico en las ciencias forenses se manifiesta cuando el perito debe evaluar la autoría de un documento desconocido y solo cuenta con muestras certificadas de un autor, para lo cual debe responder si fue redactado o no por el consiguiente autor, se puede abstener o en qué grado pudo ser redactado, entre otros elementos, atendiendo a la semejanza con las muestras conocidas. Este caso de estudio se corresponde con las investigaciones realizadas en la Verificación de Autoría (VA). Al proceso que trata de determinar la autoría de un documento digital a partir de las muestras digitales conocidas de uno o más autores se conoce como Verificación de Autoría Intrínseca (VAI). La propuesta se centra en el diseño y la implementación de métodos supervisados de VAI orientado a una sola clase, donde solo se empleen muestras conocidas de un autor y se analicen las características contenidas en la redacción de cada documento (enfoque basado en instancias) y otra variante donde a partir de las muestras conocidas de autor se crea un nuevo documento ficticio que contiene información de todos los documentos (enfoque basado en prototipo). Los resultados obtenidos son alentadores y permiten evaluar la utilidad y generalización de nuestra propuesta ante diferentes escenarios y dominios de aplicación. En lo fundamental se manifiesta la importancia de disponer de más de una muestra conocida para cada autor que se desee analizar. Los mejores resultados se obtienen para las colecciones con mayor promedio de palabras por documentos y número de muestras por autores. Se aprecia que la combinación de los resultados en las decisiones permite obtener una mayor efectividad que si solo se empleara una función de comparación y una representación de los documentos empleando un solo tipo de rasgo.
author2	Muñoz, Rafael
author_facet	Muñoz, Rafael Castro, Daniel
author	Castro, Daniel
author_sort	Castro, Daniel
title	Verificación de autoría, modelos intrínsecos basados en semejanza
title_short	Verificación de autoría, modelos intrínsecos basados en semejanza
title_full	Verificación de autoría, modelos intrínsecos basados en semejanza
title_fullStr	Verificación de autoría, modelos intrínsecos basados en semejanza
title_full_unstemmed	Verificación de autoría, modelos intrínsecos basados en semejanza
title_sort	verificación de autoría, modelos intrínsecos basados en semejanza
publisher	Universidad de Alicante
publishDate	2019
url	http://hdl.handle.net/10045/91047
work_keys_str_mv	AT castrodaniel verificaciondeautoriamodelosintrinsecosbasadosensemejanza
_version_	1719409076791672832

Verificación de autoría, modelos intrínsecos basados en semejanza

Similar Items