Verificación de autoría, modelos intrínsecos basados en semejanza
El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analiz...
Main Author: | |
---|---|
Other Authors: | |
Format: | Doctoral Thesis |
Language: | Spanish |
Published: |
Universidad de Alicante
2019
|
Subjects: | |
Online Access: | http://hdl.handle.net/10045/91047 |
id |
ndltd-ua.es-oai-rua.ua.es-10045-91047 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-ua.es-oai-rua.ua.es-10045-910472021-06-04T05:14:24Z Verificación de autoría, modelos intrínsecos basados en semejanza Castro, Daniel Muñoz, Rafael Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analizados en la comunidad internacional se corresponde con determinar el autor de un documento anónimo o uno cuyo autor esté en duda. Para esto es necesario intentar inferir características del estilo de redacción del autor a través de los documentos escritos por él, estas características nos permitirán conformar un modelo del estilo de este autor y medir qué tan similar puede ser un documento cualquiera a los documentos escritos por dicho autor. Un caso de estudio práctico en las ciencias forenses se manifiesta cuando el perito debe evaluar la autoría de un documento desconocido y solo cuenta con muestras certificadas de un autor, para lo cual debe responder si fue redactado o no por el consiguiente autor, se puede abstener o en qué grado pudo ser redactado, entre otros elementos, atendiendo a la semejanza con las muestras conocidas. Este caso de estudio se corresponde con las investigaciones realizadas en la Verificación de Autoría (VA). Al proceso que trata de determinar la autoría de un documento digital a partir de las muestras digitales conocidas de uno o más autores se conoce como Verificación de Autoría Intrínseca (VAI). La propuesta se centra en el diseño y la implementación de métodos supervisados de VAI orientado a una sola clase, donde solo se empleen muestras conocidas de un autor y se analicen las características contenidas en la redacción de cada documento (enfoque basado en instancias) y otra variante donde a partir de las muestras conocidas de autor se crea un nuevo documento ficticio que contiene información de todos los documentos (enfoque basado en prototipo). Los resultados obtenidos son alentadores y permiten evaluar la utilidad y generalización de nuestra propuesta ante diferentes escenarios y dominios de aplicación. En lo fundamental se manifiesta la importancia de disponer de más de una muestra conocida para cada autor que se desee analizar. Los mejores resultados se obtienen para las colecciones con mayor promedio de palabras por documentos y número de muestras por autores. Se aprecia que la combinación de los resultados en las decisiones permite obtener una mayor efectividad que si solo se empleara una función de comparación y una representación de los documentos empleando un solo tipo de rasgo. 2019-04-10T09:31:24Z 2019-04-10T09:31:24Z 2019 2019 2019-01-28 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10045/91047 spa Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 info:eu-repo/semantics/openAccess Universidad de Alicante |
collection |
NDLTD |
language |
Spanish |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos |
spellingShingle |
Autoría de documentos Plagio Minería de datos Grafos Lenguajes y Sistemas Informáticos Castro, Daniel Verificación de autoría, modelos intrínsecos basados en semejanza |
description |
El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de Datos (MD), donde se persigue el propósito de minar un estilo o patrón de redacción correspondiente y característico de un autor, a partir de los documentos redactados por el mismo. Una de las aplicaciones o enfoques más analizados en la comunidad internacional se corresponde con determinar el autor de un documento anónimo o uno cuyo autor esté en duda. Para esto es necesario intentar inferir características del estilo de redacción del autor a través de los documentos escritos por él, estas características nos permitirán conformar un modelo del estilo de este autor y medir qué tan similar puede ser un documento cualquiera a los documentos escritos por dicho autor. Un caso de estudio práctico en las ciencias forenses se manifiesta cuando el perito debe evaluar la autoría de un documento desconocido y solo cuenta con muestras certificadas de un autor, para lo cual debe responder si fue redactado o no por el consiguiente autor, se puede abstener o en qué grado pudo ser redactado, entre otros elementos, atendiendo a la semejanza con las muestras conocidas. Este caso de estudio se corresponde con las investigaciones realizadas en la Verificación de Autoría (VA). Al proceso que trata de determinar la autoría de un documento digital a partir de las muestras digitales conocidas de uno o más autores se conoce como Verificación de Autoría Intrínseca (VAI). La propuesta se centra en el diseño y la implementación de métodos supervisados de VAI orientado a una sola clase, donde solo se empleen muestras conocidas de un autor y se analicen las características contenidas en la redacción de cada documento (enfoque basado en instancias) y otra variante donde a partir de las muestras conocidas de autor se crea un nuevo documento ficticio que contiene información de todos los documentos (enfoque basado en prototipo). Los resultados obtenidos son alentadores y permiten evaluar la utilidad y generalización de nuestra propuesta ante diferentes escenarios y dominios de aplicación. En lo fundamental se manifiesta la importancia de disponer de más de una muestra conocida para cada autor que se desee analizar. Los mejores resultados se obtienen para las colecciones con mayor promedio de palabras por documentos y número de muestras por autores. Se aprecia que la combinación de los resultados en las decisiones permite obtener una mayor efectividad que si solo se empleara una función de comparación y una representación de los documentos empleando un solo tipo de rasgo. |
author2 |
Muñoz, Rafael |
author_facet |
Muñoz, Rafael Castro, Daniel |
author |
Castro, Daniel |
author_sort |
Castro, Daniel |
title |
Verificación de autoría, modelos intrínsecos basados en semejanza |
title_short |
Verificación de autoría, modelos intrínsecos basados en semejanza |
title_full |
Verificación de autoría, modelos intrínsecos basados en semejanza |
title_fullStr |
Verificación de autoría, modelos intrínsecos basados en semejanza |
title_full_unstemmed |
Verificación de autoría, modelos intrínsecos basados en semejanza |
title_sort |
verificación de autoría, modelos intrínsecos basados en semejanza |
publisher |
Universidad de Alicante |
publishDate |
2019 |
url |
http://hdl.handle.net/10045/91047 |
work_keys_str_mv |
AT castrodaniel verificaciondeautoriamodelosintrinsecosbasadosensemejanza |
_version_ |
1719409076791672832 |