Estudiante de UAM gana concurso para detectar plagios en código fuente

16 de Marzo de 2015
Guardar
México, 16 Mar 15 (Notimex).- Aarón Ramírez de la Cruz, alumno de la licenciatura en Tecnologías y Sistemas de Información de la UAM, ganó el primer lugar en el concurso Source Code Reuse, en Bangalore, India, con un programa para detectar plagios en el código fuente.

La Universidad Autónoma Metropolitana (UAM) detalló que el trabajo del estudiante de octavo trimestre consistió en analizar diferentes aspectos, como las similitudes estructural, léxica y de estilo, que podrían dar evidencia de un posible plagio entre un programa o lenguaje de programación y otro.

Refirió que esta labor la llevó a cabo en colaboración con la maestra Gabriela Ramírez de la Rosa y el doctor Esaú Villatoro Tello, quien detalló que una de las líneas del grupo de investigación Lenguaje y Razonamiento, es la que denominan Análisis de Autoría.

Con esta técnica pueden responder a preguntas como quién escribe un texto a partir solamente de lo que se tiene escrito, afirmó en un comunicado.

Dijo que se realiza una similitud a la tarea que desarrollan especialistas para determinar si hay plagio en una novela de determinado escritor, donde se analiza el estilo del autor y la pregunta es si una computadora puede realizar dicha función, “y hasta cierto punto la respuesta es: sí, lo puede hacer”.

Explicó que en un contexto donde hay cada vez más facilidades para acceder a distintas fuentes de información, hay “una tentación muy grande” de tomar cosas de la web y hacerlas pasar como propias, y el ambiente académico no es la excepción.

El programa desarrollado por el alumno “no dice si algo es plagiado o no, pero a partir de una aplicación, yo como usuario decido si algo está plagiado o no. Son herramientas que deben apoyar la toma de decisiones”, aseguró el académico.

El doctor Villatoro Tello resaltó que se trata “de una técnica de inteligencia artificial, es decir, un sistema que aprende o es capaz de aprender y de alguna forma modelar en qué grado un par de documentos pueden o no ser plagiados”.

Por su parte, el estudiante Aarón Ramírez y la profesora Gabriela Ramírez explicaron que el lenguaje de programación que analizaron fue Java y “la idea principal fue ver diferentes aspectos que podrían darnos evidencias de que dos programas fueron o no plagiados”.

Especificaron que se analizó la estructura, pues los lenguajes de programación tienen propiedades muy particulares, por ejemplo, la sintaxis.

Otro aspecto revisado fue el léxico, qué palabras y qué combinaciones se utilizaron para escribir en este lenguaje, ya que los programadores tienen cierta libertad de elegir nombres de variables, identificadores, funciones, entre otros, para ver similitudes o coincidencias.

Una tercera medida fue la estilística, porque existen en el texto características que permiten identificar si un autor escribió o no ese texto, basado en el estilo de su escritura.

Por ejemplo, si escribe oraciones largas, puntuación, letras mayúsculas y minúsculas, en los lenguajes de programación es posible recuperar este tipo de características estilísticas, explicó la investigadora.

Archivado en