- Inicio
- Servicios
- Portafolio
- Comunidad
- Blog
- Contáctenos
Cómo funciona?

Introducción:
Esta aplicación recopila, analiza y clasifica noticias de diferentes fuentes electrónicas de información (nacionales e internacionales) buscando y filtrando los artículos de mayor relevancia respecto a las elecciones presidenciales que se desarrollan en Colombia durante el año 2010..
El sistema automáticamente extrae de la noticia los candidatos referenciados, temas principales, partidos políticos y ubicación geográfica.
Con toda la información extraída, el usuario puede realizar diversas consultas que le permiten tales como: los temas que mas recurrentes de cada uno de los precandidatos, los canales de comunicación que mas noticias publican al respecto, los posibles itinerarios de los candidatos y precandidatos durante su campaña política, los candidatos y precandidatos que mas van a un determinado departamento, entre otros.
Detalles Técnicos
La aplicación fué desarrollada según las necesidades de cada una de las fases descritas a continuación:
Integración y Recopilación de Información

Para la recopilación de información que sirve como insumo para este sistema se tomaron más de 90 fuentes RSS con noticias e información relacionadas con Colombia y el proceso electoral que se está desarrollando actualmente en Colombia. Entre dichas fuentes de noticias se encuentran los principales diarios del país, revistas, noticieros, programas radiales, blogs, cuentas de twitter y facebook de los diferentes candidatos, sitios oficiales de las campañas y entidades gubernamentales del país. Se crearon diferentes componentes que periódicamente están extrayendo las nuevas noticias que cada uno de los medios va publicando día a día en su sitio web.
Selección, limpieza y transformación de datos.
Dada la diversidad de formatos RSS y formas de codificación de la información existente, fué necesario realizar un proceso de limpieza y transformación de los datos que facilitara los procesos posteriores de análisis y extracción de información específica. Este paso permite generar un modelo unificado de información que se almacena en un repositorio de datos específico para este sistema.

Análisis y Minería de Datos
En esta fase de extracción de información para su conversión en conocimiento se realizan principalmente 2 tareas:
Clasificación de las Noticias según temas:
Se realiza una clasificación de los documentos almacenados en el sistema según los siguientes criterios: Personajes políticos relacionados con las elecciones, Partidos Polìticos, Temas principales para la toma de decisión del votante (Ejm: Educación, Salud, Seguridad), Temas polémicos que pueden influir en la elección (Ejm: Corrupción, Compra de Votos, Plan Colombia) y otros temas de interés (Ejm: Abstención, Encuesta, Entrevista).
Este proceso de clasificación de información y extracción de palabras claves se realiza gracias a herramientas de Inteligencia Artificial que permiten identificar temas utilizando un vocabulario controlado por Ontología diseñada para las elecciones presidenciales de Colombia en el año 2010.

Georreferenciación:
La georreferenciación consiste en el proceso de asignar una coordenada geográfica a cada uno de los documentos existentes en el sistema. Para realizar este proceso fué necesario recurrir a recursos y actividades como los que se enuncian a continuación:
Base de Datos de Gacetero (http://en.wikipedia.org/wiki/Gazetteer) de Colombia.
Reconocimiento de Entidades Geográficas a través de técnicas de Procesamiento del Lenguaje Natural e Inteligencia Artificial. Para este proceso se incluyeron también listas de sinónimos de términos geográficos y listas de nombres comunes en el idioma español. Este tipo de listas permiten resolver problemas de ambiguedad de términos y palabras comunes que generan resultados erróneos.
Detección y corrección de Coordenadas no Válidas a través de procesos de análisis espacial.
Asignación de Departamentos y Munipios para cada uno de los artículos utilizando técnicas de Análisis Espacial.
Transformación de coordenadas utilizando procesos de análisis espacial ejecutados en el motor de base de datos.

Difusión y Uso
Para la visualización y consulta de la información recopilada se desarrollaron diferentes medios implementados en diversas tecnologías:
Herramienta para consultas interactivas del archivo histórico de información. (Creada con Java, Adobe Flex y el API de Visualización de Mapas de Arcgis Server Flex API)
Visualización utilizando Google Maps
Visualización utilizando Google Earth.
Notificación en Tiempo Real a través de Twitter.

Listado de fuentes de información Utilizadas:
(Nota: Se adicionan nuevas fuentes de información según se encuentren disponibles)