12.01.2015

FONSOFT - Caso de éxito

Moderación automática de contenidos en la web

Una empresa argentina, en conjunto con el Departamento de Ingeniería Eléctrica y Computadoras de la Universidad Nacional del Sur, desarrollaron un servicio de moderación automática de contenidos que permite procesar texto, foto y video con altísimos niveles de precisión.

La Agencia Nacional de Promoción Científica y Tecnológica, dependiente del Ministerio de Ciencia, Tecnología e Innovación Productiva, a través del Fondo Fiduciario de Promoción de la Industria del Software (FONSOFT), otorgó un financiamiento de $149.850 a la empresa Keepcon para llevar a cabo un proyecto de moderación automática de contenidos. El desarrollo utiliza tecnología semántica propietaria, que permite procesar textos escritos de manera informal en tiempo real y con altísimos niveles de precisión.

El consumo masivo de sitios web 2.0 y la penetración de internet a nivel mundial, hicieron que el volumen de contenidos generado por los usuarios sea cada vez más alto. En este marco, los sitios que permiten la libre participación de la gente, se vieron obligados a revisar de forma exhaustiva los contenidos para evitar la publicación de elementos ofensivos, ilegales, insultantes, injuriosos, o que fuesen en contra los valores culturales de las empresas dueñas de los sitios. Esta evaluación puede lograrse mediante personas que revisen uno a uno los contenidos, o también a través de procesos automáticos en los que un software pueda cotejar palabras del texto revisado con las presentes en una lista de términos previamente registrados como inapropiados (blacklist). Sin embargo, ambas soluciones resultaron poco eficientes.

Si bien gran parte de los contenidos generados por los usuarios es de tipo texto, es también frecuente la publicación de imágenes y videos, los cuales también deben ser moderados. Esto significó la necesidad de desarrollar otro tipo diferente de tecnología que la necesaria para procesar textos. Por este motivo Keepcon firmó un acuerdo marco con el Departamento de Ingeniera Eléctrica y Computadoras de la Universidad Nacional del Sur (UNS), para propiciar la colaboración en investigación y desarrollo de algoritmos de reconocimiento de rostros, partes del cuerpo humano, caracteres en fotos y fotogramas. La empresa, que comenzó su actividad en 2008 y en seis años logró posicionarse como líder de la industria de moderación para sitios hispano y portugués parlantes, tiene 30 clientes en Latinoamérica, España y Estados Unidos, modera más de 100 billones de contenidos mensuales y logró un promedio de automatización del 95% y un nivel de precisión del 97%.

El principal resultado del proyecto fue la plataforma de moderación, la cual consiste en dos componentes principales: el procesamiento automático y el sistema de moderación asistida para facilitar el trabajo del equipo humano de moderadores. Esta última consiste en un sistema de control de flujos de trabajo e interfaces de usuario que dan soporte a las tareas manuales, resaltando las evidencias de riesgo encontradas por un robot y sugiriendo decisiones de moderación cuando no fueron tomadas de forma automática. El módulo de procesamiento automático se nutre de la tecnología desarrollada en el país, la cual implica grandes avances en el procesamiento de textos desestructurados escritos de manera informal en español, inglés y portugués.

“En el último año, hemos expandido nuestra capacidad de comprensión de textos informales a otra solución denominada ‘Customer Experience Management’ que consiste en el monitoreo en tiempo real de los canales de social media y de cualquier otro canal donde haya interacciones escritas con los usuarios/clientes” explicó Matías Rozenfarb, CEO de Keepcon. El director ejecutivo agregó que “clasificamos automáticamente toda interacción en tiempo real para permitir saber qué está pasando y conforme identificamos la naturaleza de cada interacción (queja, pregunta, agresión, cliente potencial, denuncia, etc.), disparamos acciones automáticas según corresponda, tales como: moderación, respuesta, ruteo inteligente al call center o área de incumbencia dentro de la organización, o bien alertas automáticas desde un tablero de control”.  

Una vez reconocidos los términos de un texto, se desarrolla la etapa de compresión. Aquí se combinan tecnologías de inteligencia artificial simbólica (registro explícito de patrones lingüísticos) y estadística (algoritmos estadísticos entrenados con textos ya clasificados) para lograr excelentes resultados de precisión en lo que respecta a la clasificación automática de textos. Esta capacidad permitió a la empresa automatizar el 100% del proceso de moderación de muchos clientes, logrando ahorros de costo significativos y mejorando notablemente la experiencia de los usuarios.