Noticias ALAS

Las noticias de la industria de la seguridad en Latinoamérica

¿Cómo los datos sintéticos están desbloqueando nuevas oportunidades para el video inteligente?

Barry Norton, vicepresidente de IA centrada en el ser humano para Milestone Systems

La tecnología de video ha avanzado significativamente en las últimas décadas, en gran parte gracias a los avances en analítica de video y a la inteligencia artificial (IA) que lo hace posible. Sin embargo, aunque se proyecta que el mercado de IA alcanzará en América Latina ganancias de alrededor de 4.600 millones de dólares para 2025, según Statista, un posible obstáculo para este crecimiento es la disponibilidad de grandes volúmenes de datos para entrenar los modelos de IA. Los llamados datos sintéticos podrían ser la solución.

El trabajo pionero de los llamados «Padrinos de la IA», los ganadores del Premio Turing 2018 Yoshua Bengio, Geoffrey Hinton y Yann LeCun, junto con la creación de ImageNet por Fei-Fei Li, sentó las bases de la IA moderna, especialmente en el campo de la visión por computadora (CV). Esto es particularmente relevante para los sensores que generan datos de imagen, como el video, y ha abierto un sinfín de oportunidades para mejorar la seguridad en nuestras ciudades, el transporte, las tiendas minoristas y mucho más.

Gracias a la IA, las organizaciones ahora pueden obtener información más profunda para orientar sus estrategias y tomar mejores decisiones, como determinar dónde construir una nueva carretera, qué productos colocar en un estante específico de una tienda y cómo planificar los cronogramas de mantenimiento o limpieza. En definitiva, es un mundo nuevo y audaz, transformado por la combinación del video y la inteligencia artificial.

La precisión de la IA requiere grandes conjuntos de datos de entrenamiento

Para que los modelos de inteligencia artificial sean lo más precisos posible, es fundamental entrenarlos con conjuntos de datos masivos. Estos datos deben ser representativos y diversos para garantizar precisión y equidad, además de estar legalmente obtenidos para respetar los derechos de propiedad intelectual de sus dueños. A medida que la IA evoluciona, la necesidad de estos grandes conjuntos de datos (parcialmente) anotados se vuelve más urgente, y obtenerlos no siempre es una tarea sencilla.

Esto es especialmente cierto cuando se trata de sensores como cámaras, que pueden recopilar una gran cantidad de información personal o confidencial. Consideraciones de seguridad, privacidad y limitaciones prácticas pueden restringir tanto la cantidad como la calidad de los datos disponibles para entrenar una IA.

Aquí es donde los datos sintéticos entran en juego, abriendo nuevas oportunidades.

La solución que ofrecen los datos sintéticos

Los datos sintéticos se refieren a conjuntos de datos generados o aumentados artificialmente que simulan condiciones del mundo real. Al utilizar estos datos, los desarrolladores de IA pueden entrenar modelos con grandes volúmenes de información diversa y representativa, al tiempo que mitigan las preocupaciones éticas y legales relacionadas con la privacidad y el consentimiento. Además, los datos sintéticos pueden preservar características clave del mundo real, lo que permite que los modelos aprendan de entornos realistas sin exponer a las personas a riesgos, y constituyen una fuente lista para usar que puede acelerar el tiempo de desarrollo de algoritmos.

Además, los datos sintéticos pueden ayudar a reducir el sesgo en los modelos de IA. Los conjuntos de datos tradicionales suelen estar influenciados por los sesgos presentes en el proceso original de recopilación de datos, lo que puede distorsionar los resultados de la toma de decisiones de la IA. Al diseñar cuidadosamente los procesos de recopilación de datos sintéticos, los desarrolladores pueden minimizar los sesgos que surgen al depender de datos históricos.

Por último, los datos sintéticos son escalables y rentables. Permiten a los desarrolladores de IA crear conjuntos de datos amplios y diversos de manera rápida y asequible, lo que resulta especialmente útil para tareas que requieren datos específicos y de alta calidad que no están fácilmente disponibles.

Ejemplo de uso de datos sintéticos en puertos

El potencial de los datos sintéticos para mejorar la seguridad y salvar vidas se refleja en un proyecto de investigación en Dinamarca, donde los modelos de IA utilizados para detectar caídas en los puertos han sido entrenados con diferentes conjuntos de datos, incluidos datos sintéticos.

Lamentablemente, los puertos daneses han sido escenario de numerosos incidentes de ahogamiento a lo largo de los años. Entre 2001 y 2015, se perdieron 1,647 vidas en aguas danesas, y una cuarta parte de estas tragedias ocurrieron en los propios puertos.

En uno de los puertos más concurridos de Dinamarca, el Puerto de Aalborg, los investigadores crearon el mayor conjunto de datos térmicos al aire libre para analítica de video, con el fin de capacitar cámaras equipadas con IA para detectar distintos tipos de objetos en un entorno térmico. Para abordar los incidentes de caídas, se pidió a voluntarios que se lanzaran al agua. Sin embargo, era demasiado peligroso solicitar que personas reales realizaran estas pruebas. Además, un salto intencional se ve muy diferente a una caída accidental. Los investigadores también necesitaban un conjunto de datos representativo que incluyera usuarios en sillas de ruedas, ciclistas y skaters.

Se utilizaron muñecos térmicos para imitar cuerpos humanos, pero estos no podían capturar completamente la complejidad de una persona cayendo al agua. Por ello, la mejor solución fue el uso de datos sintéticos, que permitieron modelar comportamientos más detallados y diversos escenarios de caídas.

Gracias a los datos sintéticos, el proyecto amplió su conjunto de datos de entrenamiento sin comprometer la seguridad ni plantear dilemas éticos. El modelo de IA desarrollado a través de este proceso ha mostrado resultados prometedores, permitiendo alertar a los equipos de rescate en caso de caída al puerto. Esto aumenta las probabilidades de supervivencia al minimizar los tiempos de respuesta y reducir la exposición al agua fría.

Aplicaciones más amplias de los datos sintéticos

La analítica de video es omnipresente en múltiples industrias, y lo mismo ocurrirá con los datos sintéticos utilizados para entrenarla. Algunos casos de uso adicionales incluyen la manufactura, donde los modelos de IA entrenados con datos sintéticos pueden garantizar el correcto funcionamiento de las líneas de producción automatizadas. La IA puede detectar anomalías en la producción o posibles fallos en los equipos. Sin embargo, recopilar grandes volúmenes de grabaciones de líneas de producción puede ser riesgoso debido a la información confidencial sobre técnicas y componentes de fabricación.

Los datos sintéticos también pueden ser de gran utilidad en entornos de atención médica, donde la privacidad de los pacientes es fundamental y la recopilación de datos de entrenamiento para ciertos escenarios, como caídas, puede resultar demasiado desafiante. Por ejemplo, pueden ayudar a entrenar modelos para detectar cuando un paciente con demencia está perdido y deambulando por los pasillos de un hospital, o para alertar al personal si un residente de un centro de atención ha caído de su cama.

Una oportunidad en crecimiento

A medida que somos testigos de un mayor uso de la inteligencia artificial en video y otras aplicaciones en la región, también podemos esperar un aumento en el uso de datos sintéticos. Al proporcionar una fuente segura, ética y escalable, estos datos pueden ser la mejor opción en algunas situaciones. Por lo tanto, todos los que trabajen con datos y video deben ser conscientes de las oportunidades que estos brindan a la precisión, representación y eficacia general de su IA.

Contacto: 

Signalis Group
Victor Galvis
Agencia de Relaciones Públicas
980-309-2166
[email protected]