Investigadores de la Universidad Carnegie Mellon han desarrollado LegoGPT, un innovador modelo de inteligencia artificial capaz de generar diseños de Lego estructuralmente sólidos a partir de simples descripciones en texto. Esta herramienta pionera, ahora disponible de forma gratuita en GitHub, representa un paso significativo hacia la fusión entre creatividad asistida por IA y construcción física.
¿Qué es LegoGPT?
LegoGPT es un modelo de lenguaje autoregresivo entrenado específicamente para predecir la próxima pieza de Lego a añadir en función de un prompt textual. A diferencia de los generadores de imágenes tradicionales que suelen producir diseños visualmente atractivos pero inviables, LegoGPT prioriza la estabilidad estructural, asegurando que cada diseño pueda ser construido tanto por humanos como por robots.
Cómo funciona
El modelo se entrenó utilizando un conjunto de datos llamado StableText2Lego, compuesto por más de 47.000 estructuras basadas en más de 28.000 objetos 3D únicos, como automóviles, guitarras o mesas.
Cada modelo fue voxelizado en una grilla de 20×20×20 y filtrado mediante análisis físicos para garantizar su viabilidad. Además, se utilizaron descripciones generadas por GPT-4o desde múltiples ángulos, creando una correspondencia entre lenguaje natural y estructura física.
Durante el proceso de generación, LegoGPT realiza verificaciones de solapamiento y aplica un mecanismo de reversión si detecta pasos inestables, asegurando que el resultado final sea construible y seguro. El modelo incluso proporciona instrucciones paso a paso para facilitar la construcción por parte de personas o brazos robóticos.
Ventajas
- Alta estabilidad: LegoGPT logra un 98% de éxito en diseños estables, superando ampliamente a otros métodos basados en IA.
- Personalización de color: El usuario puede solicitar, por ejemplo, una “guitarra violeta” y el modelo lo interpretará correctamente.
- Código abierto: Todo el código y los datos están disponibles libremente, lo que abre el camino a educadores, desarrolladores y fans del Lego.
- Compatibilidad con visión por computadora: Se pueden subir fotos de piezas propias y obtener sugerencias personalizadas para construir con ellas.
- Aplicación robótica: Los modelos generados ya han sido ensamblados por brazos robóticos con sensores de fuerza.
Limitaciones actuales
LegoGPT trabaja dentro de una grilla 20×20×20 y utiliza una biblioteca limitada de piezas estándar, lo que lo restringe a modelos relativamente simples. Sin embargo, los investigadores ya planean ampliar el sistema para incluir nuevas formas y piezas más complejas, lo que permitirá creaciones más sofisticadas en el futuro.
Conclusión de LegoGPT
LegoGPT demuestra cómo la inteligencia artificial puede transformar la manera en que concebimos y materializamos nuestras ideas. Combinando procesamiento de lenguaje natural, análisis físico y visión por computadora, este proyecto abre nuevas posibilidades en diseño, educación y robótica. Gracias a su publicación abierta, cualquier persona con una idea y algo de imaginación puede comenzar a construir su propio mundo de Lego, pieza por pieza.