Un proyecto de investigación para
el cerebro digital de México y América Latina
Más que un producto, Lattice Na'at es un proyecto de investigación dedicado a crear el dataset normativo y cultural más grande de México. Junto con universidades y cámaras empresariales, curamos el conocimiento para construir el cerebro digital de LATAM.
Modelo base open source actual
Curado con academia e industria
Corpus normativo especializado
Soberanía tecnológica de México
La soberanía tecnológica es una decisión política
Las IA extranjeras nos ofrecen una versión "doblada" de la realidad: funcional, pero que pierde modismos, chistes y profundidad cultural. Lattice Na'at es la versión en idioma original, entendiendo nuestra realidad legal y lingüística sin intermediarios.
Este esfuerzo es infraestructura nacional crítica, tan importante como las carreteras o redes eléctricas. Lo que hace único a Lattice no es el modelo base (actualmente GPT OSS 120B), sino la curaduría colaborativa del dataset junto a la academia, gobierno y cámaras empresariales.
Leer sobre el Sesgo WEIRDEficiencia y modelos abiertos europeos
Razonamiento matemático y código
Modelos abiertos financiados por el estado
Contexto cultural y normativo LATAM
Lo que el dataset de Na'at contiene que otros ignoran
Curado con lo que importa: el español real, la ley mexicana, las normas sectoriales y las voces que la IA global ha dejado fuera.
Español mexicano profundo
Comprensión nativa de modismos, tecnicismos y variaciones dialectales de México y LATAM — no traducido del inglés.
Marco normativo mexicano
Entrenado en legislación, DOF, jurisprudencia SCJN, normativas CNBV, CRE, COFEPRIS y disposiciones fiscales vigentes.
Razonamiento multi-paso
Análisis lógico complejo, deducción causal y resolución de problemas en múltiples etapas sobre casos industriales reales.
Lenguas originarias
Soporte en desarrollo para Náhuatl y Maya — las lenguas de más de 7 millones de mexicanos invisibles para la IA global.
Multimodalidad nativa
Procesamiento integrado de texto, imágenes y documentos complejos dentro de un mismo flujo de razonamiento.
Destilación eficiente
Optimizado para transferir conocimiento especializado a los SLM Séeb mediante LoRA y QLoRA — precisión industrial con modelos compactos.
El motor de todo el ecosistema Lattice
Na'at no es un simple producto comercial. Es el proyecto de investigación y la base de datos fundacional que hace posibles a los agentes expertos.
Base de conocimiento maestro
Dataset Na'at → SéebEl inmenso dataset normativo y cultural de Na'at actúa como la fuente experta que transfiere conocimiento a los SLM Séeb. Cada modelo por industria aprende de este corpus curado.
Evolución tecnológica continua
Agnóstico al modelo baseAl separar el valor del dataset (nuestro activo principal) del modelo base, podemos evolucionar de GPT OSS 120B hacia arquitecturas futuras más potentes sin perder el conocimiento adquirido.
Infraestructura de soberanía
Soberanía tecnológica nacionalGarantiza que el cerebro digital del país —el conocimiento y el modelo— no dependa de actores extranjeros. Los datos nacionales más sensibles bajo jurisdicción mexicana.
Diseño técnico auditable y responsable
Construido sobre GPT OSS 120B, con proceso de entrenamiento documentado y corpus validado para cumplimiento normativo.
Agnóstico al Modelo Base
Actualmente utilizamos GPT OSS 120B, pero la arquitectura está diseñada para evolucionar a modelos más avanzados (ej. Kimi K2.5) protegiendo nuestro dataset.
Curaduría del Dataset
El verdadero valor: un corpus construido con rigor académico y legal, revisado por instituciones para garantizar representación auténtica sin sesgo WEIRD.
Investigación Colaborativa
Desarrollado en conjunto con universidades, organizaciones civiles y cámaras empresariales para asegurar un impacto real y preciso en la sociedad.
Infraestructura Nacional
Diseñado para operar en centros de datos nacionales, garantizando soberanía de los datos más sensibles bajo jurisdicción mexicana.
Roadmap de investigación
De 120B a 1T parámetros. De un modelo nacional a un referente latinoamericano global.
Proyecto de Investigación 120B
Basado en GPT OSS 120B. Curaduría intensiva de datasets con universidades y organizaciones. En fase de pruebas con corpus normativo y soporte de lenguas originarias.
Evolución Lattice 2.0
Migración del modelo base hacia arquitecturas de razonamiento avanzado (Kimi K2.5 o similar). El valor central se mantiene en el enriquecimiento de nuestro dataset nacional.
Modelo de Frontera
Capacidades de razonamiento a nivel experto humano en dominios especializados. Modelo fundacional de frontera que incluya un dataset curado de toda América Latina.
La infraestructura de IA fundamental
debe ser auditable
Lattice Na'at está diseñado para publicarse bajo licencia permisiva open source. El proceso de entrenamiento, los datasets y las evaluaciones serán documentados públicamente conforme avanza el desarrollo. La mitigación de sesgos WEIRD no es opcional — es parte del diseño.
Construye el cerebro digital de México
Investiga, integra o contribuye a Lattice Na'at. Estamos formando la coalición de academia e industria que curará el dataset más importante de LATAM.