Apprentissage en temps réel
Dans cet article, les auteurs proposent une nouvelle classe de couches de modélisation de séquences avec une complexité linéaire et un état caché expressif, appelées couches d'entraînement en temps réel (TTT). Ces couches, TTT-Linear et TTT-MLP, surpassent les baselines existantes et offrent des perspectives prometteuses pour la recherche future.
11 juillet 2024
1 min