Technical Note
Google新嵌套学习范式:哆啦A梦讲解+核心贡献解析
# 10:28
# Transformer-周
11-23 10:00 微博网页版
回复@郑昀:有2个坑可以自然规避:
1. 内容太多了都挤一起了,即使网络总体是AR,具体的单元里面的东西也毕竟是diffusion扩散出来的,局部扩散,你太挤了,就会让latent在解噪声有点问题,它毕竟不是写字
想要查看完整笔记内容并体验 AI 智能整理功能吗?
免费注册 MeAct嵌套学习(Nested Learning)Google 机器学习新范式深度优化器自修改序列模型连续记忆系统