AI 13
- MM-DiT & DiT in Flux model
- 基于pp-ocr,从 SVTR logits 中估算字符 bbox
- 连接主义,后向传播算法,可微分学习
- 强化学习的反思:从人为干涉到无为而治,和智能悖论
- GPU上的图形渲染与神经网络训练
- 计算复杂性, 启发式算法与解析式算法
- LLM 的反向图灵测试,与量子力学量子态塌缩
- 从“听见红色”,巴甫洛夫条件反射实验,RL时序差分算法,到LLM“看”懂图像
- 训练阶段空间上的ResNet与推理阶段时间上的KV Cache
- 图像优化线性AR算法到Self-Attention机制
- 学习笔记:Diffusion 直接预测干净图片(JiT)
- 从3DMM到stable diffusion生成式模型
- 被AIGC时代复活的VAE生成模型学习