Tags

标签

用更细的关键词快速定位具体内容。

论文精读

4

Werbos 1982:低成本导数通向灵敏度分析与学习算法 / 隐藏层的训练信号:重读 Back-Propagating Errors / 舍入误差、Taylor 系数与 reverse-mode 的数值分析前史

Backpropagation

3

Werbos 1982:低成本导数通向灵敏度分析与学习算法 / 隐藏层的训练信号:重读 Back-Propagating Errors / 舍入误差、Taylor 系数与 reverse-mode 的数值分析前史

反向传播

3

Werbos 1982:低成本导数通向灵敏度分析与学习算法 / 隐藏层的训练信号:重读 Back-Propagating Errors / 舍入误差、Taylor 系数与 reverse-mode 的数值分析前史

Attention

1

Attention Is All You Need:全局注意力如何重写序列计算

Geoffrey Hinton

1

隐藏层的训练信号:重读 Back-Propagating Errors

NLP

1

Attention Is All You Need:全局注意力如何重写序列计算

Paul Werbos

1

Werbos 1982:低成本导数通向灵敏度分析与学习算法

Transformer

1

Attention Is All You Need:全局注意力如何重写序列计算

深度学习

1

Attention Is All You Need:全局注意力如何重写序列计算

神经网络

1

隐藏层的训练信号:重读 Back-Propagating Errors

自动微分

1

舍入误差、Taylor 系数与 reverse-mode 的数值分析前史