术语表¶

常见层¶

Flatten 压平层，把多维的数据化成一维，常用在从卷积层到全连接层的过渡
Dense   全连接层
Dropout 训练时，依据概率随机拿掉一些神经元，防止过拟合
softmax 归一化指数函数，常用来做输出层，比如分类器网络的输出有10个节点，不同节点得到了不同的置信率，后接一层softmax层就能找到
Embedding 嵌入层，常用于NPL领域的输入层，一方面能改变维度，一方面在网络中增加参数，为原本毫无关联的输入项建立关联（学习过程中调整的参数即是在动态调整这些关联），参考《深度学习中 Embedding层两大作用的个人理解》

编码¶

one-hot 编码¶

也称独热码：

容易计算
无关联

在NPL领域，比如词语集one two three可以表示为1 2 3也可以表示为[1 0 0] [0 1 0] [0 0 1]，后者就是one-hot编码

当数据是与数值无关的分类，用one-hot比较合适，比如国别：

	国别
A	1(Japan)
B	2(China)
C	2(China)

拆成one-hot:

	Japan	China
A	1.0	0
B	0	1.0
C	0	1.0

数据集¶

训练集：训练用数据
验证集：训练过程中，验证训练是否有效的数据，不能和测试集混在一起，因为需要用测试集来评估模型最终的泛化能力
测试集：用于评估模型的实际效果的数据集

参考¶

工具

Keras API https://keras.io/zh/
Keras 是一个用 Python 编写的高级神经网络 API，它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果，是做好研究的关键。

教程：李宏毅2020深度学习(完整版)国语