答案:√
10【判断题】梯度下降算法是最常用也是最有效的神经网络的优化办法,完全可以满足不同类型的需求。()
答案:×
第六章
1【单选题】()有跟环境进行交互,从反馈当中进行不断的学习的过程。
A、监督学习
B、非监督学习
C、强化学习
D、线性回归
答案:C
2【单选题】Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
A、期望值
B、最大值
C、最小值
D、总和
答案:A
3【单选题】在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()。
A、大;小
B、大;大
C、小;小
D、小;大
答案:A
4【单选题】在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
A、大;小
B、大;大
C、小;小
D、小;大
答案:A
5【单选题】在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
A、探索;开发
B、开发;探索
C、探索;输出
D、开发;输出
答案:A
6【单选题】马尔可夫性质强调在每一个动作状态序列中,下一个状态与()有关。
A、外部影响
B、主体内因
C、历史状态
D、当前状态
答案:D
7【单选题】强化学习的回报值一个重要特点是具有()。
A、客观性
B、主体性
C、超前性
D、滞后性
答案:D
8【多选题】用于监督分类的算法有()。
A、支持向量机
B、决策树
C、神经网络
D、线性回归
答案:ABC
9【多选题】在强化学习中,主体和环境之间交互的要素有()。
A、状态
B、动作
C、回报
D、强化
答案:ABC
10【判断题】人工智能学习玩Flappy Bird过程中,只需要人类告诉AI不能碰到水管即可,不需要提供其他信息。()
答案:×
第七章
1【单选题】以下四个人工智能的应用领域中,与其他三个不同的是()。
A、图像识别与分类
B、医学影像分析
C、语音识别
D、人脸识别与情感计算
答案:C
2【单选题】
在自动驾驶中,AI需要不断地通过路面信息来调整开车的决策,这种处理模式适合用()来训练出合理的策略。
A、监督学习
B、非监督学习
C、强化学习
D、弱化学习
答案:C
3【单选题】在人工智能当中,图像、语音、手势等识别被认为是()的层次;而问题求解、创作、推理预测被认为是()的层次。