人工智能与信息社会——基于神经网络的智能系统II

时间：2020-03-28 21:06:55 阅读：221 评论：0 收藏：0 [点我收藏+]

1.【单选题】 (C) 有跟环境进行交互 , 从反馈当中进行不断的学习的过程。

A 、监督学习

B 、非监督学习

C 、强化学习

D 、线性回归

2.【单选题】 Q 函数 Q(s,a) 是指在一个给定状态 s 下 , 采取某一个动作 a 之后 , 后续的各个状态所能得到的回报的 (A) 。

A 、期望值

B 、最大值

C 、最小值

D 、总和

3.【单选题】在 ε-greedy 策略当中 ,ε 的值越大 , 表示采用随机的一个动作的概率越 (), 采用当前 Q 函数值最大的动作的概率越 (A) 。

A 、大 ; 小

B 、大 ; 大

C 、小 ; 小

D 、小 ; 大

4.【单选题】在强化学习过程中 ,(A) 表示随机地采取某个动作 , 以便于尝试各种结果 ;() 表示采取当前认为最优的动作 , 以便于进一步优化评估当前认为最优的动作的值。

A 、探索 ; 开发

B 、开发 ; 探索

C 、探索 ; 输出

D 、开发 ; 输出

5.【单选题】强化学习中 ,(A) 主要探索未知的动作会产生的效果 , 有利于更新 Q 值 , 获得更好的策略。

A 、探索

B 、开发

C 、输入

D 、输出

6.【单选题】马尔可夫性质强调在每一个动作状态序列中 , 下一个状态与 (D) 有关。

A 、外部影响

B 、主体内因

C 、历史状态

D 、当前状态

7【单选题】强化学习的回报值一个重要特点是具有 (D) 。

A 、客观性

B 、主体性

C 、超前性

D 、滞后性

8.【多选题】用于监督分类的算法有 (ABC) 。

A 、支持向量机

B 、决策树

C 、神经网络

D 、线性回归

9.【判断题】人工智能学习玩 Flappy Bird 过程中 , 只需要人类告诉 AI 不能碰到水管即可 , 不需要提供其他信息。 ( × )

10.【判断题】状态动作函数直接决定主体该采取什么决策。 (√ )

人工智能与信息社会——基于神经网络的智能系统II

原文：https://www.cnblogs.com/gh110/p/12589050.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)