人工智能期末复习
单选题
1. 关于卷积神经网络,以下说法错误的是:
A. 卷积神经网络的基本结构由输入层、卷积层(convolutional layer)、池化层(pooling layer,也称为取样层)、全连接层及输出层构成。
B. 卷积神经网络的英文缩写为CNN。
C. 卷积神经网络中不需要激活函数。 ✅
D. 卷积神经网络中可存在多个卷积层。
答案:C
2. 关于神经网络的训练,以下说法错误的是:
A. 网络每次接收一批数据进行训练。
B. 一批数据通过网络前向流动,得到预测结果,进而计算损失函数。
C. 设置固定的学习率,学习率在每轮训练中必须保存不变。 ✅
D. 损失后向传播,根据梯度值和学习率更新各层权重及偏置。
答案:C
3. 假设有26个小写英文字母的手写数据集,数据集里有30000图片,每张图片为黑白图片,图片的宽和高都是24像素,现准备采用深度神经网络识别此数据集,则网络结构应该是:
A. 输入神经元为24个,输出神经元为26个,隐藏层可根据经验在一定范围内设置。
B. 输入神经元为576个,输出神经元为26个,隐藏层可根据经验在一定范围内设置。 ✅
C. 输入神经元为24个,隐藏层神经元为24个,输出神经元为26个。
D. 没有一定之规,所有层都可以任意设置。
答案:B
4. 关于感知机,以下说法正确的是:
A. 在感知机训练中,通过学习不断改变权重和偏置,最终达到分类目的。 ✅
B. 感知机可以对所有数据进行分类。
C. 感知机的权重只能是正数。
D. 单个感知机可以实现多分类。
答案:A
5. 评价回归模型的常用指标为:
A. 均方误差MSE(Mean Squared Error)。
B. 平均绝对误差MAE(Mean Absolute Error)。
C. 决定系数R²(R-Square)。
D. 以上都是。 ✅
答案:D
6. 人工智能的第一次低谷的原因有:
A. 计算机性能不足。
B. 问题的复杂性。
C. 数据量不足。
D. 以上都是。 ✅
答案:D
7. 导入 import matplotlib.pyplot as plt
后,画曲线图的语句为:
A. plt.scatter()
B. plt.plot()
✅
C. plt.bar()
D. plt.show()
答案:B
8. 使用matplotlib库画图时,为图片添加标题的语句为:
A. plt.title("Title")
✅
B. plt.legend("Title")
C. plt.xlabel("X-Axis")
D. plt.ylabel("Y-Axis")
答案:A
9. 若 item_freq = {'dog': 2, 'plane': 5, 'car': 3}
,则 sorted(item_freq.items(), key=operator.itemgetter(1))
的结果是:
A. [('dog', 2), ('car', 3), ('plane', 5)]
✅
B. [('plane', 5), ('car', 3), ('dog', 2)]
C. [('plane', 3), ('dog', 2), ('car', 5)]
D. [('car', 5), ('dog', 2), ('plane', 3)]
答案:A
10. 关于K近邻分类,以下说法错误的是:
A. 按照k个最近的邻居去判别自己的类别。
B. k的取值不会影响分类结果。 ✅
C. 当某个数据点需要分类时,首先计算其最近的K个邻居中,数量最多的类别即是这个点的类别。
D. 当某个数据点需要分类时,需要计算这个点与所有点的距离。
答案:B
11. 关于神经网络的应用场景,以下说法正确的是:
A. 神经网络只能用于分类。
B. 神经网络只能用于回归。
C. 神经网络既可用于分类,也可用于回归。 ✅
D. 神经网络只能用于图像分类。
答案:C
12. 有代码如下:import numpy.random as random
msk = random.rand(20) > 0.2
,以下说法正确的是:
A. msk
会返回一个布尔数组,长度为20。 ✅
B. msk
会返回一个整数数组,长度为20。
C. msk
是一个字符串数组。
D. msk
是一个空数组。
答案:A
13. 输入图片的维度为224x224x3,经过一层卷积(5个大小为7x7的卷积核),输出的特征图的大小为:
A. 218x218x5 ✅
B. 217x217x8
C. 217x217x3
D. 220x220x5
答案:A
14. 下列哪个神经网络结构会发生权重共享?
A. 卷积神经网络(CNN)。 ✅
B. 全连接神经网络。
C. 感知机。
D. 以上都不是。
答案:A
15. 下列哪项关于模型能力(model capacity)的描述是正确的?
A. 隐藏层层数增加,模型能力增加! ✅
B. Dropout的比例增加,模型能力增加。
C. 学习率增加,模型能力增加。
D. 都不正确。
答案:A
16. 已知: (1)大脑是由很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。 (2)每个神经元都有输入、处理函数和输出。 (3)神经元组合起来形成了网络,可以拟合任何函数。 (4)为了得到最佳的神经网络,我们用梯度下降法不断更新模型。 给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?
A. 加入更多层,使神经网络的深度增加。 ✅
B. 有维度更高的数据。
C. 当这是个图形识别的问题时。
D. 以上都不正确。
答案:A
17. 在一个神经网络中,知道每个神经元的权重和偏置是最重要的一步。如果以某种方式知道了神经元准确的权重和偏置,你就可以逼近任何函数。实现这个最佳的办法是什么?
A. 随机初始化权重和偏置。
B. 搜索所有权重和偏置的组合,直到得到最佳值。
C. 赋予一个初始值,通过检查与最佳值的差异,然后逐步更新权重和偏置。 ✅
D. 以上都不正确。
答案:C
18. 一般情况下,分类器效果最好的是:
A. k近邻分类。
B. 支持向量机(SVM)。 ✅
C. 贝叶斯分类。
D. 决策树。
答案:B
19. 机器学习按照是否有正确答案可以分为:
A. 自主学习和驱动学习。
B. 监督学习和非监督学习。 ✅
C. 分类与回归。
D. 线性回归与多项式回归。
答案:B
20. 导入 import matplotlib.pyplot as plt
后,画散点图的语句为:
A. plt.scatter()
✅
B. plt.plot()
C. plt.bar()
D. plt.show()
答案:A
21. 下列关于分类算法与聚类算法的描述,正确的是:
A. 分类算法是有监督的。 ✅
B. 聚类算法是有监督的。
C. 分类算法是无监督的。
D. 聚类算法计算量小。
答案:A
22. 神经网络的隐含层使用最广泛的激活函数为
A. sgn
B. Softmax
C. Sigmoid
D. ReLU ✅
答案: D
23. 人工智能的元年是哪一年?
A. 1956
B. 1970
C. 1995
D. 2000
答案: A
24. 使用matplotlib库画图时,为图片添加标题的语句为
A. plt.title(“Title”) ✅
B. plt.text(“Title”)
C. plt.label(“Title”)
D. plt.legend(“Title”)
答案: A
25. 使用matplotlib库画图时,有如下语句用于在一张图上画出 sin(x) 和 cos(x) 的图像,并设置图例,则正确语句应是
1
2
3
4
x = np.linspace(0, 6.28, 100)
plt.plot(x, np.sin(x))
plt.plot(x, np.cos(x))
plt.show()
A. plt.title(“sin(x) and cos(x)”)
B. plt.legend([“sin(x)”, “cos(x)”]) ✅
C. plt.legend([“cos(x)”, “sin(x)”])
D. plt.xlim(“sin(x), cos(x)”)
答案: B
26. 我们收集了1000条蘑菇数据,每个蘑菇有3个特征,那这些数据可以用维度为(1000,3)的 numpy 数组表示,假定这些数据已读入到 data
变量中。现在需要将前800条数据作为训练集,后200条数据作为测试集,请问正确的语句为
A. train = data[800] test = data[200]
B. train = data[:800] test = data[800:] ✅
C. train = data[:2400] test = data[2400:]
D. train = data[800:] test = data[:200]
答案: B
27. 我们收集了2023年3000条合肥房价的数据,每个数据有5个特征,那这些数据可以用维度为(3000,5)的 numpy 数组表示,假定这些数据已读入到 data
变量中。现在需要将前2400条数据作为训练集,后600条数据作为测试集,请问正确的语句为
A. train = data[2400] test = data[600]
B. train = data[:2400] test = data[2400:] ✅
C. train = data[:, :2400] test = data[:, 2400:]
D. train = data[2400:] test = data[600:]
答案: B
28. 准备将一块画布上分成两行三列的子图,当前准备画出第3个子图,以下语句正确的是
A. plt.subplot(2, 3, 2)
B. plt.subplot(2, 3, 3) ✅
C. plt.subplot(1, 3, 2)
D. plt.subplot(1, 3, 3)
答案: B
29. 某银行准备使用多层前馈神经网络模型决定是否通过用户的信用卡申请,假设手头有每个用户的月收入、学历、年龄以及负债情况的数据,以下哪种网络结构是合适的
A. 输入层2个神经元,隐藏层若干个神经元,输出层1个神经元
B. 输入层3个神经元,隐层若干个神经元,输出层1个神经元
C. 输入层4个神经元,隐藏层若干个神经元,输出层1个神经元 ✅
D. 输入层5个神经元,隐层若干个神经元,输出层2个神经元
答案: C
30. 应用机器学习的关键点为
A. 存在某种潜在模式可以去学
B. 模式很难去定义
C. 需要一定量的数据
D. 以上都是 ✅
答案: D
31. 人民币金额书写的中文由以下19个汉字组成:壹、贰、参、肆、伍、陆、染、捌、玖、拾、佰、仟、万、亿、元、角、分、零、整。为识别票据上的中文金额数字,现制作了60000图片数据集,每张图片上书写一个中文数字,图片为黑白图片,图片的宽和高都是32个像素,现准备采用深度神经网络识别此数据集,则网络结构应该是
A. 输入神经元为32个,输出神经元为19个,隐藏层可根据经验在一定范围内设置
B. 输入神经元为1024个,输出神经元为19个,隐藏层可根据经验在一定范围内设置 ✅
C. 输入神经元为19个,隐藏层神经元为60000个,输出神经元为19个
D. 没有一定之规,所有层都可以任意设置
答案: B
32. numpy中的多维数组定义为:arr_m=np.array([[1, 2], [3, 4]]),则获得数组元素3的语句为
A. a = arr_m[1][0]
✅
B. a = arr_m[1][2]
C. a = arr_m[1]
D. a = arr_m[2:]
答案: A
简答题
-
深度神经网络用于二分类与多分类的区别是什么?
深度神经网络用于二分类与多分类的区别在于输出层。当用于二分类时,输出层只需要一个神经元,激活函数采用sigmoid函数;当用于多分类时,输出层的神经元个数必须和标签类别数目一致,激活函数采用softmax函数。
-
什么是多层前馈神经网络?
将若干个单层神经网络级联在一起,前一层的输出作为后一层的输入,这样就构成了多层前馈神经网络。更确切地说,每一层神经元仅与下一层的神经元全连接。但在同一层之内,神经元彼此不连接,而且跨层之间的神经元,彼此也不连接。
-
在深度学习中,降低过拟合一般都有哪些方法?
在深度学习中,降低过拟合的方法包括:数据增强、正则化(如L1、L2正则化)、dropout、早停(early stopping)、使用更简单的模型、集成学习等。
-
什么是欠拟合?什么是过拟合?
欠拟合是指模型没有能够很好地学习到数据特征,不能很好地拟合数据,表现为预测值与真实值之间存在较大的偏差。过拟合是指模型学习数据的能力太强(复杂的预测函数),除了学习到数据整体的特性以外,还额外学习到了训练集的一些特性,主要表现为能够很好地拟合训练集,但是不能很好地预测测试样本(即,泛化能力太差)。
-
什么是监督学习?
监督学习就是训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。
-
请回答分类与回归的相同点与不同
相同点:不管是分类还是回归,其本质是一样的,都是对输入做出预测,并且都是监督学习。不同点:分类问题输出的值是离散的,回归问题输出的值是连续的;分类问题输出的值是定性的,回归问题输出的值是定量的。
-
简述机器学习与深度学习的相同点与不同?
相同点:二者都是从数据中学到规律(也就是模型),然后用这个模型去预测新的数据。不同点:机器学习需要人工抽取原始数据中的特征,这些特征就构成了能够喂入机器学习模型的数据;深度学习从原始数据中自动学得特征,并将这些特征组合起来进行预测。
-
人工智能的三个发展阶段是什么?
第一阶段为推理期,其跨度为1956-1960年代,出发点是数学家=聪明(符号主义),代表成就是自动定理证明系统;第二阶段为知识期,其跨度为1970-1980年代,出发点是知识就是力量,代表成就为专家系统;第三阶段为学习期,其跨度为1990年代至今,出发点是让系统自己学习,代表成就为车牌识别、谷歌翻译等等。
-
什么是损失函数?
损失函数(loss function)是用来估量模型的预测值f(x)与真实值y的不一致程度,它是一个非负实值函数。神经网络学习的过程就是使损失函数逐步减小的过程,也就是使模型与真实值越来越接近。
-
简述在TensorFlow平台上建立多层神经网络识别图像的一般步骤。
在TensorFlow平台上建立多层神经网络识别图像的一般步骤包括:数据预处理(如归一化、数据增强等)、定义网络结构(包括输入层、隐藏层、输出层及激活函数)、选择损失函数和优化器、训练模型(通过迭代优化网络参数)、评估模型性能(在测试集上验证)、进行图像识别预测。