下列说法正确的是?
A.离群(异常)点可以是正确的数据对象或者值
B.离散属性总是具有有限个值
C.噪声和异常是数据错误这一相同表述的两种叫法
D.连续属性离散化可能需要考虑特定的领域知识
- · 有5位网友选择 C,占比50%
- · 有3位网友选择 D,占比30%
- · 有2位网友选择 B,占比20%
A.离群(异常)点可以是正确的数据对象或者值
B.离散属性总是具有有限个值
C.噪声和异常是数据错误这一相同表述的两种叫法
D.连续属性离散化可能需要考虑特定的领域知识
B、烟叶质量是烟草行业的生命线
C、烟叶质量是烟草行业永恒的主题
D、烟叶质量是烟草行业提升核心竞争力的基础
A、过拟合是因为训练样本太多了,把训练样本的规律都拟合进去了,因此检测样本的准确率也很高。
B、减少过拟合的方法可以通过降低决策树的复杂度,例如减少决策树的深度。
C、判断模型是否过拟合可以看随着训练的增加,学习到的模型准确度高了,但检测样本的准确率下降。
D、分类算法都可能会遇到过拟合现象。
A、对于分类问题,支持向量机需要找到与边缘点距离最大的分界线,从而确定支持向量。
B、支持向量机的核函数负责输入变量和分类变量(输出)之间的映射。
C、支持向量机可根据主题对新闻进行分类。
D、支持向量机不能处理分界线为曲线的多分类问题。
A、支持向量机一般处理两分类的问题。
B、支持向量机既可以处理线性可分的问题,也可以处理非线性可分的问题。
C、支持向量机是把高维的数据投影到低维的空间进行分类。
D、对于小样本集,支持向量机的分类准确度可能优于其他对样本数量要求比较高的分类算法。
A、朴素贝叶斯分类器的变量必须是非连续性变量。
B、朴素贝叶斯模型分类时需要计算属于各种类别的概率,取其中概率最大的类别最为分类预测值。
C、朴素贝叶斯模型中的特征和类别变量之间也要相互独立。
D、朴素贝叶斯分类器对于小样本数据集效果不如决策树好。
A、与决策树算法不同,朴素贝叶斯模型是比较各种类别出现的概率大小确定样本的类别。
B、朴素贝叶斯算法是一种使用概率理论的非监督分类算法。
C、朴素贝叶斯模型需要先确定特征,并根据样本计算相关的先验概率,再计算特征条件下的分类变量的后验概率。
D、朴素贝叶斯模型课用于垃圾邮件分类、微博用户情感的识别等场景。
A、贝叶斯网络克服了朴素贝叶斯特征之间相关的不足。
B、贝叶斯网络设计过程中主要是根据领域知识确定贝叶斯网络结构、确定网络参数(条件概率表)。
C、贝叶斯网络变量之间的因果关系和相应的概率部分是人工专家指定,不需要样本训练。
D、贝叶斯网络的参数主要是条件概率表中的概率值,可以使用最大似然估计或贝叶斯估计等方法。
A、贝叶斯网络结构可以由机器自动完成。
B、贝叶斯网络的搭建需要考虑变量之间的因果关系,这是贝叶斯网络推理的基础。
C、作为一种监督学习算法,贝叶斯网络也需要大量的样本分析变量之间的概率。
D、贝叶斯网络的推理只能由原因变量,计算其联合概率,推出目标(分类)变量的条件概率,而不能由目标变量推出原因变量的可能性。
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!