数据挖掘算法中,下列关于聚类的说法中,错误的是()。
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
A.不预先设定数据归类类目,完全根据数据本身趋势与结构进行不同类别的分组
B.要求同类数据间内容相似度尽可能小
C.要求不同类数据间内容相似度尽可能小
D.与分类挖掘技术一样,都是需要对数据进行分类处理
A.商务智能的主要分析工具包括联机分析处理和数据挖掘及应用
B.关联分析用来寻找数据库中值的相关性
C.聚类是在不考虑已知分类的情况下对数据类或概念进行区分
D.商业智能的概念和决策支持系统完全不同
A.聚类本身是一种无监督学习的算法
B.聚类的结果并不总是有实际的使用意义
C.在聚类之前一般不需要进行数据清洗
D.不同的应用场景下,应注意选择合适的聚类方法
A.聚类算法中,同一类别内部样本的相似度较低
B.自动编码器常应用于图像抗噪和数据降维
C.聚类算法中,不同类别之间样本不交叉
D.与有监督学习相比,无监督学习更接近人类学习的过程
下列关于K-Means算法的说法错误的是()。
A.构建K-Means聚类模型需要对数据进行标准化
B.K-Means算法涉及空间距离计算
C.K-Means算法训练结果具有一定的随机性,所以需要多次训练
D.K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.K-Means对于噪声比较敏感
B.当处理较大数据集时,无法保持可伸缩性和高效率
C.不能对变量进行聚类
D.当簇近似为正态分布时,效果较好
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!