美文网首页
数据挖掘任务

数据挖掘任务

作者: 从此不迷茫 | 来源:发表于2020-02-13 23:21 被阅读0次

预测建模

分类:离散

回归:连续


关联分析


聚类分析


异常检测仪



练习题:

1.以下是否是数据挖掘任务。

a.根据性别划分公司的顾客。

否。这是一个简单的数据库查询

b.根据可盈利性划分公司的顾客。

否。这是数学计算,伴随着阈值应用。如果计算顾客购买的的可能性,则是数据挖掘。

c.公司的总销售额。

否。简单的数学计算。

d.根据学生的标识号码对学生数据库排序。

否。这是简单的数据库查询。

e.预测一枚均匀骰子的结果。

否。 既然骰子是均匀的,这就是概率计算。如果不均匀,我们需要从数据中,估计每种可能结果的可能性,那么这就更像是数据挖掘考虑的问题。然而在特定情况下,这种问题长时间以来是数学家要解决的问题,我们不把他考虑成数据挖掘问题。

f.利用历史记录预测某公司未来的股票价格。

是。我们会试图建立一个可预测连续股票价格价值的模型。这是一个简单的数据挖掘领域,即预测建模。我们可以使用回归模型来建模,即使许多领域的研究者们已经发展出了大量技术来预测时间序列。

g.监测病人心率的异常变化。

是。我们会建立一个心率正常变化的模型,当心率出现异常时发出警报。这就是数据挖掘领域中的异常检测。

h.监测地震活动的地震波。

是。这个案例中,我们会建立一个和地震活动相关的不同种地震波变化模型,当其中地震活动被观察到时发出警报。这是数据挖掘领域中的一种----分类。

i.提取声波的频率。

否。这是信号处理。

2.假设你是一个数据挖掘顾问,受雇于一家因特网搜索引擎公司。举例说明如何使用诸如聚类、分类、关联规则挖掘和异常检测等技术,让数据挖掘为公司提供帮助。

举例:

聚类可以通过某个主题的相似性为结果分组,从而使呈现给用户的主题更加简洁,比如报告簇中使用最多的十个单词。

分类可以把结果分配到预定义的类别中,如:"运动","政治",等等。

序列关联分析可以检测特定序列伴随其他特定序列的高可能性,允许更有效率的存储。

异常检测技术可以发现用户流量的不寻常模式,比如某个物品突然变得更加受欢迎。广告可以使用这种技术来调整策略。

3.对于以下数据集,解释数据私有性是否是重要问题。

a.1900-1950年间的人口普查数据。否

b.访问你的web站点的web用户的ip地址和访问次数。是

c.从地球轨道卫星发回的图像。否

d.电话号码簿上的姓名和地址。否

e.从网上收集的姓名和电子邮件地址。否

相关文章

  • 数据挖掘任务

    预测建模 分类:离散 回归:连续 关联分析 聚类分析 异常检测仪 练习题: 1.以下是否是数据挖掘任务。 a.根据...

  • 零售业的数据挖掘

    数据挖掘的任务和方法 数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘 的任务主要是关联分析、...

  • 机器学习简介3--PCA

    在我们数据挖掘的任务中,数据往往拥有非常多的纬度。这些过多的维度,往往给数据挖掘的任务带来困难。本小节以PCA算法...

  • 第一章 数据挖掘基础

    数据挖掘的基本任务:分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐数据挖掘建模过程:1)定义挖掘目标...

  • 数据挖掘实践任务3

    任务3 - 建模(2天) 用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,评分方式任意,如准确率...

  • 数据挖掘实践任务2

    任务2: 特征工程(2天) 特征衍生特征挑选:分别用IV值和随机森林等进行特征选择……以及你能想到特征工程处理 结...

  • 数据挖掘实践任务4

    任务4: 记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precisio...

  • 数据挖掘实践任务1

    任务1 - 数据分析(2天) 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否...

  • 数据挖掘基本任务

    定义挖掘目标 数据取样 数据探索 数据预处理 挖掘建模* 模型评价 平均水平的指标是对个体集中趋势的度量, 使用最...

  • 时空数据挖掘

    数据挖掘已经成为当代显学,只要是个公司可能都需要数据挖掘,由此也衍生除了金融数据挖掘、生物数据挖掘、时空数据挖掘、...

网友评论

      本文标题:数据挖掘任务

      本文链接:https://www.haomeiwen.com/subject/vayrfhtx.html