数据分类应用
上一节
下一节
一个工程上的实际应用,往往不是一个机器学习方法所能完成的。需要多种机器学习方法的组合,共同实现精确的推荐或者识别准确度。在数据分类应用过程中也是一样,需要整合多个方法来实现。同时,数据的应用还取决数据的完整性和有效性,错误的数据或缺失的数据类别,都会让结果不是那么精确。
(1)电影的聚类分析
应用中,可以通过对电影的分类,对不同类型的电影安排不同的推广策略,最终增加营业收入。通过评分、日均票房分析等多个信息,将电影进行分类。首先通过DBSCAN确定电影的分类个数,然后使用该数值通过K-Means方法实现对电影的聚类和预测。示例结果如下图所示。

(2)电影的分类分析
有时,在工程应用的一个大项目中,通常会招用一个团队去做标记,使用标记后的结果做有监督的学习。同样,我们也可以根据现实经验对观影数据进行标记,将电影进行分类。根据标记后的结果使用不同的机器学习方法来实现对电影的机器分类。下图,我们将电影标记成了三类,通过机器学习方法实现了对电影类别的一个判定。

