本教材内容包括了解机器学习、机器学习开发环境安装及使用,以及 8 个大类的预测任务(涵盖监督学习、无监督学习、集成学习、深度学习等知识点)。在内容的选取上,本教材突出数据的多样性、方法的代表性和继承性,通过丰富的机器学习任务深入浅出地介绍机器学习技术在现实生活中的应用和实践。本教材共有 10 个模块,第 1~2 个模块是实施机器学习任务前的概念介绍和环境准备,第 3~8 个模块结合案例介绍 K-最近邻、线性回归和逻辑回归、决策树、贝叶斯模型、支持向量机、K-平均值等机器学习算法及模型,第 9、10 个模块分别介绍了结合多分类器的集成学习方法和源自神经网络模型的深度学习算法。从第 3 个模块开始,每个模块至少包含 3 个案例,涵盖数据清洗、数据转换、模型训练、模型评估、结果可视化等大数据和人工智能技术。本教材提供丰富多样的机器学习任务,借鉴企业项目开发的工作流程,采用 JupyterLab 融合注释、代码和运行结果,图文并茂地介绍机器学习任务的编码过程。在编码过程中,涉及机器学习概念、公式及注意事项的详细讲解。本教材适用于高职高专院校大数据和人工智能技术应用专业开展任务驱动式教学,也可作为机器学习初学者的启蒙资料。