type
status
date
slug
summary
tags
category
icon
password
mlr3包可以对Task进行多种操作
- 获取预设的Task
- 指定Task类型
- 创建Task
- 通过API操作Task
- 为Task的行和列分配角色
- 运行Task突变器
- 检索存储在Task中的数据
Task常见类型
- 分类任务(Classification Task)
- 回归任务(Regression Task)
- 生存任务(Survival Task)
- 密度任务(Density Task)
- 聚类任务(Cluster Task)
- 空间任务(Spatial Task)
- 序列回归任务(Ordinal Regression Task)
获取预设的Task
mlr3预设了许多Task
而要想获取更多的详细信息,可以使用以下代码
指定Task类型
二元分类(Binary classification)
as_task_classif、as_task_regr……
数据的行列
列
将变量从变量中移除,赋予新角色
本质上并没有对数据进行改变,仅仅改变了数据的表现形式
行
行可以有两种类型:
1.使用类型:默认类型,用于模型构建
2.验证类型:用于模型验证。值得注意的是,含有缺失值的行被默认用于模型验证。
出于以下理由,我们常需要准备些后备变量:1. 为了验证模型的效能;2.部分变量可能不可用
运行Task突变器
值得注意的是,尽管mrl3给予了我们操作数据的方法,但仍建议我们在应用tidyverse整理了数据后不要在这之中对数据进行操作
创建Task
- 准备数据
- 创建任务
- 任务可视化
值得指出的是,见于mlr3具有众多附属包,可以考虑导入mlr3verse包。mlr3verse包提供了绝大多是的mlr3系列包的功能
运用mlr3的API
从Task中重新获取数据
可以使用以下代码获取