刚刚发布了2.0版本,只需要写上几行Python代码

日期:2020-08-02 17:57:46   来源:互联网   编辑:小狐   阅读人数:318

萧箫 发自 凹非寺

Python开源机器学习建模库 PyCaret,刚刚发布了2.0版本。

刚刚发布了2.0版本,只需要写上几行Python代码(图1)

从数据预处理到模型效果对比,PyCaret都能 自动实现

所以,PyCaret长啥样,2.0的版本又做了什么改进?

一起来看看。

PyCaret说白了,有点像一个机器学习库的 炼丹炉

数据处理:pandas、numpy…

数据可视化:matplotlib、seaborn…

各种模型:sklearn、xgboost、catboost、lightgbm…

嗯…sklearn直接就给封装进去了,调用很方便。

PyCaret这个炼丹炉,自带功能“按键” (定义了一些函数)包括数据预处理、模型训练、模型集成、模型分析、模型等。

只需要写上几行Python代码,这些功能“按键”就会被按下,PyCaret自动帮你实现。

至于实现过程中需要调用什么基本库,那些 可以放弃思考不需要考虑。

从下图来看,仅仅是 预处理阶段,就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能。

刚刚发布了2.0版本,只需要写上几行Python代码(图2)

如果要实现必需的预处理功能,需要多少行代码来调用?

答案是 0行

因为,当使用setup进行初始化时,PyCaret将 自动执行机器学习必需的数据预处理步骤,包括缺失值插入、分类变量编码、编码、数据集拆分等。

例如,在数据处理前,你发现数据集有空缺的地方 (下图中NaN部分)

刚刚发布了2.0版本,只需要写上几行Python代码(图3)

别怕,PyCaret会自动分析数据,进行缺失值插入。

刚刚发布了2.0版本,只需要写上几行Python代码(图4)

预处理后,PyCaret还贴心地帮你准备了各种模型。

从模型训练、选用到,只有你想不到的,没有它做不了的。

如果已经将数据处理好,并交给PyCaret,一个 compare_models函数就能 训练库中的所有模型,进行结果比较后,标出最佳模型。

如下图,各种模型指标的最优值会被一键标黄,就看你怎么选择了。

刚刚发布了2.0版本,只需要写上几行Python代码(图5)

选好后,想对模型进行一点优化?一个 tune_model函数就能帮你搞定。

或者,不想仅仅选用一个模型?

PyCaret也准备了 模型集成的函数,blend和stack任你选。

除此之外,模型参数的分析 (包括可视化)也只需要几行代码就能实现,功能非常强大。

刚刚发布了2.0版本,只需要写上几行Python代码(图6)

刚刚发布了2.0版本,只需要写上几行Python代码(图7)

那么,这次PyCaret增强,进行了什么改进呢? (项目见传送门)

PyCaret 2.0增强版

刚刚发布了2.0版本,只需要写上几行Python代码(图8)

实验日志,对于模型的调整不可或缺。

例如,想要将训练过程中模型的精度变化 可视化,通常我们会在模型中加入生成日志文件的函数,生成一个更直观的时间-精度变化图。

PyCaret 2.0加入了实验日志的功能,自动帮你跟踪模型实验过程中的各项指标,以及生成视觉效果等。

不仅如此,在2.0中,模型生成到预测的所有工作流程,现在可以被设计了。

以及,PyCaret 2.0现在几乎支持所有算法的并行处理,xgboost和catboost模型也支持GPU训练。

刚刚发布了2.0版本,只需要写上几行Python代码(图9)

除此之外,还有一些新的程序功能,等待你去发现。

传送门

不了解任何隐私AI技术的情况下,者怎样做到只改动两三行代码,就将现有AI代码转换为具备数据隐私保护功能的程序?

8月6号, 软件研究所博士、矩阵元算法科学家--谢翔将直播解析,加小助手“qbitbot9”或者直接扫码,即可进入直播交流群:

վ“ᴗ” ի 追踪AI技术和产品新动态

本文相关词条概念解析:

模型

模型是所研究的系统、过程、事物或概念的一种表达形式,也可指根据实验、图样放大或缩小而制作的样品,模型一般用于展览或实验或铸造机器零件等用的模子。对于现实世界的事物、现象、过程或系统的简化描述,或其部分属性的模仿。在一般的意义下是指模仿实物或设计中的构造物的形状制成的雏型,其大小可以分为缩小型、实物型和放大型。

网友评论
相关阅读
小米手机1,改变了消费者对于手机的期待,与失之交臂的发展机会

小米手机1,改变了消费者对于手机的期待,与失之交臂的发展机会

小米公司成立于2010年,在2011年8月16日推出了第一代

不排除2020款16寸MacBook,主流观点都认为它会搭载10代酷睿处理器

不排除2020款16寸MacBook,主流观点都认为它会搭载10代酷睿处理器

去年11月,苹果发布了首款16英寸的MacBook Pro。

公交司机被抽打不还手获委屈奖究竟什么情况?公交司机被抽打不还手获委屈奖时间过程详解

公交司机被抽打不还手获委屈奖究竟什么情况?公交司机被抽打不还手获委屈奖时间过程详解

20秒内被打32拳晕倒在方向盘,公交司机是否应该“打不还手”

北京新发地市场监管所揭牌成立是什么原因?北京新发地市场监管所揭牌成立令人震惊

北京新发地市场监管所揭牌成立是什么原因?北京新发地市场监管所揭牌成立令人震惊

换人!北京新发地批发市场迎来新任总经理日前,北京新发地市场官

Note20系列国行发布会将于明天,潮流配色抢先看

Note20系列国行发布会将于明天,潮流配色抢先看

PConline 资讯大家苦苦期盼的三星下半年重磅旗舰三星N

拍一部电影能收一辈子钱,即使再不拍戏,百年后子孙还能继续收钱

拍一部电影能收一辈子钱,即使再不拍戏,百年后子孙还能继续收钱

人生在世,倘若价值观崩塌了的话,那么为没意义了。但今天小编要

如在iPhone,这样可以保证两次发布,避免产能不足

如在iPhone,这样可以保证两次发布,避免产能不足

苹果的发布会总是那么牵动人心,近期,外媒爆料,苹果今年的发布

现有功能分析,我们究竟该如何看待B站的弹幕功能呢

现有功能分析,我们究竟该如何看待B站的弹幕功能呢

导语:B站的弹幕功能是其独特的之一,自2009年推出弹幕功能

冰火两重天,广州恒大就已经伤病满营

冰火两重天,广州恒大就已经伤病满营

北京时间8月9日,广州恒大完败山东鲁能,豪迈恒大没有越过泰山

可以拿到低价加油卡,和张某是初中同学

可以拿到低价加油卡,和张某是初中同学

加油卡想必大家都听说过,各个加油站都有出售,但是在顺义区的王