首页 科技周边 人工智能 Deepnecks教程:自动化机器学习测试

Deepnecks教程:自动化机器学习测试

Mar 05, 2025 am 09:03 AM

>本教程探讨了用于数据验证和机器学习模型测试的深检查,并利用GitHub动作来进行自动测试和创建人工制品。 我们将介绍机器学习测试原理,DEEPNACKS功能和完整的自动化工作流程。

DeepChecks Tutorial: Automating Machine Learning Testing

>由作者 图像

>

了解机器学习测试

有效的机器学习需要超出简单准确度指标的严格测试。 我们必须评估公平性,鲁棒性和道德考虑因素,包括偏见检测,误报/负面因素,绩效指标,吞吐量以及与AI伦理的一致性。 这涉及数据验证,交叉验证,F1得分计算,混淆矩阵分析和漂移检测(数据和预测)。 数据拆分(火车/测试/验证)对于可靠的模型评估至关重要。 自动化此过程是构建可靠的AI系统的关键。

对于初学者来说,带有Python技能轨迹的机器学习基础为

提供了坚实的基础。

Deepchecks,一个开源Python库,简化了全面的机器学习测试。它为模型性能,数据完整性和分配提供内置检查,并支持可靠模型部署的连续验证。

>

开始使用deepchecks

> >使用PIP安装深部检查:

pip install deepchecks --upgrade -q
登录后复制
登录后复制
数据加载和准备(贷款数据集)

> 我们将使用DataCamp的贷款数据数据集。

import pandas as pd
loan_data = pd.read_csv("loan_data.csv")
loan_data.head()
登录后复制
登录后复制

DeepChecks Tutorial: Automating Machine Learning Testing 创建一个deepchecks数据集:

from sklearn.model_selection import train_test_split
from deepchecks.tabular import Dataset

label_col = 'not.fully.paid'
deep_loan_data = Dataset(loan_data, label=label_col, cat_features=["purpose"])
登录后复制
登录后复制
数据完整性测试

> DeepChecks的数据完整性套件执行自动检查。>

这会生成一个报告覆盖:特征标签相关,特征 - 功能相关,单个值检查,特殊字符检测,零值分析,数据类型一致性,字符串不匹配,重复检测,字符串长度验证,冲突的标签和异常检测。

from deepchecks.tabular.suites import data_integrity
integ_suite = data_integrity()
suite_result = integ_suite.run(deep_loan_data)
suite_result.show_in_iframe() # Use show_in_iframe for DataLab compatibility
登录后复制

保存报告:

DeepChecks Tutorial: Automating Machine Learning Testing

单个测试执行

suite_result.save_as_html()
登录后复制

为了效率,请进行单个测试:

使用Deepchecks的模型评估

from deepchecks.tabular.checks import IsSingleValue, DataDuplicates
result = IsSingleValue().run(deep_loan_data)
print(result.value) # Unique value counts per column

result = DataDuplicates().run(deep_loan_data)
print(result.value) # Duplicate sample count
登录后复制

我们将训练一个合奏模型(逻辑回归,随机森林,高斯幼稚的贝叶斯),并使用deepchecks对其进行评估。

pip install deepchecks --upgrade -q
登录后复制
登录后复制

模型评估报告包括:ROC曲线,弱段性能,未使用的功能检测,火车测试性能比较,预测漂移分析,简单模型比较,模型推理时间,混乱矩阵等

DeepChecks Tutorial: Automating Machine Learning Testing JSON输出:

单个测试示例(标签漂移):
import pandas as pd
loan_data = pd.read_csv("loan_data.csv")
loan_data.head()
登录后复制
登录后复制

from sklearn.model_selection import train_test_split
from deepchecks.tabular import Dataset

label_col = 'not.fully.paid'
deep_loan_data = Dataset(loan_data, label=label_col, cat_features=["purpose"])
登录后复制
登录后复制
>使用github Action自动

> >本节详细介绍了设置github操作工作流程以自动化数据验证和模型测试。 该过程涉及创建一个存储库,添加数据和Python脚本(

),并配置GitHub Actions WorkFlow(data_validation.py)以执行这些脚本并将结果保存为工件。 原始输入中提供了详细的步骤和代码段。 有关一个完整的示例,请参阅train_validation.py>存储库。 工作流利用main.yml>,kingabzpro/Automating-Machine-Learning-Testingactions/checkout> action。 actions/setup-pythonactions/upload-artifact

DeepChecks Tutorial: Automating Machine Learning Testing

DeepChecks Tutorial: Automating Machine Learning Testing 结论

>使用Deepchecks和GitHub操作自动化机器学习测试可显着提高效率和可靠性。 早期发现问题可以增强模型的准确性和公平性。 本教程提供了实施此工作流程的实用指南,使开发人员能够构建更健壮和值得信赖的AI系统。 考虑使用Python职业生涯的机器学习科学家,以在该领域进一步发展。

以上是Deepnecks教程:自动化机器学习测试的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

最佳AI艺术生成器(免费付款)创意项目 最佳AI艺术生成器(免费付款)创意项目 Apr 02, 2025 pm 06:10 PM

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

开始使用Meta Llama 3.2 -Analytics Vidhya 开始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) 最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

顶级AI写作助理来增强您的内容创建 顶级AI写作助理来增强您的内容创建 Apr 02, 2025 pm 06:11 PM

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

构建AI代理的前7个代理抹布系统 构建AI代理的前7个代理抹布系统 Mar 31, 2025 pm 04:25 PM

2024年见证了从简单地使用LLM进行内容生成的转变,转变为了解其内部工作。 这种探索导致了AI代理的发现 - 自主系统处理任务和最少人工干预的决策。 Buildin

AV字节:Meta' llama 3.2,Google的双子座1.5等 AV字节:Meta' llama 3.2,Google的双子座1.5等 Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

向员工出售AI策略:Shopify首席执行官的宣言 向员工出售AI策略:Shopify首席执行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

See all articles