正在加载...

创建人工智能特征工程流程

该提示旨在帮助数据科学家、机器学习工程师和分析师为人工智能和机器学习项目构建完整的特征工程流程。特征工程是提高模型性能的关键步骤,它将原始数据转化为有意义且可用于预测的输入。通过使用此提示,用户可以识别重要特征、建议适当的数据转换、处理缺失值、编码类别变量、对数值型数据进行归一化或标准化,并在必要时创建新的复合特征。生成的输出具有可操作性,提供详细的分步计划,可直接应用于 Python、R 或其他机器学习框架。使用该提示可以节省时间,减少反复试验,并建立一致且可靠的特征工程工作流程,从而获得更高精度且易于解释的模型。

Advanced Universal (All AI Models)
#特征工程 #机器学习 #数据预处理 #预测建模 #AI 工作流 #数据科学 #特征选择 #ML 流水线

AI 提示词

539 Views
0 Copies
“请作为经验丰富的机器学习工程师,为以下数据集设计详细的特征工程流程。请考虑: 数据集描述:\[提供数据类型、特征数量、变量类型及目标变量] 模型类型:\[回归、分类、聚类等] 业务背景与目标:\[说明项目目标] 限制条件:\[如计算资源、实时处理需求或法规要求] 请生成分步流程,包括: 1. 数据清洗与预处理 2. 缺失值和异常值处理 3. 特征转换(缩放、编码、归一化) 4. 新特征创建(交互特征、聚合特征、领域特定特征) 5. 特征选择方法 6. 推荐工具、库或框架 请将输出格式化为清晰可操作的检查清单,可直接应用于机器学习工作流。”

使用方法

1. 提供详细的数据集描述和项目目标。
2. 明确将使用的模型类型。
3. 包含任何限制或特殊要求,以便 AI 给出可执行的步骤。
4. 将提示复制到 AI 工具中,并审阅生成的特征工程计划。
5. 根据数据集和业务背景对计划进行调整和优化。
6. 在应用于真实数据前,务必验证每个建议步骤的可行性。
提示: 避免模糊的数据描述,提供越详细信息,生成结果越精确。务必在实施前审查推荐的转换步骤。

使用案例

金融或营销领域的预测分析数据集准备
在 ML 流水线中自动化特征工程
提高分类或回归模型的预测精度
团队间标准化特征工程流程
为复杂数据集创建新的复合特征
支持数据科学项目的快速原型开发
通过结构化特征转换提高模型可解释性
优化大规模机器学习项目的数据预处理

专业技巧

提供尽可能详细的数据集信息以获得精准建议。
根据领域知识检查生成的特征的有效性。
将 AI 建议与 FeatureTools 或 scikit-learn 流水线结合使用。
通过迭代测试不同特征转换优化模型性能。
记录并版本化特征工程流程,确保可复现性。

相关提示词

人工智能与机器学习
Advanced

设计深度学习训练流水线

本提示旨在帮助用户设计一个完整、专业的深度学习训练流水线,适用于数据科学家、机器学习工程师、人工智能研究人员以及技术项目经理。通过使用该提示,用户可以获得从数据收集与预处理、模型架构选择、超参数调优、训练计划制定、评估策略到模型部署的全面建议。提示还能帮助识别潜在瓶颈、提供性能优化方案,并确保实验结果的可复现性。使用该提示可以显著节省复杂项目的规划时间,并减少在处理大规模或多源数据集时可能出现的尝试与调整错误。最终,用户能够构建出稳健、可扩展且高效的深度学习训练流水线,流水线步骤清晰、可操作,并可根据不同项目灵活调整。

为 \[项目描述或问题领域] 设计一个完整的深度学习训练流水线。流水线应包含: 1. 数据收集与预处理策略,包括缺失值处理、归一化、数据增强,以及训练、验证和测试集的划分。 2. 模型架构建议,包括层类型、激活函数以及适用的模型类别(如 CNN、RNN、Transformer)。 3. 超参数调优方法,包括学习率、批量大小、优化器选择和正则化技术。 4. 训练计划,包括训练轮数(epochs)、早停(early stopping)、检查点(checkpoints)设置,以及 GPU/CPU 优化。 …

#深度学习 #训练流水线 #机器学习 +5
590 0
Universal (All AI Models)
人工智能与机器学习
Advanced

模型性能评估开发

此提示旨在帮助用户系统性、深入地评估其机器学习模型的性能,适用于数据科学家、人工智能工程师及分析师等专业人员。它可以量化模型的有效性,比较不同模型方案,或在部署前进行优化。通过该提示,用户能够获得全面的性能指标,包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-Score)、混淆矩阵(Confusion Matrix)、ROC-AUC等关键指标。同时,它还能识别过拟合(Overfitting)、欠拟合(Underfitting)以及数据或模型中的潜在偏差。输出结果将生成结构化、专业的报告,既可用于企业决策,也可支持学术研究。该提示能够节省分析时间,标准化评估流程,并提供深度洞察,避免人工分析的繁琐。它在企业环境、研究项目和生产级AI系统中尤为有价值,为模型优化和改进提供明确、可执行的指导。

请评估我的机器学习模型的性能。模型类型为 \[输入模型类型,例如 Random Forest,神经网络]。使用的数据集为 \[输入数据集描述]。请提供详细分析,包括: Accuracy, Precision, Recall, F1-Score 混淆矩阵和ROC-AUC(如适用) 过拟合或欠拟合的迹象 提升模型性能的建议 模型的潜在偏差或局限性 请将输出格式化为专业且结构化的报告,适用于企业或科研使用。

#机器学习 #模型评估 #性能指标 +5
572 0
Universal (All AI Models)
人工智能与机器学习
Advanced

构建人工智能伦理与偏见评估

本提示旨在帮助用户对人工智能(AI)系统进行全面的伦理与偏见评估。它适用于AI开发人员、数据科学家、机器学习工程师及伦理合规负责人,提供对模型、数据集及决策流程的系统化分析方法。通过此提示,用户可以识别潜在的伦理风险,检测训练数据中的偏差,分析模型输出中可能存在的歧视性模式,并评估其与行业伦理标准及相关法规的符合度。此外,提示还可生成可操作的改进建议与风险缓解策略,使其在内部审计或外部合规报告中同样适用。该评估方法可应用于预测模型、推荐系统、自然语言处理、计算机视觉等多种AI应用。总体而言,该提示有助于组织提升AI项目的公平性、透明度和问责性,降低声誉风险,并增强技术的可信度和可靠性。

请对系统 \[AI系统或模型名称] 进行全面的伦理与偏见评估,分析以下方面: 1. \\数据分析:\\识别训练和测试数据中的潜在偏见,包括人口统计、地理和社会经济因素。 2. \\模型行为:\\检查输出是否存在歧视性或不公平的模式,并提供可能对特定群体产生不成比例影响的实例。 3. \\伦理风险:\\识别可能的伦理问题,如隐私侵犯、透明度不足或意外结果。 4. \\合规性:\\评估其与行业伦理指南及相关法规的符合程度。 5. \\缓解策略:\\提供针对已识别偏见和伦理风险的具体改进建议。 请生成包含结论、实例和专业建议的结构化报告,适用于内部审计或外部报告。

#AI伦理 #偏见评估 #公平性 +5
567 0
Universal (All AI Models)
人工智能与机器学习
Advanced

制定自动化机器学习策略

本提示旨在帮助用户为其项目、业务需求或研究目标制定全面的自动化机器学习(AutoML)策略。它指导人工智能工具构建结构化的方法,以自动化整个机器学习流程,包括数据预处理、特征工程、模型选择、超参数优化、模型评估和部署。数据科学家、机器学习工程师和项目经理可使用此提示来减少手动操作,加快开发周期,并确保生成高质量、可靠的预测模型。通过此提示,团队可以为其数据集和业务目标选择最合适的AutoML工具和框架,同时遵循可扩展性、可重复性和伦理规范的最佳实践。该提示特别适用于希望优化ML管道、提高资源管理效率,并通过模型迭代和部署快速做出数据驱动决策的组织。它可以帮助团队在保持灵活性和效率的同时,构建可持续、可扩展和符合伦理标准的机器学习策略。

为\[具体项目、业务问题或数据集]制定详细的自动化机器学习(AutoML)策略。请包含以下内容: 1. 针对\[数据类型:结构化、非结构化、时间序列、图像、文本]推荐的AutoML工具或框架。 2. 根据\[数据集特征]的适当数据预处理和特征工程步骤。 3. 模型选择和超参数优化的方法。 4. 评估指标和验证策略。 5. 模型在生产环境中的部署与性能监控计划。 6. 可扩展性、可重复性及伦理方面的建议。 请提供一份可由数据科学团队直接实施的分步计划,并包含最佳实践及常见错误的规避方法。

#AutoML #机器学习 #数据科学 +5
564 0
Universal (All AI Models)
人工智能与机器学习
Advanced

自然语言处理(Nlp)开发与实现

本提示旨在帮助人工智能专家和数据科学家开发和实现高级自然语言处理(NLP)解决方案。适用于希望从文本数据中提取有价值信息、自动化语言相关流程并优化数据驱动决策的工程师、分析师和开发者。该提示提供了结构化的NLP管道方法,包括数据收集、预处理、特征提取、模型选择、训练、评估以及生产环境部署策略。它能够解决常见问题,如非结构化文本处理、多语言数据集管理,以及模型在生产环境中的集成与优化。使用此提示,用户可以节省开发时间,同时遵循最佳实践,实现高质量、可扩展的NLP解决方案。提示中包含详细说明、代码示例及方法论建议,确保在企业项目或研究项目中实现专业、高效的工作流程。

请开发一个完整的自然语言处理(NLP)实现,用于\[具体应用场景,例如:情感分析、文本分类、实体识别],使用\[编程语言或平台,例如:Python, TensorFlow, PyTorch]。实现内容应包括以下步骤: 1. 数据收集与预处理(清洗、分词、去停用词、词干提取/词形还原)。 2. 特征提取或嵌入方法(例如:TF-IDF、Word2Vec、BERT embeddings)。 3. 针对\[数据集和任务]的模型选择与架构设计。 4. 模型训练、超参数优化及验证策略。 5. 使用适当指标进行评估和性能分析。 6. …

#NLP #自然语言处理 #机器学习 +5
558 0
Universal (All AI Models)
人工智能与机器学习
Advanced

神经网络架构设计与规划

此提示面向人工智能专家、数据科学家和机器学习工程师,旨在帮助他们为特定任务高效地规划和设计神经网络架构。它引导用户完成一个结构化流程,包括输入特征定义、合适层类型选择、激活函数设计、优化策略和输出结构配置。通过使用此提示,用户可以生成详细的架构方案,评估不同的网络配置,并理解模型复杂度、性能和计算成本之间的权衡。该提示尤其适用于分类、回归、自然语言处理(NLP)、计算机视觉及时间序列分析等应用场景的定制化解决方案开发。它能够减少试错过程,提供结构化指导,并确保关键因素如过拟合、数据需求及模型可扩展性被充分考虑。使用此提示可显著节省时间,提高模型性能,并在实施前做出更有依据的决策,为企业或研究项目提供可靠的神经网络设计支持。

请为以下任务设计神经网络架构:\[指定任务/问题],数据类型为:\[例如图像、文本、表格数据]。请考虑以下要求: 输入特征:\[列出输入特征或数据维度] 输出要求:\[例如分类标签、回归值] 性能目标:\[例如准确率、速度、内存效率] 限制条件:\[例如计算资源限制、延迟、参数数量] 请提供详细架构规划,包括: 1. 各层类型及顺序(例如 Dense, Convolutional, LSTM, Transformer) 2. 每层的神经元/单元数量 3. …

#神经网络 #AI架构 #深度学习 +5
558 0
Universal (All AI Models)

更多来自 人工智能与机器学习

Intermediate

构建机器学习模型选择框架

本提示旨在帮助数据科学家、机器学习工程师和AI专业人士系统性地构建适合项目的机器学习模型选择框架。通过使用该提示,用户可以根据项目需求、数据集特征、计算资源和模型性能目标,比较不同算法,选择最优模型。提示内容包括:任务类型分析(分类、回归、聚类等)、数据特征分析(数据量、特征类型、缺失值情况)、推荐模型及其优缺点、数据预处理与特征工程策略、超参数优化方法、模型评估指标与验证方法,以及资源使用和可扩展性建议。使用该提示可标准化团队的模型选择流程,提高决策的可靠性,加速开发过程,同时平衡模型性能与可解释性,降低项目风险。对于需要快速原型设计、优化性能和提升数据驱动决策质量的专业人士而言,本提示尤其适用。

“你是一名机器学习专家。请为\[项目名称或描述]构建一个全面的机器学习模型选择框架。框架应包括: 任务类型分析(分类、回归、聚类等) 数据特征分析(数据量、特征类型、缺失值情况) 推荐模型及其优缺点 数据预处理与特征工程建议 超参数优化策略 模型评估指标与验证方法 资源使用与可扩展性建议 模型可解释性与性能平衡 请逐步构建框架,并说明每个模型为何适合\[项目要求]。”

#机器学习 #模型选择 #框架构建 +5
495 0
Universal (All AI Models)
Advanced

数据预处理流水线策略开发

本提示旨在帮助数据科学家、机器学习工程师和分析师制定全面的数据预处理流水线策略,将原始数据转化为适用于建模和分析的高质量数据集。该提示涵盖数据清洗、缺失值和重复值处理、异常值检测与修正、特征工程、变量标准化与归一化、关键特征选择以及降维等系统步骤。此外,还提供了训练集与测试集划分的建议,以及可选的数据增强或生成合成数据的策略。应用此策略可以提升模型精度、优化计算资源使用,并构建可重复和可维护的数据流水线。本提示同时推荐合适的工具和库,识别潜在问题并提出实用解决方案,尤其适用于来自多源、存在噪声或需要特殊转换以最大化模型性能的数据项目。使用该提示,团队可以确保数据处理过程系统化、可控且符合业务目标。

“为我的数据集制定详细的数据预处理流水线策略。数据集描述为:\[数据集简要描述,例如 ‘包含100,000行、20列的客户交易数据’]。策略应包括: 1. 数据清洗(处理缺失值、重复值和异常值) 2. 特征转换与标准化/归一化(如数值特征缩放、类别特征编码等) 3. 特征选择或降维 4. 训练集与测试集划分 5. 数据增强或合成数据生成(可选) 6. 推荐适合实现的工具、库或框架 请将策略以详细的步骤指南形式提供,说明每个步骤的重要性以及如何为模型准备数据,同时指出可能的挑战并提供实用解决方案。”

#数据预处理 #机器学习 #特征工程 +5
512 0
Universal (All AI Models)
Advanced

神经网络架构设计与规划

此提示面向人工智能专家、数据科学家和机器学习工程师,旨在帮助他们为特定任务高效地规划和设计神经网络架构。它引导用户完成一个结构化流程,包括输入特征定义、合适层类型选择、激活函数设计、优化策略和输出结构配置。通过使用此提示,用户可以生成详细的架构方案,评估不同的网络配置,并理解模型复杂度、性能和计算成本之间的权衡。该提示尤其适用于分类、回归、自然语言处理(NLP)、计算机视觉及时间序列分析等应用场景的定制化解决方案开发。它能够减少试错过程,提供结构化指导,并确保关键因素如过拟合、数据需求及模型可扩展性被充分考虑。使用此提示可显著节省时间,提高模型性能,并在实施前做出更有依据的决策,为企业或研究项目提供可靠的神经网络设计支持。

请为以下任务设计神经网络架构:\[指定任务/问题],数据类型为:\[例如图像、文本、表格数据]。请考虑以下要求: 输入特征:\[列出输入特征或数据维度] 输出要求:\[例如分类标签、回归值] 性能目标:\[例如准确率、速度、内存效率] 限制条件:\[例如计算资源限制、延迟、参数数量] 请提供详细架构规划,包括: 1. 各层类型及顺序(例如 Dense, Convolutional, LSTM, Transformer) 2. 每层的神经元/单元数量 3. …

#神经网络 #AI架构 #深度学习 +5
558 0
Universal (All AI Models)
Advanced

构建人工智能模型训练策略

此提示旨在帮助用户为其项目制定全面且结构化的人工智能(AI)模型训练策略。适用于数据科学家、机器学习工程师、AI项目经理以及希望构建高效、可扩展和高性能AI解决方案的业务分析师。该提示引导用户完成训练过程中的所有关键步骤,包括数据准备与清洗、特征选择、算法与模型选择、超参数调优、训练计划制定、性能指标设定及模型部署建议。同时,它也解决了常见问题,如过拟合(overfitting)、欠拟合(underfitting)、数据集不平衡及计算资源限制。使用该提示,用户能够获得一个结构化、可操作的策略,从而减少试错时间,加快模型投入生产的速度。此外,该策略还促使用户遵循最佳实践,确保模型的准确性、可靠性和公平性,并保证解决方案在未来需求变化下具备可扩展性与适应性。

“请以人工智能专家的身份,制定一份全面的AI模型训练策略。请考虑以下信息: 模型类型:\[例如,分类、回归、自然语言处理、计算机视觉] 项目目标:\[简要描述目标] 数据规模与质量:\[例如,样本数量、是否带标签、数据来源] 关键特征:\[重要输入变量或数据类型列表] 性能指标:\[例如,Accuracy、F1-score、RMSE] 计算资源:\[例如,GPU、云计算环境] 限制条件:\[例如,时间、预算、隐私要求] 请提供详细的分步骤策略,包括数据预处理、特征工程、模型选择、超参数调优、训练计划、验证、性能评估及部署建议。同时,加入避免常见错误、提高效率、保证可扩展性与公平性的最佳实践。”

#人工智能 #机器学习 #模型训练 +5
541 0
Universal (All AI Models)
Advanced

自然语言处理(Nlp)开发与实现

本提示旨在帮助人工智能专家和数据科学家开发和实现高级自然语言处理(NLP)解决方案。适用于希望从文本数据中提取有价值信息、自动化语言相关流程并优化数据驱动决策的工程师、分析师和开发者。该提示提供了结构化的NLP管道方法,包括数据收集、预处理、特征提取、模型选择、训练、评估以及生产环境部署策略。它能够解决常见问题,如非结构化文本处理、多语言数据集管理,以及模型在生产环境中的集成与优化。使用此提示,用户可以节省开发时间,同时遵循最佳实践,实现高质量、可扩展的NLP解决方案。提示中包含详细说明、代码示例及方法论建议,确保在企业项目或研究项目中实现专业、高效的工作流程。

请开发一个完整的自然语言处理(NLP)实现,用于\[具体应用场景,例如:情感分析、文本分类、实体识别],使用\[编程语言或平台,例如:Python, TensorFlow, PyTorch]。实现内容应包括以下步骤: 1. 数据收集与预处理(清洗、分词、去停用词、词干提取/词形还原)。 2. 特征提取或嵌入方法(例如:TF-IDF、Word2Vec、BERT embeddings)。 3. 针对\[数据集和任务]的模型选择与架构设计。 4. 模型训练、超参数优化及验证策略。 5. 使用适当指标进行评估和性能分析。 6. …

#NLP #自然语言处理 #机器学习 +5
558 0
Universal (All AI Models)
Advanced

创建计算机视觉系统设计

此提示专为人工智能专家、数据科学家和机器学习工程师设计,帮助他们规划和设计完整的计算机视觉系统。它允许用户构建端到端的视觉数据处理架构,包括图像与视频采集、预处理、特征提取、模型选择、训练、部署及性能评估。 通过此提示,团队可以针对特定的技术或业务需求开发解决方案,例如物体检测、人脸识别、自动驾驶导航或工业质量控制。该提示还引导用户考虑硬件要求、数据采集策略、标注工作流以及模型优化方法,从而确保系统具备可扩展性和高效性。对于希望系统化规划计算机视觉项目的组织,这个提示能够降低开发风险,提高模型的准确性与效率,并确保技术决策与业务目标保持一致。它能够将概念性需求转化为实际、有效的 AI 解决方案,帮助企业快速落地和优化项目成果。

为 \[具体应用,例如:工业缺陷检测、自动驾驶车辆导航、人脸识别] 设计完整的计算机视觉系统。设计内容应包括: 1. 数据采集方法与来源 2. 数据预处理与增强策略 3. 特征提取技术与算法 4. 模型选择与架构设计 5. 训练策略及超参数调整 6. 部署环境及与现有系统的集成 …

#计算机视觉 #AI 系统设计 #机器学习 +5
494 0
Universal (All AI Models)
Advanced

设计深度学习训练流水线

本提示旨在帮助用户设计一个完整、专业的深度学习训练流水线,适用于数据科学家、机器学习工程师、人工智能研究人员以及技术项目经理。通过使用该提示,用户可以获得从数据收集与预处理、模型架构选择、超参数调优、训练计划制定、评估策略到模型部署的全面建议。提示还能帮助识别潜在瓶颈、提供性能优化方案,并确保实验结果的可复现性。使用该提示可以显著节省复杂项目的规划时间,并减少在处理大规模或多源数据集时可能出现的尝试与调整错误。最终,用户能够构建出稳健、可扩展且高效的深度学习训练流水线,流水线步骤清晰、可操作,并可根据不同项目灵活调整。

为 \[项目描述或问题领域] 设计一个完整的深度学习训练流水线。流水线应包含: 1. 数据收集与预处理策略,包括缺失值处理、归一化、数据增强,以及训练、验证和测试集的划分。 2. 模型架构建议,包括层类型、激活函数以及适用的模型类别(如 CNN、RNN、Transformer)。 3. 超参数调优方法,包括学习率、批量大小、优化器选择和正则化技术。 4. 训练计划,包括训练轮数(epochs)、早停(early stopping)、检查点(checkpoints)设置,以及 GPU/CPU 优化。 …

#深度学习 #训练流水线 #机器学习 +5
590 0
Universal (All AI Models)
Advanced

构建人工智能伦理与偏见评估

本提示旨在帮助用户对人工智能(AI)系统进行全面的伦理与偏见评估。它适用于AI开发人员、数据科学家、机器学习工程师及伦理合规负责人,提供对模型、数据集及决策流程的系统化分析方法。通过此提示,用户可以识别潜在的伦理风险,检测训练数据中的偏差,分析模型输出中可能存在的歧视性模式,并评估其与行业伦理标准及相关法规的符合度。此外,提示还可生成可操作的改进建议与风险缓解策略,使其在内部审计或外部合规报告中同样适用。该评估方法可应用于预测模型、推荐系统、自然语言处理、计算机视觉等多种AI应用。总体而言,该提示有助于组织提升AI项目的公平性、透明度和问责性,降低声誉风险,并增强技术的可信度和可靠性。

请对系统 \[AI系统或模型名称] 进行全面的伦理与偏见评估,分析以下方面: 1. \\数据分析:\\识别训练和测试数据中的潜在偏见,包括人口统计、地理和社会经济因素。 2. \\模型行为:\\检查输出是否存在歧视性或不公平的模式,并提供可能对特定群体产生不成比例影响的实例。 3. \\伦理风险:\\识别可能的伦理问题,如隐私侵犯、透明度不足或意外结果。 4. \\合规性:\\评估其与行业伦理指南及相关法规的符合程度。 5. \\缓解策略:\\提供针对已识别偏见和伦理风险的具体改进建议。 请生成包含结论、实例和专业建议的结构化报告,适用于内部审计或外部报告。

#AI伦理 #偏见评估 #公平性 +5
567 0
Universal (All AI Models)