从业务到部署：管理人工智能项目的关键步骤

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News CN 从业务到部署：管理人工智能项目的关键步骤

从业务到部署：管理人工智能项目的关键步骤

导言

大家好，今天我想暂停一下，不再讨论人工智能的工具，而是分享一些关于如何管理人工智能处理器和开发项目的内容。为此，我们将使用一种叫做Crisp-DM的协议。Crisp-DM是数据挖掘的跨行业标准协议，创建于1996年，由不同行业的一些公司（如Teradata、Daimler和NCR等）组成的联盟共同开发。目前，IBM仍广泛使用该协议。尽管数据挖掘这个术语看起来可能有些过时，但它实际上是用来描述多种机器学习和非机器学习技术的术语，这些技术广泛应用于数据挖掘和分析领域。因此，Crisp-DM对于了解机器学习流程非常有用。

最近，我和我的学生被《加利福尼亚管理评论》邀请撰写一篇关于人工智能应用的论文。我们决定聚焦于AI开发过程的管理方面，并考虑尝试提出一个新的流程来描述我们如何进行AI开发。然而，随着我们的思考深入，我们逐渐意识到Crisp-DM已经基本上涵盖了大部分相关内容。幸好，Crisp-DM在各种上下文中都得到了广泛应用，无论是在汽车领域的AI，还是在业务流程的改进与自动化，甚至是图像分析等方面，都非常适合应用于AR应用的开发。

Crisp-DM根据一系列步骤构建了一个循环模型，该模型应该是不断循环迭代的。首先，需要进行业务理解，确定业务目标并制定项目计划。IBM提供了一系列问题，供我们在这个过程中使用。然后，进行数据理解，收集初始数据，描述数据，并创建数据字典，该文档描述了数据的详细信息。接下来，进行数据准备，包括数据的选择、清洗、构建和整合等过程，使其能够进行进一步的分析和建模。之后，进行模型建立，选择适合的人工智能方法来探索数据，生成测试和评估的指标，并建立和评估模型。紧接着，进行模型评估，评估新建立的模型对业务问题的解决程度，并对整个过程进行审查和反思，以确定下一步的行动。最后，最为重要的是部署和回顾，即将模型应用于实际环境，并进行维护和监控，以确保它能成为一种可行的工具。这个过程是一个循环往复的过程，应该持续进行下去。如果你在AI和业务分析领域工作，应该始终努力改进你的流程。

接下来我会举一个例子，该例子是我们实验室为我们正在进行的一篇论文开发的工具。我们试图为某家公司开发一种工具，帮助他们决定在Twitter上回复哪些用户。我将逐步介绍每个阶段的细节。

Crisp-DM：数据挖掘的行业标准协议

Crisp-DM（Cross-Industry Standard Process for Data Mining）是一种行业标准协议，用于指导数据挖掘项目的管理和实施。该协议于1996年由多个公司共同开发，包括Teradata、Daimler和NCR等。虽然Crisp-DM的术语可能有些过时，但它仍然被广泛应用于机器学习和数据分析领域。Crisp-DM将数据挖掘过程划分为以下六个主要阶段：

1. 业务理解

目标：了解业务需求，明确项目目标。

在这个阶段，我们需要与业务相关的人员合作，深入了解他们的需求和目标。通过与业务领域专家的讨论和研究，我们可以获得对业务问题的全面理解，并确定项目的目标和范围。这个阶段的关键任务包括确定业务问题、界定项目目标、确定潜在的数据挖掘机会以及评估项目可行性。

优点：

通过与业务相关人员合作，提高了对业务需求的理解和项目的目标。
通过评估项目可行性，避免了投入时间和资源到不可行的项目中。

缺点：

可能需要花费一定的时间与业务人员进行深入的讨论和研究。
在这个阶段确定的项目目标可能需要根据后续步骤的结果进行调整。

2. 数据理解

目标：收集和了解数据，为后续分析做准备。

在这个阶段，我们需要收集与业务问题相关的数据，并对其进行初步的探索和分析。通过对数据的描述和可视化，我们可以更好地理解数据的特征、结构和潜在的问题。此外，我们还可以验证数据的质量和可用性，并开始为后续的数据准备工作做准备。

优点：

可以对数据进行探索和分析，提高对数据特征和质量的理解。
可以验证数据的可用性和可靠性，为后续的数据准备工作做准备。

缺点：

可能需要花费大量时间和资源来收集和处理数据。
数据质量可能存在问题，导致后续分析结果不准确或不可靠。

3. 数据准备

目标：选择、清洗和集成数据，为建模和评估做准备。

在这个阶段，我们需要对数据进行选择、清洗和集成，以使其适合进行进一步的分析和建模。可能需要处理缺失值、异常值和重复值等数据质量问题。此外，我们还可能需要将数据从不同的格式和源中整合到统一的数据集中。

优点：

通过数据清洗和整合，减少了数据质量问题对后续分析的影响。
为建模和评估步骤做好了数据准备工作，提高了模型的准确性和可靠性。

缺点：

数据处理和整合可能需要花费大量时间和精力。
错误的数据处理方法可能导致数据失真或模型的不准确性。

4. 模型建立

目标：选择和构建适当的模型，探索数据并生成预测模型。

在这个阶段，我们需要选择适当的人工智能方法来进行数据的探索和建模。可以选择的方法包括决策树、神经网络、支持向量机等。我们需要为模型建立设定评估指标，并根据数据集进行模型构建和调整。

优点：

可以根据数据选择最适合的建模方法，提高模型的准确性和可靠性。
通过设定评估指标，帮助我们评估模型的好坏，为后续的模型评估做准备。

缺点：

在选择和构建模型时可能需要尝试多个方法，需要花费大量的时间和计算资源。
不合适的模型选择可能导致模型性能的下降。

5. 模型评估

目标：评估模型的性能，检验模型对业务问题的解决程度。

在这个阶段，我们需要评估我们建立的模型在解决业务问题方面的性能如何。可以使用各种评估指标，如准确度、精确度、召回率等。通过评估模型的性能，我们可以确定是否需要对模型进行改进或调整，并决定是否达到了我们的预期目标。

优点：

可以评估模型在解决业务问题方面的效果，为后续的优化和改进提供指导。
可以确定模型是否满足预期目标，以决定是否进一步使用或部署。

缺点：

评估模型的性能可能需要使用一些复杂的统计方法或技术，需要一定的专业知识和技能。
错误的评估方法可能导致对模型性能的误判。

6. 部署与回顾

目标：将模型部署到实际环境中，并进行维护和监控。

在这个阶段，我们需要将我们建立的模型应用到实际环境中，并进行维护和监控。如果模型表现良好，可以进行部署和使用。但是，与实际环境中的数据和情况不匹配可能导致模型性能的下降。因此，我们需要定期回顾并更新模型，以确保其持续有效。

优点：

可以将模型应用到实际环境中，并获得实际效果。
可以通过维护和监控来改进和修正模型，提高模型的适应性和稳定性。

缺点：

实际环境中的数据和情况可能与建模过程中的数据和假设不匹配，需要进行适时的修正和调整。
维护和监控模型可能需要额外的时间和资源。

案例研究：基于Twitter的用户反馈预测

让我们以一个例子来说明Crisp-DM的应用。这个例子是我们为一篇论文开发的一个工具。我们尝试为一家公司开发一种工具，帮助他们决定在Twitter上回复哪些用户。下面我将详细介绍每个步骤。

业务理解

目标：理解业务问题，确定回复Twitter用户的优先级。

在这个阶段，我的团队面临着一个被困住在旧金山机场取车队伍中的问题。当时，我将在LinkedIn发表演讲，但是由于等待了一个小时还没有取到租车，我非常沮丧，于是我在Twitter上发了一张照片并@了National Car Rental。他们很快做出了回应，这引发了一系列交流。最后，他们给我发送了一封电子邮件，并最终免费为我提供了一天的租车。这让我思考，为什么他们选择回应我呢？他们应该回应哪些用户？对于National而言，如何决定回应哪些用户，以及如何给出一个优先级，对于解决这个问题很重要。所以我想更好地了解这个问题。

数据理解

目标：收集和了解与Twitter用户反馈相关的数据。

在这个阶段，我们需要收集与Twitter用户反馈相关的数据，并对其进行初步的探索和分析。我们希望能够快速收集到用户的推文和个人资料信息，以便进行进一步的分析。对数据进行描述、可视化和验证，可以帮助我们更好地了解用户行为模式，并为后续的数据准备工作做好准备。

数据准备

目标：清洗和整合数据，为建模和评估做准备。

在这个阶段，我们需要对数据进行清洗和整合，以使其适合进行建模和分析。我们可能需要处理缺失值、异常值和重复值等数据质量问题。此外，我们可能需要将数据从不同的格式和源中整合到统一的数据集中，以便后续的建模和评估工作。

模型建立

目标：基于数据进行建模，预测用户的回应行为。

在这个阶段，我们将根据前面的数据分析，选择合适的建模方法，并利用数据集进行模型构建和训练。我们可以使用机器学习算法，如决策树、神经网络或支持向量机来构建模型。通过训练模型来预测用户的回应行为，可以帮助我们更好地理解和解决业务问题。

模型评估

目标：评估模型的性能，验证预测的准确性。

在这个阶段，我们需要评估我们建立的模型在预测用户回应方面的性能。可以使用各种评估指标，如准确度、精确度、召回率等。通过评估模型的性能，我们可以确定模型的有效性，并确定是否需要进行改进或调整。

部署与回顾

目标：将模型部署到实际环境中，并进行回顾和改进。

在这个阶段，我们需要将我们建立的模型应用到实际环境中，并进行回顾和改进。如果模型表现良好，可以将其部署到实际环境中，并进行维护和监控。对模型性能的持续监测和改进，可以确保模型在实际环境中的有效性和可靠性。

Christian过程的关键要素和建议

在我们多次应用Crisp-DM流程到各种AI系统的实践中，我们总结出一些关键要素和建议，以帮助您更好地应用这个流程：

早期涉及利益相关者：与利益相关者的早期合作非常重要。通过他们对业务问题的理解和洞察力，可以帮助我们更好地定义问题和目标。
不断循环迭代：在Christian过程中，不要害怕从数据到模型之间循环迭代。如果当前的模型或方法不适用于问题解决，要勇于放弃并尝试其他模型或方法。
用户驱动的数据转化：考虑转化数据时要与用户需求相匹配。不同的数据转化方式可能会对建模过程产生不同的影响，因此要仔细考虑如何转化数据。
与业务问题匹配的评估：在模型评估阶段，确保评估指标与业务问题相匹配。评估模型的性能时，要关注对业务问题的解决效果，而不是单纯地关注模型的准确度。
持续改进和更新：Christian过程应该是一个持续改进和更新的过程。通过不断反思和学习，不断改进和优化流程，以提高人工智能和分析的效果和效率。

总结

Crisp-DM是一种行业标准的数据挖掘协议，用于指导人工智能项目的管理和实施。这个协议将人工智能开发过程分为六个主要阶段：业务理解、数据理解、数据准备、模型建立、模型评估和部署与回顾。在每个阶段，我们需要根据具体的问题和目标，选择合适的方法和工具，并与利益相关者密切合作。通过遵循Crisp-DM流程，并结合实际情况进行灵活的调整和改进，我们能够更好地管理和开发人工智能项目，实现业务问题的解决和价值的提升。