Salesforce Einstein 预测生成器深度解析：无需代码构建智能预测

背景与应用场景

在当今数据驱动的商业环境中，企业越来越依赖于数据洞察来做出更明智的决策。传统上，构建预测模型需要数据科学家、复杂的算法和大量的编程工作。然而，Salesforce 借助其强大的 Einstein 人工智能平台，推出了 Einstein Prediction Builder（爱因斯坦预测生成器），旨在将预测分析的能力普及给 Salesforce 管理员和业务分析师，而无需编写任何代码。

Einstein Prediction Builder 是一个声明式的、点击式的工具，它允许用户基于 Salesforce 中的历史数据，为任何标准或自定义对象中的某个字段创建自定义的预测。其核心价值在于，它将复杂的机器学习流程自动化，让企业能够轻松预测未来的业务结果。

典型的应用场景包括：

销售预测：预测某个商机（Opportunity）的赢单可能性，帮助销售团队优先跟进高价值线索。
客户流失预测：预测某个客户（Account）是否有可能在下个季度流失，以便客服团队能够提前介入，采取挽留措施。
发票逾期预测：预测一张发票（Invoice，自定义对象）是否会逾期支付，帮助财务团队优化催收策略。
产品采用率预测：预测客户购买某个产品后，其功能采用率是高还是低，以指导客户成功团队提供针对性培训。

通过将这些预测结果（以一个 0-100 的分数形式呈现）直接嵌入到 Salesforce 记录页面、报表、以及自动化流程中，企业可以将预测能力无缝集成到日常业务流程中，从而显著提升运营效率和决策质量。

原理说明

Einstein Prediction Builder 的工作原理遵循一个清晰、自动化的机器学习流程。用户只需通过向导式的界面提供必要的信息，Einstein 就会在后台完成所有繁重的工作。整个过程可以分解为以下几个关键步骤：

1. 定义预测问题 (Define the Prediction)

首先，您需要明确要预测什么。这通常是一个业务问题，可以被转化为一个二元（是/否）或数值型（具体数字）的预测。

二元预测 (Binary Prediction)：回答一个“是”或“否”的问题。例如，“这个商机会不会赢单？”、“这个客户会不会流失？”。在配置时，您需要选择一个复选框字段，或者一个公式字段来定义“是”与“否”的条件。
数值预测 (Numeric Prediction)：预测一个具体的数值。例如，“这个商机的最终合同金额会是多少？”、“这个客户下个月会提交多少个工单？”。在配置时，您需要选择一个数字或货币类型的字段作为预测目标。

在这一步，您需要选择包含您想预测的目标字段的 Salesforce 对象。

2. 准备数据集 (Prepare the Dataset)

定义问题后，您需要告诉 Einstein 使用哪些数据来学习和构建模型。这包括两个部分：

训练集 (Training Set)：这是用于构建模型的历史数据。您需要定义一个记录集，这些记录必须是已经发生并有明确结果的。例如，在预测商机赢单率时，训练集应该是所有已结束（“Closed Won” 或 “Closed Lost”）的商机。Einstein 会分析这个数据集中各个字段与最终结果之间的关联。
预测集 (Prediction Set)：这是您希望 Einstein 对其进行预测的记录集。通常，这是当前开放的、结果未知的记录。例如，所有进行中的商机。

3. Einstein 自动建模 (Automated Model Building)

这是 Einstein 发挥其魔力的地方。一旦您定义了数据集，Einstein 就会在后台执行以下操作：

特征工程 (Feature Engineering)：Einstein 会自动分析您选择的对象上的所有相关字段（预测因子），并评估它们对预测目标的影响力。
算法选择与训练 (Algorithm Selection and Training)：Einstein 会使用多种机器学习算法（如逻辑回归、梯度提升树等）来训练模型，并自动选择表现最佳的模型。
模型验证 (Model Validation)：它会使用交叉验证等技术来评估模型的准确性和稳健性，防止过拟合。

4. 审阅预测记分卡 (Review the Scorecard)

模型构建完成后，Einstein 会生成一个详细的记分卡（Scorecard），这是评估预测质量的关键工具。记分卡包含以下核心信息：

预测质量 (Prediction Quality)：一个综合评分（0-100），直观地展示了模型的整体性能。分数越高，代表模型的预测效果越好。
主要预测因子 (Top Predictors)：列出对预测结果影响最大的字段。例如，在商机赢单预测中，“来源 (Lead Source)” 和 “商机阶段 (Stage)” 可能是最重要的预测因子。这有助于您理解模型的决策逻辑，并验证其是否符合业务常识。
其他详细指标：根据预测类型，还会提供如 AUC、Gini 系数等更专业的评估指标，帮助深入分析模型性能。

5. 启用并应用预测 (Enable and Use the Prediction)

当您对记分卡的结果满意后，就可以启用该预测。启用后，Einstein 会：

创建一个新的自定义字段（例如 `Einstein_Prediction_Score__c`）在您选择的对象上。
定期（或在记录更新时）为预测集中的每条记录计算一个预测分数（0-100），并填充到这个新字段中。

之后，您就可以像使用任何其他 Salesforce 字段一样，在 Lightning 页面布局、列表视图、报表和仪表板中使用这个分数。更重要的是，您可以在 Flow、Process Builder 或 Apex 中引用这个字段，创建强大的自动化业务流程。

示例代码

尽管 Einstein Prediction Builder 本身是无代码工具，但其产出的预测分数可以被代码（如 Apex）无缝集成，以实现更复杂的业务逻辑。以下是一个示例场景：

场景：我们已经使用 Prediction Builder 在商机（Opportunity）对象上创建了一个名为“赢单可能性”（`Likelihood_to_Win__c`）的预测字段。我们希望当一个高价值商机（金额大于 $100,000）的赢单可能性分数超过 80 时，自动为该商机的负责人（Owner）创建一个高优先级的跟进任务（Task）。

以下是一个 Apex 触发器（Trigger）的示例，它可以在商机记录被创建或更新时执行此逻辑。

/*
 * Trigger on Opportunity to create a high-priority task for high-probability, high-value deals.
 * This code should be part of a trigger handler framework in a real-world scenario
 * to adhere to best practices.
 */
trigger OpportunityScoringTrigger on Opportunity (after insert, after update) {

    // List to hold the new tasks to be created.
    List<Task> tasksToCreate = new List<Task>();
    
    // Set to store Opportunity Owner Ids to avoid duplicate queries for user info.
    Set<Id> ownerIds = new Set<Id>();

    // Iterate through the opportunities that triggered this execution.
    // Trigger.New contains the new versions of the records.
    for (Opportunity opp : Trigger.New) {
        
        // Retrieve the old version of the opportunity from Trigger.OldMap to check if the score has changed.
        Opportunity oldOpp = Trigger.isUpdate ? Trigger.OldMap.get(opp.Id) : null;

        // The custom field generated by Einstein Prediction Builder.
        // Replace 'Likelihood_to_Win__c' with the actual API name of your prediction field.
        Decimal predictionScore = opp.Likelihood_to_Win__c;
        
        // The score from the previous state of the record.
        Decimal oldPredictionScore = (oldOpp != null) ? oldOpp.Likelihood_to_Win__c : null;

        // Condition to execute the logic:
        // 1. The prediction score field is not null.
        // 2. The score is greater than 80.
        // 3. The opportunity amount is greater than 100,000.
        // 4. In an update scenario, we check if the score has crossed the 80 threshold
        //    to avoid creating duplicate tasks every time the record is saved.
        if (predictionScore != null && predictionScore > 80 && opp.Amount > 100000 &&
           (Trigger.isInsert || (predictionScore != oldPredictionScore && oldPredictionScore <= 80))) {
            
            // Create a new Task object.
            Task followupTask = new Task();
            followupTask.Subject = 'High-Priority Follow-up: High-value, high-probability Opportunity';
            followupTask.OwnerId = opp.OwnerId; // Assign the task to the opportunity owner.
            followupTask.WhatId = opp.Id; // Relate the task to the opportunity.
            followupTask.Priority = 'High';
            followupTask.Status = 'Not Started';
            followupTask.ActivityDate = Date.today().addDays(2); // Set due date to 2 days from now.
            
            // Add the newly created task to our list for DML operation.
            tasksToCreate.add(followupTask);
        }
    }

    // Perform a single DML operation outside the loop to adhere to best practices and avoid governor limits.
    if (!tasksToCreate.isEmpty()) {
        try {
            insert tasksToCreate;
        } catch (DmlException e) {
            // In a real application, implement a robust error handling/logging mechanism.
            System.debug('Error creating follow-up tasks for high-score opportunities: ' + e.getMessage());
        }
    }
}

注释说明：这段代码演示了如何在 Apex 中消费 Einstein 的预测结果。它遵循了 Salesforce 的最佳实践，例如在循环外执行 DML 操作，以及在更新时检查字段值的变化，以防止逻辑重复执行。

注意事项

作为一名技术架构师，在使用 Einstein Prediction Builder 时，需要考虑以下关键点：

权限与许可 (Permissions & Licensing)：
- 用户需要拥有 “Einstein Builder” 权限集才能创建和管理预测。
- Einstein Prediction Builder 并非在所有 Salesforce 版本中都免费提供。它通常包含在 Einstein Predictions、Einstein 1 Platform+ (formerly Platform Plus) 等许可证中，或者可以作为附加产品购买。在规划项目前，务必确认您的组织拥有相应的许可证。
数据要求 (Data Requirements)：
- 数据量：模型质量严重依赖于数据量。对于二元预测，Salesforce 建议至少有 400 条历史记录（其中“是”和“否”的结果各至少 100 条）。对于数值预测，至少需要 100 条历史记录。数据越多，模型通常越准确。
- 数据质量：“Garbage In, Garbage Out”。确保用于训练的数据是干净、完整且准确的。不一致或缺失的数据会严重影响预测质量。
- 字段类型限制：并非所有字段类型都可以用作预测因子。例如，富文本区域、加密字段等通常不被支持。
API 限制与 Governor Limits：
- Prediction Builder 本身是一个异步过程，不直接消耗实时的 Apex 或 API 限制。
- 但是，当您在 Apex Trigger 或 Flow 中使用预测分数时，这些自动化流程本身仍然受制于 Salesforce 的标准 Governor Limits（如 SOQL 查询次数、DML 操作行数等）。在设计自动化逻辑时必须考虑到这一点。
模型维护与重新训练 (Model Maintenance & Retraining)：
- 业务环境是不断变化的，因此预测模型可能会随着时间的推移而“过时”。
- Einstein Prediction Builder 支持自动重新训练。您可以配置模型每月自动重新运行和更新，以确保其预测能力与时俱进。定期检查记分卡，监控模型性能是否下降，是非常重要的实践。
理解模型的局限性 (Understanding Model Limitations)：
- 预测分数代表的是概率，而不是确定无疑的结果。一个 85 分的预测意味着有 85% 的可能性会发生，但仍有 15% 的可能性不会。应将此分数用作决策的辅助工具，而非唯一的决策依据。
- 记分卡中的“主要预测因子”可以帮助您理解模型的行为，但它本质上仍是一个复杂的统计模型。避免过度解读或将其视为简单的因果关系。

总结与最佳实践

Einstein Prediction Builder 是一款革命性的工具，它成功地将人工智能的力量从数据科学家的专属领域带到了 Salesforce 管理员和业务用户的指尖。通过声明式的方式，它极大地降低了构建和部署预测模型的门槛，使企业能够快速地从其 Salesforce 数据中挖掘出前瞻性的业务洞察。

作为技术架构师，为确保成功实施，建议遵循以下最佳实践：

从明确的业务问题开始：不要为了技术而技术。选择一个对业务有实际、可衡量影响的预测问题，例如“如何将客户流失率降低 5%？”或“如何将高价值商机的赢单率提高 10%？”。
数据是基础：在开始构建预测之前，投入时间进行数据探索和清洗。与业务专家合作，确保用于训练的数据能够真实反映业务过程。
迭代与优化：第一个模型可能不是最完美的。利用记分卡提供的洞察，尝试添加或排除某些字段，调整训练数据集的范围，不断迭代和优化模型，直到其性能达到可接受的水平。
将预测融入流程：预测的价值在于行动。仅仅在页面上显示一个分数是不够的。利用 Flow、Lightning 组件和 Apex 将预测分数深度整合到核心业务流程中，例如自动分配任务、更新记录优先级或向用户发送警报。
建立信任并进行培训：向最终用户解释预测分数是什么、它如何工作以及它的局限性。建立用户对 AI 预测的信任是推动其被广泛采用的关键。

总而言之，Einstein Prediction Builder 不仅仅是一个技术工具，更是一个赋能业务创新的催化剂。通过战略性地应用它，企业可以在激烈的市场竞争中获得独特的洞察力优势。

Salesforce Einstein AI 编程实践：开发者视角下的智能预测

九月 15, 2025

阅读全文

Salesforce中文网