Salesforce Connect 深度解析：架构师视角下的无缝外部数据集成

背景与应用场景

作为一名 Salesforce 架构师 (Salesforce Architect)，我经常面临的核心挑战之一是如何在 Salesforce 平台与企业内其他关键业务系统之间构建高效、可靠且可扩展的数据策略。传统上，企业依赖 ETL (Extract, Transform, Load - 提取、转换、加载) 工具将外部数据（如 ERP 系统中的订单、遗留系统中的客户记录）批量复制到 Salesforce 中。然而，这种方法存在固有的弊端：数据延迟、存储成本高昂、维护复杂，并且可能导致数据冗余和一致性问题。

在许多现代业务场景中，实时数据访问是至关重要的。例如，销售代表在查看客户记录时，需要立即看到其在 SAP 系统中的最新订单状态；服务代表需要查询本地数据库中的产品库存信息来解答客户疑问。在这些场景下，等待数小时甚至一天的 ETL 同步是无法接受的。

Salesforce Connect (Salesforce 连接) 正是为解决这一挑战而生的强大工具。它是一种数据虚拟化或数据联邦 (Data Federation) 解决方案，允许您在 Salesforce 中直接查看、搜索和修改存储在外部系统中的数据，而无需将这些数据物理复制到 Salesforce 中。数据始终保留在其“记录系统 (System of Record)”中，Salesforce 只是实时地将其呈现出来。这种“原地访问”的模式彻底改变了我们对集成的思考方式。

关键应用场景：

360度客户视图： 将 ERP 系统的订单历史、财务系统的发票信息、以及物流系统的配送状态实时整合到 Salesforce 的客户或客户资产页面上，为销售和服务团队提供一个真正全面的客户视图。
处理海量数据： 当外部数据量巨大（例如，数千万甚至上亿条记录）时，将其全部导入 Salesforce 不仅成本高昂，还会影响平台性能。Salesforce Connect 允许您按需访问这些数据，而无需承担存储和治理的负担。
数据合规性要求： 在某些行业（如金融、医疗），法规要求特定数据必须保留在经过认证的系统内部，不能被移动或复制。Salesforce Connect 可以在不违反这些合规性要求的前提下，实现数据的无缝访问。
快速原型和集成： 对于需要快速将外部数据源集成到 Salesforce 以验证业务流程的场景，Salesforce Connect 提供了一种比编写复杂 ETL 脚本或点对点 API 调用更快捷的实现方式。

原理说明

Salesforce Connect 的核心在于 外部对象 (External Objects) 的概念。从用户的角度看，外部对象与 Salesforce 的标准对象或自定义对象（如 Account, Contact）非常相似。它们有自己的选项卡、页面布局、字段，并且可以出现在列表视图、相关列表和搜索结果中。然而，它们的根本区别在于数据存储位置。

当用户与一个外部对象交互时，Salesforce 平台会在后台执行以下操作：

用户发起一个请求（例如，打开一个列表视图或查看一条记录）。
Salesforce 将这个请求（通常是 SOQL 查询）通过一个特定的 适配器 (Adapter) 转换成外部系统能够理解的查询语言。
适配器通过网络调用将查询发送到外部数据源的 API 端点。
外部系统处理查询并返回结果数据（通常是 JSON 或 XML 格式）。
适配器接收响应，将其解析并转换为 Salesforce UI 可以呈现的格式。

整个过程是实时的，用户感受到的延迟主要取决于外部系统的响应速度和网络状况。Salesforce Connect 提供了多种适配器来连接不同类型的外部系统：

OData 2.0 和 OData 4.0/4.01： OData (Open Data Protocol - 开放数据协议) 是一种基于 REST 的标准化协议，用于构建和消费数据 API。这是最常用也是推荐的适配器，因为它基于开放标准，被许多主流系统（如 SAP, Microsoft Dynamics）所支持。
Cross-Org： 此适配器专门用于连接另一个 Salesforce 组织。它使得在一个组织中实时访问另一个组织的数据变得非常简单，无需编写任何代码。
Custom Apex Connector： 当外部系统不提供 OData 兼容的 API，或者需要处理复杂的认证逻辑、数据转换时，我们可以使用 Apex Connector Framework 编写自定义的适配器。这为连接任何提供 REST 或 SOAP API 的系统提供了无限的灵活性，是架构师工具箱中的“瑞士军刀”。

这些适配器的配置都围绕着一个核心组件：外部数据源 (External Data Source)。在这里，我们定义连接的类型（适配器）、服务器 URL、认证方式等关键信息。我们强烈推荐使用 命名凭证 (Named Credentials) 来管理认证，它将端点 URL 和认证信息从代码或配置中分离出来，极大地提高了安全性和可维护性。

示例代码

对于 OData 和 Cross-Org 适配器，配置过程是声明式的，无需编写代码。然而，当我们需要实现一个自定义的 Apex 连接器时，就需要深入代码层面了。以下示例展示了如何使用 Apex Connector Framework 连接到一个虚构的外部数据服务。该示例严格遵循 Salesforce 官方文档的结构。

我们需要实现两个核心类：一个 `DataSource.Provider` 类和一个 `DataSource.Connection` 类。

1. DataSource.Provider 实现

这个类是连接器的入口点，负责声明连接器的能力并提供一个连接实例。

// MyDataSourceProvider.cls
// 这个 Provider 类声明了我们的自定义连接器支持哪些能力，
// 并负责创建 Connection 类的实例。
global class MyDataSourceProvider extends DataSource.Provider {

    // 声明连接器支持的功能。
    // 这里我们声明了需要身份验证，并且支持分页（ROW_QUERY）和搜索（SEARCH）。
    override global List<DataSource.Capability> getCapabilities() {
        List<DataSource.Capability> capabilities =
            new List<DataSource.Capability>();
        capabilities.add(DataSource.Capability.BASIC_AUTHENTICATION); // 支持基本认证
        capabilities.add(DataSource.Capability.ROW_QUERY); // 支持按行查询（分页）
        capabilities.add(DataSource.Capability.SEARCH); // 支持搜索
        return capabilities;
    }

    // 根据外部数据源的配置返回一个 Connection 实例。
    // Salesforce 平台会在需要与外部系统通信时调用此方法。
    override global DataSource.Connection getConnection(
        DataSource.ConnectionParams connectionParams) {
        return new MyDataSourceConnection(connectionParams);
    }
}

2. DataSource.Connection 实现

这个类是实际工作的核心，它实现了与外部系统通信的具体逻辑，如同步、查询和搜索。

// MyDataSourceConnection.cls
// 这个 Connection 类包含了与外部数据源交互的所有核心逻辑。
global class MyDataSourceConnection extends DataSource.Connection {
    private DataSource.ConnectionParams connectionInfo;

    // 构造函数，保存连接参数。
    global MyDataSourceConnection(DataSource.ConnectionParams connectionParams) {
        this.connectionInfo = connectionParams;
    }

    // sync() 方法用于发现外部系统的“表”和“列”，
    // 并将它们在 Salesforce 中创建为外部对象和字段。
    override global List<DataSource.Table> sync() {
        // 在真实场景中，这里会发起一个 HTTP Callout 到外部系统的元数据端点
        // 来获取所有可用的表和它们的结构。
        List<DataSource.Table> tables = new List<DataSource.Table>();
        
        // 定义列 (字段)
        List<DataSource.Column> columns = new List<DataSource.Column>();
        columns.add(DataSource.Column.text('ID', 255)); // 外部ID字段
        columns.add(DataSource.Column.text('Name', 255));
        columns.add(DataSource.Column.url('Url', 255));
        
        // 创建一个名为 'Orders' 的表（对应 Salesforce 中的外部对象）
        // 'ID' 列被指定为主键和显示 URL 的列。
        tables.add(DataSource.Table.create('Orders', 'Name', columns, 'ID', 'Url'));
        
        return tables;
    }

    // query() 方法是当用户查询外部对象记录时被调用的。
    // 这是数据获取的核心。
    override global DataSource.Results query(DataSource.QueryContext context) {
        // 创建一个 HTTP 请求，准备调用外部 API
        HttpRequest req = new HttpRequest();
        req.setMethod('GET');
        // context.tableSelection.columns 提供了用户查询的字段
        // context.tableSelection.filter 提供了查询的过滤条件
        // 我们可以将这些信息转换为外部 API 的查询参数
        String endpoint = 'https://api.example.com/orders?q=' + context.tableSelection.filter;
        req.setEndpoint(endpoint);

        // 发起 HTTP Callout
        // 在真实场景中，需要进行完整的错误处理
        // Http http = new Http();
        // HttpResponse res = http.send(req);
        // String responseBody = res.getBody();
        
        // **模拟数据**：为了示例，我们不执行实际的 callout，而是返回模拟数据
        // 真实场景中，你需要解析 HttpResponse 的 body
        List<Map<String, Object>> responseData = new List<Map<String, Object>>();
        Map<String, Object> row1 = new Map<String, Object>();
        row1.put('ID', '101');
        row1.put('Name', 'Order 101');
        row1.put('Url', '/101'); // 相对 URL 用于在 Salesforce 中导航
        responseData.add(row1);
        
        // 将解析后的数据包装在 DataSource.Results 对象中返回
        return DataSource.Results.create(responseData, 'ID');
    }
}

注意事项

作为架构师，在设计 Salesforce Connect 解决方案时，必须充分考虑其限制和影响，以避免潜在的性能瓶颈和功能差距。

权限与安全： 外部对象的访问权限由 Profile 和 Permission Sets 控制，就像标准对象一样。但记录级别的可见性完全由外部系统决定。Salesforce 的共享规则 (Sharing Rules) 对外部对象无效。认证必须通过命名凭证 (Named Credentials) 进行管理，以确保安全和可维护性。
API 限制： Salesforce Connect 的 callout 有其自身的限制，独立于 Apex 的 callout 限制。你需要密切关注每小时的 callout 数量。更重要的是，外部系统的 API 速率限制是更大的瓶颈。一个设计不佳的页面或一个用户执行的全局搜索都可能产生大量 API 调用，迅速耗尽外部系统的配额。
性能考量： 性能完全依赖于外部系统的响应速度。任何超过几秒钟的延迟都会严重影响用户体验。因此，必须确保外部 API 经过了充分优化，支持高效的过滤、排序和分页（例如，数据库索引）。
功能限制： 外部对象并非万能，它们不支持 Salesforce 的所有功能。关键限制包括：
- 不支持 Apex Triggers、流程 (Flows) 和工作流规则 (Workflow Rules)。
- 在报表 (Reports) 和仪表板 (Dashboards) 中的使用受限。例如，外部对象不能作为报表类型 (Report Type) 的主要对象。
- 不能位于主从关系 (Master-Detail Relationship) 的主控端。
- 字段类型支持有限，且需要仔细映射。
查询行为： 复杂的 SOQL 查询（如聚合函数、GROUP BY）在外部对象上不受支持。搜索行为也依赖于外部系统的能力。如果外部系统不支持高效搜索，Salesforce 中的全局搜索体验会很差。

总结与最佳实践

Salesforce Connect 是一个极其强大的集成工具，但它不是“银弹”。它是一种战略选择，适用于特定的业务场景。作为架构师，我们的职责是评估业务需求，权衡利弊，并选择最合适的集成模式。

最佳实践总结：

明确使用场景： 仅在需要实时访问、数据量巨大或存在数据驻留要求时，才优先考虑 Salesforce Connect。如果业务流程需要复杂的自动化（如 Triggers）或深度分析报告，传统的 ETL 或 API 集成可能是更好的选择。
优先使用 OData： 如果可以影响外部系统的 API 设计，强烈建议采用 OData 标准。这可以省去大量自定义 Apex 开发工作，并获得更好的平台原生支持。
性能是关键： 在项目开始前，必须对外部 API 进行性能基准测试。确保它能够处理预期的并发查询负载，并能在可接受的时间内返回结果。在外部数据源上启用服务器驱动分页 (Server Driven Pagination) 是管理大数据集的关键。
设计用户体验： 引导用户创建带有过滤条件的列表视图，而不是默认加载所有记录。在页面布局中，将外部对象相关列表放在次要位置，以免阻塞主记录的加载。
监控与治理： 建立对 Salesforce Connect callout 和外部系统 API 使用情况的监控机制。定期审查使用模式，识别和优化低效的查询。

总而言之，Salesforce Connect 提供了一种优雅的方式来打破数据孤岛，将 Salesforce 真正打造为企业的统一用户交互平台。通过深入理解其原理、能力和限制，架构师可以设计出既能满足业务需求，又具备高性能和可扩展性的集成解决方案。

精通 Salesforce Email Studio：咨询顾问指南之 AMPscript 与数据扩展实现动态个性化邮件

十月 07, 2025

阅读全文

Salesforce中文网