精通 Salesforce Connect：架构师的数据虚拟化指南

背景与应用场景

作为一名 Salesforce 架构师，我在设计企业级解决方案时面临的核心挑战之一，就是如何优雅地处理存在于 Salesforce 平台之外的数据。企业的数据版图往往是复杂且分散的，核心客户信息可能在 Salesforce 中，但订单历史记录在 SAP ERP 系统里，产品库存数据在本地的 Oracle 数据库中，而详细的交易日志则存储在云端的数据仓库。传统的解决方案通常依赖于 ETL (Extract, Transform, Load - 提取、转换、加载) 工具，通过定期的批量作业将外部数据复制到 Salesforce 中。然而，这种模式存在明显的弊端：数据延迟、存储成本增加，以及数据同步带来的复杂性和潜在的一致性问题。

在这样的背景下，Salesforce Connect 应运而生。它不是数据的“搬运工”，而是数据的“连接器”。Salesforce Connect 是一种强大的数据虚拟化 (Data Virtualization) 框架，它允许您在 Salesforce 界面中查看、搜索甚至修改存储在外部系统中的数据，而无需将这些数据实际复制到 Salesforce 的数据库中。这种“按需访问”的模式为架构师提供了全新的集成思路。

核心应用场景：

1. 360 度客户视图的实现： 销售代表在查看客户（Account）页面时，不仅能看到 Salesforce 内的商机和案例，还能通过 Salesforce Connect 实时查看到该客户在 ERP 系统中的历史订单、发票状态和信用额度。这一切都是实时的，无需等待夜间的 ETL 同步。

2. 应对海量数据（Large Data Volumes）： 当外部系统拥有数亿甚至数十亿条记录时（例如物联网设备的传感器读数或金融交易流水），将其全部导入 Salesforce 是不现实且成本高昂的。通过 Salesforce Connect，用户可以按需查询和展示与当前业务相关的部分数据，而无需承担海量数据的存储压力。

3. 满足数据驻留与合规性要求： 在某些行业（如金融、医疗）或地区（如欧盟的 GDPR），数据必须存储在特定的物理位置。Salesforce Connect 允许这些敏感数据保留在本地或指定的合规系统中，同时授权 Salesforce 用户在严格的权限控制下进行访问，实现了“数据不动，应用动”的合作用途。

4. 简化集成架构： 对于一些简单的“读”操作场景，使用 Salesforce Connect 可以避免复杂的 API 开发和中间件部署，从而大幅降低开发和维护成本，加快项目交付速度。

原理说明

Salesforce Connect 的核心魔法在于它引入了一个特殊的元数据类型：External Objects (外部对象)。从用户的角度看，外部对象与标准的自定义对象（Custom Object）非常相似，它们有 API 名称、字段、页面布局和相关列表。然而，它们的本质区别在于数据存储位置。

当用户执行一个与外部对象相关的操作时，例如打开一个记录的详细页面、查看一个相关列表或运行一个报表，Salesforce 平台会拦截这个请求。它不会去查询自身的数据库，而是通过 Salesforce Connect 引擎，将这个请求实时地转换成对外部数据源的 API 调用。这个调用的协议主要是 OData (Open Data Protocol)，这是一个基于 HTTP 的标准化 Web 协议，用于查询和操作数据。外部系统（如 SAP、SharePoint 或自定义的 Web 服务）只需暴露一个符合 OData 规范的端点 (Endpoint)，Salesforce Connect 就能与其进行通信。

工作流程如下：

1. 定义外部数据源 (External Data Source)： 管理员在 Salesforce 中配置一个外部数据源，指定其服务 URL、OData 版本以及身份验证方式。推荐使用 Named Credentials (命名凭据) 来安全地管理认证信息，避免硬编码。

2. 同步元数据 (Sync Metadata)： 配置完成后，Salesforce Connect 会向 OData 端点发送一个元数据请求 ($metadata)。外部系统会返回其暴露的数据实体（可以理解为数据表）及其字段信息。管理员可以选择性地将这些实体同步到 Salesforce 中，从而自动创建对应的外部对象及其字段。

3. 实时数据查询 (Real-time Data Query)： 当用户或自动化流程查询外部对象时（例如通过 SOQL），Salesforce 会将该查询动态翻译成一个 OData 查询。例如，一个 SOQL 的 WHERE 子句会被翻译成 OData 的 $filter 查询选项，ORDER BY 会被翻译成 $orderby。

4. 数据返回与呈现： 外部系统接收到 OData 请求后，执行查询并将结果（通常是 JSON 或 XML 格式）返回给 Salesforce。Salesforce Connect 解析这些数据，并将其无缝地呈现在标准的用户界面上，用户感觉就像在操作一个普通的 Salesforce 对象。

除了标准的 OData 适配器，Salesforce Connect 还提供了 Apex Connector Framework，允许开发人员使用 Apex 代码创建自定义适配器，以连接那些不提供 OData 接口的系统，例如专有的 REST API 或 SOAP 服务。这为架构设计提供了极大的灵活性。

示例代码

对于架构师而言，理解 Apex Connector Framework 的能力至关重要，因为它解锁了连接任何系统的可能性。以下示例代码片段来自 Salesforce 官方文档，展示了一个简单的自定义适配器的基本结构。它定义了如何连接到一个外部数据源，并响应 Salesforce 的查询和元数据同步请求。

一个自定义适配器通常需要实现 DataSource.Provider 和 DataSource.Connection 这两个接口。

1. Provider 类：定义适配器的基本属性和连接行为

这个类用于声明适配器的类型（如本例中的 SimpleAdapter）和它所支持的功能。

// DataSource.Provider 接口的实现，用于定义自定义适配器的元数据和功能。
public class SimpleAdapterProvider extends DataSource.Provider {
    // getAuthenticationCapabilities() 方法声明此适配器支持的认证类型。
    // 这里我们声明它支持匿名访问 (ANONYMOUS) 和使用命名凭据的 OAuth 2.0 (OAUTH)。
    // 从架构角度看，强制使用命名凭据是安全最佳实践。
    override public List<DataSource.AuthenticationCapability> getAuthenticationCapabilities() {
        List<DataSource.AuthenticationCapability> capabilities =
            new List<DataSource.AuthenticationCapability>();
        capabilities.add(DataSource.AuthenticationCapability.ANONYMOUS);
        capabilities.add(DataSource.AuthenticationCapability.OAUTH);
        return capabilities;
    }

    // getCapabilities() 方法声明适配器支持的操作类型。
    // 例如，ROW_QUERY 表示支持行级别的查询，SEARCH 表示支持搜索。
    // 决定这些能力对于后续的 SOQL 和 SOSL 支持至关重要。
    override public List<DataSource.Capability> getCapabilities() {
        List<DataSource.Capability> capabilities =
            new List<DataSource.Capability>();
        capabilities.add(DataSource.Capability.ROW_QUERY);
        capabilities.add(DataSource.Capability.SEARCH);
        return capabilities;
    }

    // getConnection() 方法是工厂方法，当 Salesforce 需要与外部系统交互时，
    // 它会调用此方法来获取一个具体的连接实例 (Connection)。
    override public DataSource.Connection getConnection(DataSource.ConnectionParams connectionParams) {
        return new SimpleAdapterConnection(connectionParams);
    }
}

2. Connection 类：处理实际的数据交互

这个类是实现数据查询 (query) 和元数据同步 (sync) 逻辑的核心。

// DataSource.Connection 接口的实现，处理与外部系统的实际通信。
public class SimpleAdapterConnection extends DataSource.Connection {
    private DataSource.ConnectionParams connectionInfo;

    // 构造函数，保存来自 Provider 的连接参数。
    public SimpleAdapterConnection(DataSource.ConnectionParams connectionParams) {
        this.connectionInfo = connectionParams;
    }

    // sync() 方法用于元数据发现。当管理员点击“验证和同步”时，此方法被调用。
    // 它应该连接到外部系统，获取可用的数据表和列，并返回一个 DataSource.Table[] 列表。
    // Salesforce 会基于此信息创建或更新外部对象。
    override public List<DataSource.Table> sync() {
        // 示例：创建一个名为 "Simple" 的虚拟表。
        List<DataSource.Table> tables = new List<DataSource.Table>();
        List<DataSource.Column> columns = new List<DataSource.Column>();
        columns.add(DataSource.Column.text('Name', 255));
        columns.add(DataSource.Column.url('Url'));
        // "DisplayUrl" 是外部对象的标准字段，用于定义记录的链接地址。
        // "ExternalId" 是外部对象的唯一标识符，至关重要。
        tables.add(DataSource.Table.get('Simple', 'Name', columns, 'DisplayUrl', 'ExternalId'));
        return tables;
    }

    // query() 方法是数据查询的核心。当执行 SOQL 查询或加载相关列表时，此方法被调用。
    // context 参数包含了查询的详细信息，如查询的表、列、过滤条件、排序等。
    override public DataSource.QueryUtils.Result query(DataSource.QueryContext context) {
        // 在真实场景中，这里会构建一个 HTTP 请求到外部系统的 API 端点。
        // 然后解析返回的 JSON/XML，并将其映射到 Salesforce 的数据结构中。
        // 为了简化，这里我们仅返回硬编码的示例数据。
        List<Map<String, Object>> data = new List<Map<String, Object>>();
        Map<String, Object> row = new Map<String, Object>();
        row.put('ExternalId', '1');
        row.put('DisplayUrl', 'http://www.salesforce.com');
        row.put('Name', 'Salesforce');
        data.add(row);

        return DataSource.QueryUtils.process(context, data);
    }
}

注意事项

作为架构师，在方案中引入 Salesforce Connect 前，必须充分评估其限制和潜在风险。

1. 性能和外部系统的可靠性

关键点：Salesforce 的性能瓶颈转移到了外部系统。如果外部系统的 OData 服务响应缓慢或不稳定，Salesforce 中的用户体验会非常糟糕。 建议：

对外部数据源进行严格的性能和压力测试。
与外部系统的所有者建立明确的 SLA (Service Level Agreement - 服务水平协议)。
在 OData 服务端实现高效的分页（Server-Driven Paging）和过滤，避免一次性返回大量数据。

2. API 调用限制

关键点：Salesforce Connect 的 OData 调用会消耗特殊的外部服务调用限制，这与通用的 Apex callout 限制是分开计算的。高频访问或设计不佳的页面布局（包含多个外部对象相关列表）可能会迅速耗尽这些限制。 建议：

仔细阅读并理解 Salesforce Connect 的使用限制文档。
监控“系统概览”中的 OData 调用消耗情况。
设计页面时，谨慎使用外部对象相关列表，考虑使用按需加载的组件（如 LWC）来替代。

3. 数据关系和功能支持

关键点：外部对象的功能受限，并非所有标准 Salesforce 功能都适用。

关系：外部对象之间以及外部对象与标准/自定义对象之间不能建立主从关系 (Master-Detail Relationship)。只能使用查找关系 (Lookup Relationship)、外部查找关系 (External Lookup Relationship) 和间接查找关系 (Indirect Lookup Relationship)。理解这三者的区别对于数据建模至关重要。
自动化：不能在外部对象上创建 Apex 触发器、流（在部分场景下受限）或审批流程。
报表和仪表板：对外部对象的报表支持有限，特别是涉及跨对象连接查询时，性能可能不佳且功能受限。
SOQL/SOSL：并非所有 SOQL 子句都受支持，其行为取决于外部 OData 服务的实现。

4. 写入操作与事务

关键点：虽然 Salesforce Connect 支持数据的创建、更新和删除（如果外部 OData 服务支持），但这些操作不参与 Salesforce 的事务。如果一个复杂的业务流程既要更新 Salesforce 内部数据，又要更新外部数据，一旦外部更新失败，Salesforce 内部已提交的更改不会自动回滚。 建议：

设计补偿逻辑（Compensation Logic）或采用事件驱动架构来处理跨系统事务的一致性问题。
对于需要强事务一致性的场景，传统的基于 API 的点对点集成可能仍然是更可靠的选择。

总结与最佳实践

Salesforce Connect 是一个强大的架构工具，但它不是万能的。它是一种战术选择，适用于特定的集成模式。作为架构师，我们的职责是判断何时使用它，以及如何正确地使用它。

最佳实践总结：

1. 明确使用场景：优先在“实时只读”或“少量写入”的场景中使用 Salesforce Connect。当需要复杂的数据转换、强大的事务保证或对数据进行离线分析时，ETL 或 API 集成模式可能更合适。

2. 治理外部端点：将外部数据源视为解决方案的一部分。确保它有良好的性能、文档、安全性和版本管理策略。

3. 善用命名凭据：始终通过命名凭据来管理外部系统的认证，这是确保集成安全、可维护的基础。

4. 了解并设计关系：深入理解外部查找和间接查找的原理，正确地将 Salesforce 内部数据与外部数据关联起来，这是实现无缝体验的关键。

5. 考虑混合模式（Hybrid Approach）：在复杂的场景中，不要局限于单一模式。例如，可以使用 Salesforce Connect 来实时展示订单状态，同时通过夜间的 ETL 过程将已完成的订单聚合数据同步到 Salesforce 中，用于复杂的年度销售报表分析。这种混合模式可以兼顾实时性与分析性能。

总之，Salesforce Connect 通过数据虚拟化，为我们提供了一种轻量级、实时且高效的集成选择。通过深入理解其工作原理、能力边界和潜在风险，架构师可以利用它来构建更灵活、更具成本效益、更能满足业务实时性需求的 Salesforce 解决方案。

精通 Salesforce Email Studio：咨询顾问指南之 AMPscript 与数据扩展实现动态个性化邮件

十月 07, 2025

阅读全文

Salesforce中文网