数据仓库,但本地基础设施的存储和处理成本严重限制了谁可以使用该资源以及用于什么目的。最重要的是,升级是一个漫长的过程,而且 需要向客户运送硬件并将其安装在客户的数据中心,以防发生中断。 将您的遗留 Teradata 数据仓库迁移到 平台可以加速您的数据现代化之旅。尽管如此,它似乎还是复杂而艰巨的,需要精心策划和计划的努力。在最初的范围界定阶段,您可能会发现您的组织多年来积累了数百个作业和数千个 SQL 脚本。 但是,不要害怕和许多其他企业客户已成功将其遗留的 Teradata 数据仓库迁移到 Databricks,使他们能够节省数百万的基础设施成本,同时加速创新和生产力。
这篇博文介绍了一个系统化的策略
可以加速您在一个封装在首字母缩写词3D:发现、开发和部署的框架中采用。 如果您想知道 有何不同,下面的汇总矩阵说使用 Unity Catalog 对表、行、列进行细粒度访问控制 表、行、列的细粒度访问控制 建筑范式 湖屋平台 传统数据仓库 许可模式 基于消费 年度订阅 + 附加功能 + 支持/维护 + 升级 电话号码列表 费用 第 1 步:发现 分析 环境 迁移过程的第一步是全面了解您的 Teradata 环境,以确定该计划所需的总体范围和工作量。以下是您想了解的有关 部署的两个关键问题: 问题 #1:关于硬件规格,我的 Teradata 拓扑结构是什么样的?(例如,存储利用率、系统利用率、仓库对象信息、查询类型) 要回答这个问题,从您的 Teradata 仓库环境中提取和分析系统日志是一个很好的起点。
为了加速这个过程迁移团队
开发了一个 工具来加速这个过程。分析器使用 Teradata 的系统表和称为 PDCR (性能数据收集和报告)的服务,这是一种数据应用程序,可提供对系统性能、工作负载利用率和管理的理解。此迁移评估实用程序可帮助您自动发现和分析当前的 境。此外,该工具还有助于DBU元)预测。下面的屏幕截 按列表 图说明了 表板生成的关键见解(有关运行探查器的更多信息,请联系表): 这是一个示例 探查器仪表板 这是一个示例 探查器仪表板 问题 我需要将多少工作负载迁移到 Databricks?我的环境的作业和代码模式有多简单或复杂? 要回答第二个问题,您需要查看 Teradata 仓库环境中积累的实际代码、脚本、数据仓库对象和作业,并创建这些工件的汇总清单。