本节将描写叙述怎样从一个或多个DynamoDB的表导出数据到S3的bucket中。在运行导出之前你须要提前创建好S3的bucket。
注意
从DynamoDB中导出数据到S3
- 登陆到AWS管理员控制台,打开DynamoDB console。
https://console.aws.amazon.com/dynamodb/.
- 在 Amazon DynamoDB Tables 页面, 点击 Export/Import.
- 在 Export/Import 页面, 选择你想导出的表,然后点击
Export from DynamoDB.
- 在 Create Export Table Data Pipeline(s) 页面。按以下流程操作:
-
- 在 S3 Output Folder 文本框中填写 Amazon S3 URI,导出文件将存放在S3中对应的目录下。比如:
s3://mybucket/exports
这个URI的规则应该是这样 s3://bucketname
/folder
: -
- 在 S3 Log Folder 文本框中输入一个S3 URI。导出过程的日志将被存储在对应的folder中。比如:
s3://mybucket/logs/
S3 Log Folder URI的格式和
S3 Output Folder的格式同样。 - 在 Throughput Rate 文本框中可选择一个百分比。
这个比率表示在导出过程中会消耗读吞吐量的上限。比如,如果你要导出的表的读吞吐量是20,同一时候你设置的百分比是40%。
那么导出时所消耗的吞吐量将不会超过8.
假设你在导出多个表,这个 Throughput Rate 将会被应用到每一个表中。
- Execution Timeout 文本框。输入导出任务的超时时长。假设导出任务在这个时长内还没运行完毕,此任务会失败。
- Send notifications to 文本框,输入一个email地址。
在 pipeline被创建后。你将会收到一封email邀请订阅Amazon SNS。假设你接受了此邀请。在每次运行导出操作时你都将会收到email通知。
- Schedule 选项,选择以下当中一项:
-
- One-time Export —导出任务将在pipeline被创建后马上运行。
- Daily Export — 导出任务将会在你所指定的时刻运行。同一时候会在每天的那个时刻反复。
- Data Pipeline Role, 选择 DataPipelineDefaultRole.
- Resource Role, 选择 DataPipelineDefaultResourceRole
- 确认好以上设置然后点击 Create Export Pipeline.
假设你选择的Schedule是 one-time export,导出任务将在pipeline 创建成功后马上运行。
假设你选择的是daily export,导出任务将会在指定时刻运行,同一时候会在每天的那个时刻运行导出任务。