Clickhouse导入CSV文件

时间：2021-08-11 15:18:21 阅读：41 评论：0 收藏：0 [点我收藏+]

一、背景

平常开发会员一次性的需求，列入将一个大文件导入到CK中进行数据分析，以下记录一下CSV导入到CK的过程：

二、创建表结构

CREATE TABLE default.test_table (
`index` String,
`uuid` String,
`variables` String,
`title` String,
`title_explain` String,
`title_meaning` String
) ENGINE = MergeTree() PARTITION BY sipHash64(uuid)%20 ORDER BY sipHash64(uuid)%20 SETTINGS index_granularity = 8192

注：由于此表没有年月日，所以按照sipHash64(uuid)%20分成20个分区，若这里直接用uuid分区会产生太多的分区，有可能导致分区过多报错，我刚开始没注意的时候，就是因为产生了太多的分区导入失败，报错信息为：

Too many partitions for single INSERT block (more than 100)，所以需要注意一下。

三.导入数据

方式一：登录服务器使用客户端

clickhouse-client -h xxx.x.x.x --database="default" --query="select * from default.test_table FORMAT CSV" > test.csv

方式二：直接连接数据库，例如用dbserver客户到，创建表之后，直接导入数据即可

技术分享图片

Clickhouse导入CSV文件

原文：https://www.cnblogs.com/linzepeng/p/15127536.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)