今天做测试,遇到了之前听大家经常说的 0x00 不兼容问题。
场景是这样的,我在 ClickHouse 里面搞了很多测试数据,采用 CK 的导出接口把数据导出成 CSV,然后用 GPDB 的 COPY 命令入库,就出现了 0x00 不兼容的问题,而且不仅有 0x00,还有 0x80-0x99。
因为我是 COPY 入库文件,所以其实把文件处理一下就行了,把这些不兼容的符号替换掉。
命令参考
这里主要采用下面这个命令在 Linux 命令行进行数据处理:
sed -i "s/search/replace/g" ./file1.csv
比如我们要替换 0x00,那就执行如下命令:
sed -i "s/\x00//g" ./file1.csv
日常简单记录,希望也能帮到大家,谢谢
本文从CSDN(点击查看原文)转载而来。不代表烟海拾贝立场,如若转载,请注明出处:https://somirror.com/3586.html