| PostgreSQL | ||
|---|---|---|
| 上一页 | 下一页 | |
COPY — 在表和文件之间拷贝数据
COPY [ BINARY ] table [ WITH OIDS ]
FROM { 'filename' | stdin }
[ [USING] DELIMITERS 'delimiter' ]
[ WITH NULL AS 'null string' ]
COPY [ BINARY ] table [ WITH OIDS ]
TO { 'filename' | stdout }
[ [USING] DELIMITERS 'delimiter' ]
[ WITH NULL AS 'null string' ]
注意:对于拷贝入(copy in),任何匹配这个字串的字串将被存储为 NULL 值,所以你应该确保你用的字串和拷贝出(copy out)相同。
COPY 在 Postgres 表和标准 Unix 文件之间交换数据.COPY 指示 Postgres 后端直接从文件中读写数据.该文件必须为后端可见,而且文件名必须从后端的角度声明.如果声明的是 stdin 或 stdout,数据通过客户前端流到后端.
BINARY 关键字将强制使用二进制对象而不是文本存储/读取所有数据.这样做在一定程度上比传统的拷贝命令快,但移植性不是很好,而且生成的文件也较大(尽管这个方面与数据本身密切相关).缺省地,文本拷贝使用 tab ("\t")字符作为分隔符.分隔符仍然可以用关键字 USING DELIMITERS 改成任何其它的字符.在数据中的与分隔符相同的字符将用引号引起.
你对任何要 COPY 出来的数据必须有select权限,对任何要 COPY 入数据的表必须有inser和update权限.使用 COPY 时后端同样需要适当的对文件操作的 Unix 权限.
关键字 USING DELIMITERS 声明一个作为所有列的分隔符的字符.如果在分隔符字串里声明了多个字符,只使用第一个字符.
小技巧: 不要把 COPY 和 psql 的命令\copy 混淆.
COPY 不会激活规则,也不会处理字段缺省值。不过它的确激活触发器。
COPY 在第一个错误处停下来.这些在 COPY FROM 中不应该导致问题,但在 COPY TO 时目的表会部分改变.应该在一次失败的拷贝后用 VACUUM 查询做一些清除工作.
因为 Postgres 后端的工作目录通常和用户的工作目录不一样,本地用户向一个文件"foo"(没有附加的路径信息)可能会产生不可预见的结果.这时,foo 将生成在 $PGDATA/foo. 通常,声明拷贝文件时要加上相对后端服务器的全路径.
作为 COPY 参数声明的文件名必须存在与数据库服务器可访问的地方,不管是在本地硬盘还是在网络文件系统上.
如果使用了一个从一台机器到另一台机器的 TCP/IP 连接,而且声明了目标文件,那么目标文件将会写到后端运行的机器上,而不是用户的机器上.
当不带 BINARY 选项使用 COPY TO 时,生成的文件每条记录占据一行,每列(字段)用分隔符分开.内嵌的分隔符将由一个反斜杠("\")开头.字段值本身是由与每个字段类型相关的输出函数生成的字符串.某一类型的输出函数本身不应该生成反斜杠;这个任务由 COPY 本身完成.
每个记录的实际格式是
<attr1><separator><attr2><separator>...<separator><attrn><newline>
如果声明了 WITH OIDST,它将被放在每行的开头.
如果 COPY 将它的输出输出到标准输出而不是一个文件,它将在每个换行符前输出一个反斜杠("\")和一个句点(".")作为行间隔.类似,如果 COPY 从标准输入读入数据,它将把一行开头的由一个反斜杠("\")和一个句点(".")和一个换行符组成的这三个连续字符作为文件结束符.不过,如果在这三个字符组合之前碰到一个真的EOF(文件结束符) COPY 将结束 terminate (接着就是后端自身).
反斜杠有其他的含义.NULL属性输出为"\N". 一个反斜杠字符输出成两个连续的反斜杠 ("\\")一个tab字符用一个反斜杠后面跟一个tab代表. 一个新行字符用一个反斜杠和一个新行代表.当装载不是由Postgres 生成的文件时,你需要将反斜杠字符 ("\")转换成双反斜杠("\\")以保证正确装载.(出于兼容性考虑,顺序的 "\N" 将总是被解释成一个反斜杠和一个 "N"。更通用的解决方法是 "\\N"。)
当使用 COPY BINARY,文件的头四个字节将是文件中记录的个数.如果数值是零, COPY BINARY 命令将一直读到文件尾.否则,它将在达到个数时停止读取.文件中剩余的数据将被忽略.
文件中每一实例的格式如下表.要注意本格式一定要 完全 符合.无符号的四字节整数数量在下表中称做 uint32 .
表 14-1. 二进制拷贝文件的内容
| 文件开始 | |
| uint32 | 记录个数 |
| 每条记录 | |
| uint32 | 记录数据总长 |
| uint32 | oid (如果声明了) |
| uint32 | null 字段的个数 |
| [uint32,...,uint32] | 字段个数(attribute numbers of attributes), 从0开始 |
| - | <字段数据> |
在Sun-3s,2-字节字段以2-字节为界对齐,而所有整数字段以4-字节为界对齐.字符字段以1-字节为界对齐.在大部分其他机器上,所有大于1字节的整数是按照4-字节为边界对齐的.注意,变长字段由字段长度在前;数组只是简单的数组元素类型的连续流.
下面的例子将一个表拷贝到标准输出,使用竖直条("|")作为域分隔符:
COPY country TO stdout USING DELIMITERS '|';
从一个 Unix 文件中拷贝数据到表 "country":
COPY country FROM '/usr1/proj/bray/sql/country_data';
这里是一些可以从标准输入 stdin 输入的数据的例子(所以在最后有结束符):
AF AFGHANISTAN AL ALBANIA DZ ALGERIA ... ZM ZAMBIA ZW ZIMBABWE \.
同样的数据,输出到一个Linux/i586机器的二进制文件中去.数据是用 Unix 应用 od -c 显示的.表里有三个域;第一个是char(2) 第二个是 text.所有记录在第三字段有空(null)值.注意 char(2) 字段是如何用空(null)补齐成四个字节的以及text字段是如何前面补长度的:
355 \0 \0 \0 027 \0 \0 \0 001 \0 \0 \0 002 \0 \0 \0
006 \0 \0 \0 A F \0 \0 017 \0 \0 \0 A F G H
A N I S T A N 023 \0 \0 \0 001 \0 \0 \0 002
\0 \0 \0 006 \0 \0 \0 A L \0 \0 \v \0 \0 \0 A
L B A N I A 023 \0 \0 \0 001 \0 \0 \0 002 \0
\0 \0 006 \0 \0 \0 D Z \0 \0 \v \0 \0 \0 A L
G E R I A
... \n \0 \0 \0 Z A M B I A 024 \0
\0 \0 001 \0 \0 \0 002 \0 \0 \0 006 \0 \0 \0 Z W
\0 \0 \f \0 \0 \0 Z I M B A B W E
在SQL92里没有 COPY 语句.
| 上一页 | 首页 | 下一页 |
| COMMIT | 开头 | CREATE AGGREGATE |