PostgreSQL
上一页   下一页

COPY

拷贝

COPY — 在表和文件之间拷贝数据

COPY [ BINARY ] table [ WITH OIDS ]
    FROM { 'filename' | stdin }
    [ [USING] DELIMITERS 'delimiter' ]
    [ WITH NULL AS 'null string' ]
COPY [ BINARY ] table [ WITH OIDS ]
    TO { 'filename' | stdout }
    [ [USING] DELIMITERS 'delimiter' ]
    [ WITH NULL AS 'null string' ]
  

输入

BINARY
改变字段格式属性,强制所有数据都使用二进制格式存储和读取.
table
现存表的名字.
WITH OIDS
拷贝每行的内部唯一对象标识(OID).
filename
输入或输出的Unix文件的绝对路径(文件)名.
stdin
声明输入是来自管道还是终端.
stdout
声明输出是进入管道还是终端.
delimiter
一个用于分隔输入或输出的域的分隔符.
null print
一个代表 NULL 值的字串。因历史原因,缺省是“\N”(反斜杠-N)。例如,你可以自己挑一个空字串。

注意:对于拷贝入(copy in),任何匹配这个字串的字串将被存储为 NULL 值,所以你应该确保你用的字串和拷贝出(copy out)相同。

Outputs

COPY
The copy completed successfully.
ERROR: reason
The copy failed for the reason stated in the error message.

描述

COPY 在 Postgres 表和标准 Unix 文件之间交换数据.COPY 指示 Postgres 后端直接从文件中读写数据.该文件必须为后端可见,而且文件名必须从后端的角度声明.如果声明的是 stdinstdout,数据通过客户前端流到后端.

注意

BINARY 关键字将强制使用二进制对象而不是文本存储/读取所有数据.这样做在一定程度上比传统的拷贝命令快,但移植性不是很好,而且生成的文件也较大(尽管这个方面与数据本身密切相关).缺省地,文本拷贝使用 tab ("\t")字符作为分隔符.分隔符仍然可以用关键字 USING DELIMITERS 改成任何其它的字符.在数据中的与分隔符相同的字符将用引号引起.

你对任何要 COPY 出来的数据必须有select权限,对任何要 COPY 入数据的表必须有inser和update权限.使用 COPY 时后端同样需要适当的对文件操作的 Unix 权限.

关键字 USING DELIMITERS 声明一个作为所有列的分隔符的字符.如果在分隔符字串里声明了多个字符,只使用第一个字符.

小技巧: 不要把 COPY 和 psql 的命令\copy 混淆.

COPY 不会激活规则,也不会处理字段缺省值。不过它的确激活触发器。

COPY 在第一个错误处停下来.这些在 COPY FROM 中不应该导致问题,但在 COPY TO 时目的表会部分改变.应该在一次失败的拷贝后用 VACUUM 查询做一些清除工作.

因为 Postgres 后端的工作目录通常和用户的工作目录不一样,本地用户向一个文件"foo"(没有附加的路径信息)可能会产生不可预见的结果.这时,foo 将生成在 $PGDATA/foo. 通常,声明拷贝文件时要加上相对后端服务器的全路径.

作为 COPY 参数声明的文件名必须存在与数据库服务器可访问的地方,不管是在本地硬盘还是在网络文件系统上.

如果使用了一个从一台机器到另一台机器的 TCP/IP 连接,而且声明了目标文件,那么目标文件将会写到后端运行的机器上,而不是用户的机器上.

文件格式

文本格式

当不带 BINARY 选项使用 COPY TO 时,生成的文件每条记录占据一行,每列(字段)用分隔符分开.内嵌的分隔符将由一个反斜杠("\")开头.字段值本身是由与每个字段类型相关的输出函数生成的字符串.某一类型的输出函数本身不应该生成反斜杠;这个任务由 COPY 本身完成.

每个记录的实际格式是

<attr1><separator><attr2><separator>...<separator><attrn><newline>
    

如果声明了 WITH OIDST,它将被放在每行的开头.

如果 COPY 将它的输出输出到标准输出而不是一个文件,它将在每个换行符前输出一个反斜杠("\")和一个句点(".")作为行间隔.类似,如果 COPY 从标准输入读入数据,它将把一行开头的由一个反斜杠("\")和一个句点(".")和一个换行符组成的这三个连续字符作为文件结束符.不过,如果在这三个字符组合之前碰到一个真的EOF(文件结束符) COPY 将结束 terminate (接着就是后端自身).

反斜杠有其他的含义.NULL属性输出为"\N". 一个反斜杠字符输出成两个连续的反斜杠 ("\\")一个tab字符用一个反斜杠后面跟一个tab代表. 一个新行字符用一个反斜杠和一个新行代表.当装载不是由Postgres 生成的文件时,你需要将反斜杠字符 ("\")转换成双反斜杠("\\")以保证正确装载.(出于兼容性考虑,顺序的 "\N" 将总是被解释成一个反斜杠和一个 "N"。更通用的解决方法是 "\\N"。)

二进制格式

当使用 COPY BINARY,文件的头四个字节将是文件中记录的个数.如果数值是零, COPY BINARY 命令将一直读到文件尾.否则,它将在达到个数时停止读取.文件中剩余的数据将被忽略.

文件中每一实例的格式如下表.要注意本格式一定要 完全 符合.无符号的四字节整数数量在下表中称做 uint32 .

表 14-1. 二进制拷贝文件的内容

文件开始
uint32 记录个数
每条记录
uint32 记录数据总长
uint32 oid (如果声明了)
uint32 null 字段的个数
[uint32,...,uint32] 字段个数(attribute numbers of attributes), 从0开始
- <字段数据>

二进制数据的对齐

在Sun-3s,2-字节字段以2-字节为界对齐,而所有整数字段以4-字节为界对齐.字符字段以1-字节为界对齐.在大部分其他机器上,所有大于1字节的整数是按照4-字节为边界对齐的.注意,变长字段由字段长度在前;数组只是简单的数组元素类型的连续流.

用法

下面的例子将一个表拷贝到标准输出,使用竖直条("|")作为域分隔符:

COPY country TO stdout USING DELIMITERS '|';
  

从一个 Unix 文件中拷贝数据到表 "country":

COPY country FROM '/usr1/proj/bray/sql/country_data';
  

这里是一些可以从标准输入 stdin 输入的数据的例子(所以在最后有结束符):

   AF      AFGHANISTAN
   AL      ALBANIA
   DZ      ALGERIA
   ...
   ZM      ZAMBIA
   ZW      ZIMBABWE
   \.
  

同样的数据,输出到一个Linux/i586机器的二进制文件中去.数据是用 Unix 应用 od -c 显示的.表里有三个域;第一个是char(2) 第二个是 text.所有记录在第三字段有空(null)值.注意 char(2) 字段是如何用空(null)补齐成四个字节的以及text字段是如何前面补长度的:

   355  \0  \0  \0 027  \0  \0  \0 001  \0  \0  \0 002  \0  \0  \0
   006  \0  \0  \0   A   F  \0  \0 017  \0  \0  \0   A   F   G   H
     A   N   I   S   T   A   N 023  \0  \0  \0 001  \0  \0  \0 002
    \0  \0  \0 006  \0  \0  \0   A   L  \0  \0  \v  \0  \0  \0   A
     L   B   A   N   I   A 023  \0  \0  \0 001  \0  \0  \0 002  \0
    \0  \0 006  \0  \0  \0   D   Z  \0  \0  \v  \0  \0  \0   A   L
     G   E   R   I   A
   ...              \n  \0  \0  \0   Z   A   M   B   I   A 024  \0
    \0  \0 001  \0  \0  \0 002  \0  \0  \0 006  \0  \0  \0   Z   W
    \0  \0  \f  \0  \0  \0   Z   I   M   B   A   B   W   E
  

兼容性

SQL92

在SQL92里没有 COPY 语句.


上一页 首页 下一页
COMMIT 开头 CREATE AGGREGATE