存储ENUM值的PostgreSQL ARRAY


问题内容

我有一个表,可以有一个状态:

statuses = ['unmoderated', 'nominee', 'finalist', 'winner']
status = db.Enum(
    *statuses, name='enum_nomination_status', metadata=db.metadata)


class Nomination(db.Model):
    status = db.Column(status, default='unmoderated')

我现在想拥有一个表,该表的列可以包含多个状态:

class Judge(db.Model):
    statuses = db.Column(ARRAY(status, dimensions=1))

但是上述方法导致我出现此错误:

ProgrammingError: (psycopg2.ProgrammingError) column "statuses" is of type enum_nomination_status[] but expression is of type text[]
LINE 1: ...4, 'Name', ARRAY['unm...
                  ^
HINT:  You will need to rewrite or cast the expression.

所以我试图创建一个自定义类型,将其强制转换为枚举类型:

class STATUS_ARRAY(TypeDecorator):
    impl = ARRAY(status, dimensions=1)

    def process_bind_param(self, value, dialect):
        if value is None:
            return value
        else:
            return cast(array(value), ARRAY(status, dimensions=1))

但这会导致段错误。

我也尝试过投射单个项目:

class STATUS_ARRAY(TypeDecorator):
    impl = ARRAY(status, dimensions=1)

    def process_bind_param(self, value, dialect):
        if value is None:
            return value
        else:
            return array(cast(s, status) for s in value)

但是我得到:

ProgrammingError: (psycopg2.ProgrammingError) can't adapt type 'Cast' [SQL: 'INSERT INTO judge (statuses) VALUES (%(statuses)s)'] [parameters: {'statuses': [<sqlalchemy.sql.elements.Cast object at 0x7fc8bb69c710>]}]

我承认我主要是在尝试各种不同的组合形式,而不真正了解引擎盖下的情况。我尝试查看底层的ENUM实现,以查看是否可以在不进行强制转换的情况下获得某种本机枚举类型,但看不到任何东西。我正在抓稻草。

谢谢你的帮助 :)


问题答案:

我查看了Wichert Akkerman发布的Issue
3467
,并发布了此变通办法。感谢Mike Bayer。在代码中声明以下类(当然,带有必要的导入):

from sqlalchemy.dialects.postgresql import ARRAY
from sqlalchemy import cast

class ArrayOfEnum(ARRAY):
    def bind_expression(self, bindvalue):
        return cast(bindvalue, self)

    def result_processor(self, dialect, coltype):
        super_rp = super(ArrayOfEnum, self).result_processor(dialect, coltype)

        def handle_raw_string(value):
            if value==None:
                return []
            inner = re.match(r"^{(.*)}$", value).group(1)
            return inner.split(",")

        def process(value):
            return super_rp(handle_raw_string(value))
        return process

ArrayOfEnum 现在是在模型定义中使用的特殊列类型。

所以代替

class Judge(db.Model):
    statuses = db.Column(ARRAY(status))

现在您可以执行以下操作:

class Judge(db.Model):
    statuses = db.Column(ArrayOfEnum(status))

现在,在您的代码中,您可以statuses使用列表为分配值,保存时它将进行正确的转换:

my_judge_object.status = ['unmoderated', 'nominee']