Имя таблицы как параметр функции PostgreSQL

56 John Doe [2012-05-22 18:55:00]

Я хочу передать имя таблицы в качестве параметра в функции Postgres. Я пробовал этот код:

CREATE OR REPLACE FUNCTION some_f(param character varying) RETURNS integer 
AS $$
    BEGIN
    IF EXISTS (select * from quote_ident($1) where quote_ident($1).id=1) THEN
     return 1;
    END IF;
    return 0;
    END;
$$ LANGUAGE plpgsql;

select some_f('table_name');

И я получил это:

ERROR:  syntax error at or near "."
LINE 4: ...elect * from quote_ident($1) where quote_ident($1).id=1)...
                                                             ^

********** Error **********

ERROR: syntax error at or near "."

И вот ошибка, которую я получил при изменении этого select * from quote_ident($1) tab where tab.id=1:

ERROR:  column tab.id does not exist
LINE 1: ...T EXISTS (select * from quote_ident($1) tab where tab.id...

Возможно, работает quote_ident($1), потому что без where quote_ident($1).id=1 я получаю 1, что означает, что что-то выбрано. Почему первая quote_ident($1) работает, а вторая - не в одно и то же время? И как это можно решить?

function plpgsql postgresql identifier dynamic-sql

Оригинал вопроса (на английском)

82 Решение Erwin Brandstetter [2012-05-23 02:07:00]

Это может быть дополнительно упрощено и улучшено:

CREATE OR REPLACE FUNCTION some_f(_tbl regclass, OUT result integer) AS
$func$
BEGIN
   EXECUTE format('SELECT (EXISTS (SELECT FROM %s WHERE id = 1))::int', _tbl)
   INTO result;
END
$func$  LANGUAGE plpgsql;

Вызов с именем, дополненным схемой (см. Ниже):

SELECT some_f('myschema.mytable');  -- would fail with quote_ident()

Или же:

SELECT some_f('"my very uncommon table name"')

Основные моменты

Используйте параметр OUT чтобы упростить функцию. Вы можете напрямую выбрать в него результат динамического SQL и все готово. Нет необходимости в дополнительных переменных и коде.
EXISTS делает именно то, что вы хотите. Вы получаете true если строка существует или false противном случае. Существуют различные способы сделать это, EXISTS обычно наиболее эффективен.
Похоже, вы хотите вернуть целое число, поэтому я преобразовал boolean результат из EXISTS в integer, которое дает именно то, что вы имели. Я бы вернул логическое вместо.
Я использую тип идентификатора объекта regclass качестве типа ввода для _tbl. Это делает все, что будет quote_ident(_tbl) или format('%I', _tbl), но лучше, потому что:
- .. это также предотвращает внедрение SQL.
- .. сразу и более изящно происходит сбой, если имя таблицы недопустимо/не существует/невидимо для текущего пользователя. (Параметр regclass применим только для существующих таблиц.)
- .. он работает с именами таблиц, допущенных схемой, где простой quote_ident(_tbl) или format(%I) потерпит неудачу, потому что они не могут разрешить неоднозначность. Вам придется передавать и экранировать имена схем и таблиц отдельно.
Я все еще использую format(), потому что он упрощает синтаксис (и демонстрирует, как он используется), но с %s вместо %I Как правило, запросы являются более сложными, поэтому format() помогает больше. Для простого примера мы могли бы просто объединить:
```
EXECUTE 'SELECT (EXISTS (SELECT FROM ' || _tbl || ' WHERE id = 1))::int'
```
Нет необходимости указывать в таблице столбец id пока в списке FROM есть только одна таблица. В этом примере двусмысленность невозможна. (Динамические) команды SQL внутри EXECUTE имеют отдельную область видимости, переменные функции или параметры там не видны - в отличие от простых команд SQL в теле функции.

Протестировано с PostgreSQL 9.1. format() требуется как минимум эта версия.

Вот почему вы всегда корректно избегаете пользовательского ввода для динамического SQL:

SQL Fiddle демонстрирует внедрение SQL

Оригинал ответа (на английском)

12 ErikE [2012-07-11 03:20:00]

Не делайте этого.

Это ответ. Это ужасный анти-шаблон. Какой цели это служит? Если клиент знает таблицу, из которой он хочет получить данные, тогда SELECT FROM ThatTable! Если вы разработали свою базу данных таким образом, чтобы это было необходимо, вы, вероятно, разработали ее неправильно. Если ваш уровень доступа к данным должен знать, существует ли значение в таблице, тривиально легко выполнить динамическую часть SQL в этом коде. Вставить его в базу данных не очень хорошо.

У меня есть идея: пусть устанавливается устройство внутри лифтов, где вы можете ввести номер требуемого пола. Затем, когда вы нажимаете "Go", он перемещает механическую руку к правильной кнопке для желаемого пола и нажимает на нее для вас. Революционный!

По-видимому, мой ответ был слишком коротким для объяснения, поэтому я исправляю этот дефект более подробно.

Я не собирался издеваться. Мой глупый пример лифта был самым лучшим устройством, которое я мог себе представить, чтобы кратко изложить недостатки техники, предложенной в вопросе. Эта технология добавляет совершенно бесполезный слой косвенности и бесполезно перемещает выбор имени таблицы из пространства вызывающего абонента с использованием надежного и хорошо понятного DSL (SQL) в гибрид с использованием неявного/странного SQL-кода на стороне сервера.

Такое разделение ответственности за перемещение логики построения запросов в динамический SQL делает код более трудным для понимания. Это разрушает совершенно разумное соглашение (как SQL-запрос выбирает, что выбрать) в имени пользовательского кода, чреватого потенциальной ошибкой.

Динамический SQL предлагает возможность SQL-инъекции, которую трудно распознать в коде переднего плана или в конце кода (один должен проверить их вместе, чтобы увидеть это).
Хранимые процедуры и функции могут обращаться к ресурсам, которые имеет владелец SP/функции, но вызывающий абонент этого не делает. Насколько я понимаю, когда вы используете код, который создает динамический SQL и запускает его, база данных выполняет динамический SQL под правами вызывающего. Это означает, что вы либо вообще не сможете использовать привилегированные объекты, либо открыть их для всех клиентов, увеличивая площадь потенциальной атаки до привилегированных данных. Установка SP/функции во время создания, чтобы всегда запускаться как определенный пользователь (в SQL Server, EXECUTE AS), может решить эту проблему, но делает вещи более сложными. Это усугубляет риск инъекции SQL, упомянутый в предыдущей точке, делая динамический SQL очень заманчивым вектором атаки.
Когда разработчик должен понять, что делает код приложения, чтобы изменить его или исправить ошибку, ему будет очень сложно получить точный SQL-запрос, выполняемый. Может использоваться профилировщик SQL, но это требует особых привилегий и может иметь негативные последствия для производственных систем. Выполненный запрос может быть зарегистрирован SP, но это увеличивает сложность без каких-либо оснований (сохранение новых таблиц, очистка старых данных и т.д.) И совершенно неочевидно. На самом деле, некоторые приложения архивируются таким образом, что разработчик не имеет учетных данных базы данных, поэтому для него практически невозможно увидеть запрос, который будет отправлен.
При возникновении ошибки, например при попытке выбрать таблицу, которая не существует, вы получите сообщение в строке "недопустимое имя объекта" из базы данных. Это произойдет точно так же, независимо от того, составляете ли вы SQL в задней части или в базе данных, но разница в том, что какой-то слабый разработчик, пытающийся устранить неполадки в системе, должен развить один уровень глубже в еще одну пещеру ниже той, где проблема действительно существует, чтобы вникнуть в чудо-процедуру, которая делает все это, и попытаться выяснить, в чем проблема. Журналы не будут показывать "Ошибка в GetWidget", на экране появится "Ошибка в OneProcedureToRuleThemAllRunner". Эта абстракция просто сделает вашу систему хуже.

Здесь гораздо лучший пример в псевдо-С# имен таблиц переключения на основе параметра:

string sql = string.Format("SELECT * FROM {0};", escapeSqlIdentifier(tableName));
results = connection.Execute(sql);

Каждый недостаток, который я упомянул с другим методом, полностью отсутствует в этом примере.

Просто нет цели, нет выгоды, нет возможного улучшения отправки имени таблицы в хранимую процедуру.

Оригинал ответа (на английском)

8 Daniel Vérité [2012-05-22 21:49:00]

Внутри кода plpgsql оператор EXECUTE должен использоваться для запросов, в которых имена таблиц или столбцы поступают из переменных. Конструкция IF EXISTS (<query>) не допускается, когда динамически генерируется query.

Здесь ваша функция с исправленными обеими проблемами:

CREATE OR REPLACE FUNCTION some_f(param character varying) RETURNS integer 
AS $$
DECLARE
 v int;
BEGIN
      EXECUTE 'select 1 FROM ' || quote_ident(param) || ' WHERE '
            || quote_ident(param) || '.id = 1' INTO v;
      IF v THEN return 1; ELSE return 0; END IF;
END;
$$ LANGUAGE plpgsql;

Оригинал ответа (на английском)

3 Matt [2012-05-22 19:35:00]

Первая на самом деле не "работает" в том смысле, что вы имеете в виду, она работает только в том случае, если она не генерирует ошибку.

Попробуйте SELECT * FROM quote_ident('table_that_does_not_exist');, и вы увидите, почему ваша функция возвращает 1: выбор возвращает таблицу с одним столбцом (с именем quote_ident) с одной строкой (переменная $1 или в этом конкретном случае table_that_does_not_exist).

Для чего вам понадобится динамический SQL, который на самом деле является местом, в котором предполагается использовать функции quote_*.

Оригинал ответа (на английском)

0 Sandip Debnath [2018-08-28 13:35:00]

Если вы хотите, чтобы имя таблицы, имя столбца и значение динамически передавались для функции в качестве параметра

используйте этот код

create or replace function total_rows(tbl_name text, column_name text, value int)
returns integer as $total$
declare
total integer;
begin
    EXECUTE format('select count(*) from %s WHERE %s = %s', tbl_name, column_name, value) INTO total;
    return total;
end;
$total$ language plpgsql;


postgres=# select total_rows('tbl_name','column_name',2); --2 is the value

Оригинал ответа (на английском)

0 Julien Feniou [2017-12-21 17:24:00]

Если вопрос состоял в том, чтобы проверить, является ли таблица пустой или нет (id = 1), вот упрощенная версия Erwin, хранящая proc:

CREATE OR REPLACE FUNCTION isEmpty(tableName text, OUT zeroIfEmpty integer) AS
$func$
BEGIN
EXECUTE format('SELECT COALESCE ((SELECT 1 FROM %s LIMIT 1),0)', tableName)
INTO zeroIfEmpty;
END
$func$ LANGUAGE plpgsql;

Оригинал ответа (на английском)

-2 dm3 [2015-04-30 15:15:00]

У меня есть версия PostgreSQL версии 9.4, и я всегда использую этот код:

CREATE FUNCTION add_new_table(text) RETURNS void AS
$BODY$
begin
    execute
        'CREATE TABLE ' || $1 || '(
        item_1      type,
        item_2      type
        )';
end;
$BODY$
LANGUAGE plpgsql

И затем:

SELECT add_new_table('my_table_name');

Это хорошо для меня.

Внимание! Вышеприведенный пример - один из тех, который показывает "Как не делать, если мы хотим сохранить безопасность во время запроса базы данных": P

Оригинал ответа (на английском)

Имя таблицы как параметр функции PostgreSQL

7 ответов

Основные моменты