Любая база данных годна к использованию только тогда, когда ее состояние соответствует состоянию предметной области. Такие состояния называют целостными. Очевидно, что при изменении данных БД должна переходить от одного целостного состояния к другому. Однако, в процессе обновления данных возможны ситуации, когда состояние целостности нарушается. Например:
UPDATE
:
UPDATE accounts SET summa=summa-1000 WHERE account="PC_1" UPDATE accounts SET summa=summa+1000 WHERE account="PC_2"Как видим, после выполнения первой команды и до завершения второй команды база данных не находится в целостном состоянии (искомая сумма списана с первого счета, но не зачислена на второй). Если в этот момент в системе произойдет сбой (например, выключение электропитания), то целостное состояние БД будет безвозвратно утеряно.
UPDATE employers SET salary=salary*1.2При этом СУБД последовательно обрабатывает все записи, подлежащие обновлению, т.е. существует временной интервал, когда часть записей содержит новые значения, а часть - старые.
Во избежание таких ситуаций в СУБД вводится понятие транзакции - атомарного действия над БД, переводящего ее из одного целостного состояния в другое целостное состояние. Другими словами, транзакция - это последовательность операций, которые должны быть или все выполнены или все не выполнены (все или ничего).
Методом контроля за транзакциями является ведение журнала, в котором фиксируются все изменения, совершаемые транзакцией в БД. Если во время обработки транзакции происходит сбой, транзакция откатывается - из журнала восстанавливаеться состояние БД на момент начала транзакции.
В СУБД различных поставщиков начало транзакции может задаваться явно (например, командой BEGIN TRANSACTION), либо предполагаться неявным (так определено в стандарте SQL), т.е. очередная транзакция открывается автоматически сразу же после удачного или неудачного завершения предыдущей. Для завершения транзакции обычно используют команды SQL:
BEGIN TRANSACTION; /* Начать транзакцию */ DELETE ...; /* Изменения */ UPDATE ...; /* данных */ if (обнаружена_ошибка) ROLLBACK; else COMMIT; /* Завершить транзакцию */Пример неявно заданной транзакции:
СOMMIT; /* Окончание предыдущей транзакции */ DELETE ...; /* Изменения */ UPDATE ...; /* данных */ if (обнаружена_ошибка) ROLLBACK; else COMMIT; /* Завершить транзакцию */К сожалению, описанный механизм транзакций гарантирует обеспечение целостного состояния базы данных только в том случае, когда все транзакции выполняются последовательно, т.е. в каждую единицу времени активна только одна транзакция. Если работу с данными ведут одновременно несколько пользователей, вряд ли их устроит такой способ организации обработки запросов, т.к. это приведет к увеличению времени реакции системы. В то же время, если одновременно выполняются две транзакции, могут возникнуть следующие ошибочные ситуации:
ROLLBACK
,
то получается, что транзакция Т2 прочитала не существующие данные.
Все описанные выше ситуации возникли только потому, что чередующееся выполнение транзакций Т1 и Т2 не было упорядочено, т.е. не было эквивалентно выполнению сначала транзакции Т1, а затем Т2, либо, наоборот, сначала транзакции Т2, а затем Т1.
Принудительное упорядочение транзакций обеспечивается с помощью механизма блокировок. Суть этого механизма в следующем: если для выполнения некоторой транзакции необходимо, чтобы некоторый объект базы данных (кортеж, набор кортежей, отношение, набор отношений,..) не изменялся непредсказуемо и без ведома этой транзакции, такой объект блокируется. Основными видами блокировок являются:
Доказано, что сериализуемость транзакций (или, иначе, их изоляция) обеспечивается при использовании двухфазного протокола блокировок (2LP - Two-Phase Locks), согласно которому все блокировки, произведенные транзакцией, снимаются только при ее завершении. Т.е выполение транзакции разбивается на две фазы: (1) - накопление блокировок, (2) - освобождение блокировок в результате фиксации или отката.
К сожалению, применение механизма блокировки приводит к замедлению обработки транзакций, поскольку система вынуждена ожидать пока освободятся данные, захваченные конкурирующей транзакцией. Решить эту проблему можно за счет уменьшения фрагментов данных, захватываемых транзакцией. В зависимости от захватываемых объектов различают несколько уровней блокировки:
Язык SQL также предоставляет способ косвенного управления скоростью выполения транзакций с помощью указания уровня изоляции транзакции. Под уровнем изоляции транзакции понимается возможность возникновения одной из описанных выше ошибочных ситуаций. В стандарте SQL определены 4 уровня изоляции:
Уровень изоляции | Грязное чтение | Размытое чтение | Фантом |
---|---|---|---|
Незафиксированное чтение (READ UNCOMMITTED) | возможно | возможно | возможно |
Зафиксированное чтение (READ COMMITED) | невозможно | возможно | возможно |
Повторяемое чтение (REPEATABLE READ) | невозможно | невозможно | возможно |
Сериализуемость (SERIALIZABLE) | невозможно | невозможно | невозможно |
Для определения характеристик транзакции используется оператор
SET TRANSACTION <режим_доступа>, <уровень_изоляции>
Список уровней изоляции приведен в таблице. Режим доступа по умолчанию используется
READ WRITE (чтение запись), если задан уровень изоляции READ UNCOMMITED, то режим
доступа должен быть READ ONLY (только чтение).
Одним из наиболее серьезных недостатков метода сериализации транзакций на основе механизма блокировок является возможность возникновения тупиков (dead locks) между транзакциями. Пусть, например, транзакция Т1 наложила монопольную блокировку на объект О1 и претендует на доступ к объекту О2, который уже монопольно заблокирован транзакцией Т2, ожидающей доступа к объекту О1. В этом случае ни одна из транзакций продолжаться не может, следовательно, блокировки объектов О1 и О2 никогда не будут сняты. Естественного выхода из такой ситуации не существует, поэтому тупиковые ситуации обнаруживаются и устраняются искусственно. При этом СУБД откатывает одну из транзакций, попавших в тупик ("жертвует" ею), что дает возможность продолжить выполнение другой транзакции.
Вопрос обеспечения параллельного выполнения транзакций весьма сложен и многие моменты остались за рамками данного раздела. Заинтересованный читатель может найти более полное изложение этой темы в одном из источников, указанных в списке литературы.