Мультимедийные СУБД: требования и проблемы
В основе любой мультимедийной информационной системы лежит соответствующая система управления базой данных (СУБД). Традиционные базы данных состоят из управляемого набора данных, относящихся к некоторым реальным сущностям, а СУБД представляет собой комплекс взаимосвязанных данных и набора программ, предназначенных для описания и создания БД, записи и выборки данных, администрирования и обработки запросов. Аналогично и мультимедийная БД может рассматриваться как набор мультимедиа-данных, таких как текст, изображения, графические объекты, рисунки, видео- и аудиозаписи. Мультимедийная СУБД должна обеспечивать поддержку всех этих типов данных, включая функции создания, хранения, доступа, обработки запросов и управления.
Различные типы данных, используемые в БД мультимедиа, могут требовать применения специальных методов оптимального хранения, доступа, индексирования и выборки. Мультимедийные СУБД должны отвечать всем этим требованиям, предоставляя высокоуровневые абстракции для управления различными типами данных, а также адекватный интерфейс для их воспроизведения.
Прежде чем перейти к детальному описанию возможностей, которые, как мы полагаем, должны присутствовать в мультимедийной СУБД, и требований, которым такие системы должны отвечать, следует сделать ряд замечаний по поводу характера и природы мультимедиа-информации. А уже затем обратимся к проблемам, возникающим при управлении ею.
Природа мультимедиа-данных Разнообразие и характерные особенности мультимедиа-данных допускают их оценку с нескольких точек зрения. Можно выделять аспекты информационной перегрузки, неадекватности текстовых описаний, многообразия типов, пространственных и временных соотношений, а также огромных объемов данных.
Задача интеграции всевозможных типов данных из множества источников является одной из важнейших для мультимедийных информационных систем. В типичной БД мультимедиа присутствуют следующие типы данных:
- текст;
- изображения: цветные, черно-белые, фотографические, картографические и рисованные;
- графические объекты: обычные чертежи, наброски и иллюстрации, а также трехмерные объекты;
- анимационные последовательности: ряд изображений или графических объектов, которые, как правило, генерируются независимо;
- видео: последовательности изображений (называемых кадрами), фиксирующие реальные сцены и обычно записываемые с помощью видеоаппаратуры;
- аудио-последовательности: данные, которые генерируются с помощью звукозаписывающих устройств;
- комплексная мультимедиа-информация: сочетание двух и более перечисленных выше типов данных. Примером может служить аудиовизуальная последовательность с текстовыми аннотациями.
Определенные типы данных, в частности видео-, аудио- и анимационные последовательности, предъявляют также дополнительные требования к соблюдению определенных временных соотношений, которые необходимо учитывать при реализации их хранения и представления, а также манипулирования ими. Проблемы обостряются, когда приходится организовывать отображение данных различных типов из нескольких, возможно разнородных, источников с синхронизацией по времени. Кроме того, изображения, графика и видеопоследовательности характеризуются еще и пространственными параметрами, обусловленными их конкретным содержанием. Обычно отдельные объекты, составляющие изображение или кадр видеопоследовательности, связаны некоторыми пространственными отношениями. Такие отношения должны учитываться, например, при организации поиска в БД.
Характерная для мультимедиа-информации особенность - огромные объемы данных. Так, изображение размером 1024 на 728 пикселов с 24-разрядной глубиной цвета занимает при хранении более 2 Мбайт (без сжатия). При использовании алгоритмов компрессии, обеспечивающих коэффициент уплотнения 20:1, эта величина может быть снижена примерно до 0,1 Мбайт. Десятиминутная последовательность видеоданных, записанная с частотой 30 кадров в секунду и имеющая те же графическое разрешение и глубину цвета, займет около 38 000 Мбайт, а при сжатии в 100 раз - 380 Мбайт. Учитывая, что обычная продолжительность видеофильма составляет около двух часов, а их количество в типовой видеотеке исчисляется тысячами, можно представить, до каких размеров разрастается объем хранилища в мультимедийных информационных системах.
Давно известно, что одна картинка стоит тысячи слов. Однако при воспроизведении изображений или последовательностей кадров возникают проблемы выборки информации, связанные с ограниченными возможностями текстового описания мультимедиа-материалов и с величиной объема данных. Потенциальная информационная перегрузка означает, что пользователи могут оказаться в большом затруднении при составлении запросов и выборке информации. Следствием ограниченности текстового описания является потребность в доступе к мультимедиа-информации по ее содержанию. Пользователи должны иметь возможность указывать множество признаков (таких, как форма, цвет и текстура), присущих мультимедиа-материалам.
Еще одна характерная особенность мультимедиа-информации состоит в том, что взаимодействие с ней обычно осуществляется на протяжении длительных отрезков времени (например, при работе с видеоданными) и иногда в этом взаимодействии участвуют несколько пользователей (что типично для сред поддержки коллективной работы). Однако в таких средах большая часть мультимедиа-данных используется в режиме только для чтения. Это допущение может существенно упростить алгоритмы параллельного управления.
Назначение мультимедийных СУБД
Мультимедийная СУБД предоставляет удобную среду для использования разнообразной информации и управления ею. Поэтому она должна в рамках набора функций обычной СУБД (описание и создание БД, выборка, доступ к данным и их организация, обеспечение независимости данных, их защищенности, интеграции и целостности, управление версиями и поддержка параллельной обработки) поддерживать различные типы данных мультимедиа.
В мультимедийных СУБД эти функции в основном напоминают соответствующие функции транзакционных СУБД, однако сама природа обрабатываемой информации неизбежно выдвигает новые задачи.
Приняв набор функций обычной СУБД в качестве отправной точки, можно сформулировать требования, предъявляемые к мультимедийным СУБД.
- Интеграция. Возможность избежать дублирования данных для обращения к ним из различных программ.
- Независимость данных. Отделение функций СУБД и администрирования от прикладных программ.
- Управление одновременным доступом. Обеспечение непротиворечивости данных в БД мультимедиа с помощью правил, регулирующих порядок выполнения параллельных транзакций.
- Сохранение текущего состояния между сеансами. Способность объектов данных продолжать существовать (сохранять текущее состояние) на протяжении ряда различных транзакций и сеансов работы программы.
- Защищенность. Ограничение на неавторизованный доступ к хранимым данным и их модификацию.
- Контроль целостности. Обеспечение непротиворечивости состояния БД в процессе обработки транзакций путем наложения на них определенных ограничений.
- Восстановление. Методы, служащие гарантией того, что неудачно завершившиеся транзакции не повлияют на постоянно хранимые данные.
- Поддержка обработки запросов. Распространение механизмов обработки запросов на мультимедиа-данные.
- Управление версиями. Организация хранения различных версий объектов и управление ими.
- наличие функций, присущих традиционным СУБД;
- поддержка огромных объемов хранения;
- возможности выборки информации;
- интеграция информации различных типов, композиция и воспроизведение;
- поддержка мультимедиа-запросов;
- наличие мультимедиа-интерфейса и интерактивность;
- производительность.
Проблемы мультимедийных СУБД
Чтобы мультимедийная СУБД соответствовала изложенным требованиям, при ее построении необходимо решить следующие проблемы:
-моделирование мультимедиа-данных;
- хранение мультимедиа-объектов;
- интеграция и воспроизведение мультимедиа-информации при обеспечении гарантированного уровня качества;
- индексирование, выборка и просмотр мультимедиа-информации;
-поддержка мультимедиа-запросов;
-управление распределенными мультимедиа-данными;
- системная поддержка.
Моделирование мультимедиа-данных
Вообще говоря, мультимедийные СУБД могут найти применение везде, где есть потребность в организации управления мультимедиа-данными при минимальных затратах сил и средств. В частности, их уже можно встретить в таких областях, как образование (цифровые библиотеки, производственное обучение, демонстрации, дистанционное обучение), здравоохранение (телемедицина, управление информацией в учреждениях здравоохранения, специальные медицинские системы обработки изображений), сфера развлечений (видео по требованию, БД музыкальных записей, интерактивное телевидение), информационные службы (новости по требованию, реклама, широковещательное телевидение) и производство (распределенное производство, распределенная коллективная работа над документами). В числе других возможных областей применения можно назвать финансы, видеоконференц-связь, электронную издательскую деятельность, электронную торговлю и географические информационные системы.