шпаргалка

Фактографические, документальные, мультимедийные типы баз данных.

[ Назад ]

База данных (БД) — совокупность определенным образом организованной информации на какую-то тему (в рамках некоторой предметной области).

Например:

1.база данных книжного фонда библиотеки;

2.база данных кадрового состава учреждения;

3.база данных законодательных актов в области уголовного права;

4.база данных современной эстрадной песни.

Конечно, вся эта информация может храниться и на бумаге (например, книжный каталог библиотеки). Но современным средством хранения и обработки баз данных является, безусловно, компьютер.

Базы данных бывают фактографическими и документальными.

В фактографических БД содержатся краткие сведения об описываемых объектах, представленные в строго определенном формате. Из приведенных выше примеров две первые БД скорее всего будут организованы как фактографические. В БД библиотеки о каждой книге хранятся библиографические сведения: год издания, автор, название и пр. Разумеется текст книги в ней содержаться не будет. В БД отдела кадров учреждения хранятся анкетные данные сотрудников: фамилия, имя, отчество; год и место рождения.

Фактографическая база данных — база, представленная поисковым образом документа и текстом в его полном или частичном объёмах, т. е. полнотекстовая или фрагментарная база. При этом содержание вводимых в ЭВМ фрагментов текстов определяется в соответствии с потенциальными информационными потребностями, характеристиками технических средств, возможностями программы и т.д. Для фактографической базы характерны соответствия «элемент = файл». То есть на каждого адресата заводится свой компьютерный файл.

Характерной особенностью фактографических систем является то, что они работают не с текстом, а с фактическими сведениями, которые представлены в виде записей. Основные компоненты ФС - это сами БД и системы управления БД (СУБД). На базе ФС создаются справочники, системы анализа и управления предприятиями, бухгалтерские системы.

В дальнейшем будем рассматривать фактографические системы.

СУБД должна предоставлять доступ к данным любым категориям пользователей, включая и тех, которые практически не имеют или не хотят иметь представления:

о физическом размещении в памяти данных и их описаний;

о механизмах поиска запрашиваемых данных;

о проблемах, возникающих при одновременном запросе одних и тех же данных многими пользователями (прикладными программами);

о способах обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа;

о поддержании баз данных в актуальном состоянии и множестве других функций СУБД.

Базы данных в третьем и четвертом примерах наверняка будут организованы как документальные. Первая из них будет включать в себя тексты законов; вторая — тексты и ноты песен; биографическую и творческую справочную информацию о композиторах, поэтах, исполнителях; звуковые записи и видеоклипы. Следовательно, документальная БД содержит обширную информацию самого разного типа: текстовую, графическую, звуковую, мультимедийную.

Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными.

Документографические системы, как правило, строятся по двухконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости).

В составе данного класса выделены следующие виды БД:

- по публикуемым научно-техническим документам ;

- по публикуемым документам в области общественных наук;

- по патентным документам;

- по отчетам по НИР, ОКР, программным средствам ;

- по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.);

- по стандартам и другой нормативно-технической документации;

- библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях;

- реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации;

- БД законодательной и правовой информации;

- документографические документографические по специальным видам документов ;

- БД по архивным документам. Анализ состояния дел с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации.

Современные информационные технологии постепенно стирают границу между фактографическими и документальными БД. Существуют средства, позволяющие легко подключать любой документ (текстовый, графический, звуковой) к фактографической базе данных.

Документальные БД характеризуются нерегулярностью типов данных, слабо структурированной информацией, записями неопределенной длины. Традиционно, в документальных БД структуры ориентированы в основном на поиск, а не на изменение, плохо представлены решения для лексического анализа, реализуются в специальных СУБД.

Предпосылками к проектированию модели послужила возможность реализации документальных БД в реляционной СУБД в связи с развитием фактографических СУБД, которые уменьшают ограничения на поля и время доступа.

Перечислим типы баз данных, получившие к настоящему времени наибольшее развитие, что связано с внедрением информационных технологий в специализированные отрасли хозяйства: - документографические и документальные БД, создаваемые в средствах массовой информации; - БД по промышленной, строительной и сельскохозяйственной продукции; - БД по экономической и конъюнктурной информации (статистическая, кредитно-финансовая, внешнеторговая); - фактографические базы социальных данных, включающие сведения о населении и о социальной среде; - БД транспортных систем; - справочные данные для населения и учреждений (энциклопедии и справочники, расписания самолетов и поездов, адреса и телефоны граждан и организаций и др.); - ресурсные БД , включающие фактографическую информацию о природных ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные ресурсы и отходы, экологическая обстановка); - фактографические базы и банки научных данных, обеспечивающие фундаментальные научные исследования; - фактографические БД в области культуры и искусства; - лингвистические БД, т.е.

Документальные системы предназначены для работы с документами на естественном языке: книги, тезисы, статьи... Наиболее распространенным видом ДС явлюется информационно-поисковые системы (ИПС), которые предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят: программные средства, поисковый массив документов и средства поддержки информационного языка этой системы.

Программные средства ИПС служат для организации ввода и хранения информации, а также обработки пользовательских запросов на поиск документов. Поисковый массив документов обычно называют БД, и он не содержит текстов, а включает только библиографические сведения: рефераты и аннотации. При выполнении поиска документа используют поисковые образы, отражающие содержание документа. Эти образы строятся путем индексирования документов и являются ключевыми словами поискового документа.

Информационные языки (ИЯ) в ИПС строятся на базе ограниченных естественных языков. Это приводит к неоднозначной интерпретации смысла запросов. Для решения этой проблемы вводятся словари - тезаурусы. Они описывают лексические единицы языка и смысловые связи между ними. Наибольшим распространением для реализации таких ИЯ получили языки дескрипторного типа, которые в качестве лексических единиц или дескрипторов используют слова или словосочетания, соответствующие основным понятиям предметной области. Дескрипторы заносятся в тезаурус ИПС.

Информационный запрос формируется на таком ИЯ, затем преобразуется в поисковый образ запроса (ПОЗ), ПОЗ сопоставляется с поисковыми образами документов по критерию смыслового соответствия, и в результате выдаются все документы, которые оказались релевантными этому запросу.

КАТЕГОРИИ:

Network | английский | архитектура эвм | астрономия | аудит | биология | вычислительная математика | география | Гражданское право | демография | дискретная математика | законодательство | история | квантовая физика | компиляторы | КСЕ - Концепция современного естествознания | культурология | линейная алгебра | литература | математическая статистика | математический анализ | Международный стандарт финансовой отчетности МСФО | менеджмент | метрология | механика | немецкий | неорганическая химия | ОБЖ | общая физика | операционные системы | оптимизация в сапр | органическая химия | педагогика | политология | правоведение | прочие дисциплины | психология (методы) | радиоэлектроника | религия | русский | сертификация | сопромат | социология | теория вероятностей | управление в технических системах | физкультура | философия | фотография | французский | школьная математика | экология | экономика | экономика (словарь) | язык Assembler | язык Basic, VB | язык Pascal | язык Си, Си++ |