Название: Патентные исследования Часть 1 - учебник (Г.А. Шаншуров)

Жанр: Технические

Просмотров: 1489


2.3.7. особенности работы с текстовыми базами данных

 

Текстовыми базами данных называются базы данных, объектами хранения в которых являются тексты. Под текстом понимаются неструктурированные данные, построенные из строк.

Проблемно ориентированные текстовые БД используются в разных областях медицины, юриспруденции, научно-технической информации, делопроизводства и др. Они хранят и обрабатывают огромные массивы постоянно увеличивающейся текстовой информации.

Системы обработки текстовой информации отличаются от систем обработки структурированных данных, имеющих фиксированный формат записи, в первую очередь типами хранимых данных.

Текстовые БД могут содержать различные тексты и документы, например тексты законов, библиографические описания, книги, рефераты, статьи и др.

Пакеты прикладных программ, предназначенные для ввода, обработки, поиска и обновления текстов, называют информационно-поисковой системой (ИПС).

Перечень задач концептуального проектирования текстовой БД:

1. Анализ информационных интересов пользователей к данной предметной области.

2. Определение источников формирования БД.

3. Выбор архитектуры БД.

4. Разработка языка описания документов.

К анализу информационных интересов пользователей относится изучение информационных потребностей, информационных запросов, собственно потребителей информации.

На основе анализа запросов и анализа информационных потоков принимается решение об источниках формирования БД, при этом рассматриваются следующие варианты:

1. Проектирование политематической текстовой БД из имеющихся БД.

2. Проектирование текстовой БД из первичных документов.

Архитектура БД выбирается исходя из интересов пользователей, вида документа, объема памяти ЭВМ.