Автор работы: Пользователь скрыл имя, 25 Июня 2013 в 11:48, курсовая работа
Использование средств и технологий тематического поиска в разнородных информационных ресурсах для подготовки обзора по теме «Влияние инвестиций на экономику»
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ГГОУ ВПО «РОССИЙСКАЯ ЭКОНОМИЧЕСКАЯ АКАДЕМИЯ
им. Г.В. ПЛЕХАНОВА»
ФАКУЛЬТЕТ ИНФОРМАТИКИ
Концептуально-теоретическая Специализированная
Мировые информационные ресурсы Высокоуровневые методы
информатики и программирования
Комплексная междисциплинарная курсовая работа
на тему: «Использование средств и технологий тематического поиска в разнородных информационных ресурсах для подготовки обзора по теме «Влияние инвестиций на экономику». Проектирование и реализация интерфейса к БД информационных источников»
Проверили:
____Голицына О.Л.____ _____Васина Е.Н.____
______________________ _______
Выполнил студент:
__2 курс, 522 группа
(курс, группа)
__Глоба А. С._____
(ФИО студента)
Введение 2
Глава 1. Средства и технологии информационного поиска. 3
1.1.
Структурно-логическое
1.2.
Поиск в информационных
1.2.1)
Реферативно-библиографические
1.2.2)
Электронные каталоги и
1.2.3) Электронные ресурсы издательств. 7
1.2.4) internet- машины 7
Глава
2.Обзор релевантных документов
Глава 3. Реализация базы данных…………………………………………….16
Заключение 21
Введение
Основной целью данной курсовой работы является использование, освоение и изучение средств поиска и обработки информации, оптимизация тематических запросов, а также использование и анализ реальных информационных ресурсов по теме «Правовое регулирование объектов интеллектуальной собственности», найденных в процессе выполнения работы. В качестве работы по дисциплине «Высокоуровневые методы информатики и программирования» выступает проектирование и реализация интерфейса к базам данных информационных источников.
Актуальность данной работы не подвергается сомнению, т. к. в век информационных технологий, наличие знаний и практики в этом вопросе может стать не только конкурентным преимуществом, но и полезным навыком для любых видов работ.
Задачей курсовой работы можно определить сравнительную оценку информативности отдельных информационных ресурсов и эффективности поисковых средств в таких видах поиска, как:
А так же, освоение методов составления аналитических обзоров реферативного типа.
В качестве информационных ресурсов, в работе выступают профессиональные базы данных и собрания документальной и фактографической информации, в том числе: базы данных научной реферативно-библиографической информации (ИНИОН РАН, ВИНИТИ, БД патентной информации (патенты) на сайте ФИПС),электронные библиотеки (e-Library, Библиотека Электронная библиотека МГТУ им. Баумана), открытые Internet-ресурсы (Яндекс, Google, Nigma).
Этапы курсовой работы:
Тема курсовой работы: «Влияние инвестиций на экономику». Она может быть логически разделена на три главные подтемы:
Эти подтемы и являются основными аспектами, определяющими предметную область темы. Далее определим смежные понятия, связанные ассоциативными, родовидовыми или другими отношениями. То есть структурно мы можем представить тему так:
Граф понятий для такого набора терминов выглядит так:
В ходе работы будет использоваться, как естественное выражение, это может быть сама тема, так и булево выражение (выражение с использованием логических операторов И, ИЛИ, НЕ), определяющее (ограничивающее) предметную область темы.
(Капиталовложение ИЛИ Вклад ИЛИ Рискоинвестиция ИЛИ Вложение ИЛИ Спонсирование ИЛИ Финансирование ИЛИ 'Движение капитала') И ('Народное хозяйство' ИЛИ 'Экономическая наука' ИЛИ Экономия ИЛИ 'Хозяйственная жизнь' ИЛИ 'Домашнее хозяйство')
1.2. Поиск в информационных ресурсах
1.2.1) Реферативно-библиографические документальные БД
В Базе данных «База данных
реферативно-библиографической информации
Всероссийского института научно-технической
информации (ВИНИТИ)» (http://library.mephi.ru:
KW:((Капиталовложение, Вклад, Рискоинвестиция, Вложение, Спонсирование, Финансирование, 'Движение капитала'))
И
KW:(('Народное хозяйство', 'Экономическая наука', Экономия, 'Хозяйственная жизнь', 'Домашнее хозяйство'))
Итак, найден 1 релевантный документ, далее осуществляем поиск по каждому термину отдельно, получим частоту в БД. Затем, объединим релевантные документы с каждым из терминов – это будет частота в выдаче.
Подобным же образом осуществим поиск по полю «Реферат»(AB) и по всем полям(ALL). В этом случае запрос будет выглядеть немного по-другому, зашифруем каждое слово с помощью символа *, и заменим словосочетания отдельными словами, связав их оператором ctx(он указывает на то ,что одно слово следует строго за другим):
AB:((Капиталовложен*, (Движен* ctx капитал*)))
И
AB:(((Народн* ctx хозяйств*), Эконом*, ('Хозяйств* ctx жизн*)))
Получим результат.
Подобным же образом осуществим поиск по полю : по всем полям(ALL). В этом случае запрос будет выглядеть немного по-другому, зашифруем каждое слово с помощью символа*.
AB:((Капиталовложен*, (Движен* капитал*)))
И
AB:(((Народн* хозяйств*), Эконом*, ('Хозяйств* жизн*)))
Получим результат.
В конце каждого поиска, составляем таблицу, которая показывает полноту и точность поиска, где Полнота(r)= (Количество релевантных документов/ Итоговый результат по всему запросу)*100%
Вид поиска |
Всего документов |
Количество релевантных документов |
Точность p |
По полю «Ключевые слова» |
42 |
39 |
0,5200 |
По полю «Реферат» |
24 |
14 |
0,1866 |
Поиск по обобщенному словарю |
37 |
22 |
0,2900 |
ФГУ ФИПС. www.fips.ru
БД патентной информации.
Поисковое предложение здесь выглядит следующим образом:
Проектирование
Такой поиск не выдал документов.
Попробуем изменить запрос: Влиян* инвестиц* на экономи*
Такой поиск не выдал документов.
1.2.2) Электронные каталоги и библиотеки
Как пример библиотеки второго типа можно привести электронную библиотеку МГТУ им. Баумана
Предложение запроса: Движен* капитал* Народн* хозяйств*
Выдано 13 документов, релевантных 6.
И опять же итоговая таблица:
№ п/п |
Термин |
Частота в выдаче |
Частота в БД |
1 |
Движен* |
3 |
5541 |
2 |
капитал* |
2 |
4861 |
3 |
Народн* |
2 |
1761 |
4 |
хозяйств* |
4 |
10245 |
Вид поиска (предложение поиска) |
Всего документов |
Кол-во релевантных документов |
Точность p |
Движен* капитал* Народн* хозяйств* |
13 |
6 |
0,4615 |
1.2.4) internet- машины
Одной из самых популярных поисковых машин является Яндекс. Выполним 2 вида запросов:
- по естественноязыковой формулировке темы запроса
Предложение поиска: Влияние инвестиций на экономику
Найдено 5 млн .документов, просмотрено 30, релевантных 25 документов.
- по булевоподобному выражению («профессиональный» язык запросов)
Предложение поиска: (Влиян & инвестиц && (экономик | народн хозяйств)
Найдено 7836 документа, просмотрено 30,релевантных 5 .
Итоговая таблица для поиска в Internet – машине Яндекс выглядит следующим образом:
Вид поиска (предложение поиска) |
Всего документов |
Кол-во релевантных документов |
Точность p |
Влияние инвестиций на экономику |
30 |
25 |
0,8333 |
(Влиян & инвестиц && (экономик | народн хозяйств) |
30 |
5 |
0,1667 |
Другой, так же известной интернет машиной является система Google. Осуществляя запросы таким же образом получим иные результаты.
-по естественноязыковой формулировке темы запроса
Предложение поиска: Влияние инвестиций на экономику
Выдано 5,7 млн. документов, просмотрены 30, релевантных 27.
– по булевоподобному выражению («профессиональный» язык запросов)
Предложение поиска: Влиян AND инвестиц AND (экономик OR народн хозяйств)
Выдано 589 тыс. документов , просмотрено 30,релевантных 7.
Итоговая таблица для поиска в Internet – машине Google выглядит следующим образом:
Вид поиска (предложение поиска) |
Всего документов |
Кол-во релевантных документов |
Точность p |
Влияние инвестиций на экономику |
30 |
27 |
0,9 |
Влиян AND инвестиц AND (экономик OR народн хозяйств) |
30 |
7 |
0,2333 |
Глава 2.Обзор релевантных документов
Введение