на первый
заказ
Курсовая работа на тему: Ввод стандартных форм и форматированных документов
Купить за 350 руб.Введение
В последнее время проблема массового ввода данных стала особо актуальной. Число документов постоянно растёт, а вместе с ними увеличиваются проблемы по вводу и обработке больших объёмов данных в вычислительных системах. Необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге, возникает в деятельности большого количества государственных, акционерных и частных предприятий. Стало очевидно, что для организации управления и контроля необходимо, чтобы любая информационная единица, порожденная на уровне отдельного гражданина или отдельного предприятия, сразу оказалась в информационной системе и была доступна в любой момент для анализа и обобщения. По мировой статистике приблизительно 80% всех документов, используемых в бизнесе, составляют формы. Они возникают практически в любом бизнесе, связанном с обслуживанием клиентов, а также в деятельности государственных органов, занятых сбором данных о физических и юридических лицах. Таким образом, существует необходимость автоматизации и повсеместного внедрения систем массового ввода форм, что существенно облегчит их обработку. Как следствие, повысится производительность и эффективность работы предприятий и организаций вцелом.Объектом исследования являются стандартные формы.
Предмет исследования - ввод стандартных форм и форматированных документов.
Цель исследования - рассмотрение принципов ввода и обработки стандартных форм.
Задачи исследования:
1. Проанализировать основную литературу по теме курсовой работы.
2. Определить понятие и классификацию стандартных форм.
3. Рассмотреть основные этапы ввода и обработки форматированных документов.
4. Установить основные требования к системам массового ввода форм.
5. Рассмотреть системы массового ввода форм, разработанные различными фирмами.
Методика исследования - системный анализ литературных источников и Интернет сайтов.
Основные работы, посвящённые данной теме - это источники 1, 3, 4, 10, 11, 13. Сущность понятия "стандартная форма" изложено в источниках 10, 13. В источнике 1 описаны признаки стандартных форм, положенные в основу их классификации. Применение стандартных форм и их типология, в зависимости от применения в той или иной области управления, приведено в источниках 1, 7, 8, 11. Этапы ввода и обработки форматированных документов рассмотрены в источниках 1, 2, 10, 11, 13. Более подробно этап сканирования изложен в источнике 1, сегментация и технологии распознавания - в источниках 1, 10, 11. Принципы потокового ввода стандартных форм освящены в источнике 3. Требования к системам массового ввода и обработки стандартных форм, а также подходы к их реализации рассмотрены в источниках 1, 2, 11. Компании, предлагающие решения по разработке систем массового ввода стандартных форм и спешность их разработок описаны в источниках 3-6, 10, 11, 13-15.
Тема достаточно полно освящена на сайтах Интернет, книг и статей по данной теме очень мало.
1 СТАНДАРТНЫЕ ФОРМЫ И ИХ КЛАССИФИКАЦИЯ
1.1 Понятие и признаки классификации стандартных форм
Стандартные формы - однотипные документы, используемые главным образом в крупных организациях, связанных с массовым обслуживанием клиентов. Для удобства их обработки, информация, содержащая ответ на один и тот же вопрос, в разных документах заносится в фиксированное по отношению к границам документа поле.
Основные отличия стандартной формы - это одинаковый размер документов и фиксированное положение линий разграфки [10].
На Западе вместо понятия "система обработки форм" используется термин "Document Capturing" (т.е. захват документа). В общем приближении рынок Document Capturing (только его программная часть) в мире оценивается примерно в 300 млн. долл., при этом довольно быстро развиваясь.
Сущность системы обработки форм сводится к распознаванию документа определенного формата в общем случае с печатным или рукопечатным заполнением. Задача распознавания состоит в нахождении неких известных полей, а результатом работы программы обычно является не просто текстовый документ, а определенная запись в некоторой базе данных [13].
Основой классификации стандартных форм могут служить следующие признаки:
1 признак - способ нанесения информации (печатный текст, рукописный текст, метки).
Способ нанесения информации определяет выбор технологии распознавания.
Метки, печатный и рукописный тексты могут применяться в документах как единственный вид информации или в любом взаимном сочетании. Так, избирательные бюллетени используют меточный способ, в то время как прайс-листы - печатный, а анкеты - в основном рукописный и меточный.
2 признак - геометрическая вариативность полей.
Расположение всех полей и записей в них должно быть строго фиксировано относительно опорных элементов: рамок, линий, постоянных напечатанных записей, специальных маркеров.
Все специально подготовленные для машинной обработки документы обладают этим качеством.
3 признак - наличие явных разделителей полей.
Этот признак часто присутствует в таблицах и играет существенную роль в выделении значимых полей [1].
На Западе существуют определённые стандарты и правила по заполнению значимых полей форм, что в последующем облегчает их обработку. Так, например, немецкие компании CGK, AEG имеют свои правила заполнения стандартных форм, которых обязаны придерживаться их клиенты. В частности в этих системах линии разграфки документов наносятся иным цветом (например, красным или зеленым) по сравнению с цветом заполнителя. Это делается для того, чтобы удалить линии еще на этапе сканирования за счет установки цветового фильтра в сканирующее устройство [10].
Оглавление
- Введение- СТАНДАРТНЫЕ ФОРМЫ И ИХ КЛАССИФИКАЦИЯ 1.1 Понятие и признаки классификации стандартных форм
- Типы стандартных форм в зависимости от применения Выводы к разделу
- ВВОД И ОБРАБОТКА СТАНДАРТНЫХ ФОРМ 2.1 Этапы ввода и обработки форматированных документов
- Основные принципы потокового ввода форм
- Требования к системам массового ввода стандартных форм 2.4 Подходы к реализации систем обработки форм Выводы к разделу
- Системы массового ввода стандартных форм 3.1 система abbyy fine reader form
- Система Cognitive Forms Выводы к разделу
- Заключение
- Список использованных источников
Заключение
В деятельности большого количества государственных, акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах.Суммарное количество документов, которые должны быть занесены в базу данных для дальнейшей обработки только в одной организации, может достигать нескольких тысяч и даже десятков тысяч в день. Можно представить, в каком масштабе подобные работы производятся в целом по Украине. На это тратятся огромные средства, в то время как проблема может быть решена намного более эффективно.
С ростом числа документов растут и проблемы по вводу и обработке больших объёмов данных в вычислительных системах. Практически в любом бизнесе, связанном с обслуживанием клиентов, а также в деятельности государственных органов, занятых сбором данных о физических и юридических лицах, возникают стандартные формы.
Стандартными формами являются однотипные, имеющие априорную структуру документы, которые классифицируются по таким признакам: способ нанесения информации, геометрическая вариативность полей и наличие явных разделителей полей.
Стандартные формы используются в различных бизнес-приложениях, занимающихся циркуляцией информации между предприятиями и клиентами. Среди основных систем обработки форм можно выделить следующие: обработка факсов, обработка государственных форм, обработка различных счетов и заказов на товары, маркетинговые исследования и опросы, обработка банковских платёжных поручений и др.
Осуществление автоматизированного ввода форм в базу данных подразумевает выполнение нескольких этапов: подготовка обработки формы, сканирование, сегментация полученного изображения, распознавание значимых полей, верификация, сохранение данных в полях базы данных. Причём сам процесс обработки формы включает именно сегментацию изображения формы и извлечение данных из значимых полей.
Придерживание определённых принципов при вводе форм освободит сотни людей от неэффективного утомительного труда. Учёт основных требований, предъявляемых к системам массового ввода форм, а также учёт подходов к их реализации обеспечит реальную экономию, снизит количество опечаток, повысит точность и соответственно достоверность вводимых данных.
Подчас неосведомленность начальства и неэффективная организация работы приводят к тому, что в компьютер вручную вбиваются тысячи однотипных печатных и рукопечатных форм. Объемы подобного труда просто огромны. Если в организации обрабатывается 100 и более форм в день, то нецелесообразность автоматизации их ввода исключается, так как автоматизация экономически себя оправдает.
Наиболее известными системами, предлагающими решения или компоненты систем обработки форм, являются "ABBYY Fine Reader Form" и "Cognitive Forms". Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему, так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки.
Следовательно, автоматизацию ввода форм могут позволить себе крупные организации с большим объёмом документооборота. Автоматизация сократит затраты на ручной ввод данных из форм и повысит эффективность работы организации вцелом.
Список литературы
1. Асєєв, Г.Г. Методологiя електронного документообiгу: динамiчнi архiви /Г.Г. Асєєв //Вiсн. Кн. Палати. - 2005. - № 11. - С. 22-252. Асеев, Г.Г. Электронный документооборот. Учебник /Г.Г. Асеев. - К.: Кондор, 2007. - 500 с.
3. ABBYY: Как правильно организовать автоматизированный ввод документов. [Электронный ресурс]. - Режим доступа: http://www.scandocs.ru/page.jsp?рк=nоdе_1185012951516(5)
4. АBBYY Form Reader. [Электронный ресурс]. - Режим доступа: http://www.radius-soft.ru/products/document159.shtml(6)
5. ABBYY Form Reader 6.5. [Электронный ресурс]. - Режим доступа: http://www.itprogress.ru/products_ABBYY.html(14)
6. Гулинин, В. Иванова, Г. Документооборотные средства: одиннадцатилетка конференции-выставки DOCFLOW в действии. [Электронный ресурс]. - Режим доступа: http://www.buhcomp.ru/htm/new_namb/arhive_ 2005/07/statyi/statya_3.shtml(9)
7. Журавлёва, Н. Система электронного документооборота: выгоды эксплуатации для сотрудников разных отделов компании /Н. Журавлёва //Секретарское дело. - 2007. - № 5. - С. 31-37(8)
8. Iвахненков, С.В. Iнформацiйнi технологiї в органiзацiї бухгалтерського облiку та аудиту: Навч. посiб. /С.В. Iвахненков. - 3-тє вид., випр. i доп. - К.: Знання, 2006. - 350 с.(10)
9. Комова, М.В. Дiловодство: Навч. посiб. /М.В. Комова; Нацiональний ун-т "Львiвська полiтехнiка". - Львiв: Трiада плюс, 2006. - 220 с.( 11)
10. Никольский, Н. Технология обработки стандартных форм документов. [Электронный ресурс]. - Режим доступа: http://www.bmw2.ru/tekhnologiya-obrabotki-standartnikh.html(1)
11. Пахчанян, А. Технологии массового ввода данных. [Электронный ресурс]. - Режим доступа: http://www.iemag.ru/articles/detail.php?ID=2634(4)
12. Полонская, Е. Заменитель терпения /Е. Полонская //Компьютеры + программы. - 2004. - № 1. - С. 78-81(7)
13. Прохоров, А. Системы автоматического распознавания форм. [Электронный ресурс]. - Режим доступа: http://www.compress.ru/article.aspx?id=12211&iid=470(2)
14. Уланов, Д. Решения Cognitive и Fujitsu облегчат ввод стандартных форм. [Электронный ресурс]. - Режим доступа: http://www.cognitive.ru/products/faq-forms.htm(12)
15. Шашенкова, Е. Cognitive Forms Network - коробочный вариант программного продукта для массового ввода стандартных форм документов. [Электронный ресурс]. - Режим доступа: http://www.osp.ru/сw/2006/16/1155120/(13)
или зарегистрироваться
в сервисе
удобным
способом
вы получите ссылку
на скачивание
к нам за прошлый год