Автоматизація документообігу
Химия

Автоматизація документообігу


clip_image001

Зміст:

1. Найменування та призначення сучасних систем автоматизації документообігу (https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami/sistemy-elektronnogo-dokumentooborota).

а. DIRECTUM

b. Е1 ЄВФРАТ

с. PayDox

2. Методи роботи із програмою розпізнавання тексту.

а. Сканування документів за допомогою сканера.

b. Розпізнавання рукописного тексту.

3. Огляд програмного забезпечення для автоматизованого перекладу документів.

а. Яндекс.Переклад

b. Google Перекладач

с. Apertium

1. Найменування та призначення сучасних систем автоматизації документа обороту:

a. DIRECTUM— це система електронного документообігу та управління взаємодією, націлена на підвищення ефективності роботи всіх працівників організаціїу різних галузях їхньої спільної діяльності. Система DIRECTUM відноситься до класу ECM-систем (Enterprise Content Management) та підтримує повний життєвий цикл управління документами, при цьому традиційне «паперове» діловодство органічно вписується.[2] у електронний документообіг. DIRECTUM забезпечує організацію та контроль ділових процесів на основі технології Workflow: погодження документів, обробка складних замовлень, підготовка та проведення нарад, підтримка циклу продажу та інших процесів взаємодії. (https://ru.wikipedia.org/wiki/Directum)

b. Е1 ЄВФРАТ— Система електронного документообігу та автоматизації бізнес-процесів, розроблена російською компанією Cognitive Technologies. Система варта комплексної автоматизації процесів діловодства, створення електронних архівів документів, організації корпоративного документообігу, автоматизації типових бізнес-процесів.

Система дозволяє автоматизувати реєстрацію документів та завдань, забезпечує взаємодію користувачів під час роботи над документами (з розмежуванням прав доступу), дає можливість пошуку інформації. Може здійснюватися контролю над виконанням робіт, і навіть відстеження стану процесів. Підсистема взаємодії віддалених серверів створена для забезпечення можливості взаємодії між філіями, а внутрішня пошта дозволяє спілкуватися з використанням поштових програм. (https://ua.wikipedia.org/wiki/%D0%95%D0%92%D0%A4%D0%A0%D0%90%D0%A2)

с. PayDox— система електронного документообігу, управління бізнес-процесами та спільною роботою. Розробка компанії Paybot LLC. Компанія з 1999 року займається створенням програмного забезпечення на веб-технологіях для бізнесу.

PayDox — це реалізований на web-технологіях корпоративний портал, який використовує електронний документообіг як інструментальну базу з широким набором стандартних необхідних для кожного підприємства функцій та необмеженими можливостями розширення та інтеграції. (https://ru.wikipedia.org/wiki/PayDox)

2. Методи роботи з програмою розпізнавання тексту:

а. Сканування документів за допомогою сканера. Результатом роботи є цифрове зображення документа – графічний файл. Більш доцільним, у порівнянні з графічним, є текстове представлення інформації. Цей варіант дозволяє суттєво скоротити витрати на зберігання та передачу інформації, а також дозволяє реалізувати всі можливі сценарії використання та аналізу електронних документів. Тому найбільший інтерес із практичної точки зору становить саме переведення паперових носіїв у текстовий електронний документ.
На вход системи розпізнавання надходить растрове зображення сторінки документа. Для роботи алгоритмів розпізнавання бажано, щоб зображення, що надходить на вхід, було якомога вищої якості. Якщо зображення зашумлено, не різко, має низьку контрастність, це ускладнить завдання алгоритмів розпізнавання.

Підготовлене зображення потрапляє до входу модуля сегментації. Завданням цього модуля є виявлення структурних одиниць тексту – рядків, слів та символів. Виділення фрагментів високих рівнів, таких як рядки та слова, може бути здійснено на основі аналізу проміжків між темними областями. (http://habrahabr.ru/post/112442/)

b. Розпізнавання рукописного тексту. Оцифрування текстової інформації може відбуватися двома способами: шляхом сканування зображення з носія (offline-метод) або за допомогою спеціального пристрою, здатного реєструвати в часі координати та швидкість переміщення кінчика пишучого інструменту безпосередньо під час створення тексту (online-метод). Offline-метод розпізнавання найзручніший при обробці великої кількості рукописних документів (наприклад, у страхових компаніях). Якість розпізнавання можна покращити, якщо будуть використані структуровані документи (форми), але навіть при цьому неможливо обійтися без редагування людиною. Офлайнове розпізнавання вважається складнішим порівняно з онлайновим.

Перед тим, як почати роботу з текстом, він спочатку повинен бути відсканований, а потім переведений в текстовий вигляд за допомогою програми розпізнавання. Проходить цей процес у кілька етапів: початкова обробка, структурне уявлення, класифікація. Початкова обробка зазвичай використовується для того, щоб видалити шуми, покращити різкість та контрастність зображення, а також змінити формат файлу. Потім проводиться структурне виділення елементів тексту (рядки, слова, окремі символи). В останню чергу відбувається перевірка фрагментів на відповідність до певних літер.

Optical Character Recognition – одна з найплідніших технологій штучного інтелекту. Розуміється вона як автоматична система, яка розпізнає зображення символів тексту (введеного в комп’ютер, наприклад, за допомогою сканера) за допомогою спеціальних програм і перетворює його на формат, що підходить для роботи з використанням текстових процесорів, редакторів текстів тощо (http: //репетитор.

3. Огляд програмного забезпечення для автоматизованого перекладу документів:

(https://ua.wikipedia.org/wiki/%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7% D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0% B5%D0%B2%D0%BE%D0%B4#.D0.9E.D0.B1.D1.89.D0.B8.D0.B9_.D0.BE.D0.B1.D0.B7.D0.BE .D1.80)

(https://ru.wikipedia.org/wiki/)

а. Яндекс.Переклад — сервіс компанії Яндекс, призначений для перекладу частини тексту або веб-сторінки іншою мовою.

У сервісі використовується самонавчальний алгоритм статистичного машинного перекладу, розроблений фахівцями компанії. Система будує свої словники відповідностей з урахуванням аналізу мільйонів перекладених текстів. Текст для перекладу комп’ютер спочатку порівнює з базою слів, потім із базою моделей мови, намагаючись визначити сенс висловлювання у тих.

Слід зазначити, що функція перекладу отриманих результатів пошуку сторінок (на кнопці «Переклад») з’явилася ще 2009 року і здійснювалася з урахуванням технологій PROMT.

Крім того, перекладач вбудований в Яндекс.Браузер та автоматично пропонує перекласти текст іноземною мовою.

(https://ua.wikipedia.org/wiki/%D0%AF%D0%BD%D0%B4%D0%B5%D0%BA%D1%81.%D0%9F%D0%B5%D1%80 %D0%B5%D0%B2%D0%BE%D0%B4)

b.Гугл перекладач (Англ. Google Translate) — веб-сервіс компанії Google, призначений для автоматичного перекладу тексту або веб-сторінки іншою мовою. Для деяких мов користувачам пропонуються варіанти перекладів, наприклад, для технічних термінів, які мають бути включені в оновлення системи перекладу.

На відміну від інших сервісів перекладу, таких як Babel Fish та AOL, які використовують технологію SYSTRAN (англійська), Google, як і Translate.ru, використовує власне програмне забезпечення. Мабуть, використовується самонавчальний алгоритм машинного перекладу. (https://ua.wikipedia.org/wiki/Google_%D0%9F%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D1%87%D0%B8 %D0%BA)

с. Apertium (https://ru.wikipedia.org/wiki/Apertium) — це платформа машинного перекладу, яка розробляється при фінансуванні з боку урядів Іспанії та Каталонії в Університеті Аліканте (Universitat d’Alacant). Це вільне програмне забезпечення, яке безкоштовно видається розробниками відповідно до умов GNU GPL.

Apertium є системою машинного перекладу, яка використовує кінцеві перетворювачі всіх своїх лексичних трансформацій, і навіть приховані моделі Маркова виділення частин промови чи усунення протиріч у категоріях слів.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *