Компьютерный форум NoWa.cc Здесь может быть Ваша реклама
Правила Форума
редакция от 22.06.2020
Портал .::2BakSa.WS::.
Вернуться   Компьютерный форум NoWa.cc > Электронные книги / eBookz > Технический раздел e-books

Уважаемые пользователи nowa.cc и 2baksa.ws. У нас сложилось тяжёлое финансовое положение. Мы работаем для вас вот уже более 15 лет и сейчас вынуждены просить о помощи. Окажите посильную поддержку проектам. Мы очень надеемся на вас. Реквизиты для переводов ниже.
Webmoney Webmoney WMZ: 826074280762 Webmoney WME: 804621616710
PayPal PayPal_Email E-mail для связи по вопросу помощи
Кошелёк для вашей помощи YooMoney 4100117770549562
YooMoney Спасибо за поддержку!
Ответ
 
Опции темы Опции просмотра Language
Старый 19.10.2007, 09:04   #1
Неактивный пользователь
 
Регистрация: 18.10.2007
Сообщений: 3
Репутация: 1
Cool Распознавание старых книг

Возникла задача перевести в электронный вид несколько дореволюционных книг, где еще используется старый алфавит. Имеется ли у кого-нибудь опыт в этом деле? Есть ли специальный софт, т.к. мой FineReader напрочь отказывается правильно понимать некоторые символы.
evgajukov вне форума
 
Ответить с цитированием Вверх
Здесь может быть Ваша реклама
Здесь может быть Ваша реклама


Реклама: концерт сколковокухонный уголокНаружный блок SYSVRF2 M 670 AIR EVO HP Rплитка половая для кухнитеплоход родная русь навигация 2024 расписание и цены


Старый 22.10.2007, 19:46   #2
Chet
Книголюб-2010
 
Пол:Мужской
Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
По умолчанию Ответ: Распознавание старых книг

evgajukov, а в режиме обучения с добавлением символов из ижицы?...
ЗЫ. тема для обговора... не совсем по теме вопрос... перенсу в "Курилку"
__________________
[RIGHT]Не спеши наследить,
попробуй оставить свой след
Chet вне форума
 
Ответить с цитированием Вверх
Старый 01.02.2009, 14:49   #3
kovserg
Новичок
 
Пол:Мужской
Регистрация: 01.02.2009
Сообщений: 1
Репутация: 0
По умолчанию Re: Распознавание старых книг

Распозновали старые книги FineReader-ом 7 в нём есть такая возможность.
kovserg вне форума
 
Ответить с цитированием Вверх
Старый 05.02.2009, 00:01   #4
LSS
Неактивный пользователь
 
Пол:Мужской
Регистрация: 11.09.2006
Сообщений: 2
Репутация: 1
По умолчанию Re: Распознавание старых книг

Цитата:
Сообщение от kovserg Посмотреть сообщение
Распозновали старые книги FineReader-ом 7 в нём есть такая возможность.

С ятями?
А можно по-подробней?
Заранее спасибо.
LSS вне форума
 
Ответить с цитированием Вверх
Старый 05.02.2009, 11:46   #5
Chet
Книголюб-2010
 
Пол:Мужской
Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
По умолчанию Re: Распознавание старых книг

Цитата:
Сообщение от LSS Посмотреть сообщение
С ятями?

а че, проблема? когда-то сканил книгу по старославянскому: взял шрифт языка и дал обучение (муторное, конечно, дело).
Но получилось просто долго нужно сидеть и каждую буковку подбирать, несколько часов изначально убивается.

бубен по этому поводу много отзвонит -
Цитата:
язык старославянский finereader

или - http://www.abbyy.ru/finereader/
__________________
[RIGHT]Не спеши наследить,
попробуй оставить свой след
Chet вне форума
 
Ответить с цитированием Вверх
Старый 25.02.2009, 13:51   #6
telenin20
Новичок
 
Пол:Мужской
Регистрация: 15.02.2005
Сообщений: 24
Репутация: 18
По умолчанию Re: Распознавание старых книг

Для этой цели есть специяльная рускоязычная программа AfterScan Express

http://www.afterscan.com/

вот пимер, взят с сайта

Ошибки распознавания

Вот пример текста, распознанного одной из ведущих программ распознавания. Старорусская орфография и плохое качество исходного документа сильно повлияли на количество ошибок. Красным цветом выделены слова которые требуют исправления:

Августъ (Кай Юл1й Цеэарь Октав1анъ)- порвый римск1й иМператОръ, первсначально на-зыв. Кай Октав1й, сынъ Кая Октав1я и Ат!и, дочери Юл1и, младшей сестры Юл\u1103я Цезаря, род. 23 сент. 63 г. до Р. X. Фамил1я Октав1-евъ принаддежала къ богагому и знагному роду. Отецъ Октав1я, бывшш сначала преторомъ, а потомъ правителемъ Македоши, умеръ, когЛа сыпу его быдо лишь 4 года. Тъмъ не менъе, благоларя заботамъ свеей матери и ея втораго муэка Люц!я Марвдя Филиппа, Окт. получидъ тщательное воспиташе. Своимн талаптами онъ сксро заслужилъ любонь Юл1я Цезаря, прихо*див-шагося ему двоюроднымъ дядей, такъ что послъдшй въ 45 г. усыновилъ его и въ своемъ завещании назначилъ главнымъ своимъ наслъд-никомъ. Когда Цезарь былъ убить (15 марта 44 г.) Августъ находился въ Аполлоны, въ Эпиръ. Онъ сейчасъ же поспъшилъ при этомъ изв^ст1и въ Итал1ю и, узнавъ при Брундиз1умЬ о содержаши завъ1цан1я, ръшплся вмъсгЬ съ наслъдствомъ принять и имя Цезаря, и въ то же время стремиться къ унаслъдовашю его власти, не высказывая, впрочемъ, открыто этего послъдняго желашя. Въ то время въ Римъ бо*ролись двй партш: республиканская, свергнув*шая Цезаря, и парт1я Антон!я (см. это сл.) и Лепида (см. это сл.), которая, подъ преддо-гомъ мести за смерть Ц., сгремилась лишЬ за*хВатить влаСть въ собственпыя руки.

В этом тексте 198 слов из которых 114 содержат ошибки распознавания или старорусское написание, которое нужно исправлять на современное. Текст практически нечитаемый и его проще набрать заново, чем исправлять. Обработаем этот текст программой AfterScan Antique. Всего за 21 секунду мы получим следующий текст:

Август (Кай Юлий Цезарь Октавиан) — первый римский император, первоначально на-зыв. Кай Октавий, сын Кая Октавия и Атии, дочери Юлии, младшей сестры Юлія Цезаря, род. 23 сент. 63 г. до Р. X. Фамилия Октавиев принадлежала к богатому и знатному роду. Отец Октавия, бывший сначала претором, а потом правителем Македонии, умер, когда сыну его было лишь 4 года. Тем не менее, благодаря заботам своей матери и ее второго мужа Люция Марвдя Филиппа, Окт. получил тщательное воспитание. Своими талантами он скоро заслужил любовь Юлия Цезаря, приходившегося ему двоюродным дядей, так что последний в 45 г. усыновил его и в своем завещании назначил главным своим наследником. Когда Цезарь был убить (15 марта 44 г.) Август находился в Аполлоны, в Эпир. Он сейчас же поспешил при этом известии в Италию и, узнав при Брундизиуме о содержании завещания, решился вместе с наследством принять и имя Цезаря, и в то же время стремиться к унаследованию его власти, не высказывая, впрочем, открыто этого последнего желания. В то время в Рим боролись две партии: республиканская, свергнувшая Цезаря, и партия Антония (см. это сл.) и Лепида (см. это сл.), которая, под предлогом мести за смерть Ц., стремилась лишь захватить власть в собственные руки.

Программа не смогла распознать четыре слова, которые на самом деле ошибок не содержат. Программа автоматически сделала в этом тексте 171 исправление.


успехов
telenin20 вне форума
 
Ответить с цитированием Вверх
Старый 10.06.2009, 03:30   #7
Gali
Неактивный пользователь
 
Пол:Женский
Регистрация: 22.04.2008
Сообщений: 7
Репутация: 1
По умолчанию Re: Распознавание старых книг

Не знала где спросить, но эта тема немного подходит - если кто-то может посоветовать програмку распознающую китайский и японский текст, заранее благодарна...
Gali вне форума
 
Ответить с цитированием Вверх
Старый 10.06.2009, 11:22   #8
Chet
Книголюб-2010
 
Пол:Мужской
Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
По умолчанию Re: Распознавание старых книг

Gali,
Цитата:
Компания ABBYY представила расширенную версию системы оптического распознавания текста ABBYY FineReader 9.0 с поддержкой иврита, китайского (традиционного и упрощенного написания), японского и тайского языков. Система оптического распознавания теперь поддерживает 184 языка – европейских, азиатских, африканских и ближневосточных. Включение в ABBYY FineReader 9.0 дополнительных языков позволит расширить пользовательскую аудиторию системы на 2 миллиарда человек.

http://www.abbyy.ru/press/?param=144349
__________________
[RIGHT]Не спеши наследить,
попробуй оставить свой след
Chet вне форума
 
Ответить с цитированием Вверх
Старый 10.06.2009, 14:52   #9
Gali
Неактивный пользователь
 
Пол:Женский
Регистрация: 22.04.2008
Сообщений: 7
Репутация: 1
По умолчанию Re: Распознавание старых книг

Chetiki, спасибо, я не знала про новую версию, у нас на 6-м нет китайского.
Gali вне форума
 
Ответить с цитированием Вверх
Старый 10.06.2009, 15:07   #10
Chet
Книголюб-2010
 
Пол:Мужской
Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
По умолчанию Re: Распознавание старых книг

Цитата:
Сообщение от Gali Посмотреть сообщение
у нас на 6-м нет китайского.

как я Вас, Gali, понимаю!.. у меня в 4-й даже украинского не было
__________________
[RIGHT]Не спеши наследить,
попробуй оставить свой след
Chet вне форума
 
Ответить с цитированием Вверх
Старый 16.11.2009, 21:41   #11
Майкопчанин
Неактивный пользователь
 
Аватар для Майкопчанин
 
Пол:Мужской
Регистрация: 12.04.2008
Сообщений: 13
Репутация: 15
По умолчанию Re: Распознавание старых книг

Кто занимался вычиткой текста в старой орфографии, тот поймет меня. Конвертация в новую представляется необходимым и оправданным решением. С этой целью я написал небольшой макрос, который текст из старой орфографии переводит в новую. Однако, от простого макроса не стоит ждать чудес, возможны неверные срабатывания, а также за бортом остается большое количество слов, написание которых со временем изменилось, например: стратиг и стратег, литтература и литература. Такие слова придется править вручную.


Скопируйте текст макроса и вставьте его в свой normal.dot :ex:

Последний раз редактировалось Майор Вихрь; 20.11.2009 в 20:55.. Причина: спрятал под cut
Майкопчанин вне форума
 
Ответить с цитированием Вверх
Старый 20.11.2009, 11:44   #12
Макушка
Неактивный пользователь
 
Пол:Мужской
Регистрация: 03.11.2009
Сообщений: 32
Репутация: 12
По умолчанию Re: Распознавание старых книг

Может кто знает, есть какие-нибудь варианты по распознаванию арабского текста?
Макушка вне форума
 
Ответить с цитированием Вверх
Ответ


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Распознавание голоса Vitalik21 Обсуждение программ 7 16.05.2010 23:24
Распознавание текста в Linux kolumn UNIX, Linux, MacOs для PC и другие ОС 7 31.03.2010 18:46
Распознавание языка иврит ribakaba Просмотр, конверторы и редакторы графики 1 17.08.2009 23:06
Восстановление старых фотографий. Elpasso Программы для обработки 3 01.03.2009 13:42

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 12:00. Часовой пояс GMT +3.


Copyright ©2004 - 2024 2BakSa.WS

Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Время генерации страницы 0.19691 секунды с 11 запросами