Правила Форума редакция от 22.06.2020 |
|
|
|
|
|
Опции темы | Опции просмотра | Language |
19.10.2007, 09:04 | #1 |
Неактивный пользователь
Регистрация: 18.10.2007
Сообщений: 3
Репутация: 1
|
Распознавание старых книг
Возникла задача перевести в электронный вид несколько дореволюционных книг, где еще используется старый алфавит. Имеется ли у кого-нибудь опыт в этом деле? Есть ли специальный софт, т.к. мой FineReader напрочь отказывается правильно понимать некоторые символы.
|
Реклама: | концерт сколково | кухонный уголок | Наружный блок SYSVRF2 M 670 AIR EVO HP R | плитка половая для кухни | теплоход родная русь навигация 2024 расписание и цены |
22.10.2007, 19:46 | #2 |
Книголюб-2010
Пол: Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
|
Ответ: Распознавание старых книг
evgajukov, а в режиме обучения с добавлением символов из ижицы?...
ЗЫ. тема для обговора... не совсем по теме вопрос... перенсу в "Курилку"
__________________
[RIGHT]Не спеши наследить, попробуй оставить свой след |
01.02.2009, 14:49 | #3 |
Новичок
Пол: Регистрация: 01.02.2009
Сообщений: 1
Репутация: 0
|
Re: Распознавание старых книг
Распозновали старые книги FineReader-ом 7 в нём есть такая возможность.
|
05.02.2009, 00:01 | #4 |
Неактивный пользователь
Пол: Регистрация: 11.09.2006
Сообщений: 2
Репутация: 1
|
Re: Распознавание старых книг
|
Сказали спасибо: |
05.02.2009, 11:46 | #5 | ||||||||||||||||||||||||||||||||||||||||||
Книголюб-2010
Пол: Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
|
Re: Распознавание старых книг
а че, проблема? когда-то сканил книгу по старославянскому: взял шрифт языка и дал обучение (муторное, конечно, дело). Но получилось просто долго нужно сидеть и каждую буковку подбирать, несколько часов изначально убивается. бубен по этому поводу много отзвонит -
или - http://www.abbyy.ru/finereader/
__________________
[RIGHT]Не спеши наследить, попробуй оставить свой след |
||||||||||||||||||||||||||||||||||||||||||
Сказали спасибо: |
25.02.2009, 13:51 | #6 |
Новичок
Пол: Регистрация: 15.02.2005
Сообщений: 24
Репутация: 18
|
Re: Распознавание старых книг
Для этой цели есть специяльная рускоязычная программа AfterScan Express
http://www.afterscan.com/ вот пимер, взят с сайта Ошибки распознавания Вот пример текста, распознанного одной из ведущих программ распознавания. Старорусская орфография и плохое качество исходного документа сильно повлияли на количество ошибок. Красным цветом выделены слова которые требуют исправления: Августъ (Кай Юл1й Цеэарь Октав1анъ)- порвый римск1й иМператОръ, первсначально на-зыв. Кай Октав1й, сынъ Кая Октав1я и Ат!и, дочери Юл1и, младшей сестры Юл\u1103я Цезаря, род. 23 сент. 63 г. до Р. X. Фамил1я Октав1-евъ принаддежала къ богагому и знагному роду. Отецъ Октав1я, бывшш сначала преторомъ, а потомъ правителемъ Македоши, умеръ, когЛа сыпу его быдо лишь 4 года. Тъмъ не менъе, благоларя заботамъ свеей матери и ея втораго муэка Люц!я Марвдя Филиппа, Окт. получидъ тщательное воспиташе. Своимн талаптами онъ сксро заслужилъ любонь Юл1я Цезаря, прихо*див-шагося ему двоюроднымъ дядей, такъ что послъдшй въ 45 г. усыновилъ его и въ своемъ завещании назначилъ главнымъ своимъ наслъд-никомъ. Когда Цезарь былъ убить (15 марта 44 г.) Августъ находился въ Аполлоны, въ Эпиръ. Онъ сейчасъ же поспъшилъ при этомъ изв^ст1и въ Итал1ю и, узнавъ при Брундиз1умЬ о содержаши завъ1цан1я, ръшплся вмъсгЬ съ наслъдствомъ принять и имя Цезаря, и въ то же время стремиться къ унаслъдовашю его власти, не высказывая, впрочемъ, открыто этего послъдняго желашя. Въ то время въ Римъ бо*ролись двй партш: республиканская, свергнув*шая Цезаря, и парт1я Антон!я (см. это сл.) и Лепида (см. это сл.), которая, подъ преддо-гомъ мести за смерть Ц., сгремилась лишЬ за*хВатить влаСть въ собственпыя руки. В этом тексте 198 слов из которых 114 содержат ошибки распознавания или старорусское написание, которое нужно исправлять на современное. Текст практически нечитаемый и его проще набрать заново, чем исправлять. Обработаем этот текст программой AfterScan Antique. Всего за 21 секунду мы получим следующий текст: Август (Кай Юлий Цезарь Октавиан) — первый римский император, первоначально на-зыв. Кай Октавий, сын Кая Октавия и Атии, дочери Юлии, младшей сестры Юлія Цезаря, род. 23 сент. 63 г. до Р. X. Фамилия Октавиев принадлежала к богатому и знатному роду. Отец Октавия, бывший сначала претором, а потом правителем Македонии, умер, когда сыну его было лишь 4 года. Тем не менее, благодаря заботам своей матери и ее второго мужа Люция Марвдя Филиппа, Окт. получил тщательное воспитание. Своими талантами он скоро заслужил любовь Юлия Цезаря, приходившегося ему двоюродным дядей, так что последний в 45 г. усыновил его и в своем завещании назначил главным своим наследником. Когда Цезарь был убить (15 марта 44 г.) Август находился в Аполлоны, в Эпир. Он сейчас же поспешил при этом известии в Италию и, узнав при Брундизиуме о содержании завещания, решился вместе с наследством принять и имя Цезаря, и в то же время стремиться к унаследованию его власти, не высказывая, впрочем, открыто этого последнего желания. В то время в Рим боролись две партии: республиканская, свергнувшая Цезаря, и партия Антония (см. это сл.) и Лепида (см. это сл.), которая, под предлогом мести за смерть Ц., стремилась лишь захватить власть в собственные руки. Программа не смогла распознать четыре слова, которые на самом деле ошибок не содержат. Программа автоматически сделала в этом тексте 171 исправление. успехов |
Сказали спасибо: |
10.06.2009, 03:30 | #7 |
Неактивный пользователь
Пол: Регистрация: 22.04.2008
Сообщений: 7
Репутация: 1
|
Re: Распознавание старых книг
Не знала где спросить, но эта тема немного подходит - если кто-то может посоветовать програмку распознающую китайский и японский текст, заранее благодарна...
|
10.06.2009, 11:22 | #8 | |||||||||||||||||||
Книголюб-2010
Пол: Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
|
Re: Распознавание старых книг
Gali,
http://www.abbyy.ru/press/?param=144349
__________________
[RIGHT]Не спеши наследить, попробуй оставить свой след |
|||||||||||||||||||
Сказали спасибо: |
10.06.2009, 14:52 | #9 |
Неактивный пользователь
Пол: Регистрация: 22.04.2008
Сообщений: 7
Репутация: 1
|
Re: Распознавание старых книг
Chetiki, спасибо, я не знала про новую версию, у нас на 6-м нет китайского.
|
Сказали спасибо: |
10.06.2009, 15:07 | #10 | |||||||||||||||||||||||
Книголюб-2010
Пол: Регистрация: 19.05.2006
Адрес: Хуст
Сообщений: 8,612
Репутация: 20216
|
Re: Распознавание старых книг
как я Вас, Gali, понимаю!.. у меня в 4-й даже украинского не было
__________________
[RIGHT]Не спеши наследить, попробуй оставить свой след |
|||||||||||||||||||||||
16.11.2009, 21:41 | #11 |
Re: Распознавание старых книг
Кто занимался вычиткой текста в старой орфографии, тот поймет меня. Конвертация в новую представляется необходимым и оправданным решением. С этой целью я написал небольшой макрос, который текст из старой орфографии переводит в новую. Однако, от простого макроса не стоит ждать чудес, возможны неверные срабатывания, а также за бортом остается большое количество слов, написание которых со временем изменилось, например: стратиг и стратег, литтература и литература. Такие слова придется править вручную.
Скопируйте текст макроса и вставьте его в свой normal.dot :ex: Последний раз редактировалось Майор Вихрь; 20.11.2009 в 20:55.. Причина: спрятал под cut |
|
Сказали спасибо: |
20.11.2009, 11:44 | #12 |
Неактивный пользователь
Пол: Регистрация: 03.11.2009
Сообщений: 32
Репутация: 12
|
Re: Распознавание старых книг
Может кто знает, есть какие-нибудь варианты по распознаванию арабского текста?
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Распознавание голоса | Vitalik21 | Обсуждение программ | 7 | 16.05.2010 23:24 |
Распознавание текста в Linux | kolumn | UNIX, Linux, MacOs для PC и другие ОС | 7 | 31.03.2010 18:46 |
Распознавание языка иврит | ribakaba | Просмотр, конверторы и редакторы графики | 1 | 17.08.2009 23:06 |
Восстановление старых фотографий. | Elpasso | Программы для обработки | 3 | 01.03.2009 13:42 |
|
|