Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Архив форумов ЦИТФорума
Море(!) вопросов - Море(!) ответов
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Как правильно задавать вопросы

как взять текст из PDF файла (Perl или PHP)?

 
Перейти:  
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Интернет
Предыдущая тема :: Следующая тема  
Автор Сообщение
Elf



Зарегистрирован: 20.02.2003
Сообщения: 10
Откуда: Moscov

СообщениеДобавлено: Сб Окт 20 2001 21:46    Заголовок сообщения: как взять текст из PDF файла (Perl или PHP)? Ответить с цитатой

Необходимо взять текст из PDF файла и сконвертить его в обычный текст. Как мне это сделать?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Dmitry.Karpov
Гость





СообщениеДобавлено: Вс Окт 21 2001 10:18    Заголовок сообщения: IMHO, это проблематично Ответить с цитатой

Насколько я понял, PDF - закрытый фрпмат, типа того адобовского формата, за раскрытие которого арестовали нашего программиста в США. Вьювер к PDF распространяется бесплатно, но копировать текст он не дает, а редактор продается за деньги.

Впрочем, попробуйте поискать формат файла на http://www.wotsit.org - там очень много чего описано.
Вернуться к началу
Elf



Зарегистрирован: 20.02.2003
Сообщения: 10
Откуда: Moscov

СообщениеДобавлено: Вс Окт 21 2001 19:16    Заголовок сообщения: Re: IMHO, это проблематично Ответить с цитатой

Спасибо всем - уже нашел как минимум два пути сделать это.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Dmitry.Karpov
Гость





СообщениеДобавлено: Вс Окт 21 2001 21:56    Заголовок сообщения: Так расскажи всем, как это можно сделать! Ответить с цитатой

Узнал сам - расскажи другому!
Вернуться к началу
RiSearcher
Гость





СообщениеДобавлено: Ср Окт 24 2001 02:57    Заголовок сообщения: Re: Так расскажи всем, как это можно сделать! Ответить с цитатой

Любой поисковик на тему "pdf2text" или "pdftotext". Я сейчас тестирую pdftotext с http://www.foolabs.com/xpdf/. Вроде неплохо работвет.
Вернуться к началу
Elf



Зарегистрирован: 20.02.2003
Сообщения: 10
Откуда: Moscov

СообщениеДобавлено: Пн Ноя 05 2001 12:44    Заголовок сообщения: Re: Так расскажи всем, как это можно сделать! Ответить с цитатой

Просто под линухом есть такая библиотека xpdf инсталишь ее вызываешь необходимые функции (список в man).
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Интернет Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
Русская поддержка phpBB

 

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 6608306, ICQ 232284597
Пресс-релизы — pr@citforum.ru
Послать комментарий
Информация для авторов
This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2006 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...