Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
Elf
Зарегистрирован: 20.02.2003 Сообщения: 10 Откуда: Moscov
|
Добавлено: Сб Окт 20 2001 21:46 Заголовок сообщения: как взять текст из PDF файла (Perl или PHP)? |
|
|
Необходимо взять текст из PDF файла и сконвертить его в обычный текст. Как мне это сделать? |
|
Вернуться к началу |
|
 |
Dmitry.Karpov Гость
|
Добавлено: Вс Окт 21 2001 10:18 Заголовок сообщения: IMHO, это проблематично |
|
|
Насколько я понял, PDF - закрытый фрпмат, типа того адобовского формата, за раскрытие которого арестовали нашего программиста в США. Вьювер к PDF распространяется бесплатно, но копировать текст он не дает, а редактор продается за деньги.
Впрочем, попробуйте поискать формат файла на http://www.wotsit.org - там очень много чего описано. |
|
Вернуться к началу |
|
 |
Elf
Зарегистрирован: 20.02.2003 Сообщения: 10 Откуда: Moscov
|
Добавлено: Вс Окт 21 2001 19:16 Заголовок сообщения: Re: IMHO, это проблематично |
|
|
Спасибо всем - уже нашел как минимум два пути сделать это. |
|
Вернуться к началу |
|
 |
Dmitry.Karpov Гость
|
Добавлено: Вс Окт 21 2001 21:56 Заголовок сообщения: Так расскажи всем, как это можно сделать! |
|
|
Узнал сам - расскажи другому! |
|
Вернуться к началу |
|
 |
RiSearcher Гость
|
Добавлено: Ср Окт 24 2001 02:57 Заголовок сообщения: Re: Так расскажи всем, как это можно сделать! |
|
|
Любой поисковик на тему "pdf2text" или "pdftotext". Я сейчас тестирую pdftotext с http://www.foolabs.com/xpdf/. Вроде неплохо работвет. |
|
Вернуться к началу |
|
 |
Elf
Зарегистрирован: 20.02.2003 Сообщения: 10 Откуда: Moscov
|
Добавлено: Пн Ноя 05 2001 12:44 Заголовок сообщения: Re: Так расскажи всем, как это можно сделать! |
|
|
Просто под линухом есть такая библиотека xpdf инсталишь ее вызываешь необходимые функции (список в man). |
|
Вернуться к началу |
|
 |
|